Talend Open Studio - Big Data là công cụ mã nguồn mở và miễn phí để dễ dàng xử lý data của bạn trên môi trường dữ liệu lớn. Với nhiều thành phần dữ liệu có sẵn trong Talend Open Studio, bạn có thể tạo và làm các công việc Hadoop chỉ bằng cách kéo và thả một vài thành phần Hadoop đơn giản.
Với Talend Open Studio for Big Data, người dùng không cần phải viết những dòng mã MapReduce lớn vì phần mềm sẽ tự động tạo mã, bạn chỉ cần kéo và thả các thành phần, cấu hình một vài tham số. Công cụ này cũng cung cấp cho bạn tùy chọn kết nối với một số bản phân phối dữ liệu lớn như Cloudera, HortonWorks, MapR, Amazon EMR và thậm chí cả Apache.
Tất cả những gì bạn cần làm là định cấu hình kết nối dữ liệu lớn và thực hiện thao tác kéo và thả đơn giản. Sau đó TOS - Big Data sẽ tự động tạo mã cơ bản. Tiếp theo, bạn có thể dễ dàng triển khai chúng dưới dạng dịch vụ hoặc các công việc độc lập vốn chạy trên cụm dữ liệu lớn như HDFS, Hive, Pig,…
Open Studio cho Big Data là mã nguồn mở hoàn toàn, vì vậy bạn có thể xem mã và làm các công việc như: nhúng thư viện mã Java hiện có, tạo các thành phần riêng hoặc tận dụng các thành phần và mã cộng đồng để mở rộng dự án của bạn.