Google Veo là một mô hình tạo video AI được phát triển bởi Google DeepMind. Công cụ này giúp tạo ra các đoạn clip chân thực và chất lượng cao từ văn bản, hình ảnh hoặc thậm chí là video. Veo 3, phiên bản mới nhất của Google Veo, có thể tạo ra âm thanh đi kèm, bao gồm lời thoại, âm thanh xung quanh và nhạc nền.
Google Veo là mô hình tạo video AI mới mạnh mẽ được công bố tại Google I/O 2024 có thể tạo video chất lượng cao ở độ phân giải 1080p, một số video có độ dài hơn một phút. Được phát triển bởi Google DeepMind, công cụ mới này được thiết kế để tạo video từ văn bản và được ra mắt cùng với Imagen - mô hình tạo hình ảnh mới của gã khổng lồ công nghệ này.
Không giống như các mô hình trước đây, Veo có thể tạo ra các video dài hơn một phút, cho phép kể chuyện phức tạp hơn. Nó cũng hiểu được các sắc thái của ngôn ngữ con người và có thể kết hợp chúng vào video, bao gồm cả việc nắm bắt tông điệu và tâm trạng. Veo cũng có thể tạo ra các clip phong cách điện ảnh, giúp người dùng kiểm soát sự sáng tạo đối với video cuối cùng.
Google Veo 3 là phiên bản mới nhất của trình tạo video AI Google Veo. Nó dựa trên các sản phẩm trước đây của Veo nhưng có những cải tiến đáng kể - thêm hiệu ứng âm thanh, tiếng ồn xung quanh và thậm chí cả hộp thoại vào video do AI tạo ra.
Google tuyên bố Veo 3 có thể đồng bộ hóa âm thanh với video một cách hoàn hảo - một bước tiến vượt bậc so với các mẫu video AI khác. Veo 3 cũng tự hào về chất lượng và độ chân thực được cải thiện cho đầu ra video của nó. Mô hình này có thể tạo ra độ phân giải 4K ấn tượng.
Veo 3 cũng cung cấp khả năng kiểm soát và trải nghiệm người dùng tốt hơn với khả năng tuân thủ lời nhắc được cải thiện. Điều này có nghĩa là Veo 3 có thể theo dõi các hành động trong một chuỗi và cảnh với độ chính xác cao hơn. Điều này có thể giúp tạo ra các video có sắc thái đa dạng hơn.
Tạo văn bản thành video: Veo có thể tạo video dựa trên mô tả văn bản, diễn giải các sắc thái và ngôn ngữ điện ảnh của lời nhắc.
Tạo hình ảnh thành video: Công cụ này cũng có thể tạo video từ hình ảnh tĩnh, cung cấp một cách để mở rộng nội dung hình ảnh hiện có.
Tạo âm thanh gốc: Veo 3 giới thiệu khả năng tạo âm thanh bên cạnh video, bao gồm lời nói, nhạc và hiệu ứng âm thanh.
Chuyển động và vật lý thực tế: Google Veo mô phỏng vật lý trong thế giới thực, tạo ra những chuyển động chân thực và chính xác hơn trong các video được tạo ra.
Hiểu rõ lời nhắc chi tiết: Veo diễn giải những lời nhắc phức tạp một cách chính xác, cho phép kiểm soát sáng tạo ở mức độ cao đối với các chi tiết của video, bao gồm góc quay, ánh sáng và hiệu ứng đặc biệt.
Đầu ra có độ nét cao: Veo tạo ra video có độ phân giải cao, bao gồm 1080p và có khả năng cao hơn, mang đến hình ảnh sắc nét và chi tiết.
Phong cách và hiệu ứng điện ảnh: Mô hình này hỗ trợ nhiều phong cách điện ảnh và hiệu ứng hình ảnh, mang đến cho người dùng nhiều lựa chọn hơn cho tầm nhìn sáng tạo của mình.
AI có trách nhiệm: Google nhấn mạnh các hoạt động AI có trách nhiệm với Veo, bao gồm hình mờ kỹ thuật số, bộ lọc an toàn và các biện pháp quản trị dữ liệu.