Những điều cần biết về Gemini Omni

  • 1 Đánh giá

Gemini Omni là một công cụ AI mới, mang tới nhiều lợi ích sáng tạo video vượt trội. Dưới đây là những điều bạn cần biết về Google Gemini Omni.

Gemini Omni

Google Omni là mô hình AI mới, có thể tạo ra bất cứ thứ gì từ dữ liệu bạn nhập vào — bắt đầu từ video. Với Omni, bạn có thể kết hợp hình ảnh, âm thanh, video và văn bản làm đầu vào và tạo ra các video chất lượng cao dựa trên kiến ​​thức thực tế của Gemini. Dưới đây là những điều cần biết về Google Omni.

Gemini Omni là gì?

Gemini Omni là mô hình truyền thông đa phương thức gốc đầu tiên của Google DeepMind. Phiên bản đầu tiên trong dòng sản phẩm này là Gemini Omni Flash, hiện đã được đưa vào sử dụng trong:

  • Ứng dụng Gemini
  • Google Flow
  • YouTube Shorts

Omni chấp nhận bất kỳ sự kết hợp nào giữa văn bản, hình ảnh, âm thanh và video làm đầu vào và tạo ra video. Điểm mấu chốt ở đây là không có sự chuyển tiếp giữa các hệ thống khác nhau; tất cả đều là một mô hình duy nhất.

Cho đến nay, Google sử dụng một hệ thống phân tách: Veo cho video, Imagen cho hình ảnh và các hệ thống riêng biệt cho âm thanh. Omni hợp nhất điều đó thành một mô hình duy nhất (do đó có tên gọi này!) có thể xử lý đa phương thức. Trên thực tế, điều đó dẫn đến việc chỉnh sửa mạch lạc hơn và ít lỗi trong quy trình xử lý hơn.

Tính năng chính của Gemini Omni

Chỉnh sửa video bằng hội thoại

Tính năng nổi bật nhất là chỉnh sửa video bằng hội thoại. Bạn đưa cho Omni một đoạn video (do bạn tạo ra hoặc quay bằng điện thoại), rồi thay đổi clip bằng cách nói chuyện với nó. Ví dụ: "Làm cho đèn mờ đi." "Thay đổi góc máy quay lên phía sau vai cô gái." "Làm cho cây vĩ cầm vô hình." Mỗi hướng dẫn sẽ được lưu lại sau mỗi lần tương tác.

Cơ chế vật lý và thông tin thực tế

Google đã nhấn mạnh điều này khi ra mắt. Omni có khả năng nắm bắt trực quan về trọng lực, động năng và động lực học chất lỏng.

Chuyển bản phác thảo và hình vẽ thành video

Bạn có thể biến những hình vẽ nguệch ngoạc thành cảnh quay chân thực, chỉ sử dụng bản phác thảo như một hướng dẫn chuyển động chứ không phải là hình ảnh tham khảo cuối cùng. Điều này sẽ hữu ích trong giai đoạn tiền sản xuất. Trẻ em cũng sẽ thích điều này, đặc biệt là với các bức vẽ của chúng.

Dấu bản quyền SynthID và chứng chỉ nội dung C2PA

Mỗi sản phẩm đầu ra của Omni đều đi kèm với hai lớp chứng minh nguồn gốc. SynthID là một dấu bản quyền vô hình được nhúng trực tiếp vào các pixel ngay từ khi tạo ra hình ảnh. Người xem không thể nhận biết được nó. Và nó được thiết kế để tồn tại sau khi cắt xén, sử dụng bộ lọc và mã hóa lại.

Chứng chỉ nội dung C2PA được đính kèm cùng với nó dưới dạng một bản kê khai mã hóa đã ký được gắn vào tệp. Loại bỏ siêu dữ liệu, tín hiệu ở cấp độ pixel vẫn được giữ nguyên.

Điều đáng lưu ý: SynthID là công nghệ độc quyền của Google. Chỉ các mô hình của Google mới nhúng nó, vì vậy "không có dấu bản quyền" không có nghĩa là "do con người tạo ra" — nó chỉ có nghĩa là "không phải từ mô hình của Google". Với việc Omni có thể dễ dàng phối lại các cảnh quay thực, chứng minh nguồn gốc bền vững trên mọi sản phẩm đầu ra bắt đầu trở nên ít giống như một tính năng "nên có" mà giống như một điều kiện tiên quyết.

Một ví dụ thử nghiệm dùng Gemini Omni Flash

Đây là kết quả từ một bài test thử nghiệm kiến thức thực tế và vật lý của Gemini Omni. Prompt:

A medieval trebuchet launching a fired clay pot at a stone castle wall, shot in slow motion. The counterweight falls, the sling whips around, the pot arcs through the air and shatters against the stone, shards and embers scattering across the courtyard. Continuous handheld camera move, golden hour light, period-accurate construction and dress. Realistic sound design — wood creaking under tension, rope strain, the whoosh of the sling, the sharp crack of impact. No music.

Bạn sẽ nhận được thông báo chờ vài phút, nhưng thực tế chỉ mất khoảng 10 giây.

Thử nghiệm dùng Google Omni

Một hình ảnh trong video kết quả:

Video được tạo từ Google Omni

Cách truy cập Gemini Omni: Giá cả và các gói dịch vụ

Hiện tại, quyền truy cập nằm trong các gói dịch vụ AI dành cho người tiêu dùng của Google tại Mỹ:

  • AI Plus với giá 7,99 USD/tháng
  • AI Pro với giá 19,99 USD/tháng và
  • AI Ultra với giá 249,99 USD/tháng

Số lượng credit được phân bổ tỷ lệ thuận với gói dịch vụ: Plus nhận được 200 credit AI hàng tháng, Pro nhận được 1.000 credit.

Cập nhật: 21/05/2026
  • lượt xem
Xem thêm: Gemini Omni