Meta tung AI tạo video và âm thanh, cạnh tranh với Sora của OpenAI

Meta tung AI tạo video và âm thanh, cạnh tranh với Sora của OpenAI

Trong một bước tiến đột phá, Meta - ông chủ của Facebook và Instagram - vừa hé lộ về Movie Gen, một mô hình trí tuệ nhân tạo mới có khả năng tạo ra video và âm thanh theo yêu cầu một cách chân thực đến kinh ngạc. Công cụ này được cho là có thể cạnh tranh với các công cụ từ các startup hàng đầu trong lĩnh vực tạo nội dung như OpenAI và ElevenLabs

Các mẫu sản phẩm của Movie Gen do Meta cung cấp cho thấy những video về động vật bơi lội và lướt sóng, cũng như các đoạn clip sử dụng hình ảnh thật của con người để miêu tả họ thực hiện các hành động như đang vẽ tranh trên canvas.

Nhưng điều thực sự khiến Movie Gen trở nên đặc biệt chính là khả năng tạo ra âm nhạc và hiệu ứng âm thanh đồng bộ hoàn hảo với nội dung video, theo thông tin từ Meta. Ngoài ra, công cụ này cũng có thể chỉnh sửa video.

Không chỉ dừng lại ở việc tạo ra video mới, Movie Gen còn thể hiện khả năng chỉnh sửa video hiện có một cách ấn tượng. Trong một video mẫu, Meta đã yêu cầu công cụ chèn những quả bóng pom-pom vào tay một người đang chạy một mình giữa sa mạc. Ở một ví dụ khác, bãi đỗ xe nơi một tay trượt ván đang biểu diễn đã được biến đổi từ mặt đất khô ráo thành một vũng nước đang tung tóe.

Meta tự tin khẳng định rằng Movie Gen có thể tạo ra các video dài tới 16 giây, trong khi âm thanh có thể kéo dài tới 45 giây. Công ty cũng chia sẻ dữ liệu cho thấy, qua các bài kiểm tra, mô hình này hoạt động vượt trội hơn so với các sản phẩm từ các startup như Runway, OpenAI, ElevenLabs và Kling.

Sự xuất hiện của Movie Gen diễn ra trong bối cảnh Hollywood đang tìm cách khai thác công nghệ video AI tạo sinh. Trước đó, vào tháng 2, OpenAI - với sự hậu thuẫn của Microsoft - đã giới thiệu Sora, một công cụ có khả năng tạo ra các video giống như phim điện ảnh theo yêu cầu bằng văn bản.

Trong khi các chuyên gia công nghệ trong ngành giải trí đang háo hức với viễn cảnh sử dụng những công cụ như vậy để nâng cao và đẩy nhanh quá trình làm phim, nhiều người lại lo ngại về việc áp dụng các hệ thống dường như đã được đào tạo trên các tác phẩm có bản quyền mà không có sự cho phép. Không chỉ vậy, các nhà lập pháp cũng đã nêu ra những lo ngại về cách thức các video giả mạo được tạo ra bởi AI, hay còn gọi là deepfake, đang được sử dụng trong các cuộc bầu cử trên khắp thế giới, từ Mỹ, Pakistan, Ấn Độ đến Indonesia.

Trước những lo ngại này, Meta cho biết họ chưa có kế hoạch phát hành Movie Gen để các nhà phát triển sử dụng rộng rãi như họ đã làm với loạt mô hình ngôn ngữ lớn Llama. Thay vào đó, công ty đang làm việc trực tiếp với cộng đồng giải trí và các nhà sáng tạo nội dung về việc sử dụng Movie Gen, đồng thời lên kế hoạch tích hợp nó vào các sản phẩm của Meta vào năm tới.

Theo bài đăng trên blog và một bài báo nghiên cứu về công cụ này được Meta công bố, công ty đã sử dụng kết hợp các bộ dữ liệu được cấp phép và công khai để xây dựng Movie Gen.

Trong khi đó, cuộc đua AI trong ngành giải trí vẫn đang diễn ra sôi nổi. OpenAI đã gặp gỡ các giám đốc điều hành và đại lý ở Hollywood để thảo luận về các hợp tác tiềm năng liên quan đến Sora. Lions Gate Entertainment, công ty đứng sau The Hunger Games và Twilight, cũng đã thông báo vào tháng 9 rằng họ đang cung cấp cho startup AI Runway quyền truy cập vào thư viện phim và truyền hình của mình để đào tạo một mô hình AI.

Vũ Hạo (Theo The Guardian)

FILI