Tạo video bằng AI – Sora hay Runway

Đối thủ OpenAI ra mắt Gen-3 tạo video cho phép cả người sử dụng cuối được tiếp cận rộng rãi

Những lợi thế Runway AI đưa vào trong trong Gen-3

Runway, công ty dựng kỹ xảo AI cho phim đoạt Oscar “Everything Everywhere All At Once”, công bố mô hình tạo video từ văn bản và nhanh chóng gây sốt.

Ra mắt đầu tháng 7, Gen-3 Alpha là bước thay đổi lớn so với mô hình Gen-2 được cung cấp miễn phí trước đó, khi “nâng cấp đáng kể về độ trung thực, tính nhất quán và chuyển động so với trước”. Bên cạnh đó, tốc độ tạo video cũng nhanh hơn nhiều thế hệ cũ.

Ngay sau khi xuất hiện, trên mạng xã hội, nhiều người chia sẻ các video do Gen-3 Alpha tạo ra và thu hút hàng trăm bình luận. Hầu hết khen công cụ mới “tuyệt vời, chân thực”, “không thể tưởng tượng được”, thậm chí lo ngại nhà quay phim, người sáng tạo nội dung video “sẽ mất việc sớm hơn dự tính”. Họ cũng so sánh với Sora của OpenAI và đánh giá “một 9 một 10”, là “đối thủ lớn nhất của Sora”.

Theo Runway, Gen-3 Alpha được phát triển từ đầu, sử dụng cơ sở hạ tầng thế hệ mới được xây dựng có mục đích cho đào tạo đa phương thức quy mô lớn. Mô hình mới được huấn luyện trên hình ảnh và video cùng lúc nhằm cải thiện tính chân thực.

Bên cạnh đó, Runway cũng đưa vào thuật toán AI cho phép cải thiện và kiểm soát chuyển động trong video theo hướng chân thực hơn, “hiểu” chuyển động trong thế giới thực và tái tạo chính xác cho video đầu ra. “Kết quả là, mọi người có thể tạo video gần với thực tế”, đại diện Runway viết trên blog.

So với Gen-2 tạo video dài bốn giây trong khoảng một phút, Gen-3 Alpha có thể xuất video tối thiểu 10 giây trong thời gian chưa tới 30 giây. Người dùng có thể nhập video, hình ảnh hoặc chỉ cần đoạn văn bản ngắn để tạo video. Bản cũ chỉ hỗ trợ ảnh và văn bản.

Khác với Sora vẫn chưa được cung cấp cho người dùng cuối, Gen-3 Alpha đã có mặt để trải nghiệm, nhưng với phí 15 USD mỗi tháng hoặc 144 USD mỗi năm.

Runway ra đời năm 2018, là startup nổi tiếng với 45 nhân viên toàn thời gian. Công ty đang cung cấp công cụ hỗ trợ người dùng chỉnh sửa video nhanh, như xóa phông hay thêm hiệu ứng. Ví dụ trong phim Everything Everywhere All At Once, đoạt giải Oscar 2023, nghệ sĩ hiệu ứng hình ảnh Evan Halleck đã sử dụng AI tiên tiến từ Runway để tạo kỹ xảo. “AI cắt chủ thể tốt hơn so với mắt thường”, ông nói. “Tôi có thể cắt nhân vật ra khỏi khung hình, đặt gọn gàng trên một tấm ảnh trong ít phút, so với việc mất nửa ngày như trước kia”.

Runway được định giá 1,5 tỷ USD sau khi huy động được 141 triệu USD từ các nhà đầu tư như Google, Nvidia. Theo The Infomation ngày 3/7, công ty có thể sắp nhận thêm khoản vốn mới 450 triệu USD, qua đó sẽ được định giá khoảng bốn tỷ USD.

Sora làm được gì

OpenAI đã ví mô hình AI mới của mình là một nghệ sĩ sáng tạo đích thực vì nó không chỉ hiểu biết sâu sắc về ngôn ngữ mà còn có thể tạo ra các video sống động và chính xác các yêu cầu mà người dùng đã cung cấp.

Thông qua các video mà Sora đã tạo ra, người dùng sẽ có thể nhìn thấy các nhân vật sống động và có cảm xúc y như thật. Điều này cho thấy khả năng xây dựng lại vật thể của Sora OpenAI thật đáng kinh ngạc.

Bên cạnh khả năng biến văn bản thành video thì Sora còn có thể sáng tạo video từ những hình ảnh tĩnh. Người dùng chỉ cần cung cấp cho Sora một hình ảnh bất kỳ và nhập mô tả thì nó sẽ tự động tạo ra video theo như yêu cầu của người dùng. Thậm chí Sora còn có thể mở rộng thời lượng video vô cùng tiên tiến. Điều này sẽ giúp ích rất nhiều cho quá trình sáng tạo của người dùng.

Bên cạnh các tính năng trên, Sora còn có khả năng tùy biến và đọc hiểu cao. Nó cho phép bạn có thể thực hiện các điều chỉnh tùy ý trong hình ảnh, từ bối cảnh đến nhân vật,… Do đó, các video do Sora tạo ra bao giờ cũng mới mẻ và thú vị, không bị nhàm chán.

Xem các video được tạo ra bởi Runway Gen 3 và Sora để cùng so sánh nhé. Bên cạnh đó, để tìm hiểu thêm nhiều thông tin hơn về AI, kiến trúc ở đây nhé !

Những lợi thế Runway AI đưa vào trong trong Gen-3

Sora làm được gì

Login