Hôm 20/3, Runway, công ty AI có trụ sở tại New York, giới thiệu công cụ Gen-2. Đây là một công cụ cho phép tạo video từ ảnh tĩnh hoặc văn bản đầu vào. Ví dụ, khi nhập văn bản “bình minh trên biển”, AI sẽ tự động tạo ra một đoạn video 3 giây theo chủ đề này.

AI, chuyển văn bản thành video

Startup Runway được thành lập vào năm 2018 và đã nhanh chóng trở thành một trong những công ty nổi tiếng về trí tuệ nhân tạo (AI), không thua kém OpenAI, với đội ngũ 45 nhân viên toàn thời gian. Công ty đang cung cấp một trang web hỗ trợ người dùng chỉnh sửa video nhanh chóng bằng trí tuệ nhân tạo, cho phép người dùng xóa nền hay thêm hiệu ứng một cách dễ dàng. Họ đã đóng góp cho nhóm phát triển phiên bản đầu tiên của Stable Diffusion - một công nghệ trí tuệ nhân tạo chuyển đổi văn bản thành hình ảnh và sau này được công ty Stability AI phát triển thêm.

Vào tháng 2 năm 2019, Runway đã chính thức giới thiệu Gen-1 - một mô hình chỉnh sửa video tân tiến. Công cụ này tập trung vào việc chuyển đổi cảnh quay video sẵn có bằng cách thêm hoạt cảnh 3D hoặc bộ lọc được tạo ra bởi trí tuệ nhân tạo (AI). Với Gen-2, Runway tiếp tục sử dụng kiến trúc của Gen-1, tuy nhiên, tập trung nhiều hơn vào việc khởi tạo video bằng cách sử dụng văn bản hoặc ảnh đầu vào, hoặc kết hợp cả hai.

Cris Valenzuela, nhà đồng sáng lập và CEO của Runway, đã trình diễn bản demo của Gen-2 trên Twitter. Bản demo này đã cho thấy khả năng của Gen-2 trong việc tạo ra những cảnh quay "drone bay trên bầu trời sa mạc" chỉ trong vài giây. Tuy nhiên, hiện tại, độ phân giải và tính chân thực của Gen-2 vẫn còn hạn chế và chưa có âm thanh đi kèm.

Theo Valenzuela, Gen-2 có thể tạo ra những video về cuộc rượt đuổi bằng ôtô đầy kịch tính, tuy nhiên, đôi khi, Gen-2 còn có thể tạo ra những chiếc ô tô bay lượn trong không trung.

Valenzuela đã khẳng định rằng, nếu yêu cầu đầu vào càng cụ thể, thì nội dung được tạo ra bởi Gen-2 sẽ càng sống động và tương tự như những ảnh tạo bởi trí tuệ nhân tạo như Dall-E hay Stable Diffusion từ văn bản. Trong tương lai, công cụ này sẽ được cải tiến để hỗ trợ nghệ sĩ, nhà thiết kế và nhà làm phim tạo ra các video với chi phí thấp và tốc độ nhanh hơn bằng cách chuyển các ý tưởng thành video.

Giáo sư Hany Farid tại Đại học California đã đánh giá video được tạo ra bởi Gen-2 là "tuyệt vời". Ông dự đoán rằng trong tương lai, công nghệ này sẽ tạo ra các video chất lượng cao hơn và việc này chỉ là vấn đề thời gian.

Mặc dù Gen-2 đang mở ra một cuộc đua mới cho mô hình trí tuệ nhân tạo AI) tổng quát, tuy nhiên, có nguy cơ rằng công nghệ này có thể bị lạm dụng và trở nên nguy hiểm hơn cả deepfake. Những kẻ xấu có thể sử dụng công nghệ này để tạo ra các video giả mạo và lan truyền tin giả, gây ra sự lừa đảo cho người dùng.

Hiện tại, Gen-2 đang bị giới hạn quyền truy cập, và người dùng cần đăng ký và chờ đợi. Tuy nhiên, theo người phát ngôn Kelsey Rondenet của Runway, người dùng sẽ được cấp quyền truy cập rộng rãi trong những tuần tới.