Luma AI, một công ty khởi nghiệp có trụ sở tại San Francisco, đã phát hành Dream Machine 1.5 vào thứ Hai, đánh dấu một bước tiến đáng kể trong lĩnh vực tạo video bằng AI. Phiên bản mới nhất của mô hình chuyển văn bản thành video này mang đến độ chân thực cao hơn, theo dõi chuyển động được cải thiện và khả năng hiểu lời nhắc trực quan hơn.
Dream Machine 1.5 is here 🎉 Now with higher-quality text-to-video, smarter understanding of your prompts, custom text rendering, and improved image-to-video! Level up. https://t.co/G3HUEBE2ng #LumaDreamMachine pic.twitter.com/VQvfSTK0AI
— Luma AI (@LumaLabsAI) August 19, 2024
“Dream Machine 1.5 đã đến”, Luma AI thông báo trên X.com. “Giờ đây với **chất lượng văn bản thành video cao hơn, hiểu rõ hơn về lời nhắc của bạn, kết xuất văn bản tùy chỉnh và hình ảnh thành video được cải thiện! Nâng tầm trải nghiệm của bạn.”
Bản nâng cấp xuất hiện chỉ hai tháng sau khi Dream Machine ra mắt lần đầu, cho thấy tốc độ đổi mới nhanh chóng trong lĩnh vực video AI.
Một trong những cải tiến đáng chú ý nhất là khả năng hiển thị văn bản trong video được tạo của mô hình, một tính năng mà trước đây các mô hình AI gặp khó khăn. Bước tiến này mở ra những khả năng mới cho việc tạo ra các đoạn tiêu đề động, logo động và đồ họa trên màn hình cho bài thuyết trình.
Bước đột phá trong kết xuất văn bản: Video do AI tạo ra giờ đây có thể “nói” ngôn ngữ của bạn
Một người dùng truy cập sớm (@aziz4ai) đã chia sẻ các ví dụ về khả năng của mô hình trên X.com, thể hiện khả năng tạo hiệu ứng hình ảnh phức tạp của nó. Trong một ví dụ, mô hình đã tạo ra “Văn bản 3D chất lỏng óng ánh” tạo thành từ “LUMA”, thể hiện chuyển động mượt mà và thực thi gọn gàng.
1️⃣ 🎥 prompt
Iridescent liquid 3d text 3d “LUMA”. The text appears gradually with motion graphics stile where the liquid gathers to create the letters each once. The motion is neat, clean and smooth. The background is black. pic.twitter.com/TQIBUHLP4k
— AZIZ | AI ART (@aziz4ai) August 17, 2024
Dream Machine 1.5 cũng cho thấy khả năng xử lý lời nhắc không phải tiếng Anh được cải thiện. Cùng một nghệ sĩ đã chứng minh điều này bằng đầu vào ngôn ngữ tiếng Ả Rập, bao gồm yêu cầu “một người đàn ông cắt thịt trên thớt gỗ, biến các miếng thịt thành dòng chữ ‘chuẩn bị hàng ngày’ một cách điện ảnh.”
Video kết quả đã kết hợp liền mạch văn bản và hình ảnh, cho thấy tiềm năng của Dream Machine trong việc tạo nội dung đa ngôn ngữ.
Bản nâng cấp tự hào có tốc độ được cải thiện đáng kể, tạo ra năm giây video chất lượng cao chỉ trong khoảng hai phút. Khả năng tăng hiệu quả này có thể cực kỳ quan trọng đối với những người sáng tạo nội dung và nhà tiếp thị, những người cần lặp lại nhanh chóng các ý tưởng hình ảnh.
“Dân chủ hóa” video AI: Cách Luma AI vượt qua những gã khổng lồ như OpenAI và Kuaishou
Cách tiếp cận của Luma AI trong việc khiến Dream Machine được tiếp cận rộng rãi đã định vị công ty trở thành một nhân tố quan trọng trong thị trường tạo video AI đang phát triển nhanh chóng. Mặc dù lĩnh vực này đang ngày càng trở nên đông đúc, nhưng chiến lược cải tiến liên tục và khả năng tiếp cận công khai của Luma đã tạo nên sự khác biệt.
Sora của OpenAI, mặc dù ấn tượng về khả năng của nó, vẫn đang trong giai đoạn thử nghiệm beta kín, chỉ dành riêng cho các đối tác được chọn. Sự độc quyền này đã hạn chế khả năng thử nghiệm và ứng dụng trong thế giới thực của nó. Ngược lại, Kling của Kuaishou, được phổ biến rộng rãi cách đây khoảng một tháng, đã nhanh chóng thu hút được sự chú ý. Tuy nhiên, Dream Machine của Luma AI đã có thời gian tiếp cận công chúng lâu hơn, cho phép nó xây dựng cơ sở người dùng đáng kể và thu thập phản hồi rộng rãi từ thế giới thực.
Khởi đầu thuận lợi này đã mang lại cho Luma AI một lợi thế trong việc tinh chỉnh mô hình của mình dựa trên các trường hợp sử dụng đa dạng. Việc phát hành Dream Machine 1.5 thể hiện cam kết của công ty đối với việc lặp lại và cải thiện nhanh chóng. Bằng cách kết hợp phản hồi của người dùng và dữ liệu ứng dụng trong thế giới thực, Luma AI đã có thể giải quyết các vấn đề cụ thể và nâng cao các tính năng quan trọng nhất đối với người sáng tạo.
Các nhà phân tích ngành công nghiệp lưu ý rằng cách tiếp cận “phát triển dân chủ hóa” này có thể dẫn đến các công cụ video AI mạnh mẽ và linh hoạt hơn. Nội dung đa dạng do người dùng tạo ra trên nhiều ngành khác nhau cung cấp cho Luma AI một tập dữ liệu phong phú để cải thiện, có khả năng đẩy nhanh chu kỳ phát triển của họ vượt xa những gì mà các hệ thống khép kín có thể đạt được.
Tuy nhiên, cách tiếp cận cởi mở này cũng mang đến những thách thức. Khi video do AI tạo ra trở nên dễ tiếp cận và tinh vi hơn, những lo ngại về việc sử dụng sai mục đích, chẳng hạn như tạo ra deepfake hoặc nội dung gây hiểu nhầm, đã gia tăng. Ngành công nghiệp này đang phải vật lộn với nhu cầu về các phương pháp phát hiện mạnh mẽ và hướng dẫn đạo đức. Vị trí dẫn đầu trong công cuộc dân chủ hóa này của Luma AI đặt công ty vào vị trí đặc biệt để dẫn dắt các cuộc thảo luận về việc sử dụng AI có trách nhiệm, mặc dù công ty vẫn chưa công khai nêu rõ lập trường của mình về những vấn đề quan trọng này.
Khi thị trường tạo video AI tiếp tục phát triển, chiến lược cởi mở và lặp lại nhanh chóng của Luma AI có thể là yếu tố tạo nên sự khác biệt chính. Mặc dù các đối thủ cạnh tranh như Kling đang bắt kịp về mặt khả năng tiếp cận công khai, nhưng lịch sử lâu đời và cơ sở người dùng đã được thiết lập của Luma có thể mang lại cho nó lợi thế bền vững trong cuộc đua xác định tương lai của nội dung video do AI tạo ra.
Tương lai của nội dung trực quan: Cân bằng giữa đổi mới và cân nhắc về mặt đạo đức
Bất chấp những thách thức này, việc phát hành Dream Machine 1.5 đánh dấu một cột mốc quan trọng trong quá trình phát triển của video do AI tạo ra. Khi công nghệ tiếp tục được cải thiện, nó có tiềm năng cách mạng hóa các ngành công nghiệp, từ giải trí và quảng cáo đến giáo dục và báo chí.
Hiện tại, Luma AI dường như tập trung vào việc vượt qua ranh giới kỹ thuật của những gì có thể. Như một người dùng trên Twitter đã lưu ý, “Các khả năng thật đáng kinh ngạc.” Vẫn còn phải xem những khả năng này sẽ định hình như thế nào đối với tương lai của việc tạo và tiêu thụ nội dung trực quan.