ElevenLabs, một startup phát triển các công cụ hỗ trợ bởi AI để tạo và chỉnh sửa giọng nói tổng hợp, đang chính thức phát hành ứng dụng Reader của mình trên toàn thế giới với khả năng hỗ trợ 32 ngôn ngữ.
Ứng dụng này, được phát hành lần đầu tiên vào tháng 6 tại Hoa Kỳ, Vương quốc Anh và Canada, cho phép người dùng tải lên bất kỳ nội dung văn bản nào – chẳng hạn như bài báo, tài liệu PDF hoặc sách điện tử – và nghe nội dung đó bằng các ngôn ngữ và giọng nói khác nhau. Reader hiện hỗ trợ các ngôn ngữ bao gồm tiếng Bồ Đào Nha, Tây Ban Nha, Pháp, Hindi, Đức, Nhật Bản, Ả Rập, Hàn Quốc, Ý, Tamil và Thụy Điển.
ElevenLabs, trở thành kỳ lân (Unicorn) vào đầu năm nay sau khi huy động được 80 triệu đô la từ các nhà đầu tư, bao gồm Andreessen Horowitz, cung cấp API mà các công ty có thể sử dụng cho nhiều trường hợp sử dụng khác nhau như lồng tiếng hoặc chuyển văn bản thành giọng nói. Công ty cung cấp năng lượng cho các tương tác bằng giọng nói trên Rabbit r1, cũng như các tính năng chuyển văn bản thành giọng nói trên công cụ tìm kiếm Perplexity do AI cung cấp và các nền tảng âm thanh Pocket FM và Kuku FM. Ứng dụng Reader là sản phẩm đầu tiên hướng đến người tiêu dùng của công ty.
Công ty khởi nghiệp cho biết họ đã bổ sung hàng trăm giọng nói mới từ thư viện của mình phù hợp với các ngôn ngữ khác nhau. Tháng trước, công ty đã cấp phép giọng nói của các diễn viên như Judy Garland, James Dean, Burt Reynolds và Sir Laurence Olivier cho ứng dụng.
ElevenLabs cho biết khả năng hỗ trợ ngôn ngữ mở rộng được hỗ trợ bởi mô hình Turbo v2.5 của họ, được phát hành vào tháng trước, được cho là làm giảm độ trễ của chuyển đổi văn bản thành giọng nói và cải thiện chất lượng.
Đối thủ cạnh tranh gần nhất của ứng dụng Reader là Speechify, cung cấp các tính năng bổ sung như quét tài liệu để tìm văn bản, tích hợp với Gmail và Canvas, cũng như cho phép người dùng sao chép giọng nói của chính họ để đọc văn bản. Ứng dụng âm thanh dựa trên Audm của Pocket thuộc sở hữu của Mozilla và The New York Times cũng cho phép người dùng nghe nội dung.
ElevenLabs cho biết họ sẽ bổ sung thêm nhiều tính năng cho ứng dụng, chẳng hạn như hỗ trợ ngoại tuyến và khả năng chia sẻ các đoạn âm thanh.