Google phát hành bộ mô hình AI "mở" mới, tập trung vào tính an toàn

Google vừa phát hành bộ ba mô hình AI tạo sinh “mở” mới được xem là “an toàn hơn”, “nhỏ gọn hơn” và “minh bạch hơn” so với hầu hết các mô hình khác – một tuyên bố táo bạo.

Đây là những bổ sung cho dòng mô hình tạo sinh Gemma 2 của Google, ra mắt lần đầu vào tháng 5. Các mô hình mới, Gemma 2 2B, ShieldGemma và Gemma Scope, được thiết kế cho các ứng dụng và trường hợp sử dụng hơi khác nhau, nhưng đều có chung đặc điểm là chú trọng đến an toàn.

Dòng mô hình Gemma của Google khác với dòng Gemini ở chỗ Google không cung cấp mã nguồn cho Gemini (dòng mô hình được sử dụng bởi các sản phẩm của chính Google cũng như dành cho các nhà phát triển). Thay vào đó, Gemma là nỗ lực của Google nhằm thúc đẩy thiện chí trong cộng đồng nhà phát triển, giống như cách Meta đang cố gắng thực hiện với Llama.

Gemma 2 2B là một mô hình gọn nhẹ để tạo và phân tích văn bản có thể chạy trên nhiều loại phần cứng, bao gồm máy tính xách tay và thiết bị edge. Mô hình này được cấp phép cho một số ứng dụng nghiên cứu và thương mại nhất định và có thể được tải xuống từ các nguồn như thư viện mô hình Vertex AI của Google, nền tảng khoa học dữ liệu Kaggle và bộ công cụ AI Studio của Google.

Về phần ShieldGemma, đây là bộ sưu tập “bộ phân loại an toàn” cố gắng phát hiện các nội dung độc hại như ngôn từ kích động thù địch, quấy rối và nội dung khiêu dâm. Được xây dựng dựa trên Gemma 2, ShieldGemma có thể được sử dụng để lọc lời nhắc cho mô hình tạo sinh cũng như nội dung mà mô hình tạo ra.

Cuối cùng, Gemma Scope cho phép các nhà phát triển “phóng to” các điểm cụ thể trong mô hình Gemma 2 và làm cho hoạt động bên trong của nó dễ hiểu hơn. Dưới đây là cách Google mô tả nó trong một bài đăng trên blog: “[Gemma Scope được tạo thành từ] các mạng nơ-ron chuyên biệt giúp chúng tôi giải nén thông tin phức tạp, dày đặc được xử lý bởi Gemma 2, mở rộng nó thành dạng dễ phân tích và hiểu hơn. Bằng cách nghiên cứu các chế độ xem mở rộng này, các nhà nghiên cứu có thể hiểu rõ hơn về cách Gemma 2 xác định các mẫu, xử lý thông tin và đưa ra dự đoán.”

Việc phát hành các mô hình Gemma 2 mới diễn ra ngay sau khi Bộ Thương mại Hoa Kỳ xác nhận các mô hình AI mở trong một báo cáo sơ bộ. Báo cáo cho biết các mô hình mở sẽ mở rộng khả năng tiếp cận trí tuệ nhân tạo tạo sinh cho các công ty nhỏ hơn, nhà nghiên cứu, tổ chức phi lợi nhuận và nhà phát triển cá nhân, đồng thời nêu bật sự cần thiết của các khả năng giám sát các mô hình như vậy để phát hiện các rủi ro tiềm ẩn.