Trong nỗ lực cạnh tranh với các đối thủ trí tuệ nhân tạo (AI) như Anthropic và OpenAI, Google đang tung ra bản cập nhật cho Gemini, chatbot AI miễn phí của mình. Bản cập nhật tập trung vào việc giúp nền tảng hoạt động hiệu quả hơn và có sẵn rộng rãi hơn.
Gemini 1.5 Flash: Hiệu Suất Cao, Tiếp Cận Rộng
Bắt đầu từ thứ Năm, Gemini 1.5 Flash – một mô hình đa phương thức gọn nhẹ được Google công bố vào tháng 5 – sẽ có sẵn trên web và thiết bị di động ở 40 ngôn ngữ và khoảng 230 quốc gia. Google tuyên bố rằng Gemini 1.5 Flash mang đến những nâng cấp về chất lượng và độ trễ, với những cải tiến đáng chú ý về khả năng lập luận và hiểu hình ảnh.
Một lợi ích cho Google là mô hình này có thể rẻ hơn để chạy ở backend.
Tại buổi ra mắt Gemini 1.5 Flash, Google đã nhấn mạnh rằng mô hình này là phiên bản “tinh gọn” và hiệu quả cao của Gemini 1.5 Pro, được xây dựng cho những gì công ty mô tả là khối lượng công việc AI “hẹp”, “tần suất cao”. Do chi phí vận hành một nền tảng chatbot như Gemini (xem: Hóa đơn ChatGPT của OpenAI), Google chắc chắn rất muốn nắm bắt các cơ hội giảm chi phí, đặc biệt nếu những cơ hội đó có tác dụng phụ may mắn là tăng hiệu suất trong các lĩnh vực khác.
Cửa Sổ Ngữ Cảnh Mở Rộng và Khả Năng Tải Lên Tệp
Ngoài mô hình cơ sở mới, Google cho biết họ đang mở rộng cửa sổ ngữ cảnh của Gemini lên 32.000 token, tương đương với khoảng 24.000 từ (hoặc 48 trang văn bản).
Ngữ cảnh hoặc cửa sổ ngữ cảnh đề cập đến dữ liệu đầu vào (ví dụ: văn bản) mà mô hình xem xét trước khi tạo đầu ra (ví dụ: văn bản bổ sung). Một số lợi thế của các mô hình có ngữ cảnh lớn hơn là chúng có thể tóm tắt và lập luận trên các đoạn văn bản và tệp dài hơn (ít nhất là trên lý thuyết) và – trong ngữ cảnh chatbot – chúng ít có khả năng quên các chủ đề đã được thảo luận gần đây.
Trước đây, khả năng tải tệp lên Gemini để phân tích yêu cầu phải có Gemini Advanced, phiên bản trả phí của Gemini được tích hợp trong Gói Google One AI Premium trị giá 20 đô la mỗi tháng của Google. Nhưng Google cho biết họ sẽ sớm cho phép tải lên tệp từ Google Drive và thiết bị cục bộ cho tất cả người dùng Gemini.
“Bạn sẽ có thể thực hiện những việc như tải lên tài liệu học tập kinh tế của mình và yêu cầu Gemini tạo câu hỏi luyện tập”, Amar Subramanya, Phó chủ tịch kỹ thuật của Google, đã viết trong một bài đăng trên blog được chia sẻ với TechCrunch. “Gemini cũng sẽ sớm có thể phân tích các tệp dữ liệu cho bạn, cho phép bạn khám phá thông tin chi tiết và hình dung chúng thông qua biểu đồ và đồ họa.”
Chống Ảo Giác và Minh Bạch Nguồn Thông Tin
Để cố gắng chống lại ảo giác – trường hợp mà một mô hình AI tạo sinh như Gemini 1.5 Flash bịa đặt thông tin – Google đang xem trước một tính năng hiển thị liên kết đến nội dung web có liên quan bên dưới các câu trả lời do Gemini tạo ra. Người dùng Gemini nói tiếng Anh ở một số vùng lãnh thổ nhất định sẽ thấy biểu tượng “con chip” ở cuối đoạn văn bản do Gemini tạo ra với liên kết đến các trang web – hoặc email, nếu bạn đã cấp cho Gemini quyền truy cập vào hộp thư đến Gmail của mình – nơi bạn có thể tìm hiểu sâu hơn.
Động thái này được đưa ra sau khi có thông tin tiết lộ rằng các mô hình AI tạo sinh của Google dễ bị ảo giác một cách khá tệ – ví dụ: gợi ý keo không độc hại trong công thức bánh pizza và tạo ra các bài đánh giá sách giả mạo được gán cho người thật. Đầu năm nay, Google đã phát hành tính năng “kiểm tra chéo” trong Gemini được thiết kế để làm nổi bật các câu do Gemini tạo ra mà các nguồn trực tuyến khác chứng thực hoặc mâu thuẫn. Nhưng các liên kết nội dung có liên quan dường như là một nỗ lực nhằm minh bạch hơn về nguồn thông tin mà Gemini có thể đang sử dụng.
Câu hỏi trong tâm trí của phóng viên này là tần suất và mức độ chính xác mà Gemini sẽ hiển thị các liên kết có liên quan. Cần chờ xem.
Mở Rộng Tiếp Cận và Hỗ Trợ Thanh Thiếu Niên
Tuy nhiên, Google không chờ đợi để tràn ngập các kênh.
Sau khi ra mắt Gemini trong Tin nhắn cho một số thiết bị được chọn vào đầu năm nay, Google đang triển khai tính năng này ở Khu vực Kinh tế Châu Âu (EEA), Vương quốc Anh và Thụy Sĩ, với khả năng trò chuyện bằng các ngôn ngữ mới được bổ sung như tiếng Pháp, tiếng Ba Lan và tiếng Tây Ban Nha. Người dùng có thể tìm thấy Gemini trong Tin nhắn bằng cách nhấn vào nút “Bắt đầu trò chuyện” và chọn Gemini làm bạn trò chuyện.
Google cũng đang ra mắt ứng dụng Gemini dành cho thiết bị di động ở nhiều quốc gia hơn và mở rộng quyền truy cập Gemini cho thanh thiếu niên trên toàn cầu.
Công ty đã giới thiệu trải nghiệm Gemini dành riêng cho thanh thiếu niên vào tháng 6, cho phép học sinh đăng ký bằng tài khoản trường học của mình – mặc dù không phải ở tất cả các quốc gia. Trong tuần tới, điều đó sẽ thay đổi khi Gemini sẽ khả dụng cho thanh thiếu niên ở mọi quốc gia và khu vực mà Gemini thường khả dụng cho người lớn.
Trùng với việc triển khai, Google cho biết họ đang áp dụng “các chính sách và biện pháp bảo vệ bổ sung” để bảo vệ thanh thiếu niên – mà không đi sâu vào chi tiết. Một quy trình giới thiệu phù hợp với lứa tuổi thanh thiếu niên cũng đang được tiến hành, cùng với “hướng dẫn sử dụng AI” để – như cách Google diễn đạt – “giúp thanh thiếu niên sử dụng AI một cách có trách nhiệm.”
Việc trẻ em đang tận dụng các công cụ AI tạo sinh theo cách mà chúng được thiết kế hay đang lạm dụng chúng là chủ đề gây tranh cãi lớn. Google chắc chắn rất muốn tránh những tiêu đề cho thấy Gemini là một công cụ tạo bài luận đạo văn hoặc có khả năng đưa ra lời khuyên tồi tệ cho thanh thiếu niên về các vấn đề cá nhân, và do đó, hãy thực hiện các biện pháp có thể để ngăn chặn điều tồi tệ nhất xảy ra.