Trí tuệ nhân tạo (AI) đã trở thành bước tiến công nghệ được nhắc đến nhiều nhất thập kỷ này. Khi chúng ta không ngừng mở rộng ranh giới của những gì máy móc có thể làm, mục tiêu cuối cùng của nhiều gã khổng lồ công nghệ là đạt được Trí tuệ nhân tạo tổng quát (AGI) – một dạng AI giả định có thể hiểu, học hỏi và áp dụng trí thông minh của nó để giải quyết bất kỳ vấn đề nào, giống như bộ não con người.
Cuộc đua hướng tới AGI không chỉ là vấn đề về uy thế công nghệ; mà còn là một sứ mệnh có thể định hình lại toàn bộ kết cấu xã hội của chúng ta. Các ứng dụng tiềm năng của AGI là rất lớn và mang tính biến đổi, từ việc giải quyết các vấn đề toàn cầu phức tạp đến cách mạng hóa các ngành trên diện rộng. Đây là lý do tại sao các công ty công nghệ hàng đầu thế giới đang đầu tư hàng tỷ đô la và vô số giờ vào nghiên cứu và phát triển AI.
Trong bài viết này, chúng ta sẽ cùng tìm hiểu những nỗ lực của những cái tên chủ chốt trong cuộc đua AI, bao gồm Google, NVIDIA, Microsoft, OpenAI, Meta và những công ty khác. Chúng ta sẽ đi sâu vào chiến lược, thành tựu của họ và những cách tiếp cận độc đáo mà họ đang thực hiện để vượt qua ranh giới của công nghệ AI.
Hiểu về AGI
AGI là gì?
AGI, thường được mô tả là “chén thánh” của trí tuệ nhân tạo, được hình dung như một hệ thống có khả năng thực hiện bất kỳ nhiệm vụ trí tuệ nào mà con người có thể làm. Tuy nhiên, việc định nghĩa AGI cũng khó khăn như việc đạt được nó. Geoffrey Hinton, một nhân vật tiên phong trong lĩnh vực AI, lưu ý rằng mặc dù AGI là một “khái niệm nghiêm túc, mặc dù chưa được xác định rõ ràng”, nhưng có rất ít sự đồng thuận về chính xác những gì nó đòi hỏi. Hinton thích thuật ngữ “siêu trí tuệ” để mô tả các hệ thống AGI sẽ vượt qua khả năng nhận thức của con người.
Bản chất khó nắm bắt của AGI
Những gã khổng lồ công nghệ hàng đầu, bao gồm OpenAI, Google, Meta, Microsoft và Amazon, đang đi đầu trong cuộc đua này. Mỗi công ty đều mang đến những thế mạnh và mục tiêu chiến lược riêng. Ví dụ, OpenAI cam kết sâu sắc trong việc đảm bảo rằng AGI, sau khi được phát triển, sẽ mang lại lợi ích cho toàn nhân loại. Tổ chức này đã thiết lập cấu trúc quản trị, trong đó hội đồng quản trị sẽ quyết định thời điểm hệ thống của họ đạt được AGI, một cột mốc sẽ tác động đáng kể đến quan hệ đối tác của họ với Microsoft.
Google từ lâu đã đi đầu trong nghiên cứu và phát triển AI, với hai bộ phận chính dẫn đầu là DeepMind và Google Brain.
A. DeepMind và những thành tựu của nó
DeepMind, được Google mua lại vào năm 2014, là công ty đứng sau một số thành tựu đột phá nhất trong lĩnh vực AI. Chương trình AlphaGo của họ đã đánh bại nhà vô địch thế giới trong trò chơi cờ vây phức tạp vào năm 2016, một kỳ tích mà nhiều người cho rằng phải mất hàng thập kỷ nữa mới đạt được. Tiếp theo là AlphaZero, đạt hiệu suất siêu phàm trong cờ vua, shogi và cờ vây thông qua học tăng cường tự chơi.
Gần đây hơn, DeepMind đã đạt được những bước tiến đáng kể trong việc gấp protein với AlphaFold. Hệ thống AI này có thể dự đoán cấu trúc protein với độ chính xác đáng kinh ngạc, có khả năng cách mạng hóa việc khám phá thuốc và hiểu biết của chúng ta về các loại bệnh.
B. Google Brain và TensorFlow
Google Brain, nhóm nghiên cứu AI nội bộ của công ty, đã góp phần tạo ra các công cụ và framework đã thúc đẩy nghiên cứu AI trên toàn thế giới. TensorFlow, một thư viện máy học mã nguồn mở do Google Brain phát triển, đã trở thành một trong những công cụ được sử dụng rộng rãi nhất để xây dựng các mô hình AI.
Google Brain cũng có những đóng góp đáng kể cho xử lý ngôn ngữ tự nhiên với các mô hình như BERT (Bidirectional Encoder Representations from Transformers), giúp cải thiện kết quả tìm kiếm của Google và khả năng hiểu ngôn ngữ.
C. Những phát triển gần đây và kế hoạch tương lai
Google tiếp tục vượt qua ranh giới của AI với các dự án như LaMDA (Mô hình Ngôn ngữ cho Ứng dụng Đối thoại), nhằm mục đích giúp AI đàm thoại trở nên tự nhiên và nhận biết ngữ cảnh hơn. Công ty cũng đang nỗ lực tích hợp AI sâu hơn vào các sản phẩm của mình, từ Google Tìm kiếm đến Gmail và Google Photos.
Về phần cứng, Google đã phát triển chip AI của riêng mình, được gọi là Bộ xử lý Tensor (TPU), được tối ưu hóa cho khối lượng công việc học máy. Những con chip này cung cấp năng lượng cho nhiều dịch vụ AI của Google và cũng có sẵn cho khách hàng thông qua Google Cloud.
Trong tương lai, chiến lược AI của Google dường như tập trung vào việc phát triển các hệ thống AI đa năng và linh hoạt hơn, có thể xử lý nhiều loại nhiệm vụ, tiến gần hơn đến khái niệm AGI. Công ty cũng đầu tư rất nhiều vào nghiên cứu máy tính lượng tử.
Vai trò của NVIDIA trong Hệ sinh thái AI
Mặc dù NVIDIA có thể không phải là một cái tên quen thuộc như Google hay Microsoft, nhưng nó đóng một vai trò quan trọng trong hệ sinh thái AI với tư cách là nhà cung cấp phần cứng hàng đầu cung cấp năng lượng cho các phép tính AI.
A. GPU thống trị trong phần cứng AI
Bộ xử lý đồ họa (GPU) của NVIDIA đã trở thành tiêu chuẩn thực tế để đào tạo và chạy các mô hình AI. Ban đầu được thiết kế để kết xuất đồ họa trong trò chơi điện tử, GPU hóa ra lại đặc biệt phù hợp cho xử lý song song cần thiết trong các phép tính AI.
Doanh thu trung tâm dữ liệu của NVIDIA, phần lớn được thúc đẩy bởi doanh số bán hàng liên quan đến AI, đã tăng trưởng nhanh chóng. Năm 2022, công ty đã giới thiệu GPU H100, dựa trên kiến trúc Hopper mới, hứa hẹn cải thiện hiệu suất đáng kể cho khối lượng công việc AI.
B. Ngăn xếp phần mềm AI của NVIDIA
Ngoài phần cứng, NVIDIA đã phát triển một ngăn xếp phần mềm toàn diện để phát triển AI. Điều này bao gồm CUDA, một nền tảng tính toán song song và mô hình lập trình cho phép các nhà phát triển khai thác sức mạnh của GPU NVIDIA để xử lý đa mục đích.
NVIDIA cũng cung cấp các công cụ như cuDNN (thư viện Mạng Nơ-ron Sâu CUDA) và TensorRT, giúp tối ưu hóa hiệu suất học sâu trên GPU NVIDIA. Các công cụ này được sử dụng rộng rãi trong cộng đồng AI và đã góp phần vào vị thế thống lĩnh của NVIDIA trên thị trường phần cứng AI.
C. Quan hệ đối tác và hợp tác
NVIDIA đã hình thành quan hệ đối tác chiến lược với nhiều công ty công nghệ và tổ chức nghiên cứu hàng đầu. Ví dụ: công ty hợp tác chặt chẽ với các nhà sản xuất xe tự lái để cung cấp giải pháp hỗ trợ AI cho xe tự lái. Công ty cũng đã hợp tác với các tổ chức y tế để áp dụng AI trong hình ảnh y tế và khám phá thuốc.
Năm 2022, NVIDIA đã công bố hợp tác với Booz Allen Hamilton để phát triển các giải pháp an ninh mạng hỗ trợ AI cho chính phủ Hoa Kỳ và cơ sở hạ tầng quan trọng. Điều này cho thấy tầm quan trọng ngày càng tăng của AI trong các ứng dụng an ninh và quốc phòng.
Microsoft’s AI Strategy
Microsoft đã định vị chiến lược bản thân là người dẫn đầu trong lĩnh vực AI bằng cách tận dụng các mối quan hệ đối tác và đầu tư vào các công ty khởi nghiệp AI chủ chốt. Khoản đầu tư 13 tỷ USD của công ty vào OpenAI đã mang đến cho họ quyền truy cập độc quyền vào các mô hình của OpenAI, vốn đã được tích hợp vào các sản phẩm của Microsoft như GitHub Copilot và nền tảng Azure AI.
A. Azure AI và các dịch vụ đám mây
Nền tảng đám mây của Microsoft, Azure, cung cấp một loạt các dịch vụ AI cho phép các doanh nghiệp kết hợp AI vào ứng dụng của họ. Các dịch vụ này bao gồm các lĩnh vực như học máy, thị giác máy tính, xử lý ngôn ngữ tự nhiên và nhận dạng giọng nói.
Azure Machine Learning, một môi trường dựa trên đám mây để đào tạo, triển khai và quản lý các mô hình học máy, đã trở thành lựa chọn phổ biến cho các doanh nghiệp đang tìm cách triển khai các giải pháp AI. Chiến lược cung cấp các công cụ AI dễ sử dụng của Microsoft đã giúp dân chủ hóa sự phát triển AI và đẩy nhanh việc áp dụng nó trên nhiều ngành khác nhau.
B. Tích hợp AI trên các sản phẩm của Microsoft
Microsoft đã và đang tích hợp ổn định các khả năng AI trên dòng sản phẩm của mình. Trong Microsoft 365 (trước đây là Office), AI cung cấp năng lượng cho các tính năng như so soạn thông minh trong Outlook, thiết kế trang trình bày tự động trong PowerPoint và phân tích dữ liệu trong Excel.
Windows 11 đã được tích hợp AI nhiều hơn với các tính năng như Windows Studio Effects, sử dụng AI để làm mờ hậu cảnh, giao tiếp bằng mắt và tự động căn khung hình trong các cuộc gọi điện video. Công ty cũng đã giới thiệu các tính năng hỗ trợ AI trong trình duyệt Edge và công cụ tìm kiếm Bing, tận dụng các mô hình ngôn ngữ lớn để mang đến trải nghiệm tìm kiếm tương tác và nhiều thông tin hơn.
Bước tiến nhanh chóng của OpenAI
OpenAI vẫn là một nhân vật trung tâm trong lĩnh vực AI, đặc biệt là với sứ mệnh phát triển AGI. Công ty là người tiên phong trong việc tạo ra một số mô hình ngôn ngữ tiên tiến nhất, bao gồm GPT-4 và GPT-5 sắp ra mắt. Các mô hình của OpenAI không chỉ dẫn đầu về khả năng kỹ thuật mà còn về tích hợp thương mại, nhờ vào mối quan hệ đối tác sâu sắc với Microsoft.
Tham vọng AGI của OpenAI đã được ghi chép rõ ràng, với việc Giám đốc điều hành Sam Altman tuyên bố rằng việc đạt được AGI sẽ đại diện cho “công nghệ mạnh mẽ nhất mà loài người từng phát minh ra”. Cách tiếp cận phát triển AI của công ty cân bằng giữa đổi mới tiên tiến với việc chú trọng đến các cân nhắc về đạo đức và tác động xã hội. Tuy nhiên, chi phí cao liên quan đến việc đào tạo các mô hình lớn đã đòi hỏi nguồn tài trợ bên ngoài đáng kể, bao gồm các cuộc đàm phán với các nhà đầu tư như chính phủ UAE để đảm bảo tới 7 nghìn tỷ USD cho các dự án sản xuất chip AI trong tương lai.
A. Dòng GPT và tác động của nó
Thành tựu đáng chú ý nhất của OpenAI là sự phát triển của dòng mô hình ngôn ngữ GPT (Generative Pre-trained Transformer). GPT-3, được phát hành vào năm 2020, là một yếu tố thay đổi cuộc chơi trong lĩnh vực xử lý ngôn ngữ tự nhiên, thể hiện khả năng tạo văn bản giống người chưa từng có.
Việc phát hành GPT-4 vào năm 2023 tiếp tục vượt qua ranh giới của những gì có thể với các mô hình ngôn ngữ. GPT-4 đã chứng minh khả năng lập luận được cải thiện, giảm ảo giác và khả năng xử lý đầu vào đa phương thức (văn bản và hình ảnh). Các mô hình này đã tìm thấy ứng dụng trong nhiều lĩnh vực, từ tạo nội dung đến tạo mã đến dịch vụ khách hàng tự động.
B. DALL-E và AI đa phương thức
Ngoài tạo văn bản, OpenAI đã có những bước tiến đáng kể trong việc tạo hình ảnh với DALL-E. Hệ thống AI này có thể tạo ra những hình ảnh độc đáo từ mô tả văn bản, thể hiện tiềm năng của AI trong các lĩnh vực sáng tạo. Phiên bản mới nhất, DALL-E 3, đã cải thiện chất lượng và độ chính xác của hình ảnh được tạo, đồng thời giới thiệu các tính năng như vẽ trong và vẽ ngoài.
Những phát triển này trong AI đa phương thức – các hệ thống có thể hoạt động với các loại dữ liệu khác nhau như văn bản và hình ảnh – đại diện cho một bước tiến quan trọng hướng tới các hệ thống AI tổng quát hơn.
Các sáng kiến AI của Meta
Meta, dưới sự lãnh đạo của Giám đốc điều hành Mark Zuckerberg, đã chuyển trọng tâm sang phát triển Trí tuệ nhân tạo tổng quát (AGI). Chiến lược của Meta liên quan đến việc xây dựng các hệ thống AGI có thể thực hiện nhiều loại nhiệm vụ phức tạp cũng như hoặc tốt hơn con người. Mục tiêu đầy tham vọng này phản ánh tầm nhìn rộng lớn hơn của Meta về việc tích hợp AI tiên tiến trên hệ sinh thái ứng dụng và dịch vụ khổng lồ của mình.
Để hỗ trợ nỗ lực này, Meta đang đầu tư rất nhiều vào năng lực tính toán, với kế hoạch sở hữu hơn 340.000 GPU H100 của Nvidia vào cuối năm 2024. Khả năng tính toán khổng lồ này là rất quan trọng để đào tạo các mô hình AI quy mô lớn như LLaMA 3, đã được ra mắt gần đây.
A. PyTorch và những đóng góp mã nguồn mở
Một trong những đóng góp quan trọng nhất của Meta cho cộng đồng AI là PyTorch, một thư viện máy học mã nguồn mở. PyTorch đã được áp dụng rộng rãi trong cộng đồng nghiên cứu do tính linh hoạt và dễ sử dụng, đặc biệt là đối với các ứng dụng học sâu.
Meta AI, bộ phận nghiên cứu AI của công ty, thường xuyên công bố nghiên cứu của mình và phát hành các công cụ mã nguồn mở, đóng góp cho hệ sinh thái AI rộng lớn hơn. Cách tiếp cận cởi mở này đã giúp Meta thu hút những tài năng AI hàng đầu và luôn đi đầu trong nghiên cứu AI.
B. AI trong mạng xã hội và metaverse
Meta tận dụng AI rộng rãi trên các nền tảng mạng xã hội của mình (Facebook, Instagram, WhatsApp) để đề xuất nội dung, nhắm mục tiêu quảng cáo và kiểm duyệt nội dung. Các thuật toán đề xuất của công ty xử lý một lượng lớn dữ liệu để cá nhân hóa trải nghiệm người dùng.
C. Những đột phá và thách thức gần đây
Năm 2024, Meta đã công bố một số đột phá về AI, bao gồm Mô hình Phân đoạn Bất kỳ (SAM), một mô hình AI mới để phân đoạn hình ảnh có thể xác định và phác thảo các đối tượng trong hình ảnh và video với độ chính xác đáng chú ý. Họ cũng giới thiệu một loạt các LLM mã nguồn mở phổ biến nhất được gọi là LLaMA (Mô hình Ngôn ngữ Lớn Meta AI).
Tuy nhiên, Meta đã phải đối mặt với những thách thức, đặc biệt là trong việc kiểm duyệt nội dung. Công ty đã phải vật lộn để sử dụng AI một cách hiệu quả để chống lại thông tin sai lệch và ngôn từ kích động thù địch trên nền tảng của mình, nêu bật sự phức tạp của việc áp dụng AI vào các vấn đề xã hội trong thế giới thực.
Những tên tuổi đáng chú ý khác
A. IBM và Watsonx
IBM tiếp tục là một tay chơi lớn trong lĩnh vực AI với nền tảng watsonx, nền tảng này đã phát triển đáng kể kể từ khi ra đời. Trọng tâm của IBM đã chuyển sang việc làm cho AI trở nên cởi mở, dễ tiếp cận và có khả năng mở rộng hơn cho các doanh nghiệp. Nền tảng watsonx hiện bao gồm một bộ công cụ tự động hóa được hỗ trợ bởi AI và khả năng quản trị cho phép các doanh nghiệp tích hợp và quản lý các giải pháp AI hiệu quả hơn trên nhiều lĩnh vực khác nhau như hoạt động CNTT, an ninh mạng và dịch vụ khách hàng.
Gần đây, IBM đã giới thiệu các khả năng AI tổng quát để nâng cao Dịch vụ Phản hồi và Phát hiện Mối đe dọa được quản lý của mình. Điều này bao gồm một Trợ lý An ninh mạng mới được hỗ trợ bởi AI được thiết kế để hợp lý hóa và tăng tốc việc điều tra và ứng phó với các mối đe dọa bảo mật, tiếp tục tận dụng các khả năng AI rộng lớn hơn của IBM được xây dựng trên nền tảng watsonx.
IBM cũng đang thúc đẩy quan hệ đối tác chiến lược với các công ty như AWS, Adobe, Meta và Salesforce để tích hợp các giải pháp AI của mình vào hệ sinh thái rộng lớn hơn, đảm bảo rằng các công nghệ AI của mình vừa linh hoạt vừa được áp dụng rộng rãi trong các ngành.
B. Dịch vụ AI của Amazon
Amazon vẫn là một thế lực thống trị trong lĩnh vực AI thông qua nền tảng Amazon Web Services (AWS) của mình, cung cấp một bộ công cụ AI và học máy toàn diện. Amazon SageMaker của AWS là dịch vụ chính, cho phép các nhà phát triển xây dựng, đào tạo và triển khai các mô hình học máy trên quy mô lớn.
Ngoài các dịch vụ AI dành cho doanh nghiệp, Amazon tiếp tục đổi mới các sản phẩm AI dành cho người tiêu dùng với Alexa, trợ lý ảo của hãng, sử dụng công nghệ xử lý ngôn ngữ tự nhiên và học máy tiên tiến để tương tác với người dùng. Trọng tâm của công ty vào việc tích hợp AI một cách liền mạch vào dịch vụ thương mại điện tử và đám mây đã đưa công ty trở thành công ty dẫn đầu trong lĩnh vực AI.
C. Cách tiếp cận AI trên thiết bị của Apple
Cách tiếp cận độc đáo của Apple đối với AI tập trung vào xử lý trên thiết bị để ưu tiên quyền riêng tư của người dùng. Điều này được minh chứng bằng các tính năng như Face ID và việc sử dụng rộng rãi hơn các mô hình học máy thông qua framework Core ML của hãng. Silicon tùy chỉnh của Apple, bao gồm chip dòng A và dòng M, bao gồm các công cụ thần kinh chuyên dụng cung cấp năng lượng cho các tác vụ AI hiệu quả trên thiết bị.
Công ty cũng đã tăng cường các dịch vụ AI của mình với những cải tiến trong xử lý ngôn ngữ tự nhiên thông qua Siri và những tiến bộ trong thị giác máy tính với các tính năng như Live Text.
Điều gì tiếp theo? Con đường đến AGI
Con đường đến với AGI đầy rẫy những thách thức về kỹ thuật, đạo đức và pháp lý. Khi các hệ thống AI ngày càng trở nên tiên tiến, mối lo ngại về tác động của chúng đối với việc làm, quyền riêng tư và thậm chí cả nhân quyền ngày càng gia tăng. Các công ty không chỉ chạy đua để phát triển AI mạnh mẽ hơn mà còn phải vật lộn với cách triển khai những công nghệ này một cách có trách nhiệm.
Ví dụ, việc Google phát triển Med-PaLM, một hệ thống AI có khả năng vượt qua các kỳ thi cấp phép y tế của Hoa Kỳ, cho thấy tiềm năng của AI trong việc cách mạng hóa các ngành như chăm sóc sức khỏe. Tuy nhiên, nó cũng đặt ra câu hỏi về trách nhiệm giải trình và sự tin tưởng vào các quyết định do AI điều khiển.
Việc Microsoft tích hợp AI trên bộ sản phẩm của mình phản ánh xu hướng rộng lớn hơn là nhúng AI vào các công cụ hàng ngày. Cách tiếp cận này có thể dân chủ hóa AI, giúp nhiều đối tượng hơn có thể tiếp cận các khả năng tiên tiến.
Thông tin chi tiết từ Podcast của Lex Fridman
Podcast của Lex Fridman cung cấp những hiểu biết vô giá từ một số tiếng nói hàng đầu trong lĩnh vực này. Một cuộc thảo luận đặc biệt đáng chú ý liên quan đến Yann LeCun, Nhà khoa học trưởng về AI tại Meta, người đi sâu vào những thách thức của việc phát triển AGI. LeCun chỉ ra những hạn chế của các mô hình AI hiện tại, đặc biệt là các mô hình ngôn ngữ lớn (LLM), trong việc hiểu và tương tác với thế giới vật chất. Ông nhấn mạnh rằng mặc dù LLM có thể xử lý văn bản và tạo phản hồi, nhưng chúng thiếu khả năng hiểu được sự phức tạp của vật lý trực quan và lý luận thông thường, những yếu tố rất quan trọng đối với AGI thực sự. Khoảng cách này cho thấy nhu cầu không ngừng đối với những tiến bộ trong AI có thể tái tạo sự hiểu biết và ra quyết định giống con người.
Trong một tập khác, Sam Altman, Giám đốc điều hành của OpenAI, thảo luận về ý nghĩa rộng lớn hơn của AGI đối với xã hội. Altman nhấn mạnh tầm quan trọng của việc đảm bảo rằng AGI được phát triển theo cách phù hợp với các giá trị và đạo đức của con người. Ông thừa nhận tiềm năng to lớn của AGI trong việc cách mạng hóa các ngành công nghiệp và cải thiện đời sống con người, nhưng cũng nhấn mạnh những rủi ro liên quan đến sự phát triển AI không được kiểm soát. Những suy ngẫm của Altman cho thấy sự cân bằng tinh tế phải được duy trì giữa đổi mới và an toàn trong việc theo đuổi AGI.
Những cuộc thảo luận này minh họa rằng cuộc đua hướng tới AGI không chỉ là một thách thức về kỹ thuật mà còn là một thách thức về triết học và đạo đức. Quan điểm này bổ sung thêm chiều sâu cho sự hiểu biết về cách các công ty như Meta và OpenAI đang điều hướng sự phát triển AI.
Kết luận: Cuộc đua AI mới chỉ bắt đầu
Cuộc đua phát triển AGI là một thách thức mang tính quyết định của thời đại chúng ta, với những gã khổng lồ công nghệ như Google, Microsoft, OpenAI, Meta và Nvidia dẫn đầu. Mỗi công ty mang đến những thế mạnh và chiến lược riêng, góp phần tạo nên một bối cảnh phát triển nhanh chóng. Khi sự cạnh tranh ngày càng gay gắt, những tác động đối với xã hội, nền kinh tế và quản trị đạo đức sẽ là điều tối quan trọng. Hành trình hướng tới AGI không chỉ là tiến bộ công nghệ; nó còn là việc định hình một tương lai nơi AI phục vụ lợi ích tốt nhất của nhân loại.