Google ra mắt Gemini - Mô hình AI có thể hạ gục Chat GPT-4

Google đã là 'công ty ưu tiên AI' trong gần một thập kỷ. Bây giờ, một năm đã trôi qua trong kỷ nguyên AI do ChatGPT mang lại, cuối cùng nó cũng đã có một bước chuyển lớn.

Giám đốc điều hành Sundar Pichai cho biết đây là sự khởi đầu cho một kỷ nguyên mới của AI tại Google: Kỷ nguyên Gemini (Song Tử). Gemini là mô hình ngôn ngữ lớn nhất của Google, được Pichai giới thiệu lần đầu tại hội nghiij nhà phát triển I/O vào tháng 6 và hiện đang ra mắt người dùng. Nghe Pichai và Giám đốc điều hành Google DeepMind Demis Hassabis mô tả, đây là một bước tiến vượt bậc trong mô hình AI cuối cùng sẽ ảnh hưởng đến hầu hết các sản phẩm của Google. Pichai nói: “Một trong những điều mạnh mẽ ở thời điểm này là bạn có thể làm việc trên một công nghệ cơ bản và làm cho nó tốt hơn và nó ngay lập tức lan truyền khắp các sản phẩm của chúng tôi”. 

Gemini không chỉ là một mô hình AI đơn lẻ. Có một phiên bản nhẹ hơn tên là Gemini Nano được thiết kế để chạy tự nhiên và ngoại tuyến trên các thiết bị Android. Có một phiên bản mạnh mẽ hơn có tên Gemini Pro sẽ sớm hỗ trợ nhiều dịch vụ AI của Google và là xương sống của Bard kể từ hôm nay. Và có một mô hình thậm chí còn có khả năng cao hơn tên là

Gemini Ultra, LLM mạnh nhất mà Google từng tạo ra và dường như được thiết kế chủ yếu cho các trung tâm dữ liệu và ứng dụng doanh nghiệp. 

Google hiện đang tung ra mô hình này theo một số cách: Bard hiện được cung cấp bởi Gemini Pro và người dùng Pixel 8 Pro sẽ nhận được một số tính năng mới nhờ Gemini Nano. (Gemini Ultra sẽ ra mắt vào năm tới.) Các nhà phát triển và khách hàng doanh nghiệp sẽ có thể truy cập Gemini Pro thông qua Google Generative AI Studio hoặc Vertex AI trong Google Cloud bắt đầu từ ngày 13 tháng 12. Gemini hiện chỉ có sẵn bằng tiếng Anh và các ngôn ngữ khác chắc chắn sẽ sớm ra mắt. Nhưng Pichai cho biết mô hình này cuối cùng sẽ được tích hợp vào công cụ tìm kiếm của Google , các sản phẩm quảng cáo của Google, trình duyệt Chrome và hơn thế nữa trên toàn thế giới. Đó là tương lai của Google và không còn sớm nữa.

Google cho biết Gemini đánh bại GPT-4 ở 30 trên 32 điểm chuẩn

OpenAI đã ra mắt ChatGPT cách đây một năm, công ty và sản phẩm này ngay lập tức trở thành những thứ lớn nhất trong lĩnh vực AI. Giờ đây, Google - công ty đã tạo ra phần lớn công nghệ nền tảng đằng sau sự bùng nổ AI hiện tại, đã tự gọi mình là tổ chức “ưu tiên AI” trong gần một thập kỷ và điều đó rõ ràng đã bị bất ngờ một cách đáng xấu hổ trước mức độ tốt của ChatGPT và Công nghệ của OpenAI đã chiếm lĩnh ngành nhanh đến mức nào — cuối cùng đã sẵn sàng đáp trả.

Vì vậy, chúng ta hãy đi vào câu hỏi quan trọng, phải không? GPT-4 của OpenAI so với Gemini của Google: sẵn sàng, bắt đầu. Điều này rõ ràng đã được Google nghĩ tới từ lâu. Hassabis cho biết: “Chúng tôi đã thực hiện phân tích rất kỹ lưỡng về các hệ thống và điểm chuẩn”.

Google đã chạy 32 điểm chuẩn được thiết lập tốt để so sánh hai mô hình, từ các bài kiểm tra tổng thể rộng rãi như điểm chuẩn Hiểu ngôn ngữ đa tác vụ đến điểm chuẩn so sánh khả năng tạo mã Python của hai mô hình. “Tôi nghĩ về cơ bản chúng tôi đang dẫn trước ở 30 trên 32” trong số các tiêu chuẩn đó, Hassabis nói với một nụ cười trên môi. “Một số trong số chúng rất hẹp. Một số trong số chúng lớn hơn.”

Trong những điểm chuẩn đó (thực sự hầu hết đều rất gần nhau), lợi thế rõ ràng nhất của Song Tử đến từ khả năng hiểu và tương tác với video và âm thanh. Điều này phụ thuộc rất nhiều vào thiết kế: đa phương thức đã là một phần trong kế hoạch của Song Tử ngay từ đầu.

Google chưa đào tạo các mô hình riêng biệt cho hình ảnh và giọng nói, như cách OpenAI tạo ra DALL-E và Whisper; nó đã xây dựng một mô hình đa giác quan ngay từ đầu. Hassabis nói: “Chúng tôi luôn quan tâm đến những hệ thống rất, rất tổng quát. Anh ấy đặc biệt quan tâm đến cách kết hợp tất cả các chế độ đó - để thu thập càng nhiều dữ liệu càng tốt từ bất kỳ số lượng đầu vào và giác quan nào, sau đó đưa ra phản hồi đa dạng nhất có thể.

Những mô hình này phần nào hiểu rõ hơn về thế giới xung quanh chúng 

Hiện tại, các mô hình cơ bản nhất của Gemini là nhập văn bản và gửi văn bản, nhưng các mô hình mạnh mẽ hơn như Gemini Ultra có thể hoạt động với hình ảnh, video và âm thanh. Và “nó sẽ còn mang tính khái quát hơn thế nữa,” Hassabis nói. “Vẫn còn những thứ như hành động và chạm - giống những thứ kiểu robot hơn.” Ông nói, theo thời gian, Song Tử sẽ có nhiều giác quan hơn, nhận thức rõ hơn và trở nên chính xác và có căn cứ hơn trong quá trình này. “Những mô hình này phần nào hiểu rõ hơn về thế giới xung quanh họ.” Tất nhiên, những mô hình này vẫn còn ảo giác, chúng vẫn có những thành kiến và các vấn đề khác. Nhưng họ càng biết nhiều, Hassabis nói, họ sẽ càng nhận được nhiều hơn.

Tuy nhiên, điểm chuẩn chỉ là điểm chuẩn và cuối cùng, bài kiểm tra thực sự về khả năng của Gemini sẽ đến từ những người dùng hàng ngày muốn sử dụng nó để suy nghĩ ý tưởng, tra cứu thông tin, viết mã và hơn thế nữa. Google dường như coi việc viết mã nói riêng là một ứng dụng hấp dẫn đối với Gemini; nó sử dụng một hệ thống tạo mã mới có tên AlphaCode 2 mà nó cho biết hoạt động tốt hơn 85% số người tham gia cuộc thi mã hóa, tăng từ 50% đối với AlphaCode ban đầu. Nhưng Pichai nói rằng người dùng sẽ nhận thấy sự cải thiện ở mọi thứ mà mô hình chạm vào.

Điều quan trọng không kém đối với Google là Gemini rõ ràng là một mô hình hiệu quả hơn nhiều. Nó được đào tạo trên Bộ xử lý Tensor của riêng Google và chạy nhanh hơn cũng như rẻ hơn so với các mô hình trước đây của Google như PaLM. Bên cạnh mẫu mới, Google cũng tung ra phiên bản mới của hệ thống TPU , TPU v5p, một hệ thống máy tính được thiết kế để sử dụng trong các trung tâm dữ liệu nhằm đào tạo và chạy các mô hình quy mô lớn. 

Nói chuyện với Pichai và Hassabis, rõ ràng là họ coi việc ra mắt Gemini vừa là sự khởi đầu của một dự án lớn hơn vừa là một bước thay đổi của bản thân. Gemini là mô hình mà Google đã chờ đợi, mô hình mà họ đã hướng tới trong nhiều năm, thậm chí có thể là mô hình mà lẽ ra họ phải có trước khi OpenAI và ChatGPT thống trị thế giới. 

Google, đã tuyên bố “ mã đỏ ” sau khi ra mắt ChatGPT và được cho là đang chơi trò đuổi bắt kể từ đó, dường như vẫn đang cố gắng giữ vững câu thần chú “táo bạo và có trách nhiệm” của mình. Hassabis và Pichai đều nói rằng họ không sẵn sàng tiến quá nhanh chỉ để theo kịp, đặc biệt là khi chúng ta đang tiến gần hơn đến giấc mơ AI cuối cùng: trí tuệ nhân tạo tổng quát, thuật ngữ chỉ AI có khả năng tự cải thiện, thông minh hơn con người và sẵn sàng thay đổi thế giới. Hassabis nói: “Khi chúng tôi tiếp cận AGI, mọi thứ sẽ khác. “Đó là một loại công nghệ tích cực, vì vậy tôi nghĩ chúng ta phải tiếp cận nó một cách thận trọng. Thận trọng nhưng lạc quan”.

Google cho biết họ đã làm việc chăm chỉ để đảm bảo sự an toàn và trách nhiệm của Gemini, cả thông qua thử nghiệm nội bộ và bên ngoài cũng như đội đỏ. Pichai chỉ ra rằng việc đảm bảo tính bảo mật và độ tin cậy của dữ liệu là đặc biệt quan trọng đối với các sản phẩm dành cho doanh nghiệp, đây là nơi mà hầu hết AI tạo ra lợi nhuận. Nhưng Hassabis thừa nhận rằng một trong những rủi ro khi tung ra một hệ thống AI tiên tiến là nó sẽ gặp phải các vấn đề và các vectơ tấn công mà không ai có thể lường trước được. “Đó là lý do tại sao bạn phải công bố mọi thứ,” anh ấy nói, “để xem và học hỏi.”

Google đang sử dụng bản phát hành Ultra một cách đặc biệt chậm rãi; Hassabis so sánh nó với phiên bản beta được kiểm soát, với “khu vực thử nghiệm an toàn hơn” dành cho mô hình có khả năng và không bị hạn chế nhất của Google. Về cơ bản, nếu có một tính cách thay thế nào đó có thể hủy hoại hôn nhân trong Song Tử, thì Google sẽ cố gắng tìm ra nó trước bạn.

Trong nhiều năm, Pichai và các giám đốc điều hành khác của Google đã ca ngợi tiềm năng của AI. Bản thân Pichai đã hơn một lần nói rằng AI sẽ có tác dụng biến đổi con người nhiều hơn lửa hay điện. Ở thế hệ đầu tiên này, hình mẫu Song Tử có thể không thay đổi được thế giới.

Trong trường hợp tốt nhất, nó có thể giúp Google bắt kịp OpenAI trong cuộc đua xây dựng AI có khả năng sáng tạo tuyệt vời. (Trường hợp xấu nhất, Bard vẫn nhàm chán và tầm thường, còn Chat GPT tiếp tục chiến thắng.) Nhưng Pichai, Hassabis và mọi người khác tại Google dường như nghĩ rằng đây là sự khởi đầu của một điều gì đó thực sự to lớn. Web đã biến Google trở thành gã khổng lồ công nghệ; Song Tử có thể còn lớn hơn nữa.