“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo
11/12/2023
Google gần đây đã ra mắt bộ mô hình trí tuệ nhân tạo mới, mang tên Gemini lần đầu tiên chạy trực tiếp trên điện thoại di động, một bước đột phá trong nỗ lực của công ty công nghệ nhằm cạnh tranh với các đối thủ như OpenAI, nhà sản xuất ChatGPT…
Gemini, một loại mô hình AI mới có khả năng làm việc với văn bản, hình ảnh và video, có thể là thuật toán quan trọng nhất trong lịch sử của Google sau PageRank, thuật toán đã đưa công cụ tìm kiếm trở nên phổ biến trên toàn cầu…
Phiên bản đầu tiên của Gemini sẽ có mặt ở hơn 170 quốc gia và vùng lãnh thổ. Google cho biết Gemini sẽ được cung cấp cho các nhà phát triển thông qua API của Google Cloud từ ngày 13/12. Một phiên bản nhỏ gọn hơn của mô hình này có tên là “nano” sẽ cung cấp khả năng đề xuất trả lời tin nhắn từ bàn phím của điện thoại thông minh của họ Pixel 8. Công ty cho biết Gemini sẽ được giới thiệu vào các sản phẩm khác của Google bao gồm tìm kiếm tổng hợp, quảng cáo và Chrome trong “những tháng tới”. Google cho biết phiên bản Gemini mạnh mẽ nhất sẽ ra mắt vào năm 2024, hiện đang trong giai đoạn “kiểm tra độ tin cậy và an toàn trên diện rộng”.
CEO GOOGLE DEEPMIND: ĐÂY LÀ THỜI ĐIỂM QUAN TRỌNG VỚI CHÚNG TÔI
Demis Hassabis, Giám đốc điều hành của Google DeepMind, chia sẻ với WIRED: “Chúng tôi thực sự hào hứng với hiệu suất của nó và chúng tôi cũng rất hào hứng muốn xem mọi người sẽ làm gì với công cụ này”
Gemini được Google mô tả là “bản đa phương thức” vì được đào tạo cả hình ảnh, video và âm thanh thay vì chỉ văn bản, như các mô hình ngôn ngữ lớn khác. “Đó là mô hình lớn nhất và có khả năng nhất của chúng tôi”, Eli Collins, Phó chủ tịch sản phẩm của Google DeepMind, cho biết trong cuộc họp báo công bố Gemini.
Google cho biết có ba phiên bản Gemini: Ultra, phiên bản hiệu suất cao nhất; Nano, nhỏ hơn và hiệu quả hơn và Pro, có kích thước trung bình và khả năng trung bình.
Kể từ hôm nay, Bard của Google, một chatbot tương tự như ChatGPT, sẽ được cung cấp bởi Gemini Pro, một thay đổi mà Google cho biết sẽ nâng cao khả năng tóm tắt nội dung, lập kế hoạch và lý luận của công cụ. Hiện nay, một phiên bản chuyên biệt của Gemini Pro đang được kết hợp thành phiên bản mới của AlphaCode, một công cụ tạo ra “sản phẩm nghiên cứu” để viết mã từ Google DeepMind. Phiên bản mạnh nhất của Gemini, Ultra, sẽ được đưa vào Bard và cung cấp thông qua API đám mây vào năm 2024.
GOOGLE VƯỢT QUA TAY CHƠI HÀNG ĐẦU OPENAI?
Theo Giáo sư của Đại học Washington, những mô hình khổng lồ như Gemini đã tiêu tốn hàng trăm triệu USD để xây dựng, nhưng sẽ giúp các công ty thu lại doanh thu hàng tỷ hoặc thậm chí hàng nghìn tỷ USD khi thống trị công nghệ đám mây.
Phó chủ tịch sản phẩm của Google, Eli Collins nói rằng Gemini Pro, mô hình được triển khai trong tuần này, đã vượt qua mô hình GPT-3.5, khi vượt qua sáu trên tám điểm chuẩn thường được sử dụng để kiểm tra tính thông minh của phần mềm AI.
Google cho biết Gemini Ultra, mô hình sẽ ra mắt vào năm tới, vượt qua 90%, cao hơn bất kỳ mô hình nào khác bao gồm GPT-4, trên điểm chuẩn Hiểu ngôn ngữ đa nhiệm lớn (MMLU), được phát triển bởi các nhà nghiên cứu hàn lâm để kiểm tra mô hình ngôn ngữ cho các câu hỏi về chủ đề bao gồm toán học, lịch sử và luật của Mỹ.
Eli Collins cho biết: “Gemini là công cụ tiên tiến vượt qua nhiều tiêu chuẩn khác nhau – 30/32 tiêu chuẩn được sử dụng rộng rãi trong cộng đồng nghiên cứu máy học”.
Công ty nói thêm rằng Gemini là mô hình AI đầu tiên vượt trội hơn các chuyên gia con người trong một số nhiệm vụ nhất định, vượt qua mô hình GPT4 của OpenAI trong nhiều thử nghiệm. Đặc biệt, nó có thể suy luận toán học, phân tích dữ liệu khoa học và thực hiện mã hóa nâng cao. Google không đưa ra sự so sánh với mô hình GPT4 của OpenAI khi thông báo cho các nhà báo nhưng sau đó đã làm rõ điều này trong một blog.
Trong khi đó, kể từ khi ra mắt vào tháng 3 năm nay, GPT-4 của OpenAI đã khiến mọi người ngạc nhiên, thậm chí khiến một số nhà nghiên cứu xem xét lại dự đoán của họ về thời điểm AI có thể sánh ngang với trí thông minh của con người. Google đã đẩy nhanh việc phát hành công nghệ AI nhằm giảm bớt tiếng sự nổi tiếng xung quanh ChatGPT của OpenAI và tái lập mình trở thành công ty AI hàng đầu thế giới.
Oren Etzioni, Giáo sư tại Đại học Washington và cựu Giám đốc điều hành của Viện AI Allen, cho biết: “Chúng ta đang trong một cuộc chạy đua vũ trang ăn miếng trả miếng. Không có lý do gì để không tin rằng Gemini làm tốt hơn GPT-4 ở thời điểm này, nhưng phiên bản tiếp theo, GPT-5, thì Gemini chưa chắc”.
ĐỔ DỒN MỌI NGUỒN LỰC ĐỂ LÀM CHỦ AI
Sundar Pichai, giám đốc điều hành Google và Alphabet, cho biết trong một bài đăng: “Tôi tin rằng quá trình chuyển đổi mà chúng ta đang chứng kiến với AI lớn hơn nhiều so với sự chuyển đổi sang thiết bị di động hoặc web trước đó. Kỷ nguyên mô hình mới này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà chúng tôi đã thực hiện với tư cách là một công ty.”
Công ty tìm kiếm lần đầu tiên thông báo họ đang làm việc trên Gemini tại hội nghị I/O vào tháng 5, khi công ty nỗ lực ngăn chặn mối đe dọa rằng công nghệ từ OpenAI. Thị phần ước tính của Google trên thị trường công cụ tìm kiếm toàn cầu vẫn đạt hơn 90%.
Google DeepMind, bộ phận dẫn đầu sự phát triển của Gemini, được thành lập bằng cách sáp nhập nhóm nghiên cứu AI chính của Google, Google Brain, với đơn vị AI có trụ sở tại London, DeepMind, vào tháng 4. Và dự án Gemini đã thu hút các nhà nghiên cứu và kỹ sư từ khắp Google trong vài tháng qua. Hệ thống này đã sử dụng phiên bản nâng cấp gần đây của chip silicon tùy chỉnh của Google để đào tạo các mô hình AI, được gọi là Bộ xử lý Tensor (TPU).
Gemini được đặt tên để đánh dấu sự kết hợp giữa hai phòng thí nghiệm AI lớn của Google và để tham khảo Dự án Gemini của NASA, mở đường cho cuộc đổ bộ lên mặt trăng của Chương trình Apollo.
Dù robot hình người vẫn còn cách khá xa việc phổ cập đại trà, nhưng doanh nghiệp dẫn đầu trong lĩnh vực này đã sẵn sàng bước lên sàn chứng khoán...
Với định vị là công ty số toàn cầu, tập đoàn công nghệ này phát triển trên ba trụ cột công nghệ chiến lược gồm hạ tầng AI, an ninh bảo mật và giải pháp AI...
Các nhà nghiên cứu của Google vừa đưa ra cảnh báo đáng chú ý: trong tương lai, máy tính lượng tử có thể phá vỡ các lớp mã hóa đang bảo vệ Bitcoin và nhiều tài sản số khác...
Cuộc thi robot FIRST® LEGO® League Vietnam Championship 2026 đang phản ánh rõ nét sự chuyển động của giáo dục STEM tại Việt Nam – nơi học sinh ngày càng tiếp cận sớm với công nghệ, tư duy kỹ thuật và các chuẩn mực đổi mới sáng tạo toàn cầu...
Siri có thể hoạt động như một tác nhân AI xử lý tác vụ xuyên suốt nhiều ứng dụng thông qua ngữ cảnh cá nhân…
Đầu tháng này, công ty Neuracle Medical Technology đã chính thức nhận được phê duyệt thương mại cho một thiết bị BCI. Trong khi đó, tại Mỹ, các thiết bị BCI xâm lấn vẫn chưa được phê duyệt thương mại...
Học sinh khiếm thị tại Việt Nam đang có nhiều cơ hội học tập độc lập hơn và tham gia tích cực hơn trong lớp học nhờ việc tiếp cận sách giáo khoa điện tử...
Bất chấp việc ký thỏa thuận kéo dài ba năm với The Walt Disney Company cho phép người dùng tạo video với hơn 200 nhân vật Disney, OpenAI vẫn đóng cửa ứng dụng từng làm mưa làm gió Sora…
Trung Quốc đang đẩy mạnh phổ cập trí tuệ nhân tạo trên quy mô lớn, và các “big tech” công nghệ nước này đang trực tiếp tổ chức nhiều sự kiện công khai để giúp người dân tiếp cận OpenClaw – trợ lý số cá nhân đang gây sốt…
Khi trí tuệ nhân tạo bước vào giai đoạn thương mại hóa quy mô lớn, “token” – đơn vị dữ liệu nhỏ nhất mà mô hình AI xử lý – đang nổi lên như một loại hàng hóa mới...