“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo

Ngô Huyền
Chia sẻ

Google gần đây đã ra mắt bộ mô hình trí tuệ nhân tạo mới, mang tên Gemini lần đầu tiên chạy trực tiếp trên điện thoại di động, một bước đột phá trong nỗ lực của công ty công nghệ nhằm cạnh tranh với các đối thủ như OpenAI, nhà sản xuất ChatGPT…

“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo
“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo

Gemini, một loại mô hình AI mới có khả năng làm việc với văn bản, hình ảnh và video, có thể là thuật toán quan trọng nhất trong lịch sử của Google sau PageRank, thuật toán đã đưa công cụ tìm kiếm trở nên phổ biến trên toàn cầu… 

Phiên bản đầu tiên của Gemini sẽ có mặt ở hơn 170 quốc gia và vùng lãnh thổ. Google cho biết Gemini sẽ được cung cấp cho các nhà phát triển thông qua API của Google Cloud từ ngày 13/12. Một phiên bản nhỏ gọn hơn của mô hình này có tên là “nano” sẽ cung cấp khả năng đề xuất trả lời tin nhắn từ bàn phím của điện thoại thông minh của họ Pixel 8. Công ty cho biết Gemini sẽ được giới thiệu vào các sản phẩm khác của Google bao gồm tìm kiếm tổng hợp, quảng cáo và Chrome trong “những tháng tới”. Google cho biết phiên bản Gemini mạnh mẽ nhất sẽ ra mắt vào năm 2024, hiện đang trong giai đoạn “kiểm tra độ tin cậy và an toàn trên diện rộng”.

CEO GOOGLE DEEPMIND: ĐÂY LÀ THỜI ĐIỂM QUAN TRỌNG VỚI CHÚNG TÔI 

Demis Hassabis, Giám đốc điều hành của Google DeepMind, chia sẻ với WIRED: “Chúng tôi thực sự hào hứng với hiệu suất của nó và chúng tôi cũng rất hào hứng muốn xem mọi người sẽ làm gì với công cụ này”

Gemini được Google mô tả là “bản đa phương thức” vì được đào tạo cả hình ảnh, video và âm thanh thay vì chỉ văn bản, như các mô hình ngôn ngữ lớn khác. “Đó là mô hình lớn nhất và có khả năng nhất của chúng tôi”, Eli Collins, Phó chủ tịch sản phẩm của Google DeepMind, cho biết trong cuộc họp báo công bố Gemini.

Google cho biết có ba phiên bản Gemini: Ultra, phiên bản hiệu suất cao nhất; Nano, nhỏ hơn và hiệu quả hơn và Pro, có kích thước trung bình và khả năng trung bình.

Kể từ hôm nay, Bard của Google, một chatbot tương tự như ChatGPT, sẽ được cung cấp bởi Gemini Pro, một thay đổi mà Google cho biết sẽ nâng cao khả năng tóm tắt nội dung, lập kế hoạch và lý luận của công cụ. Hiện nay, một phiên bản chuyên biệt của Gemini Pro đang được kết hợp thành phiên bản mới của AlphaCode, một công cụ tạo ra “sản phẩm nghiên cứu” để viết mã từ Google DeepMind. Phiên bản mạnh nhất của Gemini, Ultra, sẽ được đưa vào Bard và cung cấp thông qua API đám mây vào năm 2024.

GOOGLE VƯỢT QUA TAY CHƠI HÀNG ĐẦU OPENAI? 

“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo - Ảnh 1

Theo Giáo sư của Đại học Washington, những mô hình khổng lồ như Gemini đã tiêu tốn hàng trăm triệu USD để xây dựng, nhưng sẽ giúp các công ty thu lại doanh thu hàng tỷ hoặc thậm chí hàng nghìn tỷ USD khi thống trị công nghệ đám mây. 

Phó chủ tịch sản phẩm của Google, Eli Collins nói rằng Gemini Pro, mô hình được triển khai trong tuần này, đã vượt qua mô hình GPT-3.5, khi vượt qua sáu trên tám điểm chuẩn thường được sử dụng để kiểm tra tính thông minh của phần mềm AI.

Google cho biết Gemini Ultra, mô hình sẽ ra mắt vào năm tới, vượt qua 90%, cao hơn bất kỳ mô hình nào khác bao gồm GPT-4, trên điểm chuẩn Hiểu ngôn ngữ đa nhiệm lớn (MMLU), được phát triển bởi các nhà nghiên cứu hàn lâm để kiểm tra mô hình ngôn ngữ cho các câu hỏi về chủ đề bao gồm toán học, lịch sử và luật của Mỹ.

Eli Collins cho biết: “Gemini là công cụ tiên tiến vượt qua nhiều tiêu chuẩn khác nhau – 30/32 tiêu chuẩn được sử dụng rộng rãi trong cộng đồng nghiên cứu máy học”.

Công ty nói thêm rằng Gemini là mô hình AI đầu tiên vượt trội hơn các chuyên gia con người trong một số nhiệm vụ nhất định, vượt qua mô hình GPT4 của OpenAI trong nhiều thử nghiệm. Đặc biệt, nó có thể suy luận toán học, phân tích dữ liệu khoa học và thực hiện mã hóa nâng cao. Google không đưa ra sự so sánh với mô hình GPT4 của OpenAI khi thông báo cho các nhà báo nhưng sau đó đã làm rõ điều này trong một blog.

Trong khi đó, kể từ khi ra mắt vào tháng 3 năm nay, GPT-4 của OpenAI đã khiến mọi người ngạc nhiên, thậm chí khiến một số nhà nghiên cứu xem xét lại dự đoán của họ về thời điểm AI có thể sánh ngang với trí thông minh của con người. Google đã đẩy nhanh việc phát hành công nghệ AI nhằm giảm bớt tiếng sự nổi tiếng xung quanh ChatGPT của OpenAI và tái lập mình trở thành công ty AI hàng đầu thế giới.

Oren Etzioni, Giáo sư tại Đại học Washington và cựu Giám đốc điều hành của Viện AI Allen, cho biết: “Chúng ta đang trong một cuộc chạy đua vũ trang ăn miếng trả miếng. Không có lý do gì để không tin rằng Gemini làm tốt hơn GPT-4 ở thời điểm này, nhưng phiên bản tiếp theo, GPT-5, thì Gemini chưa chắc”. 

ĐỔ DỒN MỌI NGUỒN LỰC ĐỂ LÀM CHỦ AI 

Sundar Pichai, giám đốc điều hành Google và Alphabet, cho biết trong một bài đăng: “Tôi tin rằng quá trình chuyển đổi mà chúng ta đang chứng kiến với AI lớn hơn nhiều so với sự chuyển đổi sang thiết bị di động hoặc web trước đó. Kỷ nguyên mô hình mới này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà chúng tôi đã thực hiện với tư cách là một công ty.”

Công ty tìm kiếm lần đầu tiên thông báo họ đang làm việc trên Gemini tại hội nghị I/O vào tháng 5, khi công ty nỗ lực ngăn chặn mối đe dọa rằng công nghệ từ OpenAI. Thị phần ước tính của Google trên thị trường công cụ tìm kiếm toàn cầu vẫn đạt hơn 90%.

Google DeepMind, bộ phận dẫn đầu sự phát triển của Gemini, được thành lập bằng cách sáp nhập nhóm nghiên cứu AI chính của Google, Google Brain, với đơn vị AI có trụ sở tại London, DeepMind, vào tháng 4. Và dự án Gemini đã thu hút các nhà nghiên cứu và kỹ sư từ khắp Google trong vài tháng qua. Hệ thống này đã sử dụng phiên bản nâng cấp gần đây của chip silicon tùy chỉnh của Google để đào tạo các mô hình AI, được gọi là Bộ xử lý Tensor (TPU).

Gemini được đặt tên để đánh dấu sự kết hợp giữa hai phòng thí nghiệm AI lớn của Google và để tham khảo Dự án Gemini của NASA, mở đường cho cuộc đổ bộ lên mặt trăng của Chương trình Apollo.

Khởi nghiệp

Hồ sơ Startup

Citigo là công ty công nghệ cung cấp những giải pháp đơn giản với chi phí tiết kiệm, giúp khách hàng nâng cao hiệu quả kinh doanh. Citigo hướng tới tầm nhìn trở thành công ty cung cấp giải pháp công nghệ cho doanh nghiệp phổ biến tại Đông Nam Á
ESBT là công ty hoạt động trọng lĩnh vực công nghệ thông tin, chúng tôi xây dựng những sản phẩm phần mềm cho cộng đồng và cung cấp dịch vụ phát triển phần mềm cho các doanh nghiệp
Lozi là một trong những ứng dụng thương mại điện tử được yêu thích nhất tại Việt Nam, kết nối hàng triệu người mua và người bán nhằm phục vụ nhu cầu mua bán trực tuyến ngày càng cao. Không chỉ là một cầu nối thương mại điện tử đáng tin cậy, Lozi còn cung cấp dịch vụ giao hàng nhanh chóng và tiện lợi chỉ trong 1 giờ, đem đến cho khách hàng những trải nghiệm mua sắm trực tuyến hiệu quả và tối ưu
Bắt nguồn từ mong muốn mang chất lượng dạy Tiếng Anh tại Trường Quốc tế đến với mọi học sinh Việt Nam, để các bạn nhỏ dù không có điều kiện kinh tế theo học tại các Trường Quốc Tế hay Trung Tâm đắt tiền vẫn có thể sử dụng Tiếng Anh tốt như người bản ngữ. Đây chính là hành trang chuẩn bị cho các em tương lai vươn ra thế giới. Chính vì lý do trên, đội ngũ sáng lập đã bắt tay vào xây dựng sản phẩm đầu tiên có tên “Chương trình học Tiếng Anh Online EDUPIA”.
Công ty TNHH SA-ACH định vị về lĩnh vững trồng rừng, phát triển gồm 3 loại cây và bốn tầng cây trên một hecta đất nhằm tạo hệ sinh thái bền vững, và nâng cao thu nhập cho bà con