“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo

11/12/2023

Google gần đây đã ra mắt bộ mô hình trí tuệ nhân tạo mới, mang tên Gemini lần đầu tiên chạy trực tiếp trên điện thoại di động, một bước đột phá trong nỗ lực của công ty công nghệ nhằm cạnh tranh với các đối thủ như OpenAI, nhà sản xuất ChatGPT…

“Gemini” của Google tạo ra bước đột phá trên thiết bị di động cho AI sáng tạo

Gemini, một loại mô hình AI mới có khả năng làm việc với văn bản, hình ảnh và video, có thể là thuật toán quan trọng nhất trong lịch sử của Google sau PageRank, thuật toán đã đưa công cụ tìm kiếm trở nên phổ biến trên toàn cầu…

Phiên bản đầu tiên của Gemini sẽ có mặt ở hơn 170 quốc gia và vùng lãnh thổ. Google cho biết Gemini sẽ được cung cấp cho các nhà phát triển thông qua API của Google Cloud từ ngày 13/12. Một phiên bản nhỏ gọn hơn của mô hình này có tên là “nano” sẽ cung cấp khả năng đề xuất trả lời tin nhắn từ bàn phím của điện thoại thông minh của họ Pixel 8. Công ty cho biết Gemini sẽ được giới thiệu vào các sản phẩm khác của Google bao gồm tìm kiếm tổng hợp, quảng cáo và Chrome trong “những tháng tới”. Google cho biết phiên bản Gemini mạnh mẽ nhất sẽ ra mắt vào năm 2024, hiện đang trong giai đoạn “kiểm tra độ tin cậy và an toàn trên diện rộng”.

CEO GOOGLE DEEPMIND: ĐÂY LÀ THỜI ĐIỂM QUAN TRỌNG VỚI CHÚNG TÔI

Demis Hassabis, Giám đốc điều hành của Google DeepMind, chia sẻ với WIRED: “Chúng tôi thực sự hào hứng với hiệu suất của nó và chúng tôi cũng rất hào hứng muốn xem mọi người sẽ làm gì với công cụ này”

Gemini được Google mô tả là “bản đa phương thức” vì được đào tạo cả hình ảnh, video và âm thanh thay vì chỉ văn bản, như các mô hình ngôn ngữ lớn khác. “Đó là mô hình lớn nhất và có khả năng nhất của chúng tôi”, Eli Collins, Phó chủ tịch sản phẩm của Google DeepMind, cho biết trong cuộc họp báo công bố Gemini.

Google cho biết có ba phiên bản Gemini: Ultra, phiên bản hiệu suất cao nhất; Nano, nhỏ hơn và hiệu quả hơn và Pro, có kích thước trung bình và khả năng trung bình.

Kể từ hôm nay, Bard của Google, một chatbot tương tự như ChatGPT, sẽ được cung cấp bởi Gemini Pro, một thay đổi mà Google cho biết sẽ nâng cao khả năng tóm tắt nội dung, lập kế hoạch và lý luận của công cụ. Hiện nay, một phiên bản chuyên biệt của Gemini Pro đang được kết hợp thành phiên bản mới của AlphaCode, một công cụ tạo ra “sản phẩm nghiên cứu” để viết mã từ Google DeepMind. Phiên bản mạnh nhất của Gemini, Ultra, sẽ được đưa vào Bard và cung cấp thông qua API đám mây vào năm 2024.

GOOGLE VƯỢT QUA TAY CHƠI HÀNG ĐẦU OPENAI?

Theo Giáo sư của Đại học Washington, những mô hình khổng lồ như Gemini đã tiêu tốn hàng trăm triệu USD để xây dựng, nhưng sẽ giúp các công ty thu lại doanh thu hàng tỷ hoặc thậm chí hàng nghìn tỷ USD khi thống trị công nghệ đám mây.

Phó chủ tịch sản phẩm của Google, Eli Collins nói rằng Gemini Pro, mô hình được triển khai trong tuần này, đã vượt qua mô hình GPT-3.5, khi vượt qua sáu trên tám điểm chuẩn thường được sử dụng để kiểm tra tính thông minh của phần mềm AI.

Google cho biết Gemini Ultra, mô hình sẽ ra mắt vào năm tới, vượt qua 90%, cao hơn bất kỳ mô hình nào khác bao gồm GPT-4, trên điểm chuẩn Hiểu ngôn ngữ đa nhiệm lớn (MMLU), được phát triển bởi các nhà nghiên cứu hàn lâm để kiểm tra mô hình ngôn ngữ cho các câu hỏi về chủ đề bao gồm toán học, lịch sử và luật của Mỹ.

Eli Collins cho biết: “Gemini là công cụ tiên tiến vượt qua nhiều tiêu chuẩn khác nhau – 30/32 tiêu chuẩn được sử dụng rộng rãi trong cộng đồng nghiên cứu máy học”.

Công ty nói thêm rằng Gemini là mô hình AI đầu tiên vượt trội hơn các chuyên gia con người trong một số nhiệm vụ nhất định, vượt qua mô hình GPT4 của OpenAI trong nhiều thử nghiệm. Đặc biệt, nó có thể suy luận toán học, phân tích dữ liệu khoa học và thực hiện mã hóa nâng cao. Google không đưa ra sự so sánh với mô hình GPT4 của OpenAI khi thông báo cho các nhà báo nhưng sau đó đã làm rõ điều này trong một blog.

Trong khi đó, kể từ khi ra mắt vào tháng 3 năm nay, GPT-4 của OpenAI đã khiến mọi người ngạc nhiên, thậm chí khiến một số nhà nghiên cứu xem xét lại dự đoán của họ về thời điểm AI có thể sánh ngang với trí thông minh của con người. Google đã đẩy nhanh việc phát hành công nghệ AI nhằm giảm bớt tiếng sự nổi tiếng xung quanh ChatGPT của OpenAI và tái lập mình trở thành công ty AI hàng đầu thế giới.

Oren Etzioni, Giáo sư tại Đại học Washington và cựu Giám đốc điều hành của Viện AI Allen, cho biết: “Chúng ta đang trong một cuộc chạy đua vũ trang ăn miếng trả miếng. Không có lý do gì để không tin rằng Gemini làm tốt hơn GPT-4 ở thời điểm này, nhưng phiên bản tiếp theo, GPT-5, thì Gemini chưa chắc”.

ĐỔ DỒN MỌI NGUỒN LỰC ĐỂ LÀM CHỦ AI

Sundar Pichai, giám đốc điều hành Google và Alphabet, cho biết trong một bài đăng: “Tôi tin rằng quá trình chuyển đổi mà chúng ta đang chứng kiến với AI lớn hơn nhiều so với sự chuyển đổi sang thiết bị di động hoặc web trước đó. Kỷ nguyên mô hình mới này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà chúng tôi đã thực hiện với tư cách là một công ty.”

Công ty tìm kiếm lần đầu tiên thông báo họ đang làm việc trên Gemini tại hội nghị I/O vào tháng 5, khi công ty nỗ lực ngăn chặn mối đe dọa rằng công nghệ từ OpenAI. Thị phần ước tính của Google trên thị trường công cụ tìm kiếm toàn cầu vẫn đạt hơn 90%.

Google DeepMind, bộ phận dẫn đầu sự phát triển của Gemini, được thành lập bằng cách sáp nhập nhóm nghiên cứu AI chính của Google, Google Brain, với đơn vị AI có trụ sở tại London, DeepMind, vào tháng 4. Và dự án Gemini đã thu hút các nhà nghiên cứu và kỹ sư từ khắp Google trong vài tháng qua. Hệ thống này đã sử dụng phiên bản nâng cấp gần đây của chip silicon tùy chỉnh của Google để đào tạo các mô hình AI, được gọi là Bộ xử lý Tensor (TPU).

Gemini được đặt tên để đánh dấu sự kết hợp giữa hai phòng thí nghiệm AI lớn của Google và để tham khảo Dự án Gemini của NASA, mở đường cho cuộc đổ bộ lên mặt trăng của Chương trình Apollo.

Đội ngũ IoT/Smart Devices Lab của CMC ATI phát triển các giải pháp AI ứng dụng cho thiết bị thông minh và định danh số

Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026

Toàn cảnh chương trình công bố tái cấu trúc CMC TS và lễ bổ nhiệm ban lãnh đạo mới CMC TS

CMC tái cấu trúc Khối Công nghệ và Giải pháp, thúc đẩy mục tiêu chuyển đổi AI

CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...

11:07 13/05/2026

Ngày 12/5, Qualcomm Technologies, Inc. chính thức công bố khai trương Trung tâm Nghiên cứu và Phát triển (R&D) tại Hà Nội

Qualcomm chính thức khai trương Trung tâm R&D tại Hà Nội

Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...

15:55 12/05/2026

Người lái xe tại Việt Nam đang di chuyển trong một trong những môi trường giao thông đông đúc và biến động nhanh bậc nhất châu Á

Công nghệ điều hướng: 'Phao cứu sinh' cho thu nhập và an toàn của người lái xe 2 bánh tại Việt Nam

Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.

19:11 11/05/2026

Ảnh minh hoạ: Trong khi quá trình điện hóa giao thông diễn ra mạnh mẽ, hạ tầng năng lượng vẫn được xem là “nút thắt” lớn nhất, từ hệ thống trạm sạc, trạm đổi pin cho tới khả năng kết nối và vận hành đồng bộ.

Kiến tạo mô hình hạ tầng năng lượng xanh dùng chung tại Việt Nam

Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…

15:56 07/05/2026

Siêu máy tính của Eli Lilly, được phát triển cùng với Nvidia.

Ngành dược thế giới đang ứng dụng AI mạnh mẽ để tìm ra thuốc mới

Thay vì tiếp tục phụ thuộc vào phương pháp thử-sai truyền thống, các công ty dược đang chuyển hướng sang AI với kỳ vọng tận dụng sức mạnh tính toán để rút ngắn thời gian và tăng xác suất thành công...

14:06 06/05/2026

Intel đã hoàn tất bàn giao 31 thiết bị lắp ráp và kiểm định chip cho Khu Công nghệ Cao TP. Hồ Chí Minh (SHTP) và Đại học Quốc gia Hà Nội (VNU Hà Nội).

Intel hỗ trợ thiết bị sản xuất chip, phục vụ công tác đào tạo nhân lực bán dẫn cho Việt Nam

Chương trình mang đến cơ hội thực hành trực tiếp trên các trang thiết bị chuyên dụng, làm cầu nối giữa kiến thức học thuật và thực tiễn ngành, đặc biệt là trong khâu đóng gói và kiểm thử chip.

15:46 05/05/2026

Tại các thị trường như Việt Nam, ngành công nghiệp ô tô đang tăng trưởng ổn định cùng nhu cầu ngày càng cao đối với các dòng xe có kết nối và đa tính năng.

Bước tiến mới trong công nghệ truyền dẫn âm thanh cho ô tô thế hệ mới

Sự ra đời của công nghệ truyền dẫn âm thanh thế hệ 2.0 với khả năng tích hợp Ethernet liền mạch đang trở thành mắt xích quan trọng giúp các hãng xe tối ưu hóa hạ tầng kết nối và đáp ứng nhu cầu ngày càng cao về giải trí đa phương tiện trên ô tô…

15:46 05/05/2026

Japan Airlines bắt đầu thử nghiệm robot hình người tại sân bay

Trước tình trạng thiếu hụt lao động ngày càng trầm trọng, Japan Airlines đã bắt đầu thử nghiệm robot hình người tại sân bay Haneda (Tokyo) nhằm hỗ trợ các công việc mặt đất như bốc xếp hành lý và vệ sinh khoang máy bay…

08:43 05/05/2026

Động thái của Meta phản ánh áp lực ngày càng lớn về năng lượng trong cuộc đua AI toàn cầu

Meta đặt cược vào năng lượng truyền từ không gian để nuôi tham vọng AI

Meta đang theo đuổi một hướng đi đầy tham vọng: khai thác năng lượng mặt trời ngoài không gian để cung cấp điện cho các trung tâm dữ liệu trí tuệ nhân tạo...

14:39 28/04/2026