image Thứ Năm, 05/02/2026

Các mô hình AI ráo riết ra mắt phiên bản tiên tiến hơn

Mai Anh

28/03/2025

Chia sẻ

Các doanh nghiệp AI đang tạo ra cuộc đua không chỉ về mô hình AI cao cấp mà còn về chi phí và bản quyền…

Các mô hình AI ngày càng có nhiều kỹ năng giống con người. Ảnh: Fiverr
Các mô hình AI ngày càng có nhiều kỹ năng giống con người. Ảnh: Fiverr

Google ngày 26/3 đã tung ra Gemini 2.5 – phiên bản cập nhật với nhiều điểm tối ưu chỉ vài tháng sau khi ra mắt Gemini 2.0, gọi đây là “mô hình AI thông minh nhất”.

Theo giới thiệu trên trang blog của Google, Gemini 2.5 được thiết kế nhằm tư duy trước khi đưa ra các phản hồi, từ đó giúp nâng cao hiệu suất và cải thiện độ chính xác.

Trong lĩnh vực AI, “khả năng suy luận” không chỉ đơn thuần là phân loại và dự đoán, mà còn bao gồm phân tích thông tin, rút ra kết luận logic, kết hợp cùng ngữ cảnh và sắc thái, từ đó đưa ra quyết định sáng suốt.

“Chúng tôi đã dành nhiều thời gian để nghiên cứu cách giúp AI trở nên thông minh hơn thông qua các kỹ thuật như học tăng cường (reinforcement learning) và chuỗi tư duy (chain-of-thought prompting)”, ông Koray Kavukcuoglu, Giám đốc Công nghệ của Google DeepMind, cho biết.

Gemini 2.5 được giới thiệu là đã đạt tới cấp độ hiệu suất mới nhờ kết hợp giữa các mô hình được nâng cấp cùng quá trình huấn luyện được cải thiện.

Gemini 2.5 Pro Experimental hiện là mô hình tiên tiến nhất của Google dành cho các tác vụ phức tạp. Theo Google, mô hình này hiện đang đứng đầu bảng xếp hạng LMArena với khoảng cách đáng kể so với các mô hình khác, cho thấy khả năng vượt trội cả về hiệu suất và chất lượng phản hồi. 2.5 Pro cũng thể hiện năng lực xuất sắc trong suy luận và lập trình, dẫn đầu ở nhiều bài đánh giá về lập trình, toán học và khoa học.

Không hề kém cạnh, Microsoft 365 Copilot cùng ngày 26/3 đã giới thiệu hai tác nhân AI có tên Nghiên cứu và Phân tích. Hai tác nhân này có thể phân tích lượng thông tin khổng lồ với quyền truy cập an toàn vào các dữ liệu công việc.

Theo Microsoft, tác nhân Nghiên cứu có thể giúp con người giải quyết các nghiên cứu phức tạp tại nơi làm việc, cung cấp thông tin chi tiết với chất lượng và độ chính xác cao hơn so với trước đây nhờ vào sự kết hợp mô hình nghiên cứu chuyên sâu của OpenAI với khả năng tìm kiếm chuyên sâu của Microsoft 365 Copilot.

Tác nhân này còn có thể tận dụng dữ liệu của bên thứ ba thông qua các kết nối để cung cấp thông tin chi tiết, toàn diện hơn.

Trong khi đó, tác nhân Phân tích có thể suy nghĩ như một nhà khoa học dữ liệu lành nghề, giúp con người chuyển từ dữ liệu thô sang thông tin chi tiết chỉ trong vài phút.

Được xây dựng trên mô hình lý luận o3-mini của OpenAI và được tối ưu hóa để thực hiện phân tích dữ liệu nâng cao tại nơi làm việc, tác nhân Phân tích sử dụng suy luận thông qua qua chuỗi suy nghĩ đã được dùng thực hiện các vấn đề có tính lặp đi lặp lại và tinh chỉnh liên tục, từ đó cung cấp câu trả lời chất lượng cao, phản ánh tư duy phân tích của con người.

Thậm chí, tác nhân này có thể chạy Python để giải quyết các truy vấn dữ liệu phức tạp nhất, có thể biến dữ liệu thô nằm rải rác trên nhiều bảng tính thành dự báo nhu cầu cho một sản phẩm mới, hình ảnh trực quan về các mẫu mua hàng của khách hàng hoặc dự báo doanh thu.

Các mô hình AI đang ngày càng được nâng cao khả năng suy luận giống con người. Ảnh: India AI
Các mô hình AI đang ngày càng được nâng cao khả năng suy luận giống con người. Ảnh: India AI

Không chỉ có Mỹ, các doanh nghiệp Trung Quốc cũng ráo riết trong cuộc đua AI.

Thông tin từ Reuters cho biết, Baidu giữa tháng 3 này đã ra mắt hai mô hình AI mới, bao gồm một mô hình tập trung vào khả năng suy luận nhằm cạnh tranh với DeepSeek.

"ERNIE X1 mang lại hiệu suất ngang bằng với DeepSeek R1 với mức giá chỉ bằng một nửa", Baidu cho biết. X1 có "khả năng hiểu biết, lập kế hoạch, phản hồi và tiến hóa mạnh mẽ hơn", đồng thời, đây là mô hình tư duy sâu đầu tiên sử dụng các công cụ một cách tự động.

Bên cạnh đó, mô hình nền tảng mới nhất ERNIE 4.5 của doanh nghiệp này có "khả năng hiểu biết đa phương thức tuyệt vời, có khả năng ngôn ngữ tiên tiến hơn. Khả năng hiểu biết, tạo ra, logic và ghi nhớ của mô hình được cải thiện toàn diện".

Điều đáng chú ý nữa là mô hình này được giới thiệu là có “EQ cao”, hiểu được các ảnh chế hài hước và các phim hoạt hình châm biếm.

Trong bối cảnh cạnh tranh khốc liệt, Baidu đã phải vật lộn để phổ biến mô hình ngôn ngữ lớn dù đưa ra các tuyên bố hiệu suất tương đường với với GPT-4 của OpenAI.

Với DeepSeek – cái tên đến từ Trung Quốc từng làm chao đảo giới công nghệ hồi đầu năm nay – tiếp tục tạo ra thêm làn sóng mới trong ngành công nghiệp AI với mô hình mới có tên DeepSeek-V3-0324 trên nền tảng phát triển AI Hugging Face.

Theo trang Venturebeat, điều đặc biệt trong lần nâng cấp này là mô hình của DeepSeek cho phép sử dụng miễn phí với mục đích thương mại. DeepSeek-V3-0324 còn có thể chạy trực tiếp trên phần cứng của các sản phẩm tiêu dùng như Apple Mac Studio với chip M3.

Không chỉ đột phá về công nghệ, mô hình mới của DeepSeek còn đặt ra thách thức lớn với mô hình kinh doanh thu phí của OpenAI. Trong khi tay chơi đến từ Mỹ vẫn duy trì các gói trả phí, DeepSeek lại đưa ra một công nghệ tương đương không mất phí và có thể sử dụng thương mại.

Khả năng chạy trực tiếp trên các phần cứng trong những sản phẩm tiêu dùng cao cấp có thể khiến nhu cầu đối với dịch vụ đám mây cũng như API trả phí – cầu nối cho phép các nền tảng giao tiếp và chia sẻ dữ liệu.


Công cụ AI mới của Google có khả năng giải mã và dự đoán thay đổi DNA

Mô hình AI của Google DeepMind có thể giải mã DNA và dự đoán một số đột biến, mở ra hướng đi mới cho nghiên cứu chữa bệnh…

09:58 04/02/2026
Chip não Neuralink: Từ thí nghiệm phòng lab đến những thay đổi thực tế trên cơ thể người

Các bác sĩ cho biết kết quả ban đầu của Neuralink rất đáng khích lệ, nhưng công nghệ hiện vẫn trong giai đoạn thử nghiệm…

09:10 04/02/2026
Cuộc chơi mới có thể khiến chip Nvidia ‘thất sủng’

Các đối thủ đã kiếm được hàng tỷ đô la trong lĩnh vực kinh doanh chip năm qua, cho thấy rằng Nvidia không phải là người duy nhất thống trị thị trường…

09:10 04/02/2026
Giữa "bão" thông tin và AI, điều gì thực sự khiến khách hàng dừng lại và tin tưởng thương hiệu?

Khi các tính năng sản phẩm và sự hỗ trợ của AI dần trở nên bão hòa, cảm xúc trở thành "chiến trường" cuối cùng để các thương hiệu giành lấy niềm tin khách hàng...

11:57 02/02/2026
Edtech năm 2026: Các xu hướng định hình tương lai giáo dục

Công nghệ giáo dục đang chuyển sang một kỷ nguyên thích ứng, nơi các hệ thống vận hành như một hệ sinh thái số thống nhất và không ngừng phát triển…

11:44 30/01/2026
CMC hợp tác chiến lược với NTT DATA

Sự hợp tác được thúc đẩy bởi nhu cầu hiện đại hóa và tình trạng thiếu hụt nhân sự tại Nhật Bản, giữa lúc Việt Nam nổi lên là điểm đến tối ưu nhờ năng lực chuyên môn, khả năng mở rộng đội ngũ và kinh nghiệm làm việc dày dặn với khách hàng Nhật...

07:46 29/01/2026
Các giải pháp AI cho nông nghiệp và nuôi trồng thủy sản dẫn đầu cuộc thi Hackathon khí hậu

Hackathon nhấn mạnh cách tiếp cận giải quyết vấn đề từ thực tiễn, việc sử dụng AI một cách có trách nhiệm và đạo đức, cũng như sự phù hợp của giải pháp với điều kiện khí hậu và bối cảnh địa phương của Đồng bằng sông Cửu Long...

07:45 29/01/2026
Trung Quốc tiến sát cột mốc phê duyệt thuốc “thuần AI”

Trung Quốc có thể trở thành một trong những thị trường đầu tiên trên thế giới phê duyệt một loại thuốc được thiết kế hoàn toàn bằng trí tuệ nhân tạo ngay trong năm 2026…

07:44 29/01/2026
Apple đang suy nghĩ lại về cách Siri hoạt động như một chatbot

Trong nhiều năm, Apple luôn tỏ ra thận trọng, thậm chí có phần né tránh với trí tuệ nhân tạo dạng trò chuyện. Hãng tin rằng người dùng không muốn phải “bước vào một khung chat” chỉ để hoàn thành những thao tác hàng ngày…

17:04 27/01/2026
ChatGPT bắt đầu hiển thị quảng cáo cho người dùng dựa trên nội dung hội thoại

ChatGPT có thể sớm hiển thị quảng cáo sản phẩm mà hệ thống cho rằng người dùng muốn mua...

11:25 22/01/2026