Các mô hình AI ráo riết ra mắt phiên bản tiên tiến hơn
Mai Anh
28/03/2025
Các doanh nghiệp AI đang tạo ra cuộc đua không chỉ về mô hình AI cao cấp mà còn về chi phí và bản quyền…
Google ngày 26/3 đã tung ra Gemini 2.5 – phiên bản cập nhật với nhiều điểm tối ưu chỉ vài tháng sau khi ra mắt Gemini 2.0, gọi đây là “mô hình AI thông minh nhất”.
Theo giới thiệu trên trang blog của Google, Gemini 2.5 được thiết kế nhằm tư duy trước khi đưa ra các phản hồi, từ đó giúp nâng cao hiệu suất và cải thiện độ chính xác.
Trong lĩnh vực AI, “khả năng suy luận” không chỉ đơn thuần là phân loại và dự đoán, mà còn bao gồm phân tích thông tin, rút ra kết luận logic, kết hợp cùng ngữ cảnh và sắc thái, từ đó đưa ra quyết định sáng suốt.
“Chúng tôi đã dành nhiều thời gian để nghiên cứu cách giúp AI trở nên thông minh hơn thông qua các kỹ thuật như học tăng cường (reinforcement learning) và chuỗi tư duy (chain-of-thought prompting)”, ông Koray Kavukcuoglu, Giám đốc Công nghệ của Google DeepMind, cho biết.
Gemini 2.5 được giới thiệu là đã đạt tới cấp độ hiệu suất mới nhờ kết hợp giữa các mô hình được nâng cấp cùng quá trình huấn luyện được cải thiện.
Gemini 2.5 Pro Experimental hiện là mô hình tiên tiến nhất của Google dành cho các tác vụ phức tạp. Theo Google, mô hình này hiện đang đứng đầu bảng xếp hạng LMArena với khoảng cách đáng kể so với các mô hình khác, cho thấy khả năng vượt trội cả về hiệu suất và chất lượng phản hồi. 2.5 Pro cũng thể hiện năng lực xuất sắc trong suy luận và lập trình, dẫn đầu ở nhiều bài đánh giá về lập trình, toán học và khoa học.
Không hề kém cạnh, Microsoft 365 Copilot cùng ngày 26/3 đã giới thiệu hai tác nhân AI có tên Nghiên cứu và Phân tích. Hai tác nhân này có thể phân tích lượng thông tin khổng lồ với quyền truy cập an toàn vào các dữ liệu công việc.
Theo Microsoft, tác nhân Nghiên cứu có thể giúp con người giải quyết các nghiên cứu phức tạp tại nơi làm việc, cung cấp thông tin chi tiết với chất lượng và độ chính xác cao hơn so với trước đây nhờ vào sự kết hợp mô hình nghiên cứu chuyên sâu của OpenAI với khả năng tìm kiếm chuyên sâu của Microsoft 365 Copilot.
Tác nhân này còn có thể tận dụng dữ liệu của bên thứ ba thông qua các kết nối để cung cấp thông tin chi tiết, toàn diện hơn.
Trong khi đó, tác nhân Phân tích có thể suy nghĩ như một nhà khoa học dữ liệu lành nghề, giúp con người chuyển từ dữ liệu thô sang thông tin chi tiết chỉ trong vài phút.
Được xây dựng trên mô hình lý luận o3-mini của OpenAI và được tối ưu hóa để thực hiện phân tích dữ liệu nâng cao tại nơi làm việc, tác nhân Phân tích sử dụng suy luận thông qua qua chuỗi suy nghĩ đã được dùng thực hiện các vấn đề có tính lặp đi lặp lại và tinh chỉnh liên tục, từ đó cung cấp câu trả lời chất lượng cao, phản ánh tư duy phân tích của con người.
Thậm chí, tác nhân này có thể chạy Python để giải quyết các truy vấn dữ liệu phức tạp nhất, có thể biến dữ liệu thô nằm rải rác trên nhiều bảng tính thành dự báo nhu cầu cho một sản phẩm mới, hình ảnh trực quan về các mẫu mua hàng của khách hàng hoặc dự báo doanh thu.
Không chỉ có Mỹ, các doanh nghiệp Trung Quốc cũng ráo riết trong cuộc đua AI.
Thông tin từ Reuters cho biết, Baidu giữa tháng 3 này đã ra mắt hai mô hình AI mới, bao gồm một mô hình tập trung vào khả năng suy luận nhằm cạnh tranh với DeepSeek.
"ERNIE X1 mang lại hiệu suất ngang bằng với DeepSeek R1 với mức giá chỉ bằng một nửa", Baidu cho biết. X1 có "khả năng hiểu biết, lập kế hoạch, phản hồi và tiến hóa mạnh mẽ hơn", đồng thời, đây là mô hình tư duy sâu đầu tiên sử dụng các công cụ một cách tự động.
Bên cạnh đó, mô hình nền tảng mới nhất ERNIE 4.5 của doanh nghiệp này có "khả năng hiểu biết đa phương thức tuyệt vời, có khả năng ngôn ngữ tiên tiến hơn. Khả năng hiểu biết, tạo ra, logic và ghi nhớ của mô hình được cải thiện toàn diện".
Điều đáng chú ý nữa là mô hình này được giới thiệu là có “EQ cao”, hiểu được các ảnh chế hài hước và các phim hoạt hình châm biếm.
Trong bối cảnh cạnh tranh khốc liệt, Baidu đã phải vật lộn để phổ biến mô hình ngôn ngữ lớn dù đưa ra các tuyên bố hiệu suất tương đường với với GPT-4 của OpenAI.
Với DeepSeek – cái tên đến từ Trung Quốc từng làm chao đảo giới công nghệ hồi đầu năm nay – tiếp tục tạo ra thêm làn sóng mới trong ngành công nghiệp AI với mô hình mới có tên DeepSeek-V3-0324 trên nền tảng phát triển AI Hugging Face.
Theo trang Venturebeat, điều đặc biệt trong lần nâng cấp này là mô hình của DeepSeek cho phép sử dụng miễn phí với mục đích thương mại. DeepSeek-V3-0324 còn có thể chạy trực tiếp trên phần cứng của các sản phẩm tiêu dùng như Apple Mac Studio với chip M3.
Không chỉ đột phá về công nghệ, mô hình mới của DeepSeek còn đặt ra thách thức lớn với mô hình kinh doanh thu phí của OpenAI. Trong khi tay chơi đến từ Mỹ vẫn duy trì các gói trả phí, DeepSeek lại đưa ra một công nghệ tương đương không mất phí và có thể sử dụng thương mại.
Khả năng chạy trực tiếp trên các phần cứng trong những sản phẩm tiêu dùng cao cấp có thể khiến nhu cầu đối với dịch vụ đám mây cũng như API trả phí – cầu nối cho phép các nền tảng giao tiếp và chia sẻ dữ liệu.
Dòng sự kiện:
Trí tuệ nhân tạo -AICIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.
CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...
Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...
Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.
Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…
Thay vì tiếp tục phụ thuộc vào phương pháp thử-sai truyền thống, các công ty dược đang chuyển hướng sang AI với kỳ vọng tận dụng sức mạnh tính toán để rút ngắn thời gian và tăng xác suất thành công...
Chương trình mang đến cơ hội thực hành trực tiếp trên các trang thiết bị chuyên dụng, làm cầu nối giữa kiến thức học thuật và thực tiễn ngành, đặc biệt là trong khâu đóng gói và kiểm thử chip.
Sự ra đời của công nghệ truyền dẫn âm thanh thế hệ 2.0 với khả năng tích hợp Ethernet liền mạch đang trở thành mắt xích quan trọng giúp các hãng xe tối ưu hóa hạ tầng kết nối và đáp ứng nhu cầu ngày càng cao về giải trí đa phương tiện trên ô tô…
Trước tình trạng thiếu hụt lao động ngày càng trầm trọng, Japan Airlines đã bắt đầu thử nghiệm robot hình người tại sân bay Haneda (Tokyo) nhằm hỗ trợ các công việc mặt đất như bốc xếp hành lý và vệ sinh khoang máy bay…
Meta đang theo đuổi một hướng đi đầy tham vọng: khai thác năng lượng mặt trời ngoài không gian để cung cấp điện cho các trung tâm dữ liệu trí tuệ nhân tạo...