image Thứ Bảy, 23/05/2026

Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra

Bảo Ngọc

14/11/2025

Chia sẻ

Kimi K2 Thinking đến từ startup Trung Quốc Moonshot AI vượt mặt GPT-5 và Claude Sonnet 4.5 trong nhiều bài đánh giá quan trọng, đặc biệt chỉ tốn 4,6 triệu USD để huấn luyện…

Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.
Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.

Một mô hình AI Trung Quốc vừa ra mắt âm thầm nhưng mang lại kết quả ấn tượng. Mô hình Kimi K2 Thinking của Moonshot AI vừa công bố đã vượt qua GPT-5 và Claude Sonnet 4.5 trong nhiều bài kiểm tra tiêu chuẩn ngành, buộc giới quan sát phải đánh giá lại vị thế dẫn đầu trong cuộc đua AI toàn cầu, KrASIA đưa tin.

Đây là diễn biến mới nhất của cuộc cạnh tranh ngày càng gay gắt giữa Hoa Kỳ và Trung Quốc trong lĩnh vực trí tuệ nhân tạo, khiến nhiều người so sánh với bước đột phá trước đó của DeepSeek. Giới chuyên gia đặt câu hỏi liệu chuỗi thành công liên tiếp của các nhà phát triển Trung Quốc có cho thấy sự thay đổi căn bản trong cán cân AI hay không.

KẾT QUẢ KIỂM TRA CHO THẤY KHOẢNG CÁCH HIỆU SUẤT

Moonshot AI công bố vào ngày 6/11 rằng Kimi K2 Thinking đạt độ chính xác 44,9% trong bài kiểm tra Humanity’s Last Exam — bài đánh giá khắt khe gồm 2.500 câu hỏi chuyên sâu về toán học, khoa học và nhân văn. Kết quả vượt qua GPT-5 của OpenAI, vốn chỉ đạt 41,7%, theo dữ liệu được đăng trên kho GitHub của công ty.

Mô hình AI Trung Quốc tiếp tục vượt trội với 60,2% điểm trong bài kiểm tra BrowseComp, đo khả năng tìm kiếm và thu thập thông tin trên web. Trong bài kiểm tra Seal-0, được thiết kế nhằm đánh giá khả năng xử lý nhiệm vụ nghiên cứu phức tạp trong thế giới thực, Kimi K2 Thinking đạt 56,3%, dẫn đầu bảng xếp hạng.

Công ty tư vấn Artificial Analysis cũng xác nhận kết quả độc lập, báo cáo rằng Kimi K2 đạt 93% trong bài kiểm tra Tau-2 Bench Telecom mô phỏng tình huống dịch vụ khách hàng, nhấn mạnh đây là “điểm số cao nhất từng ghi nhận được”.

Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.
Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.

HIỆU QUẢ KINH TẾ LÀM GIA TĂNG SỨC CẠNH TRANH

Ngoài khả năng vượt trội về hiệu suất, yếu tố kinh tế trong quá trình phát triển Kimi K2 Thinking cũng khiến giới công nghệ chú ý. Theo CNBC, chi phí huấn luyện mô hình vào khoảng 4,6 triệu USD, dù Moonshot AI từ chối xác nhận con số cụ thể.

Tờ South China Morning Post tính toán rằng giá sử dụng API (Giao diện Lập trình Ứng dụng) của Kimi K2 Thinking rẻ hơn từ 6 đến 10 lần so với dịch vụ tương tự của OpenAI và Anthropic, có thể làm đảo lộn xu hướng ứng dụng AI trong doanh nghiệp.

Theo nền tảng Hugging Face, mô hình áp dụng kiến trúc Mixture-of-Experts với tổng cộng 1 nghìn tỷ tham số trong đó 32 tỷ tham số được kích hoạt khi suy luận, và sử dụng công nghệ lượng tử hóa INT4 giúp tăng gấp đôi tốc độ xử lý mà vẫn giữ nguyên hiệu suất.

Ông Zhang Yi, nhà khoa học trưởng tại công ty tư vấn iiMedia, nhận định chi phí huấn luyện AI tại Trung Quốc “giảm mạnh” nhờ đổi mới về kiến trúc và phương pháp huấn luyện, đánh dấu sự khác biệt rõ rệt so với cách tiếp cận tiêu tốn tài nguyên tính toán trước đây.

CẤU TRÚC KỸ THUẬT VÀ NĂNG LỰC NỔI BẬT

Nhóm nhà nghiên cứu thuộc Moonshot AI cho biết Kimi K2 Thinking có thể tự động thực hiện 200 – 300 tác vụ nối tiếp nhau mà không cần con người can thiệp, vẫn giữ được mạch lập luận logic xuyên suốt trong nhiều bài toán phức tạp. Năng lực cho phép mô hình xử lý nhiều quy trình phức hợp như nghiên cứu, lập trình hay phân tích theo chuỗi.

Mô hình hỗ trợ cửa sổ ngữ cảnh 256.000 token, sử dụng độ chính xác INT4 ngay từ đầu. Moonshot AI áp dụng đào tạo nhận biết lượng tử hóa (Quantisation-Aware Training) trong giai đoạn hậu huấn luyện, giúp giảm độ trễ và tiết kiệm bộ nhớ GPU mà không làm giảm hiệu năng.

Kimi K2 Thinking được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng thương mại hoàn toàn, với một điều kiện: các tổ chức sở hữu hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu trên 20 triệu USD/tháng phải hiển thị nhãn hiệu “Kimi K2” trên giao diện người dùng.

PHẢN ỨNG CỦA NGÀNH

Ông Thomas Wolf, đồng sáng lập nền tảng phát triển AI Hugging Face, nơi Kimi K2 Thinking trở thành mô hình phổ biến nhất cho các nhà phát triển sau khi ra mắt, đã đặt câu hỏi trên mạng xã hội: liệu ngành AI “có nên kỳ vọng vào ‘khoảnh khắc DeepSeek’ mới mỗi vài tháng hay không”, ám chỉ sự xuất hiện liên tiếp của các bước đột phá đến từ Trung Quốc.

Tuy nhiên, ông Nathan Lambert đến từ Viện AI Allen đưa ra góc nhìn thận trọng hơn, cho rằng vẫn tồn tại độ trễ khoảng 4–6 tháng giữa mô hình mã nguồn mở tiên tiến và mô hình thương mại đóng, nhưng thừa nhận “các phòng thí nghiệm Trung Quốc đang thu hẹp khoảng cách rất nhanh và đạt kết quả xuất sắc trong bài kiểm tra”.

Chuyên gia Lambert nhận xét thêm rằng dù Trung Quốc đang dẫn đầu về điểm số đánh giá, một số phòng thí nghiệm Hoa Kỳ vẫn có lợi thế trong việc tối ưu hóa trải nghiệm người dùng dài hạn, nhờ vòng phản hồi liên tục từ người dùng phương Tây.

Ông Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh, cho rằng sự cạnh tranh về chi phí là điều tất yếu đối với Trung Quốc: “Hiệu suất tổng thể của các mô hình Trung Quốc vẫn chưa bằng các mô hình hàng đầu của Mỹ, nên doanh nghiệp phải cạnh tranh bằng hiệu quả chi phí để tìm đường phát triển”.

Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.
Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.

BỐI CẢNH THỊ TRƯỜNG VÀ HƯỚNG ĐI TƯƠNG LAI

Moonshot AI hiện được định giá 3,3 tỷ USD, sau các vòng gọi vốn dẫn đầu bởi Alibaba và Tencent, là một trong những “AI Tigers” – nhóm startup AI mạnh mẽ nhất Trung Quốc theo đuổi mô hình nền tảng.

Công ty cùng với DeepSeek, Qwen và Baichuan đang chứng minh rằng các mô hình AI Trung Quốc có thể thách thức OpenAI và Anthropic không phải bằng quy mô tính toán khổng lồ, mà bằng đổi mới kiến trúc và hiệu quả huấn luyện.

Một nhà nghiên cứu AI nhận định thành công của các nhà phát triển mã nguồn mở Trung Quốc đã khiến nhiều phòng thí nghiệm phương Tây “toát mồ hôi”, tạo ra “áp lực giá nghiêm trọng và kỳ vọng mới”.

Hiện vẫn chưa rõ liệu hiệu suất của Kimi K2 Thinking có thể duy trì lâu dài hay chỉ là sự hội tụ tạm thời. Cả các phòng thí nghiệm Trung Quốc lẫn Hoa Kỳ đều đang nỗ lực nâng cấp kiến trúc, nhưng với định hướng khác nhau: Trung Quốc ưu tiên hiệu quả chi phí và mở quyền truy cập, trong khi Hoa Kỳ tập trung vào phát triển độc quyền và tối ưu trải nghiệm người dùng.

Tuy nhiên, sự ra mắt của Kimi K2 Thinking cho thấy cục diện cạnh tranh AI toàn cầu có sự thay đổi: vị thế dẫn đầu công nghệ ngày càng phụ thuộc vào hiệu quả kinh tế và đổi mới kiến trúc, chứ không chỉ dựa vào năng lực tính toán – xu hướng có thể mang lợi thế cho startup Trung Quốc, thu hút nguồn tài trợ mạnh mẽ hơn so với nhiều đối thủ phương Tây có nhu cầu vốn khổng lồ.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Đào tạo nghề cho robot: Trung Quốc chuẩn bị đưa máy móc gia nhập lực lượng lao động

Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…

18:45 22/05/2026
ADI chi 1,5 tỷ USD mua lại Empower Semiconductor, mở rộng giải pháp nguồn điện cho AI

Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.

18:45 22/05/2026
VinFuture 2026 nhận 1.819 đề cử từ 117 quốc gia và vùng lãnh thổ

Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...

20:48 19/05/2026
Gần 450 đội thi từ khắp châu Á tham gia Asian Hackathon for Green Future 2026

Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...

20:48 19/05/2026
Trung Quốc tăng tốc xây dựng mạng lưới sức mạnh tính toán quốc gia

Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...

10:19 18/05/2026
Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026
CMC tái cấu trúc Khối Công nghệ và Giải pháp, thúc đẩy mục tiêu chuyển đổi AI

CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...

11:07 13/05/2026
Qualcomm chính thức khai trương Trung tâm R&D tại Hà Nội

Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...

15:55 12/05/2026
Công nghệ điều hướng: 'Phao cứu sinh' cho thu nhập và an toàn của người lái xe 2 bánh tại Việt Nam

Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.

19:11 11/05/2026
Kiến tạo mô hình hạ tầng năng lượng xanh dùng chung tại Việt Nam

Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…

15:56 07/05/2026