image Chủ Nhật, 12/04/2026

Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra

Bảo Ngọc

14/11/2025

Chia sẻ

Kimi K2 Thinking đến từ startup Trung Quốc Moonshot AI vượt mặt GPT-5 và Claude Sonnet 4.5 trong nhiều bài đánh giá quan trọng, đặc biệt chỉ tốn 4,6 triệu USD để huấn luyện…

Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.
Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.

Một mô hình AI Trung Quốc vừa ra mắt âm thầm nhưng mang lại kết quả ấn tượng. Mô hình Kimi K2 Thinking của Moonshot AI vừa công bố đã vượt qua GPT-5 và Claude Sonnet 4.5 trong nhiều bài kiểm tra tiêu chuẩn ngành, buộc giới quan sát phải đánh giá lại vị thế dẫn đầu trong cuộc đua AI toàn cầu, KrASIA đưa tin.

Đây là diễn biến mới nhất của cuộc cạnh tranh ngày càng gay gắt giữa Hoa Kỳ và Trung Quốc trong lĩnh vực trí tuệ nhân tạo, khiến nhiều người so sánh với bước đột phá trước đó của DeepSeek. Giới chuyên gia đặt câu hỏi liệu chuỗi thành công liên tiếp của các nhà phát triển Trung Quốc có cho thấy sự thay đổi căn bản trong cán cân AI hay không.

KẾT QUẢ KIỂM TRA CHO THẤY KHOẢNG CÁCH HIỆU SUẤT

Moonshot AI công bố vào ngày 6/11 rằng Kimi K2 Thinking đạt độ chính xác 44,9% trong bài kiểm tra Humanity’s Last Exam — bài đánh giá khắt khe gồm 2.500 câu hỏi chuyên sâu về toán học, khoa học và nhân văn. Kết quả vượt qua GPT-5 của OpenAI, vốn chỉ đạt 41,7%, theo dữ liệu được đăng trên kho GitHub của công ty.

Mô hình AI Trung Quốc tiếp tục vượt trội với 60,2% điểm trong bài kiểm tra BrowseComp, đo khả năng tìm kiếm và thu thập thông tin trên web. Trong bài kiểm tra Seal-0, được thiết kế nhằm đánh giá khả năng xử lý nhiệm vụ nghiên cứu phức tạp trong thế giới thực, Kimi K2 Thinking đạt 56,3%, dẫn đầu bảng xếp hạng.

Công ty tư vấn Artificial Analysis cũng xác nhận kết quả độc lập, báo cáo rằng Kimi K2 đạt 93% trong bài kiểm tra Tau-2 Bench Telecom mô phỏng tình huống dịch vụ khách hàng, nhấn mạnh đây là “điểm số cao nhất từng ghi nhận được”.

Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.
Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.

HIỆU QUẢ KINH TẾ LÀM GIA TĂNG SỨC CẠNH TRANH

Ngoài khả năng vượt trội về hiệu suất, yếu tố kinh tế trong quá trình phát triển Kimi K2 Thinking cũng khiến giới công nghệ chú ý. Theo CNBC, chi phí huấn luyện mô hình vào khoảng 4,6 triệu USD, dù Moonshot AI từ chối xác nhận con số cụ thể.

Tờ South China Morning Post tính toán rằng giá sử dụng API (Giao diện Lập trình Ứng dụng) của Kimi K2 Thinking rẻ hơn từ 6 đến 10 lần so với dịch vụ tương tự của OpenAI và Anthropic, có thể làm đảo lộn xu hướng ứng dụng AI trong doanh nghiệp.

Theo nền tảng Hugging Face, mô hình áp dụng kiến trúc Mixture-of-Experts với tổng cộng 1 nghìn tỷ tham số trong đó 32 tỷ tham số được kích hoạt khi suy luận, và sử dụng công nghệ lượng tử hóa INT4 giúp tăng gấp đôi tốc độ xử lý mà vẫn giữ nguyên hiệu suất.

Ông Zhang Yi, nhà khoa học trưởng tại công ty tư vấn iiMedia, nhận định chi phí huấn luyện AI tại Trung Quốc “giảm mạnh” nhờ đổi mới về kiến trúc và phương pháp huấn luyện, đánh dấu sự khác biệt rõ rệt so với cách tiếp cận tiêu tốn tài nguyên tính toán trước đây.

CẤU TRÚC KỸ THUẬT VÀ NĂNG LỰC NỔI BẬT

Nhóm nhà nghiên cứu thuộc Moonshot AI cho biết Kimi K2 Thinking có thể tự động thực hiện 200 – 300 tác vụ nối tiếp nhau mà không cần con người can thiệp, vẫn giữ được mạch lập luận logic xuyên suốt trong nhiều bài toán phức tạp. Năng lực cho phép mô hình xử lý nhiều quy trình phức hợp như nghiên cứu, lập trình hay phân tích theo chuỗi.

Mô hình hỗ trợ cửa sổ ngữ cảnh 256.000 token, sử dụng độ chính xác INT4 ngay từ đầu. Moonshot AI áp dụng đào tạo nhận biết lượng tử hóa (Quantisation-Aware Training) trong giai đoạn hậu huấn luyện, giúp giảm độ trễ và tiết kiệm bộ nhớ GPU mà không làm giảm hiệu năng.

Kimi K2 Thinking được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng thương mại hoàn toàn, với một điều kiện: các tổ chức sở hữu hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu trên 20 triệu USD/tháng phải hiển thị nhãn hiệu “Kimi K2” trên giao diện người dùng.

PHẢN ỨNG CỦA NGÀNH

Ông Thomas Wolf, đồng sáng lập nền tảng phát triển AI Hugging Face, nơi Kimi K2 Thinking trở thành mô hình phổ biến nhất cho các nhà phát triển sau khi ra mắt, đã đặt câu hỏi trên mạng xã hội: liệu ngành AI “có nên kỳ vọng vào ‘khoảnh khắc DeepSeek’ mới mỗi vài tháng hay không”, ám chỉ sự xuất hiện liên tiếp của các bước đột phá đến từ Trung Quốc.

Tuy nhiên, ông Nathan Lambert đến từ Viện AI Allen đưa ra góc nhìn thận trọng hơn, cho rằng vẫn tồn tại độ trễ khoảng 4–6 tháng giữa mô hình mã nguồn mở tiên tiến và mô hình thương mại đóng, nhưng thừa nhận “các phòng thí nghiệm Trung Quốc đang thu hẹp khoảng cách rất nhanh và đạt kết quả xuất sắc trong bài kiểm tra”.

Chuyên gia Lambert nhận xét thêm rằng dù Trung Quốc đang dẫn đầu về điểm số đánh giá, một số phòng thí nghiệm Hoa Kỳ vẫn có lợi thế trong việc tối ưu hóa trải nghiệm người dùng dài hạn, nhờ vòng phản hồi liên tục từ người dùng phương Tây.

Ông Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh, cho rằng sự cạnh tranh về chi phí là điều tất yếu đối với Trung Quốc: “Hiệu suất tổng thể của các mô hình Trung Quốc vẫn chưa bằng các mô hình hàng đầu của Mỹ, nên doanh nghiệp phải cạnh tranh bằng hiệu quả chi phí để tìm đường phát triển”.

Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.
Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.

BỐI CẢNH THỊ TRƯỜNG VÀ HƯỚNG ĐI TƯƠNG LAI

Moonshot AI hiện được định giá 3,3 tỷ USD, sau các vòng gọi vốn dẫn đầu bởi Alibaba và Tencent, là một trong những “AI Tigers” – nhóm startup AI mạnh mẽ nhất Trung Quốc theo đuổi mô hình nền tảng.

Công ty cùng với DeepSeek, Qwen và Baichuan đang chứng minh rằng các mô hình AI Trung Quốc có thể thách thức OpenAI và Anthropic không phải bằng quy mô tính toán khổng lồ, mà bằng đổi mới kiến trúc và hiệu quả huấn luyện.

Một nhà nghiên cứu AI nhận định thành công của các nhà phát triển mã nguồn mở Trung Quốc đã khiến nhiều phòng thí nghiệm phương Tây “toát mồ hôi”, tạo ra “áp lực giá nghiêm trọng và kỳ vọng mới”.

Hiện vẫn chưa rõ liệu hiệu suất của Kimi K2 Thinking có thể duy trì lâu dài hay chỉ là sự hội tụ tạm thời. Cả các phòng thí nghiệm Trung Quốc lẫn Hoa Kỳ đều đang nỗ lực nâng cấp kiến trúc, nhưng với định hướng khác nhau: Trung Quốc ưu tiên hiệu quả chi phí và mở quyền truy cập, trong khi Hoa Kỳ tập trung vào phát triển độc quyền và tối ưu trải nghiệm người dùng.

Tuy nhiên, sự ra mắt của Kimi K2 Thinking cho thấy cục diện cạnh tranh AI toàn cầu có sự thay đổi: vị thế dẫn đầu công nghệ ngày càng phụ thuộc vào hiệu quả kinh tế và đổi mới kiến trúc, chứ không chỉ dựa vào năng lực tính toán – xu hướng có thể mang lợi thế cho startup Trung Quốc, thu hút nguồn tài trợ mạnh mẽ hơn so với nhiều đối thủ phương Tây có nhu cầu vốn khổng lồ.


Trung Quốc thúc đẩy AI bằng năng lượng hạt nhân tiên tiến

Trung Quốc đang đẩy nhanh việc tích hợp giữa năng lượng và tính toán như một ưu tiên quốc gia...

19:52 11/04/2026
Trải nghiệm nhân viên: "Chìa khoá" giữ chân nhân tài trong kỷ nguyên số

Trong bối cảnh cạnh tranh nhân tài ngày càng gay gắt, trải nghiệm nhân viên (EX – Employee Experience) được đánh giá không chỉ là một xu hướng, mà đang trở thành yếu tố cốt lõi quyết định sự gắn bó, giữ chân nhân tài và hiệu suất của đội ngũ…

10:26 10/04/2026
Canva đẩy mạnh AI Agent và tự động hóa marketing qua hàng loạt thương vụ thâu tóm

Các vụ mua lại được kỳ vọng giúp Canva gia tăng sức mạnh vượt trội về tác nhân AI (AI Agent), hạ tầng dữ liệu và khả năng tương tác khách hàng, từ đó giúp hãng tiến hóa mạnh mẽ từ một công cụ thiết kế đơn thuần trở thành một hệ thống toàn diện...

10:25 10/04/2026
Trung Quốc chính thức vận hành trung tâm dữ liệu dưới nước, giải "cơn khát năng lượng" cho AI

Công trình được đặt ở độ sâu 10 mét dưới mặt nước. Tổng vốn đầu tư lên tới 1,6 tỷ nhân dân tệ (khoảng 232 triệu USD), với công suất thiết kế đạt 24 MW...

10:25 10/04/2026
Việt Nam là thị trường trung tâm dữ liệu mới nổi của châu Á - Thái Bình Dương

Việt Nam đang thu hút sự quan tâm như một thị trường hạ tầng số mới nổi, được hỗ trợ bởi chi phí xây dựng cạnh tranh và tiềm năng tăng trưởng dài hạn…

10:49 07/04/2026
Công ty Nhật Bản theo đuổi giấc mơ sản xuất chip trên Mặt Trăng

Không chỉ đặt mục tiêu chen chân vào nhóm dẫn đầu ngành bán dẫn toàn cầu, Rapidus, công ty được Chính phủ Nhật Bản hậu thuẫn, còn theo đuổi một giấc mơ táo bạo hơn: xây dựng nhà máy sản xuất chip trên Mặt Trăng...

10:49 07/04/2026
Giải mã những điểm khác biệt trong vòng gọi vốn mới nhất của OpenAI

OpenAI lần đầu tiên mở rộng sự tham gia cho nhà đầu tư thông qua các kênh ngân hàng trong vòng gọi vốn kỷ lục mới đây…

16:07 04/04/2026
Nhà sản xuất robot hình người lớn nhất thế giới chuẩn bị IPO

Dù robot hình người vẫn còn cách khá xa việc phổ cập đại trà, nhưng doanh nghiệp dẫn đầu trong lĩnh vực này đã sẵn sàng bước lên sàn chứng khoán...

16:44 03/04/2026
Năm tài chính 2026: CMC đặt mục tiêu tăng trưởng doanh thu trên 20% mỗi năm

Với định vị là công ty số toàn cầu, tập đoàn công nghệ này phát triển trên ba trụ cột công nghệ chiến lược gồm hạ tầng AI, an ninh bảo mật và giải pháp AI...

17:20 02/04/2026
Máy tính lượng tử có thể phá vỡ lớp mã hóa bảo vệ crypto

Các nhà nghiên cứu của Google vừa đưa ra cảnh báo đáng chú ý: trong tương lai, máy tính lượng tử có thể phá vỡ các lớp mã hóa đang bảo vệ Bitcoin và nhiều tài sản số khác...

17:20 02/04/2026