image Thứ Sáu, 14/11/2025

Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra

Bảo Ngọc

14/11/2025

Chia sẻ

Kimi K2 Thinking đến từ startup Trung Quốc Moonshot AI vượt mặt GPT-5 và Claude Sonnet 4.5 trong nhiều bài đánh giá quan trọng, đặc biệt chỉ tốn 4,6 triệu USD để huấn luyện…

Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.
Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.

Một mô hình AI Trung Quốc vừa ra mắt âm thầm nhưng mang lại kết quả ấn tượng. Mô hình Kimi K2 Thinking của Moonshot AI vừa công bố đã vượt qua GPT-5 và Claude Sonnet 4.5 trong nhiều bài kiểm tra tiêu chuẩn ngành, buộc giới quan sát phải đánh giá lại vị thế dẫn đầu trong cuộc đua AI toàn cầu, KrASIA đưa tin.

Đây là diễn biến mới nhất của cuộc cạnh tranh ngày càng gay gắt giữa Hoa Kỳ và Trung Quốc trong lĩnh vực trí tuệ nhân tạo, khiến nhiều người so sánh với bước đột phá trước đó của DeepSeek. Giới chuyên gia đặt câu hỏi liệu chuỗi thành công liên tiếp của các nhà phát triển Trung Quốc có cho thấy sự thay đổi căn bản trong cán cân AI hay không.

KẾT QUẢ KIỂM TRA CHO THẤY KHOẢNG CÁCH HIỆU SUẤT

Moonshot AI công bố vào ngày 6/11 rằng Kimi K2 Thinking đạt độ chính xác 44,9% trong bài kiểm tra Humanity’s Last Exam — bài đánh giá khắt khe gồm 2.500 câu hỏi chuyên sâu về toán học, khoa học và nhân văn. Kết quả vượt qua GPT-5 của OpenAI, vốn chỉ đạt 41,7%, theo dữ liệu được đăng trên kho GitHub của công ty.

Mô hình AI Trung Quốc tiếp tục vượt trội với 60,2% điểm trong bài kiểm tra BrowseComp, đo khả năng tìm kiếm và thu thập thông tin trên web. Trong bài kiểm tra Seal-0, được thiết kế nhằm đánh giá khả năng xử lý nhiệm vụ nghiên cứu phức tạp trong thế giới thực, Kimi K2 Thinking đạt 56,3%, dẫn đầu bảng xếp hạng.

Công ty tư vấn Artificial Analysis cũng xác nhận kết quả độc lập, báo cáo rằng Kimi K2 đạt 93% trong bài kiểm tra Tau-2 Bench Telecom mô phỏng tình huống dịch vụ khách hàng, nhấn mạnh đây là “điểm số cao nhất từng ghi nhận được”.

Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.
Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.

HIỆU QUẢ KINH TẾ LÀM GIA TĂNG SỨC CẠNH TRANH

Ngoài khả năng vượt trội về hiệu suất, yếu tố kinh tế trong quá trình phát triển Kimi K2 Thinking cũng khiến giới công nghệ chú ý. Theo CNBC, chi phí huấn luyện mô hình vào khoảng 4,6 triệu USD, dù Moonshot AI từ chối xác nhận con số cụ thể.

Tờ South China Morning Post tính toán rằng giá sử dụng API (Giao diện Lập trình Ứng dụng) của Kimi K2 Thinking rẻ hơn từ 6 đến 10 lần so với dịch vụ tương tự của OpenAI và Anthropic, có thể làm đảo lộn xu hướng ứng dụng AI trong doanh nghiệp.

Theo nền tảng Hugging Face, mô hình áp dụng kiến trúc Mixture-of-Experts với tổng cộng 1 nghìn tỷ tham số trong đó 32 tỷ tham số được kích hoạt khi suy luận, và sử dụng công nghệ lượng tử hóa INT4 giúp tăng gấp đôi tốc độ xử lý mà vẫn giữ nguyên hiệu suất.

Ông Zhang Yi, nhà khoa học trưởng tại công ty tư vấn iiMedia, nhận định chi phí huấn luyện AI tại Trung Quốc “giảm mạnh” nhờ đổi mới về kiến trúc và phương pháp huấn luyện, đánh dấu sự khác biệt rõ rệt so với cách tiếp cận tiêu tốn tài nguyên tính toán trước đây.

CẤU TRÚC KỸ THUẬT VÀ NĂNG LỰC NỔI BẬT

Nhóm nhà nghiên cứu thuộc Moonshot AI cho biết Kimi K2 Thinking có thể tự động thực hiện 200 – 300 tác vụ nối tiếp nhau mà không cần con người can thiệp, vẫn giữ được mạch lập luận logic xuyên suốt trong nhiều bài toán phức tạp. Năng lực cho phép mô hình xử lý nhiều quy trình phức hợp như nghiên cứu, lập trình hay phân tích theo chuỗi.

Mô hình hỗ trợ cửa sổ ngữ cảnh 256.000 token, sử dụng độ chính xác INT4 ngay từ đầu. Moonshot AI áp dụng đào tạo nhận biết lượng tử hóa (Quantisation-Aware Training) trong giai đoạn hậu huấn luyện, giúp giảm độ trễ và tiết kiệm bộ nhớ GPU mà không làm giảm hiệu năng.

Kimi K2 Thinking được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng thương mại hoàn toàn, với một điều kiện: các tổ chức sở hữu hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu trên 20 triệu USD/tháng phải hiển thị nhãn hiệu “Kimi K2” trên giao diện người dùng.

PHẢN ỨNG CỦA NGÀNH

Ông Thomas Wolf, đồng sáng lập nền tảng phát triển AI Hugging Face, nơi Kimi K2 Thinking trở thành mô hình phổ biến nhất cho các nhà phát triển sau khi ra mắt, đã đặt câu hỏi trên mạng xã hội: liệu ngành AI “có nên kỳ vọng vào ‘khoảnh khắc DeepSeek’ mới mỗi vài tháng hay không”, ám chỉ sự xuất hiện liên tiếp của các bước đột phá đến từ Trung Quốc.

Tuy nhiên, ông Nathan Lambert đến từ Viện AI Allen đưa ra góc nhìn thận trọng hơn, cho rằng vẫn tồn tại độ trễ khoảng 4–6 tháng giữa mô hình mã nguồn mở tiên tiến và mô hình thương mại đóng, nhưng thừa nhận “các phòng thí nghiệm Trung Quốc đang thu hẹp khoảng cách rất nhanh và đạt kết quả xuất sắc trong bài kiểm tra”.

Chuyên gia Lambert nhận xét thêm rằng dù Trung Quốc đang dẫn đầu về điểm số đánh giá, một số phòng thí nghiệm Hoa Kỳ vẫn có lợi thế trong việc tối ưu hóa trải nghiệm người dùng dài hạn, nhờ vòng phản hồi liên tục từ người dùng phương Tây.

Ông Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh, cho rằng sự cạnh tranh về chi phí là điều tất yếu đối với Trung Quốc: “Hiệu suất tổng thể của các mô hình Trung Quốc vẫn chưa bằng các mô hình hàng đầu của Mỹ, nên doanh nghiệp phải cạnh tranh bằng hiệu quả chi phí để tìm đường phát triển”.

Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.
Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.

BỐI CẢNH THỊ TRƯỜNG VÀ HƯỚNG ĐI TƯƠNG LAI

Moonshot AI hiện được định giá 3,3 tỷ USD, sau các vòng gọi vốn dẫn đầu bởi Alibaba và Tencent, là một trong những “AI Tigers” – nhóm startup AI mạnh mẽ nhất Trung Quốc theo đuổi mô hình nền tảng.

Công ty cùng với DeepSeek, Qwen và Baichuan đang chứng minh rằng các mô hình AI Trung Quốc có thể thách thức OpenAI và Anthropic không phải bằng quy mô tính toán khổng lồ, mà bằng đổi mới kiến trúc và hiệu quả huấn luyện.

Một nhà nghiên cứu AI nhận định thành công của các nhà phát triển mã nguồn mở Trung Quốc đã khiến nhiều phòng thí nghiệm phương Tây “toát mồ hôi”, tạo ra “áp lực giá nghiêm trọng và kỳ vọng mới”.

Hiện vẫn chưa rõ liệu hiệu suất của Kimi K2 Thinking có thể duy trì lâu dài hay chỉ là sự hội tụ tạm thời. Cả các phòng thí nghiệm Trung Quốc lẫn Hoa Kỳ đều đang nỗ lực nâng cấp kiến trúc, nhưng với định hướng khác nhau: Trung Quốc ưu tiên hiệu quả chi phí và mở quyền truy cập, trong khi Hoa Kỳ tập trung vào phát triển độc quyền và tối ưu trải nghiệm người dùng.

Tuy nhiên, sự ra mắt của Kimi K2 Thinking cho thấy cục diện cạnh tranh AI toàn cầu có sự thay đổi: vị thế dẫn đầu công nghệ ngày càng phụ thuộc vào hiệu quả kinh tế và đổi mới kiến trúc, chứ không chỉ dựa vào năng lực tính toán – xu hướng có thể mang lợi thế cho startup Trung Quốc, thu hút nguồn tài trợ mạnh mẽ hơn so với nhiều đối thủ phương Tây có nhu cầu vốn khổng lồ.


Dubai chuyển đổi số dịch vụ công bằng AI với tốc độ cực nhanh

Chính quyền Dubai triển khai các dự án AI chỉ trong vài tháng, với mục tiêu 96% cơ quan áp dụng AI vào năm 2025, mang lại lợi ích cho người dân.

09:44 13/11/2025
Bước tiến mới của điều trị ung thư: Trí tuệ nhân tạo giúp tạo ra kháng thể

Nhóm nghiên cứu Đại học Washington đã thành công trong việc sử dụng AI để tạo ra kháng thể chống ung thư, rút ngắn thời gian phát triển thuốc.

09:43 13/11/2025
Kỹ sư Việt phát triển AI tra cứu luật, truy xuất pháp lý chính xác 90%

Dự án AI Tra Cứu Luật Pro ra mắt với công nghệ VERA và SIFAI, giúp truy xuất 350.000 văn bản pháp luật Việt Nam chính xác 90%.

09:42 13/11/2025
Điều gì khiến máy tính lượng tử chưa thể thật sự bứt phá bất chấp nhiều tin tốt?

Ngành máy tính lượng tử đang thu hút sự chú ý với những bước tiến lớn, nhưng vẫn còn nhiều thách thức cần vượt qua trước khi bứt phá.

15:46 11/11/2025
Hệ thống máy tính lượng tử mới ra mắt, được đánh giá “tối tân nhất hiện nay”

Quantinuum ra mắt Helios, hệ thống máy tính lượng tử tiên tiến với 98 qubit vật lý, đánh dấu bước tiến quan trọng trong ứng dụng thực tiễn công nghệ lượng tử.

15:25 07/11/2025
Tatinta giới thiệu mô hình“Trawell” (Travel kết hợp Well-being) tại ITB ASIA 2025

Tatinta giới thiệu mô hình Trawell kết hợp du lịch và sức khỏe tại ITB Asia 2025, hướng tới trải nghiệm sâu sắc và toàn diện cho du khách.

13:00 07/11/2025
Univers, AMD, Microsoft và Đại học Quốc gia Singapore ra mắt phòng thí nghiệm AI nhằm nâng cao hiệu quả công nghiệp

Univers, AMD, Microsoft và NUS ra mắt Global Impact AI Lab tại Singapore, thúc đẩy đổi mới trong lĩnh vực AI và IoT, cải thiện hiệu quả công nghiệp.

10:15 07/11/2025
Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"

Các mô hình ngôn ngữ nhỏ đang chứng tỏ sức mạnh vượt trội trong việc tối ưu hóa quy trình kinh doanh và giảm chi phí, thay vì những mô hình lớn đắt đỏ.

10:12 07/11/2025