Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra
Bảo Ngọc
14/11/2025
Kimi K2 Thinking đến từ startup Trung Quốc Moonshot AI vượt mặt GPT-5 và Claude Sonnet 4.5 trong nhiều bài đánh giá quan trọng, đặc biệt chỉ tốn 4,6 triệu USD để huấn luyện…
Một mô hình AI Trung Quốc vừa ra mắt âm thầm nhưng mang lại kết quả ấn tượng. Mô hình Kimi K2 Thinking của Moonshot AI vừa công bố đã vượt qua GPT-5 và Claude Sonnet 4.5 trong nhiều bài kiểm tra tiêu chuẩn ngành, buộc giới quan sát phải đánh giá lại vị thế dẫn đầu trong cuộc đua AI toàn cầu, KrASIA đưa tin.
Đây là diễn biến mới nhất của cuộc cạnh tranh ngày càng gay gắt giữa Hoa Kỳ và Trung Quốc trong lĩnh vực trí tuệ nhân tạo, khiến nhiều người so sánh với bước đột phá trước đó của DeepSeek. Giới chuyên gia đặt câu hỏi liệu chuỗi thành công liên tiếp của các nhà phát triển Trung Quốc có cho thấy sự thay đổi căn bản trong cán cân AI hay không.
KẾT QUẢ KIỂM TRA CHO THẤY KHOẢNG CÁCH HIỆU SUẤT
Moonshot AI công bố vào ngày 6/11 rằng Kimi K2 Thinking đạt độ chính xác 44,9% trong bài kiểm tra Humanity’s Last Exam — bài đánh giá khắt khe gồm 2.500 câu hỏi chuyên sâu về toán học, khoa học và nhân văn. Kết quả vượt qua GPT-5 của OpenAI, vốn chỉ đạt 41,7%, theo dữ liệu được đăng trên kho GitHub của công ty.
Mô hình AI Trung Quốc tiếp tục vượt trội với 60,2% điểm trong bài kiểm tra BrowseComp, đo khả năng tìm kiếm và thu thập thông tin trên web. Trong bài kiểm tra Seal-0, được thiết kế nhằm đánh giá khả năng xử lý nhiệm vụ nghiên cứu phức tạp trong thế giới thực, Kimi K2 Thinking đạt 56,3%, dẫn đầu bảng xếp hạng.
Công ty tư vấn Artificial Analysis cũng xác nhận kết quả độc lập, báo cáo rằng Kimi K2 đạt 93% trong bài kiểm tra Tau-2 Bench Telecom mô phỏng tình huống dịch vụ khách hàng, nhấn mạnh đây là “điểm số cao nhất từng ghi nhận được”.
HIỆU QUẢ KINH TẾ LÀM GIA TĂNG SỨC CẠNH TRANH
Ngoài khả năng vượt trội về hiệu suất, yếu tố kinh tế trong quá trình phát triển Kimi K2 Thinking cũng khiến giới công nghệ chú ý. Theo CNBC, chi phí huấn luyện mô hình vào khoảng 4,6 triệu USD, dù Moonshot AI từ chối xác nhận con số cụ thể.
Tờ South China Morning Post tính toán rằng giá sử dụng API (Giao diện Lập trình Ứng dụng) của Kimi K2 Thinking rẻ hơn từ 6 đến 10 lần so với dịch vụ tương tự của OpenAI và Anthropic, có thể làm đảo lộn xu hướng ứng dụng AI trong doanh nghiệp.
Theo nền tảng Hugging Face, mô hình áp dụng kiến trúc Mixture-of-Experts với tổng cộng 1 nghìn tỷ tham số trong đó 32 tỷ tham số được kích hoạt khi suy luận, và sử dụng công nghệ lượng tử hóa INT4 giúp tăng gấp đôi tốc độ xử lý mà vẫn giữ nguyên hiệu suất.
Ông Zhang Yi, nhà khoa học trưởng tại công ty tư vấn iiMedia, nhận định chi phí huấn luyện AI tại Trung Quốc “giảm mạnh” nhờ đổi mới về kiến trúc và phương pháp huấn luyện, đánh dấu sự khác biệt rõ rệt so với cách tiếp cận tiêu tốn tài nguyên tính toán trước đây.
CẤU TRÚC KỸ THUẬT VÀ NĂNG LỰC NỔI BẬT
Nhóm nhà nghiên cứu thuộc Moonshot AI cho biết Kimi K2 Thinking có thể tự động thực hiện 200 – 300 tác vụ nối tiếp nhau mà không cần con người can thiệp, vẫn giữ được mạch lập luận logic xuyên suốt trong nhiều bài toán phức tạp. Năng lực cho phép mô hình xử lý nhiều quy trình phức hợp như nghiên cứu, lập trình hay phân tích theo chuỗi.
Mô hình hỗ trợ cửa sổ ngữ cảnh 256.000 token, sử dụng độ chính xác INT4 ngay từ đầu. Moonshot AI áp dụng đào tạo nhận biết lượng tử hóa (Quantisation-Aware Training) trong giai đoạn hậu huấn luyện, giúp giảm độ trễ và tiết kiệm bộ nhớ GPU mà không làm giảm hiệu năng.
Kimi K2 Thinking được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng thương mại hoàn toàn, với một điều kiện: các tổ chức sở hữu hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu trên 20 triệu USD/tháng phải hiển thị nhãn hiệu “Kimi K2” trên giao diện người dùng.
PHẢN ỨNG CỦA NGÀNH
Ông Thomas Wolf, đồng sáng lập nền tảng phát triển AI Hugging Face, nơi Kimi K2 Thinking trở thành mô hình phổ biến nhất cho các nhà phát triển sau khi ra mắt, đã đặt câu hỏi trên mạng xã hội: liệu ngành AI “có nên kỳ vọng vào ‘khoảnh khắc DeepSeek’ mới mỗi vài tháng hay không”, ám chỉ sự xuất hiện liên tiếp của các bước đột phá đến từ Trung Quốc.
Tuy nhiên, ông Nathan Lambert đến từ Viện AI Allen đưa ra góc nhìn thận trọng hơn, cho rằng vẫn tồn tại độ trễ khoảng 4–6 tháng giữa mô hình mã nguồn mở tiên tiến và mô hình thương mại đóng, nhưng thừa nhận “các phòng thí nghiệm Trung Quốc đang thu hẹp khoảng cách rất nhanh và đạt kết quả xuất sắc trong bài kiểm tra”.
Chuyên gia Lambert nhận xét thêm rằng dù Trung Quốc đang dẫn đầu về điểm số đánh giá, một số phòng thí nghiệm Hoa Kỳ vẫn có lợi thế trong việc tối ưu hóa trải nghiệm người dùng dài hạn, nhờ vòng phản hồi liên tục từ người dùng phương Tây.
Ông Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh, cho rằng sự cạnh tranh về chi phí là điều tất yếu đối với Trung Quốc: “Hiệu suất tổng thể của các mô hình Trung Quốc vẫn chưa bằng các mô hình hàng đầu của Mỹ, nên doanh nghiệp phải cạnh tranh bằng hiệu quả chi phí để tìm đường phát triển”.
BỐI CẢNH THỊ TRƯỜNG VÀ HƯỚNG ĐI TƯƠNG LAI
Moonshot AI hiện được định giá 3,3 tỷ USD, sau các vòng gọi vốn dẫn đầu bởi Alibaba và Tencent, là một trong những “AI Tigers” – nhóm startup AI mạnh mẽ nhất Trung Quốc theo đuổi mô hình nền tảng.
Công ty cùng với DeepSeek, Qwen và Baichuan đang chứng minh rằng các mô hình AI Trung Quốc có thể thách thức OpenAI và Anthropic không phải bằng quy mô tính toán khổng lồ, mà bằng đổi mới kiến trúc và hiệu quả huấn luyện.
Một nhà nghiên cứu AI nhận định thành công của các nhà phát triển mã nguồn mở Trung Quốc đã khiến nhiều phòng thí nghiệm phương Tây “toát mồ hôi”, tạo ra “áp lực giá nghiêm trọng và kỳ vọng mới”.
Hiện vẫn chưa rõ liệu hiệu suất của Kimi K2 Thinking có thể duy trì lâu dài hay chỉ là sự hội tụ tạm thời. Cả các phòng thí nghiệm Trung Quốc lẫn Hoa Kỳ đều đang nỗ lực nâng cấp kiến trúc, nhưng với định hướng khác nhau: Trung Quốc ưu tiên hiệu quả chi phí và mở quyền truy cập, trong khi Hoa Kỳ tập trung vào phát triển độc quyền và tối ưu trải nghiệm người dùng.
Tuy nhiên, sự ra mắt của Kimi K2 Thinking cho thấy cục diện cạnh tranh AI toàn cầu có sự thay đổi: vị thế dẫn đầu công nghệ ngày càng phụ thuộc vào hiệu quả kinh tế và đổi mới kiến trúc, chứ không chỉ dựa vào năng lực tính toán – xu hướng có thể mang lợi thế cho startup Trung Quốc, thu hút nguồn tài trợ mạnh mẽ hơn so với nhiều đối thủ phương Tây có nhu cầu vốn khổng lồ.
Sự kiện mở ra mô hình hợp tác mới giữa Nhà nước - Nhà trường - Doanh nghiệp nhằm thúc đẩy đổi mới sáng tạo, phát triển hệ sinh thái khởi nghiệp công nghệ và hình thành động lực tăng trưởng dựa trên tri thức cho Hà Nội trong giai đoạn mới…
Các tính năng quen thuộc như lướt (infinite scroll), video tự động phát (autoplay), thông báo liên tục và bảng tin cá nhân hóa đang bị cho là có tính cưỡng ép hành vi sử dụng mạng xã hội…
Những vật liệu thế hệ mới có thể mang lại hiệu năng vượt trội cho các dòng chip chiến lược…
Robot hình người Trung Quốc vừa gây ấn tượng mạnh tại Spring Festival Gala hồi đầu tuần trước, làm thay đổi rõ rệt cảm nhận của công chúng…
Mô hình 4o của ChatGPT được rất nhiều người dùng ưa chuộng nhưng đây cũng có nhiều tranh cãi liên quan đến xu hướng trả lời nịnh nọt và những tác hại…
AI khiến các trung tâm dữ liệu cần nguồn điện khổng lồ và nhanh chóng, các nhà sản xuất truyền thống chưa kịp phản ứng và đã khoảng trống cho những “tay chơi” mới…
Bước sang năm 2026, Tập đoàn CMC đẩy mạnh chiến lược "Go Global" với mục tiêu thiết lập sự hiện diện vững chắc tại các thị trường công nghệ trọng điểm…
Pin giấy có chi phí sản xuất thấp, dễ mở rộng quy mô và không phụ thuộc vào chuỗi cung ứng khoáng sản tập trung toàn cầu. Đây là yếu tố chiến lược trong bối cảnh các quốc gia ngày càng quan tâm đến an ninh năng lượng và tự chủ công nghệ...
Đây là dự án thử nghiệm trung tâm dữ liệu nổi ngoài khơi sử dụng 100% năng lượng tái tạo...
Trung Quốc đang tăng tốc mạnh mẽ để thống lĩnh lĩnh vực robot hình người. Đây là lĩnh vực Bắc Kinh xác định sẽ nắm vai trò dẫn dắt trong vòng 5 năm tới...