image Thứ Ba, 30/12/2025

Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra

Bảo Ngọc

14/11/2025

Chia sẻ

Kimi K2 Thinking đến từ startup Trung Quốc Moonshot AI vượt mặt GPT-5 và Claude Sonnet 4.5 trong nhiều bài đánh giá quan trọng, đặc biệt chỉ tốn 4,6 triệu USD để huấn luyện…

Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.
Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.

Một mô hình AI Trung Quốc vừa ra mắt âm thầm nhưng mang lại kết quả ấn tượng. Mô hình Kimi K2 Thinking của Moonshot AI vừa công bố đã vượt qua GPT-5 và Claude Sonnet 4.5 trong nhiều bài kiểm tra tiêu chuẩn ngành, buộc giới quan sát phải đánh giá lại vị thế dẫn đầu trong cuộc đua AI toàn cầu, KrASIA đưa tin.

Đây là diễn biến mới nhất của cuộc cạnh tranh ngày càng gay gắt giữa Hoa Kỳ và Trung Quốc trong lĩnh vực trí tuệ nhân tạo, khiến nhiều người so sánh với bước đột phá trước đó của DeepSeek. Giới chuyên gia đặt câu hỏi liệu chuỗi thành công liên tiếp của các nhà phát triển Trung Quốc có cho thấy sự thay đổi căn bản trong cán cân AI hay không.

KẾT QUẢ KIỂM TRA CHO THẤY KHOẢNG CÁCH HIỆU SUẤT

Moonshot AI công bố vào ngày 6/11 rằng Kimi K2 Thinking đạt độ chính xác 44,9% trong bài kiểm tra Humanity’s Last Exam — bài đánh giá khắt khe gồm 2.500 câu hỏi chuyên sâu về toán học, khoa học và nhân văn. Kết quả vượt qua GPT-5 của OpenAI, vốn chỉ đạt 41,7%, theo dữ liệu được đăng trên kho GitHub của công ty.

Mô hình AI Trung Quốc tiếp tục vượt trội với 60,2% điểm trong bài kiểm tra BrowseComp, đo khả năng tìm kiếm và thu thập thông tin trên web. Trong bài kiểm tra Seal-0, được thiết kế nhằm đánh giá khả năng xử lý nhiệm vụ nghiên cứu phức tạp trong thế giới thực, Kimi K2 Thinking đạt 56,3%, dẫn đầu bảng xếp hạng.

Công ty tư vấn Artificial Analysis cũng xác nhận kết quả độc lập, báo cáo rằng Kimi K2 đạt 93% trong bài kiểm tra Tau-2 Bench Telecom mô phỏng tình huống dịch vụ khách hàng, nhấn mạnh đây là “điểm số cao nhất từng ghi nhận được”.

Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.
Kimi K2 Thinking vượt trội trong nhiều bài kiểm tra hiệu suất.

HIỆU QUẢ KINH TẾ LÀM GIA TĂNG SỨC CẠNH TRANH

Ngoài khả năng vượt trội về hiệu suất, yếu tố kinh tế trong quá trình phát triển Kimi K2 Thinking cũng khiến giới công nghệ chú ý. Theo CNBC, chi phí huấn luyện mô hình vào khoảng 4,6 triệu USD, dù Moonshot AI từ chối xác nhận con số cụ thể.

Tờ South China Morning Post tính toán rằng giá sử dụng API (Giao diện Lập trình Ứng dụng) của Kimi K2 Thinking rẻ hơn từ 6 đến 10 lần so với dịch vụ tương tự của OpenAI và Anthropic, có thể làm đảo lộn xu hướng ứng dụng AI trong doanh nghiệp.

Theo nền tảng Hugging Face, mô hình áp dụng kiến trúc Mixture-of-Experts với tổng cộng 1 nghìn tỷ tham số trong đó 32 tỷ tham số được kích hoạt khi suy luận, và sử dụng công nghệ lượng tử hóa INT4 giúp tăng gấp đôi tốc độ xử lý mà vẫn giữ nguyên hiệu suất.

Ông Zhang Yi, nhà khoa học trưởng tại công ty tư vấn iiMedia, nhận định chi phí huấn luyện AI tại Trung Quốc “giảm mạnh” nhờ đổi mới về kiến trúc và phương pháp huấn luyện, đánh dấu sự khác biệt rõ rệt so với cách tiếp cận tiêu tốn tài nguyên tính toán trước đây.

CẤU TRÚC KỸ THUẬT VÀ NĂNG LỰC NỔI BẬT

Nhóm nhà nghiên cứu thuộc Moonshot AI cho biết Kimi K2 Thinking có thể tự động thực hiện 200 – 300 tác vụ nối tiếp nhau mà không cần con người can thiệp, vẫn giữ được mạch lập luận logic xuyên suốt trong nhiều bài toán phức tạp. Năng lực cho phép mô hình xử lý nhiều quy trình phức hợp như nghiên cứu, lập trình hay phân tích theo chuỗi.

Mô hình hỗ trợ cửa sổ ngữ cảnh 256.000 token, sử dụng độ chính xác INT4 ngay từ đầu. Moonshot AI áp dụng đào tạo nhận biết lượng tử hóa (Quantisation-Aware Training) trong giai đoạn hậu huấn luyện, giúp giảm độ trễ và tiết kiệm bộ nhớ GPU mà không làm giảm hiệu năng.

Kimi K2 Thinking được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng thương mại hoàn toàn, với một điều kiện: các tổ chức sở hữu hơn 100 triệu người dùng hoạt động hàng tháng hoặc doanh thu trên 20 triệu USD/tháng phải hiển thị nhãn hiệu “Kimi K2” trên giao diện người dùng.

PHẢN ỨNG CỦA NGÀNH

Ông Thomas Wolf, đồng sáng lập nền tảng phát triển AI Hugging Face, nơi Kimi K2 Thinking trở thành mô hình phổ biến nhất cho các nhà phát triển sau khi ra mắt, đã đặt câu hỏi trên mạng xã hội: liệu ngành AI “có nên kỳ vọng vào ‘khoảnh khắc DeepSeek’ mới mỗi vài tháng hay không”, ám chỉ sự xuất hiện liên tiếp của các bước đột phá đến từ Trung Quốc.

Tuy nhiên, ông Nathan Lambert đến từ Viện AI Allen đưa ra góc nhìn thận trọng hơn, cho rằng vẫn tồn tại độ trễ khoảng 4–6 tháng giữa mô hình mã nguồn mở tiên tiến và mô hình thương mại đóng, nhưng thừa nhận “các phòng thí nghiệm Trung Quốc đang thu hẹp khoảng cách rất nhanh và đạt kết quả xuất sắc trong bài kiểm tra”.

Chuyên gia Lambert nhận xét thêm rằng dù Trung Quốc đang dẫn đầu về điểm số đánh giá, một số phòng thí nghiệm Hoa Kỳ vẫn có lợi thế trong việc tối ưu hóa trải nghiệm người dùng dài hạn, nhờ vòng phản hồi liên tục từ người dùng phương Tây.

Ông Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh, cho rằng sự cạnh tranh về chi phí là điều tất yếu đối với Trung Quốc: “Hiệu suất tổng thể của các mô hình Trung Quốc vẫn chưa bằng các mô hình hàng đầu của Mỹ, nên doanh nghiệp phải cạnh tranh bằng hiệu quả chi phí để tìm đường phát triển”.

Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.
Nhiều chuyên gia dự đoán thành công của các mô hình AI Trung Quốc có thể thay đổi cục diện toàn ngành.

BỐI CẢNH THỊ TRƯỜNG VÀ HƯỚNG ĐI TƯƠNG LAI

Moonshot AI hiện được định giá 3,3 tỷ USD, sau các vòng gọi vốn dẫn đầu bởi Alibaba và Tencent, là một trong những “AI Tigers” – nhóm startup AI mạnh mẽ nhất Trung Quốc theo đuổi mô hình nền tảng.

Công ty cùng với DeepSeek, Qwen và Baichuan đang chứng minh rằng các mô hình AI Trung Quốc có thể thách thức OpenAI và Anthropic không phải bằng quy mô tính toán khổng lồ, mà bằng đổi mới kiến trúc và hiệu quả huấn luyện.

Một nhà nghiên cứu AI nhận định thành công của các nhà phát triển mã nguồn mở Trung Quốc đã khiến nhiều phòng thí nghiệm phương Tây “toát mồ hôi”, tạo ra “áp lực giá nghiêm trọng và kỳ vọng mới”.

Hiện vẫn chưa rõ liệu hiệu suất của Kimi K2 Thinking có thể duy trì lâu dài hay chỉ là sự hội tụ tạm thời. Cả các phòng thí nghiệm Trung Quốc lẫn Hoa Kỳ đều đang nỗ lực nâng cấp kiến trúc, nhưng với định hướng khác nhau: Trung Quốc ưu tiên hiệu quả chi phí và mở quyền truy cập, trong khi Hoa Kỳ tập trung vào phát triển độc quyền và tối ưu trải nghiệm người dùng.

Tuy nhiên, sự ra mắt của Kimi K2 Thinking cho thấy cục diện cạnh tranh AI toàn cầu có sự thay đổi: vị thế dẫn đầu công nghệ ngày càng phụ thuộc vào hiệu quả kinh tế và đổi mới kiến trúc, chứ không chỉ dựa vào năng lực tính toán – xu hướng có thể mang lợi thế cho startup Trung Quốc, thu hút nguồn tài trợ mạnh mẽ hơn so với nhiều đối thủ phương Tây có nhu cầu vốn khổng lồ.


Những phát minh công nghệ kỳ lạ trong năm 2025

Năm 2025 chứng kiến những phát minh công nghệ độc đáo như robot dọn nhà NEO, máy tắm thú cưng AI và son môi thông minh, mang đến trải nghiệm thú vị cho người dùng.

09:55 30/12/2025
Đôi nét về Menotron 3 - Bộ xử lý mã nguồn mở thế hệ tiếp theo của Nvidia

Nvidia giới thiệu Menotron 3, mô hình mở giúp nâng cao khả năng AI với hiệu suất cao và tiết kiệm chi phí tính toán, tạo nền tảng cho hệ sinh thái AI toàn diện.

10:28 22/12/2025
Nitro V 16S ProPanel: Laptop gaming mỏng nhẹ, mạnh mẽ với Ryzen AI và RTX 50 Series

Nitro V 16S ProPanel mang đến hiệu năng vượt trội với Ryzen AI và RTX 50 Series, thiết kế mỏng nhẹ, màn hình 2K+ 180Hz, và bảo hành VIP 3S1 tại Việt Nam.

08:00 20/12/2025
Marcom AI lọt Top 10 Sản phẩm – Dịch vụ Tiên phong 2025: Dấu ấn AI Việt trong lĩnh vực truyền thông

Marcom AI được vinh danh trong Top 10 Sản phẩm – Dịch vụ Tiên phong 2025, phản ánh xu hướng AI Việt trong truyền thông và quản trị nội dung số.

21:21 18/12/2025
Tích hợp Blockchain trên VNeID, ứng dụng rộng rãi trong khu vực dịch vụ công - tư

Công nghệ Blockchain được tích hợp trên VNeID, phục vụ truy xuất nguồn gốc tiền chất, hoá chất, nâng cao hiệu quả quản lý nhà nước.

21:21 18/12/2025
Doanh nghiệp kiến nghị lập bảng so sánh chính sách để Việt Nam thành Digital & AI Hub của khu vực

Chủ tịch CMC kiến nghị lập bảng so sánh chính sách dữ liệu giữa Việt Nam và các trung tâm khu vực nhằm nâng cao năng lực cạnh tranh và thu hút đầu tư.

14:04 17/12/2025
Cuộc đua đưa trung tâm dữ liệu AI lên quỹ đạo không gian

Jeff Bezos và Elon Musk cạnh tranh đưa trung tâm dữ liệu AI lên quỹ đạo, mở ra cơ hội mới cho ngành không gian thương mại và công nghệ.

10:45 16/12/2025
Sự bùng nổ của AI có nhiều điểm khác biệt so với thời "bong bóng" dot-com

Thung lũng Silicon đang bùng nổ AI, nhưng điều gì khiến cơn sốt này khác biệt so với bong bóng dot-com năm 2000? Tìm hiểu những yếu tố quyết định.

10:44 16/12/2025