Mỹ tung bộ mô hình AI “mở hoàn toàn”, thách thức ưu thế mã nguồn mở của Trung Quốc
26/11/2025
Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ...
Viện Allen dành cho Trí tuệ nhân tạo (Allen Institute for AI – Ai2), một tổ chức phi lợi nhuận tại Mỹ, vừa công bố bộ mô hình trí tuệ nhân tạo “mở hoàn toàn” với toàn bộ dữ liệu huấn luyện và quy trình đào tạo được công khai. Động thái được xem như nỗ lực trực diện nhằm thu hẹp khoảng cách và cạnh tranh với hệ sinh thái mô hình mở đang phát triển mạnh tại Trung Quốc.
Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế rõ rệt trên toàn cầu nhờ chi phí thấp, khả năng tùy chỉnh linh hoạt và dễ triển khai trên hạ tầng hạn chế.
Tuy nhiên, theo trang South China Morning Post, mức độ minh bạch của các mô hình Trung Quốc lâu nay vẫn là chủ đề gây tranh cãi, nhất là khi hầu hết chỉ công bố trọng số mà không tiết lộ dữ liệu hoặc quy trình huấn luyện mô hình AI.
AI2 THEO ĐUỔI SỰ MINH BẠCH TUYỆT ĐỐI ĐỂ XÂY DỰNG NIỀM TIN
Trong thông báo mới nhất, Ai2 khẳng định bộ mô hình Olmo 3 được phát triển với mức độ minh bạch “chưa từng có”. Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ. Bộ dữ liệu tiền huấn luyện bao gồm 9,3 nghìn tỷ token và được lựa chọn theo nguyên tắc loại bỏ toàn bộ nội dung có bản quyền hoặc bị trả phí.
Mục tiêu của Ai2 là thúc đẩy niềm tin vào AI trong bối cảnh các hệ thống này đang được sử dụng ngày càng rộng rãi trong nhiều dịch vụ quan trọng của các cơ quan, tổ chức và doanh nghiệp. Tổ chức này cho rằng sự minh bạch toàn diện là yếu tố then chốt để cộng đồng có thể đánh giá mức độ an toàn, đạo đức và khả năng vận hành của hệ thống.
Mô hình chủ lực Olmo 3-Think 32 tỷ tham số được cho là đã thu hẹp đáng kể khoảng cách với những mô hình mạnh hàng đầu tại Trung Quốc có quy mô tương đương, như Qwen3-32B của Alibaba Cloud – trong khi chỉ sử dụng khoảng 1/6 số token huấn luyện.
Dòng mô hình Olmo có kích thước từ 7B đến 32B tham số, cho phép chạy trực tiếp trên phần cứng phổ thông, phù hợp với các doanh nghiệp hoặc nhà phát triển muốn triển khai mô hình tại chỗ thay vì dùng dịch vụ đám mây.
Sự xuất hiện của Olmo 3 diễn ra trong bối cảnh mô hình Trung Quốc đang được nhiều công ty Mỹ sử dụng rộng rãi vì giá rẻ và hiệu năng vượt trội. Theo The Stanford Review, thậm chí một số lớp học khoa học máy tính tại Đại học Stanford còn dùng chủ yếu mô hình Qwen của Trung Quốc. Điều này làm dấy lên lo ngại trong giới hoạch định chính sách Mỹ, nhất là về vấn đề an ninh, rủi ro bảo mật dữ liệu và khả năng mô hình bị kiểm duyệt đầu ra.
Chính quyền Tổng thống Trump trước đó đã nhiều lần nhấn mạnh sự cần thiết phát triển mô hình mở dựa trên “giá trị Mỹ”, nhằm giảm phụ thuộc vào công nghệ Trung Quốc trong bối cảnh cạnh tranh AI ngày càng gay gắt.
TRUNG QUỐC GIỮ VỊ THẾ DẪN ĐẦU, NHƯNG CHỊU ÁP LỰC CẠNH TRANH MỚI TỪ MỸ
Dù Mỹ đang đẩy mạnh minh bạch hóa mô hình AI, Trung Quốc hiện vẫn giữ vị thế thống trị trong lĩnh vực mô hình mở. Các công ty như Alibaba, Tencent, Baichuan, Zhipu AI hay DeepSeek liên tục tung ra các phiên bản mới với hiệu năng cao và chi phí vận hành thấp.
Dẫu vậy, phần lớn các mô hình Trung Quốc được phân loại là “open-weight” – nghĩa là chỉ công bố trọng số, trong khi dữ liệu và quy trình đào tạo vẫn được giữ kín. Ai2 cho rằng cách công bố này không thực sự “mã nguồn mở” và không đáp ứng nhu cầu ngày càng tăng về kiểm chứng độc lập trong cộng đồng AI.
DeepSeek – một start-up nổi bật tại Hàng Châu – là ngoại lệ hiếm hoi khi tháng 9 vừa qua công bố bài nghiên cứu trên tạp chí Nature mô tả chi tiết quá trình đào tạo mô hình R1. Tuy nhiên, điều này vẫn chưa đủ để thay đổi bức tranh chung về khả năng kiểm chứng của mô hình Trung Quốc.
Nathan Lambert, nhà nghiên cứu tại Ai2, cho rằng Olmo 3 32B Base có thể trở thành “tạo phẩm có tác động lớn nhất” trong bộ mô hình Olmo mới. Ông cũng lưu ý rằng Alibaba đến nay vẫn chưa mở mã nguồn cho bản Qwen3-32B Base – điều có thể xuất phát từ lý do cạnh tranh hoặc lo ngại bị sao chép.
Theo Lambert, các doanh nghiệp Mỹ đang ngày càng cân nhắc yếu tố “nguồn gốc địa lý” khi chọn mô hình AI, đặc biệt là khi phải xử lý dữ liệu nhạy cảm tại chỗ. Việc có thêm lựa chọn “open source thực sự” từ Mỹ có thể giảm phụ thuộc vào mô hình Trung Quốc, đồng thời tạo môi trường cạnh tranh lành mạnh và minh bạch hơn.
Ai2 – được thành lập năm 2014 bởi Paul Allen, đồng sáng lập Microsoft – hiện tập trung nghiên cứu nền tảng AI, mô hình mở và robot. Từ tháng 8, Lambert đã dẫn dắt dự án ATOM (American Truly Open Models) nhằm thúc đẩy phong trào phát triển mô hình mở mang “thương hiệu Mỹ”.
Cùng lúc, hệ sinh thái mô hình mở của Mỹ cũng có thêm động lực mới. Mới đây, start-up Deep Cogito tại San Francisco ra mắt Cogito v2.1, tự nhận là “mô hình open-weight tốt nhất do công ty Mỹ phát triển”. Tuy nhiên, mô hình này vẫn dựa trên nền tảng của DeepSeek – một minh chứng cho sự lan tỏa mạnh mẽ của mô hình Trung Quốc ở cả thị trường Mỹ.
Chuỗi cung ứng thông minh, AI đa tác tử và thiết bị biên thông minh sẽ là những xu hướng công nghệ nổi bật tại Đông Nam Á trong năm 2026.
Mặc dù có tiến bộ trong nghiên cứu, pin thể rắn vẫn đối mặt nhiều rào cản trước khi có thể sản xuất hàng loạt vào năm 2030.
AgiBot đang dẫn đầu xu hướng robot công nghiệp thông minh tại Trung Quốc, với công nghệ học hành vi mới, hứa hẹn thay đổi cách sản xuất.
Tuần lễ Khoa học Công nghệ VinFuture 2025 diễn ra từ 02-06/12, quy tụ các nhà khoa học hàng đầu toàn cầu bàn thảo về AI, robot và nhiều công nghệ tiên tiến.
Alibaba phát hành Qwen app mới, hợp nhất nhiều mô hình AI, hướng tới thị trường tiêu dùng với tính năng mua sắm bằng ngôn ngữ tự nhiên.
Google giới thiệu Gemini 3, mô hình AI mới với khả năng lập trình và tìm kiếm vượt trội, cạnh tranh trực diện với OpenAI và Anthropic.