Mỹ tung bộ mô hình AI “mở hoàn toàn”, thách thức ưu thế mã nguồn mở của Trung Quốc
26/11/2025
Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ...
Viện Allen dành cho Trí tuệ nhân tạo (Allen Institute for AI – Ai2), một tổ chức phi lợi nhuận tại Mỹ, vừa công bố bộ mô hình trí tuệ nhân tạo “mở hoàn toàn” với toàn bộ dữ liệu huấn luyện và quy trình đào tạo được công khai. Động thái được xem như nỗ lực trực diện nhằm thu hẹp khoảng cách và cạnh tranh với hệ sinh thái mô hình mở đang phát triển mạnh tại Trung Quốc.
Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế rõ rệt trên toàn cầu nhờ chi phí thấp, khả năng tùy chỉnh linh hoạt và dễ triển khai trên hạ tầng hạn chế.
Tuy nhiên, theo trang South China Morning Post, mức độ minh bạch của các mô hình Trung Quốc lâu nay vẫn là chủ đề gây tranh cãi, nhất là khi hầu hết chỉ công bố trọng số mà không tiết lộ dữ liệu hoặc quy trình huấn luyện mô hình AI.
AI2 THEO ĐUỔI SỰ MINH BẠCH TUYỆT ĐỐI ĐỂ XÂY DỰNG NIỀM TIN
Trong thông báo mới nhất, Ai2 khẳng định bộ mô hình Olmo 3 được phát triển với mức độ minh bạch “chưa từng có”. Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ. Bộ dữ liệu tiền huấn luyện bao gồm 9,3 nghìn tỷ token và được lựa chọn theo nguyên tắc loại bỏ toàn bộ nội dung có bản quyền hoặc bị trả phí.
Mục tiêu của Ai2 là thúc đẩy niềm tin vào AI trong bối cảnh các hệ thống này đang được sử dụng ngày càng rộng rãi trong nhiều dịch vụ quan trọng của các cơ quan, tổ chức và doanh nghiệp. Tổ chức này cho rằng sự minh bạch toàn diện là yếu tố then chốt để cộng đồng có thể đánh giá mức độ an toàn, đạo đức và khả năng vận hành của hệ thống.
Mô hình chủ lực Olmo 3-Think 32 tỷ tham số được cho là đã thu hẹp đáng kể khoảng cách với những mô hình mạnh hàng đầu tại Trung Quốc có quy mô tương đương, như Qwen3-32B của Alibaba Cloud – trong khi chỉ sử dụng khoảng 1/6 số token huấn luyện.
Dòng mô hình Olmo có kích thước từ 7B đến 32B tham số, cho phép chạy trực tiếp trên phần cứng phổ thông, phù hợp với các doanh nghiệp hoặc nhà phát triển muốn triển khai mô hình tại chỗ thay vì dùng dịch vụ đám mây.
Sự xuất hiện của Olmo 3 diễn ra trong bối cảnh mô hình Trung Quốc đang được nhiều công ty Mỹ sử dụng rộng rãi vì giá rẻ và hiệu năng vượt trội. Theo The Stanford Review, thậm chí một số lớp học khoa học máy tính tại Đại học Stanford còn dùng chủ yếu mô hình Qwen của Trung Quốc. Điều này làm dấy lên lo ngại trong giới hoạch định chính sách Mỹ, nhất là về vấn đề an ninh, rủi ro bảo mật dữ liệu và khả năng mô hình bị kiểm duyệt đầu ra.
Chính quyền Tổng thống Trump trước đó đã nhiều lần nhấn mạnh sự cần thiết phát triển mô hình mở dựa trên “giá trị Mỹ”, nhằm giảm phụ thuộc vào công nghệ Trung Quốc trong bối cảnh cạnh tranh AI ngày càng gay gắt.
TRUNG QUỐC GIỮ VỊ THẾ DẪN ĐẦU, NHƯNG CHỊU ÁP LỰC CẠNH TRANH MỚI TỪ MỸ
Dù Mỹ đang đẩy mạnh minh bạch hóa mô hình AI, Trung Quốc hiện vẫn giữ vị thế thống trị trong lĩnh vực mô hình mở. Các công ty như Alibaba, Tencent, Baichuan, Zhipu AI hay DeepSeek liên tục tung ra các phiên bản mới với hiệu năng cao và chi phí vận hành thấp.
Dẫu vậy, phần lớn các mô hình Trung Quốc được phân loại là “open-weight” – nghĩa là chỉ công bố trọng số, trong khi dữ liệu và quy trình đào tạo vẫn được giữ kín. Ai2 cho rằng cách công bố này không thực sự “mã nguồn mở” và không đáp ứng nhu cầu ngày càng tăng về kiểm chứng độc lập trong cộng đồng AI.
DeepSeek – một start-up nổi bật tại Hàng Châu – là ngoại lệ hiếm hoi khi tháng 9 vừa qua công bố bài nghiên cứu trên tạp chí Nature mô tả chi tiết quá trình đào tạo mô hình R1. Tuy nhiên, điều này vẫn chưa đủ để thay đổi bức tranh chung về khả năng kiểm chứng của mô hình Trung Quốc.
Nathan Lambert, nhà nghiên cứu tại Ai2, cho rằng Olmo 3 32B Base có thể trở thành “tạo phẩm có tác động lớn nhất” trong bộ mô hình Olmo mới. Ông cũng lưu ý rằng Alibaba đến nay vẫn chưa mở mã nguồn cho bản Qwen3-32B Base – điều có thể xuất phát từ lý do cạnh tranh hoặc lo ngại bị sao chép.
Theo Lambert, các doanh nghiệp Mỹ đang ngày càng cân nhắc yếu tố “nguồn gốc địa lý” khi chọn mô hình AI, đặc biệt là khi phải xử lý dữ liệu nhạy cảm tại chỗ. Việc có thêm lựa chọn “open source thực sự” từ Mỹ có thể giảm phụ thuộc vào mô hình Trung Quốc, đồng thời tạo môi trường cạnh tranh lành mạnh và minh bạch hơn.
Ai2 – được thành lập năm 2014 bởi Paul Allen, đồng sáng lập Microsoft – hiện tập trung nghiên cứu nền tảng AI, mô hình mở và robot. Từ tháng 8, Lambert đã dẫn dắt dự án ATOM (American Truly Open Models) nhằm thúc đẩy phong trào phát triển mô hình mở mang “thương hiệu Mỹ”.
Cùng lúc, hệ sinh thái mô hình mở của Mỹ cũng có thêm động lực mới. Mới đây, start-up Deep Cogito tại San Francisco ra mắt Cogito v2.1, tự nhận là “mô hình open-weight tốt nhất do công ty Mỹ phát triển”. Tuy nhiên, mô hình này vẫn dựa trên nền tảng của DeepSeek – một minh chứng cho sự lan tỏa mạnh mẽ của mô hình Trung Quốc ở cả thị trường Mỹ.
Năm 2025 chứng kiến những phát minh công nghệ độc đáo như robot dọn nhà NEO, máy tắm thú cưng AI và son môi thông minh, mang đến trải nghiệm thú vị cho người dùng.
Nvidia giới thiệu Menotron 3, mô hình mở giúp nâng cao khả năng AI với hiệu suất cao và tiết kiệm chi phí tính toán, tạo nền tảng cho hệ sinh thái AI toàn diện.
Nitro V 16S ProPanel mang đến hiệu năng vượt trội với Ryzen AI và RTX 50 Series, thiết kế mỏng nhẹ, màn hình 2K+ 180Hz, và bảo hành VIP 3S1 tại Việt Nam.
Marcom AI được vinh danh trong Top 10 Sản phẩm – Dịch vụ Tiên phong 2025, phản ánh xu hướng AI Việt trong truyền thông và quản trị nội dung số.
Công nghệ Blockchain được tích hợp trên VNeID, phục vụ truy xuất nguồn gốc tiền chất, hoá chất, nâng cao hiệu quả quản lý nhà nước.
Chủ tịch CMC kiến nghị lập bảng so sánh chính sách dữ liệu giữa Việt Nam và các trung tâm khu vực nhằm nâng cao năng lực cạnh tranh và thu hút đầu tư.
Jeff Bezos và Elon Musk cạnh tranh đưa trung tâm dữ liệu AI lên quỹ đạo, mở ra cơ hội mới cho ngành không gian thương mại và công nghệ.
Thung lũng Silicon đang bùng nổ AI, nhưng điều gì khiến cơn sốt này khác biệt so với bong bóng dot-com năm 2000? Tìm hiểu những yếu tố quyết định.