Mỹ tung bộ mô hình AI “mở hoàn toàn”, thách thức ưu thế mã nguồn mở của Trung Quốc
26/11/2025
Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ...
Viện Allen dành cho Trí tuệ nhân tạo (Allen Institute for AI – Ai2), một tổ chức phi lợi nhuận tại Mỹ, vừa công bố bộ mô hình trí tuệ nhân tạo “mở hoàn toàn” với toàn bộ dữ liệu huấn luyện và quy trình đào tạo được công khai. Động thái được xem như nỗ lực trực diện nhằm thu hẹp khoảng cách và cạnh tranh với hệ sinh thái mô hình mở đang phát triển mạnh tại Trung Quốc.
Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế rõ rệt trên toàn cầu nhờ chi phí thấp, khả năng tùy chỉnh linh hoạt và dễ triển khai trên hạ tầng hạn chế.
Tuy nhiên, theo trang South China Morning Post, mức độ minh bạch của các mô hình Trung Quốc lâu nay vẫn là chủ đề gây tranh cãi, nhất là khi hầu hết chỉ công bố trọng số mà không tiết lộ dữ liệu hoặc quy trình huấn luyện mô hình AI.
AI2 THEO ĐUỔI SỰ MINH BẠCH TUYỆT ĐỐI ĐỂ XÂY DỰNG NIỀM TIN
Trong thông báo mới nhất, Ai2 khẳng định bộ mô hình Olmo 3 được phát triển với mức độ minh bạch “chưa từng có”. Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ. Bộ dữ liệu tiền huấn luyện bao gồm 9,3 nghìn tỷ token và được lựa chọn theo nguyên tắc loại bỏ toàn bộ nội dung có bản quyền hoặc bị trả phí.
Mục tiêu của Ai2 là thúc đẩy niềm tin vào AI trong bối cảnh các hệ thống này đang được sử dụng ngày càng rộng rãi trong nhiều dịch vụ quan trọng của các cơ quan, tổ chức và doanh nghiệp. Tổ chức này cho rằng sự minh bạch toàn diện là yếu tố then chốt để cộng đồng có thể đánh giá mức độ an toàn, đạo đức và khả năng vận hành của hệ thống.
Mô hình chủ lực Olmo 3-Think 32 tỷ tham số được cho là đã thu hẹp đáng kể khoảng cách với những mô hình mạnh hàng đầu tại Trung Quốc có quy mô tương đương, như Qwen3-32B của Alibaba Cloud – trong khi chỉ sử dụng khoảng 1/6 số token huấn luyện.
Dòng mô hình Olmo có kích thước từ 7B đến 32B tham số, cho phép chạy trực tiếp trên phần cứng phổ thông, phù hợp với các doanh nghiệp hoặc nhà phát triển muốn triển khai mô hình tại chỗ thay vì dùng dịch vụ đám mây.
Sự xuất hiện của Olmo 3 diễn ra trong bối cảnh mô hình Trung Quốc đang được nhiều công ty Mỹ sử dụng rộng rãi vì giá rẻ và hiệu năng vượt trội. Theo The Stanford Review, thậm chí một số lớp học khoa học máy tính tại Đại học Stanford còn dùng chủ yếu mô hình Qwen của Trung Quốc. Điều này làm dấy lên lo ngại trong giới hoạch định chính sách Mỹ, nhất là về vấn đề an ninh, rủi ro bảo mật dữ liệu và khả năng mô hình bị kiểm duyệt đầu ra.
Chính quyền Tổng thống Trump trước đó đã nhiều lần nhấn mạnh sự cần thiết phát triển mô hình mở dựa trên “giá trị Mỹ”, nhằm giảm phụ thuộc vào công nghệ Trung Quốc trong bối cảnh cạnh tranh AI ngày càng gay gắt.
TRUNG QUỐC GIỮ VỊ THẾ DẪN ĐẦU, NHƯNG CHỊU ÁP LỰC CẠNH TRANH MỚI TỪ MỸ
Dù Mỹ đang đẩy mạnh minh bạch hóa mô hình AI, Trung Quốc hiện vẫn giữ vị thế thống trị trong lĩnh vực mô hình mở. Các công ty như Alibaba, Tencent, Baichuan, Zhipu AI hay DeepSeek liên tục tung ra các phiên bản mới với hiệu năng cao và chi phí vận hành thấp.
Dẫu vậy, phần lớn các mô hình Trung Quốc được phân loại là “open-weight” – nghĩa là chỉ công bố trọng số, trong khi dữ liệu và quy trình đào tạo vẫn được giữ kín. Ai2 cho rằng cách công bố này không thực sự “mã nguồn mở” và không đáp ứng nhu cầu ngày càng tăng về kiểm chứng độc lập trong cộng đồng AI.
DeepSeek – một start-up nổi bật tại Hàng Châu – là ngoại lệ hiếm hoi khi tháng 9 vừa qua công bố bài nghiên cứu trên tạp chí Nature mô tả chi tiết quá trình đào tạo mô hình R1. Tuy nhiên, điều này vẫn chưa đủ để thay đổi bức tranh chung về khả năng kiểm chứng của mô hình Trung Quốc.
Nathan Lambert, nhà nghiên cứu tại Ai2, cho rằng Olmo 3 32B Base có thể trở thành “tạo phẩm có tác động lớn nhất” trong bộ mô hình Olmo mới. Ông cũng lưu ý rằng Alibaba đến nay vẫn chưa mở mã nguồn cho bản Qwen3-32B Base – điều có thể xuất phát từ lý do cạnh tranh hoặc lo ngại bị sao chép.
Theo Lambert, các doanh nghiệp Mỹ đang ngày càng cân nhắc yếu tố “nguồn gốc địa lý” khi chọn mô hình AI, đặc biệt là khi phải xử lý dữ liệu nhạy cảm tại chỗ. Việc có thêm lựa chọn “open source thực sự” từ Mỹ có thể giảm phụ thuộc vào mô hình Trung Quốc, đồng thời tạo môi trường cạnh tranh lành mạnh và minh bạch hơn.
Ai2 – được thành lập năm 2014 bởi Paul Allen, đồng sáng lập Microsoft – hiện tập trung nghiên cứu nền tảng AI, mô hình mở và robot. Từ tháng 8, Lambert đã dẫn dắt dự án ATOM (American Truly Open Models) nhằm thúc đẩy phong trào phát triển mô hình mở mang “thương hiệu Mỹ”.
Cùng lúc, hệ sinh thái mô hình mở của Mỹ cũng có thêm động lực mới. Mới đây, start-up Deep Cogito tại San Francisco ra mắt Cogito v2.1, tự nhận là “mô hình open-weight tốt nhất do công ty Mỹ phát triển”. Tuy nhiên, mô hình này vẫn dựa trên nền tảng của DeepSeek – một minh chứng cho sự lan tỏa mạnh mẽ của mô hình Trung Quốc ở cả thị trường Mỹ.
Trung Quốc đang đẩy nhanh việc tích hợp giữa năng lượng và tính toán như một ưu tiên quốc gia...
Trong bối cảnh cạnh tranh nhân tài ngày càng gay gắt, trải nghiệm nhân viên (EX – Employee Experience) được đánh giá không chỉ là một xu hướng, mà đang trở thành yếu tố cốt lõi quyết định sự gắn bó, giữ chân nhân tài và hiệu suất của đội ngũ…
Các vụ mua lại được kỳ vọng giúp Canva gia tăng sức mạnh vượt trội về tác nhân AI (AI Agent), hạ tầng dữ liệu và khả năng tương tác khách hàng, từ đó giúp hãng tiến hóa mạnh mẽ từ một công cụ thiết kế đơn thuần trở thành một hệ thống toàn diện...
Công trình được đặt ở độ sâu 10 mét dưới mặt nước. Tổng vốn đầu tư lên tới 1,6 tỷ nhân dân tệ (khoảng 232 triệu USD), với công suất thiết kế đạt 24 MW...
Việt Nam đang thu hút sự quan tâm như một thị trường hạ tầng số mới nổi, được hỗ trợ bởi chi phí xây dựng cạnh tranh và tiềm năng tăng trưởng dài hạn…
Không chỉ đặt mục tiêu chen chân vào nhóm dẫn đầu ngành bán dẫn toàn cầu, Rapidus, công ty được Chính phủ Nhật Bản hậu thuẫn, còn theo đuổi một giấc mơ táo bạo hơn: xây dựng nhà máy sản xuất chip trên Mặt Trăng...
OpenAI lần đầu tiên mở rộng sự tham gia cho nhà đầu tư thông qua các kênh ngân hàng trong vòng gọi vốn kỷ lục mới đây…
Dù robot hình người vẫn còn cách khá xa việc phổ cập đại trà, nhưng doanh nghiệp dẫn đầu trong lĩnh vực này đã sẵn sàng bước lên sàn chứng khoán...
Với định vị là công ty số toàn cầu, tập đoàn công nghệ này phát triển trên ba trụ cột công nghệ chiến lược gồm hạ tầng AI, an ninh bảo mật và giải pháp AI...
Các nhà nghiên cứu của Google vừa đưa ra cảnh báo đáng chú ý: trong tương lai, máy tính lượng tử có thể phá vỡ các lớp mã hóa đang bảo vệ Bitcoin và nhiều tài sản số khác...