image Thứ Ba, 10/02/2026

Mỹ tung bộ mô hình AI “mở hoàn toàn”, thách thức ưu thế mã nguồn mở của Trung Quốc

26/11/2025

Chia sẻ

Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ...

Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế. Ảnh  minh họa
Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế. Ảnh minh họa

Viện Allen dành cho Trí tuệ nhân tạo (Allen Institute for AI – Ai2), một tổ chức phi lợi nhuận tại Mỹ, vừa công bố bộ mô hình trí tuệ nhân tạo “mở hoàn toàn” với toàn bộ dữ liệu huấn luyện và quy trình đào tạo được công khai. Động thái được xem như nỗ lực trực diện nhằm thu hẹp khoảng cách và cạnh tranh với hệ sinh thái mô hình mở đang phát triển mạnh tại Trung Quốc.

Các mô hình mới – thuộc dòng Olmo 3 – được Ai2 công bố trong bối cảnh mô hình AI Trung Quốc, đặc biệt là các mô hình mã nguồn mở, đang chiếm ưu thế rõ rệt trên toàn cầu nhờ chi phí thấp, khả năng tùy chỉnh linh hoạt và dễ triển khai trên hạ tầng hạn chế.

Tuy nhiên, theo trang South China Morning Post, mức độ minh bạch của các mô hình Trung Quốc lâu nay vẫn là chủ đề gây tranh cãi, nhất là khi hầu hết chỉ công bố trọng số mà không tiết lộ dữ liệu hoặc quy trình huấn luyện mô hình AI.

AI2 THEO ĐUỔI SỰ MINH BẠCH TUYỆT ĐỐI ĐỂ XÂY DỰNG NIỀM TIN

Trong thông báo mới nhất, Ai2 khẳng định bộ mô hình Olmo 3 được phát triển với mức độ minh bạch “chưa từng có”. Toàn bộ dữ liệu huấn luyện, quy trình đào tạo, cùng “model flow” mô tả vòng đời phát triển mô hình đều được công bố đầy đủ. Bộ dữ liệu tiền huấn luyện bao gồm 9,3 nghìn tỷ token và được lựa chọn theo nguyên tắc loại bỏ toàn bộ nội dung có bản quyền hoặc bị trả phí.

Mục tiêu của Ai2 là thúc đẩy niềm tin vào AI trong bối cảnh các hệ thống này đang được sử dụng ngày càng rộng rãi trong nhiều dịch vụ quan trọng của các cơ quan, tổ chức và doanh nghiệp. Tổ chức này cho rằng sự minh bạch toàn diện là yếu tố then chốt để cộng đồng có thể đánh giá mức độ an toàn, đạo đức và khả năng vận hành của hệ thống.

Mô hình chủ lực Olmo 3-Think 32 tỷ tham số được cho là đã thu hẹp đáng kể khoảng cách với những mô hình mạnh hàng đầu tại Trung Quốc có quy mô tương đương, như Qwen3-32B của Alibaba Cloud – trong khi chỉ sử dụng khoảng 1/6 số token huấn luyện.

Dòng mô hình Olmo có kích thước từ 7B đến 32B tham số, cho phép chạy trực tiếp trên phần cứng phổ thông, phù hợp với các doanh nghiệp hoặc nhà phát triển muốn triển khai mô hình tại chỗ thay vì dùng dịch vụ đám mây.

Sự xuất hiện của Olmo 3 diễn ra trong bối cảnh mô hình Trung Quốc đang được nhiều công ty Mỹ sử dụng rộng rãi vì giá rẻ và hiệu năng vượt trội. Theo The Stanford Review, thậm chí một số lớp học khoa học máy tính tại Đại học Stanford còn dùng chủ yếu mô hình Qwen của Trung Quốc. Điều này làm dấy lên lo ngại trong giới hoạch định chính sách Mỹ, nhất là về vấn đề an ninh, rủi ro bảo mật dữ liệu và khả năng mô hình bị kiểm duyệt đầu ra.

Chính quyền Tổng thống Trump trước đó đã nhiều lần nhấn mạnh sự cần thiết phát triển mô hình mở dựa trên “giá trị Mỹ”, nhằm giảm phụ thuộc vào công nghệ Trung Quốc trong bối cảnh cạnh tranh AI ngày càng gay gắt.

TRUNG QUỐC GIỮ VỊ THẾ DẪN ĐẦU, NHƯNG CHỊU ÁP LỰC CẠNH TRANH MỚI TỪ MỸ

Dù Mỹ đang đẩy mạnh minh bạch hóa mô hình AI, Trung Quốc hiện vẫn giữ vị thế thống trị trong lĩnh vực mô hình mở. Các công ty như Alibaba, Tencent, Baichuan, Zhipu AI hay DeepSeek liên tục tung ra các phiên bản mới với hiệu năng cao và chi phí vận hành thấp.

Dẫu vậy, phần lớn các mô hình Trung Quốc được phân loại là “open-weight” – nghĩa là chỉ công bố trọng số, trong khi dữ liệu và quy trình đào tạo vẫn được giữ kín. Ai2 cho rằng cách công bố này không thực sự “mã nguồn mở” và không đáp ứng nhu cầu ngày càng tăng về kiểm chứng độc lập trong cộng đồng AI.

DeepSeek – một start-up nổi bật tại Hàng Châu – là ngoại lệ hiếm hoi khi tháng 9 vừa qua công bố bài nghiên cứu trên tạp chí Nature mô tả chi tiết quá trình đào tạo mô hình R1. Tuy nhiên, điều này vẫn chưa đủ để thay đổi bức tranh chung về khả năng kiểm chứng của mô hình Trung Quốc.

Nathan Lambert, nhà nghiên cứu tại Ai2, cho rằng Olmo 3 32B Base có thể trở thành “tạo phẩm có tác động lớn nhất” trong bộ mô hình Olmo mới. Ông cũng lưu ý rằng Alibaba đến nay vẫn chưa mở mã nguồn cho bản Qwen3-32B Base – điều có thể xuất phát từ lý do cạnh tranh hoặc lo ngại bị sao chép.

Theo Lambert, các doanh nghiệp Mỹ đang ngày càng cân nhắc yếu tố “nguồn gốc địa lý” khi chọn mô hình AI, đặc biệt là khi phải xử lý dữ liệu nhạy cảm tại chỗ. Việc có thêm lựa chọn “open source thực sự” từ Mỹ có thể giảm phụ thuộc vào mô hình Trung Quốc, đồng thời tạo môi trường cạnh tranh lành mạnh và minh bạch hơn.

Ai2 – được thành lập năm 2014 bởi Paul Allen, đồng sáng lập Microsoft – hiện tập trung nghiên cứu nền tảng AI, mô hình mở và robot. Từ tháng 8, Lambert đã dẫn dắt dự án ATOM (American Truly Open Models) nhằm thúc đẩy phong trào phát triển mô hình mở mang “thương hiệu Mỹ”.

Cùng lúc, hệ sinh thái mô hình mở của Mỹ cũng có thêm động lực mới. Mới đây, start-up Deep Cogito tại San Francisco ra mắt Cogito v2.1, tự nhận là “mô hình open-weight tốt nhất do công ty Mỹ phát triển”. Tuy nhiên, mô hình này vẫn dựa trên nền tảng của DeepSeek – một minh chứng cho sự lan tỏa mạnh mẽ của mô hình Trung Quốc ở cả thị trường Mỹ.


Vốn đầu tư mạo hiểm đang "đổ bộ" vào robot hình người Trung Quốc

Đáng chú ý, làn sóng vốn mới đổ vào robot Trung Quốc đang chuyển sang trọng tâm xây dựng “bộ não” cho robot hình người…

18:52 06/02/2026
Mạng xã hội mới UpScrolled trở thành tâm điểm chú ý tại Hoa Kỳ trong bối cảnh TikTok tái cấu trúc

UpScrolled muốn tạo ra không gian nơi người dùng có thể “tự do bày tỏ suy nghĩ, chia sẻ khoảnh khắc và kết nối mọi người” bên ngoài các nền tảng Big Tech truyền thống…

18:52 06/02/2026
Không phải lập trình phần mềm, đâu mới là nghề đang được săn lùng khi AI nở rộ?

Khi các nội dung AI na ná nhau xuất hiện ngày càng nhiều, cuộc đua tìm kiếm những con người có thể kể chuyện thật sự ngày càng khốc liệt hơn…

18:51 06/02/2026
Công cụ AI mới của Google có khả năng giải mã và dự đoán thay đổi DNA

Mô hình AI của Google DeepMind có thể giải mã DNA và dự đoán một số đột biến, mở ra hướng đi mới cho nghiên cứu chữa bệnh…

09:58 04/02/2026
Chip não Neuralink: Từ thí nghiệm phòng lab đến những thay đổi thực tế trên cơ thể người

Các bác sĩ cho biết kết quả ban đầu của Neuralink rất đáng khích lệ, nhưng công nghệ hiện vẫn trong giai đoạn thử nghiệm…

09:10 04/02/2026
Cuộc chơi mới có thể khiến chip Nvidia ‘thất sủng’

Các đối thủ đã kiếm được hàng tỷ đô la trong lĩnh vực kinh doanh chip năm qua, cho thấy rằng Nvidia không phải là người duy nhất thống trị thị trường…

09:10 04/02/2026
Giữa "bão" thông tin và AI, điều gì thực sự khiến khách hàng dừng lại và tin tưởng thương hiệu?

Khi các tính năng sản phẩm và sự hỗ trợ của AI dần trở nên bão hòa, cảm xúc trở thành "chiến trường" cuối cùng để các thương hiệu giành lấy niềm tin khách hàng...

11:57 02/02/2026
Edtech năm 2026: Các xu hướng định hình tương lai giáo dục

Công nghệ giáo dục đang chuyển sang một kỷ nguyên thích ứng, nơi các hệ thống vận hành như một hệ sinh thái số thống nhất và không ngừng phát triển…

11:44 30/01/2026
CMC hợp tác chiến lược với NTT DATA

Sự hợp tác được thúc đẩy bởi nhu cầu hiện đại hóa và tình trạng thiếu hụt nhân sự tại Nhật Bản, giữa lúc Việt Nam nổi lên là điểm đến tối ưu nhờ năng lực chuyên môn, khả năng mở rộng đội ngũ và kinh nghiệm làm việc dày dặn với khách hàng Nhật...

07:46 29/01/2026
Các giải pháp AI cho nông nghiệp và nuôi trồng thủy sản dẫn đầu cuộc thi Hackathon khí hậu

Hackathon nhấn mạnh cách tiếp cận giải quyết vấn đề từ thực tiễn, việc sử dụng AI một cách có trách nhiệm và đạo đức, cũng như sự phù hợp của giải pháp với điều kiện khí hậu và bối cảnh địa phương của Đồng bằng sông Cửu Long...

07:45 29/01/2026