image Thứ Sáu, 24/04/2026

DeepSeek và các mô hình mã nguồn mở đang thay đổi AI như thế nào?

Mai Anh

11/09/2025

Chia sẻ

Sự xuất hiện của DeepSeek và các mô hình có chi phí rẻ hơn dấy lên một cuộc đua mới không chỉ về hiệu suất giữa các mô hình AI…

Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg
Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg

Hồi đầu tháng 8 vừa qua, OpenAI thông báo phát hành hai mô hình ngôn ngữ tiên tiến có trọng số mở, lần đầu tiên kể từ khi triển khai GPT-2 vào năm 2019. Hai mô hình này, được gọi là gpt-oss-120b và gpt-oss-20b, chỉ có định dạng văn bản và được thiết kế để phục vụ các lựa chọn chi phí thấp hơn mà các nhà phát triển, nhà nghiên cứu và doanh nghiệp có thể dễ dàng tùy chỉnh.

“Nhìn thấy một hệ sinh thái phát triển thật thú vị, và chúng tôi rất vui khi được đóng góp vào hệ sinh thái đó, thúc đẩy ranh giới và xem điều gì sẽ xảy ra tiếp theo”, Chủ tịch OpenAI – ông Greg Brockman phát biểu trong cuộc họp báo công bố.

Một mô hình trí tuệ nhân tạo được xem là trọng số mở nếu các tham số, hoặc các yếu tố cải thiện kết quả đầu ra và dự đoán trong quá trình đào tạo, được công khai.

Các công ty công nghệ và giới học thuật từ lâu đã tranh luận về rủi ro và lợi ích khi xây dựng phần mềm mã nguồn mở. Nhưng làn sóng bùng nổ quanh trí tuệ nhân tạo tạo sinh đã mang lại ý nghĩa mới cho cuộc tranh luận này.

Làn sóng ấy được kích hoạt mạnh mẽ khi DeepSeek – một doanh nghiệp khởi nghiệp non trẻ của Trung Quốc và một số công ty khác tại thị trường này đã tung ra hàng loạt mô hình mã nguồn mở giá rẻ, cạnh tranh với phần mềm của các nhà phát triển AI hàng đầu Mỹ.

Để giành lại thị phần và người dùng, các ông lớn công nghệ của Mỹ cũng không thể nằm ngoài cuộc chơi, buộc phải tìm cách tung ra các mô hình có chi phí rẻ hơn, đơn cử như OpenAI. Chính quyền của Tổng thống Mỹ Donald Trump cũng kêu gọi nhiều công ty công nghệ Mỹ làm điều tương tự.

MÃ NGUỒN MỞ LÀ GÌ?

Thuật ngữ mã nguồn mở đề cập đến phần mềm có mã nguồn được công khai miễn phí để bất kỳ ai cũng có thể sử dụng hoặc chỉnh sửa. Theo Sáng kiến Mã nguồn mở (OSI), một tổ chức phi lợi nhuận có trụ sở tại California chuyên vận động cho lợi ích của cách làm này, để đáp ứng đủ các điều kiện được coi là mã nguồn mở, phần mềm phải tuân thủ những điều khoản cụ thể về phân phối và truy cập.

Đối với một mô hình AI được coi là thực sự mở, OSI cho rằng, các nhà phát triển phải cung cấp thông tin chi tiết về dữ liệu được dùng để huấn luyện, đồng thời, cho phép mọi người nghiên cứu, sử dụng và chỉnh sửa hệ thống cho bất kỳ mục đích nào.

Ngược lại, mã nguồn đóng đề cập đến phần mềm và mô hình được kiểm soát bởi nhà phát triển, không thể chỉnh sửa, và ít minh bạch hơn về nền tảng kỹ thuật.

AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke
AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke

Hiện nay, nhiều công ty công nghệ quảng bá phần mềm AI là mã nguồn mở nhưng thực tế không phải doanh nghiệp nào cũng đáp ứng đầy đủ định nghĩa của thuật ngữ này.

Đơn cử, Meta Platforms, OpenAI của Mỹ, Mistral – một doanh nghiệp khởi nghiệp của Pháp hay DeepSeek đều đã phát hành các mô hình AI được giới thiệu là mã nguồn mở.

Tuy nhiên, các mô hình này chủ yếu ở dạng “open-weight”. Điều này có nghĩa rằng ngoài việc cung cấp mô hình và có thể cả một phần mã nguồn, các công ty còn công bố “trọng số” – tức những giá trị số học mà mô hình thu nhận và được điều chỉnh trong quá trình huấn luyện, giúp các nhà phát triển tùy biến tốt hơn. Tuy nhiên, các doanh nghiệp lại không tiết lộ chi tiết về dữ liệu thực tế đã được sử dụng để huấn luyện.

Ví dụ, Meta từng cung cấp trọng số và một phần mã nguồn cho dòng mô hình AI Llama, nhưng không cung cấp thông tin chi tiết về dữ liệu huấn luyện. Meta cũng từng bị OSI chỉ trích vì các điều khoản cấp phép có kèm theo một số hạn chế về mục đích thương mại.

Tương tự, hồi tháng 1, DeepSeek thông báo phát hành hệ thống R1 dưới dạng mô hình mã nguồn mở, nhưng lại không công bố mã nguồn hay dữ liệu huấn luyện. Điều đó dẫn đến nhiều nghi vấn về việc công ty này thực sự sử dụng dữ liệu gì để xây dựng mô hình.

OpenAI, dù trong tên gọi có chữ “open” – nghĩa là mở, nhưng lại không công khai hầu hết mô hình. Tuy nhiên, ngay sau khi DeepSeek gây tiếng vang, Giám đốc điều hành OpenAI – ông Sam Altman thừa nhận rằng, nhà sản xuất ChatGPT cần phải “tìm ra một chiến lược mã nguồn mở khác”. Ông nói thêm: “Cá nhân tôi nghĩ rằng chúng tôi đã đứng nhầm phía của lịch sử trong vấn đề này”.

LỢI ÍCH CỦA MÃ NGUỒN MỞ

Theo Bloomberg, những người ủng hộ phần mềm mã nguồn mở thường nhấn mạnh vào mức chi phí rẻ hơn cho người dùng bởi không phải trả phí cấp phép như hệ thống đóng.

Mức giá sử dụng thấp hơn sẽ mở đường cho ứng dụng AI rộng rãi hơn, đồng thời khuyến khích đổi mới sáng tạo.

Những người ủng hộ cũng cho rằng, cách tiếp cận này giúp tăng tính minh bạch và trách nhiệm giải trình của các nhà phát triển hệ thống AI khi người khác có thể hiểu rõ hơn cách mô hình vận hành.

Trong khi đó, các hệ thống đóng lại tiềm ẩn rủi ro tạo ra một thị trường AI bị thống trị bởi một số ít công ty quyền lực. Ông Aaron Levie, Giám đốc điều hành Công ty lưu trữ đám mây Box Inc., phân tích: “Trong thế giới AI đắt đỏ và độc quyền, các nhà cung cấp AI có thể sẽ giữ toàn bộ lợi ích kinh tế cho riêng mình và về cơ bản là loại bỏ cơ hội của các nhà phát triển và hệ sinh thái”.

Với những công ty như Meta, mã nguồn mở mang đến thêm lợi ích: mức độ phổ biến. Khi cho phép các nhà phát triển khác tự do truy cập và xây dựng trên nền tảng phần mềm mã nguồn mở của mình, Meta đã mở rộng được tầm ảnh hưởng trong toàn bộ hệ sinh thái AI.

Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP
Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP

Ở chiều ngược lại, những người chỉ trích phần mềm mã nguồn mở lập luận rằng mô hình này kém an toàn hơn.

Trong trường hợp của AI, một số ý kiến ở Mỹ lo ngại rằng việc sử dụng các mô hình từ đối thủ như Trung Quốc sẽ đe dọa an ninh quốc gia, ảnh hưởng đến sự an toàn của công dân. Ví dụ, các mô hình thu thập lượng lớn dữ liệu người dùng có thể bị khai thác cho mục đích giám sát.

Ngoài ra, cũng có lo ngại rằng các công ty Mỹ tung ra mô hình AI với nhiều mức độ mở khác nhau có thể vô tình trao cho các quốc gia đối thủ cơ hội tận dụng để vượt mặt Mỹ về công nghệ.

VÌ SAO DEEPSEEK CHỌN HƯỚNG ĐI MỞ?

Bằng việc áp dụng cách tiếp cận cởi mở hơn (dù có một số giới hạn), DeepSeek có thể đã làm dịu đi những lo ngại của người dùng toàn cầu về việc Trung Quốc kiểm soát quá chặt chẽ công nghệ.

Doanh nghiệp này cũng có khả năng mở rộng tầm ảnh hưởng của chatbot tại thị trường phương Tây bằng cách giúp các nhà phát triển khác dễ dàng điều chỉnh công nghệ nền tảng để đáp ứng nhu cầu của họ.

Nói cách khác, theo các tác giả trên Bloomberg, DeepSeek trên thực tế đã đi theo đúng công thức mà Meta sử dụng để chiếm lĩnh nhiều hơn hệ sinh thái AI – điều mà dường như CEO Meta Mark Zuckerberg không bỏ qua.

“Đây là một cuộc cạnh tranh địa chính trị khổng lồ, và Trung Quốc đang lao vào với tốc độ cực nhanh”, ông Zuckerberg từng nói trong một cuộc phỏng vấn trên The Joe Rogan Experience. “Nếu có một mô hình mã nguồn mở mà mọi người đều sử dụng, mô hình đó nên đến từ nước Mỹ”.

DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP
DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP

Giống như một số mô hình mới nhất từ các nhà phát triển Mỹ hàng đầu, bao gồm OpenAI và Google, R1 của DeepSeek được thiết kế để mô phỏng cách con người suy nghĩ, dành thời gian xử lý trước khi đưa ra câu trả lời cho câu hỏi của người dùng.

Tuy nhiên, phiên bản của DeepSeek được xây dựng trên nền tảng V3 mới được phát hành gần đây lại cho thấy hiệu suất khác biệt.

Nhóm phát triển đã có cách làm sáng tạo. Trong khi đối thủ sử dụng số lượng lớn chip máy tính hiệu năng cao để xây dựng các mô hình AI tương tự, nhóm của DeepSeek dường như đã tìm ra cách tận dụng hiệu quả lượng chip ít hơn và kém tiên tiến hơn mà họ có thể tiếp cận do lệnh kiểm soát xuất khẩu của Mỹ đối với các loại chip tối tân nhất.

Họ cũng tận dụng mạnh mẽ kỹ thuật được gọi là “học tăng cường” (reinforcement learning), trong đó hệ thống được “thưởng” cho câu trả lời đúng và “phạt” cho câu trả lời sai.

Theo Bloomberg, tại Mỹ, một số lãnh đạo công nghệ và chính sách đã thừa nhận những tiến bộ này, đồng thời đặt ra câu hỏi liệu công ty Trung Quốc có xây dựng chatbot dựa trên công nghệ phương Tây hay không, qua đó né tránh một phần chi phí khổng lồ trong việc phát triển các mô hình ngôn ngữ lớn – nền tảng của chatbot.

Công ty tư vấn hàng đầu thế giới Bain & Company đánh giá, hiệu suất của DeepSeek dựa trên một loạt các cải tiến kỹ thuật, giúp giảm đáng kể chi phí suy luận đồng thời cải thiện chi phí đào tạo. Kiến trúc hỗn hợp chuyên gia (MoE) của DeepSeek chỉ kích hoạt 37 tỷ trong số 671 tỷ tham số để xử lý mỗi token, giảm thiểu chi phí tính toán mà không làm giảm hiệu suất.

Công ty này cũng đã tối ưu hóa các kỹ thuật, cho phép chuyển giao khả năng suy luận từ các mô hình lớn hơn sang các mô hình nhỏ hơn. Bằng cách sử dụng học tăng cường, DeepSeek nâng cao hiệu suất mà không cần tinh chỉnh có giám sát mở rộng.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Người thu nhập cao ứng dụng AI hàng ngày trong công việc

Hơn 60% lao động có thu nhập cao cho biết họ sử dụng AI hàng ngày trong công việc, trong khi con số này ở nhóm thu nhập thấp chỉ là 16%...

10:24 24/04/2026
Bổ nhiệm 700 huấn luyện viên từ hơn 100 quốc gia cho kỳ Esports Nations Cup đầu tiên

Đội ngũ huấn luyện viên từ hơn 90 tổ chức esports hàng đầu trên toàn cầu sẽ đảm nhiệm công tác tuyển chọn tuyển thủ và xây dựng đội hình ở các bộ môn thi đấu đồng đội hàng đầu...

10:23 24/04/2026
Cơn sốt Anthropic: Định giá chạm mốc nghìn tỷ USD trên thị trường thứ cấp, vượt OpenAI

Trong khi OpenAI vẫn giữ mức định giá cao theo các vòng gọi vốn chính thức, thị trường thứ cấp đang chứng kiến một làn sóng săn lùng cổ phiếu Anthropic chưa từng có…

22:22 23/04/2026
Trung Quốc nở rộ dịch vụ tạo bản sao AI

“Huấn luyện bản sao AI” không chỉ là thử nghiệm công nghệ, mà còn là quá trình số hóa tri thức lao động, một tài sản mà doanh nghiệp có thể khai thác lâu dài. Tuy nhiên, từ góc nhìn của người lao động, trải nghiệm này lại mang màu sắc rất khác...

14:06 23/04/2026
AI sẽ khiến cuộc khủng hoảng rác thải điện tử toàn cầu tồi tệ hơn

Làn sóng đầu tư và triển khai trí tuệ nhân tạo (AI) đang kéo theo nhu cầu phần cứng tăng vọt, từ GPU đến máy chủ chuyên dụng…

14:06 23/04/2026
Chân dung John Ternus, CEO mới của Apple: Từ chuyên gia phần cứng bước vào "cuộc đua" AI

Sau 25 năm gắn bó với Apple, John Ternus chính thức được chọn làm CEO, kế nhiệm Tim Cook từ ngày 1/9…

19:47 22/04/2026
Chiến lược đằng sau thương vụ định giá 800 tỷ USD của Anthropic

Quỹ đạo tài chính gần đây của Anthropic đã khiến giới quan sát thị trường bất ngờ, khi hiện định giá công ty ở mức 800 tỷ USD, ngang bằng với đối thủ chính là OpenAI, theo Euronews Next...

17:37 21/04/2026
Ấn Độ xây dựng nhà máy đóng gói chip 3D tiên tiến đầu tiên

Ấn Độ vừa đặt nền móng cho nhà máy đóng gói chip 3D tiên tiến đầu tiên tại bang Odisha, đánh dấu bước tiến quan trọng trong chiến lược xây dựng hệ sinh thái bán dẫn nội địa…

16:20 21/04/2026
Các công ty bán dẫn, robot Trung Quốc tăng cường tuyển dụng nhân sự

Cơn sốt AI đang thúc đẩy làn sóng tuyển dụng trong các ngành công nghệ cốt lõi của Trung Quốc, từ bán dẫn đến robot và điện tử...

16:17 21/04/2026
Thiếu hụt chip nhớ sẽ kéo dài đến năm 2027

Dù đã đẩy mạnh mở rộng sản xuất, các hãng chip lớn nhất thế giới cũng chỉ có thể đáp ứng khoảng 60% nhu cầu thị trường. Tình trạng thiếu hụt chip nhớ toàn cầu được dự báo sẽ kéo dài ít nhất đến năm 2027…

13:08 20/04/2026