image Thứ Sáu, 15/05/2026

DeepSeek và các mô hình mã nguồn mở đang thay đổi AI như thế nào?

Mai Anh

11/09/2025

Chia sẻ

Sự xuất hiện của DeepSeek và các mô hình có chi phí rẻ hơn dấy lên một cuộc đua mới không chỉ về hiệu suất giữa các mô hình AI…

Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg
Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg

Hồi đầu tháng 8 vừa qua, OpenAI thông báo phát hành hai mô hình ngôn ngữ tiên tiến có trọng số mở, lần đầu tiên kể từ khi triển khai GPT-2 vào năm 2019. Hai mô hình này, được gọi là gpt-oss-120b và gpt-oss-20b, chỉ có định dạng văn bản và được thiết kế để phục vụ các lựa chọn chi phí thấp hơn mà các nhà phát triển, nhà nghiên cứu và doanh nghiệp có thể dễ dàng tùy chỉnh.

“Nhìn thấy một hệ sinh thái phát triển thật thú vị, và chúng tôi rất vui khi được đóng góp vào hệ sinh thái đó, thúc đẩy ranh giới và xem điều gì sẽ xảy ra tiếp theo”, Chủ tịch OpenAI – ông Greg Brockman phát biểu trong cuộc họp báo công bố.

Một mô hình trí tuệ nhân tạo được xem là trọng số mở nếu các tham số, hoặc các yếu tố cải thiện kết quả đầu ra và dự đoán trong quá trình đào tạo, được công khai.

Các công ty công nghệ và giới học thuật từ lâu đã tranh luận về rủi ro và lợi ích khi xây dựng phần mềm mã nguồn mở. Nhưng làn sóng bùng nổ quanh trí tuệ nhân tạo tạo sinh đã mang lại ý nghĩa mới cho cuộc tranh luận này.

Làn sóng ấy được kích hoạt mạnh mẽ khi DeepSeek – một doanh nghiệp khởi nghiệp non trẻ của Trung Quốc và một số công ty khác tại thị trường này đã tung ra hàng loạt mô hình mã nguồn mở giá rẻ, cạnh tranh với phần mềm của các nhà phát triển AI hàng đầu Mỹ.

Để giành lại thị phần và người dùng, các ông lớn công nghệ của Mỹ cũng không thể nằm ngoài cuộc chơi, buộc phải tìm cách tung ra các mô hình có chi phí rẻ hơn, đơn cử như OpenAI. Chính quyền của Tổng thống Mỹ Donald Trump cũng kêu gọi nhiều công ty công nghệ Mỹ làm điều tương tự.

MÃ NGUỒN MỞ LÀ GÌ?

Thuật ngữ mã nguồn mở đề cập đến phần mềm có mã nguồn được công khai miễn phí để bất kỳ ai cũng có thể sử dụng hoặc chỉnh sửa. Theo Sáng kiến Mã nguồn mở (OSI), một tổ chức phi lợi nhuận có trụ sở tại California chuyên vận động cho lợi ích của cách làm này, để đáp ứng đủ các điều kiện được coi là mã nguồn mở, phần mềm phải tuân thủ những điều khoản cụ thể về phân phối và truy cập.

Đối với một mô hình AI được coi là thực sự mở, OSI cho rằng, các nhà phát triển phải cung cấp thông tin chi tiết về dữ liệu được dùng để huấn luyện, đồng thời, cho phép mọi người nghiên cứu, sử dụng và chỉnh sửa hệ thống cho bất kỳ mục đích nào.

Ngược lại, mã nguồn đóng đề cập đến phần mềm và mô hình được kiểm soát bởi nhà phát triển, không thể chỉnh sửa, và ít minh bạch hơn về nền tảng kỹ thuật.

AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke
AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke

Hiện nay, nhiều công ty công nghệ quảng bá phần mềm AI là mã nguồn mở nhưng thực tế không phải doanh nghiệp nào cũng đáp ứng đầy đủ định nghĩa của thuật ngữ này.

Đơn cử, Meta Platforms, OpenAI của Mỹ, Mistral – một doanh nghiệp khởi nghiệp của Pháp hay DeepSeek đều đã phát hành các mô hình AI được giới thiệu là mã nguồn mở.

Tuy nhiên, các mô hình này chủ yếu ở dạng “open-weight”. Điều này có nghĩa rằng ngoài việc cung cấp mô hình và có thể cả một phần mã nguồn, các công ty còn công bố “trọng số” – tức những giá trị số học mà mô hình thu nhận và được điều chỉnh trong quá trình huấn luyện, giúp các nhà phát triển tùy biến tốt hơn. Tuy nhiên, các doanh nghiệp lại không tiết lộ chi tiết về dữ liệu thực tế đã được sử dụng để huấn luyện.

Ví dụ, Meta từng cung cấp trọng số và một phần mã nguồn cho dòng mô hình AI Llama, nhưng không cung cấp thông tin chi tiết về dữ liệu huấn luyện. Meta cũng từng bị OSI chỉ trích vì các điều khoản cấp phép có kèm theo một số hạn chế về mục đích thương mại.

Tương tự, hồi tháng 1, DeepSeek thông báo phát hành hệ thống R1 dưới dạng mô hình mã nguồn mở, nhưng lại không công bố mã nguồn hay dữ liệu huấn luyện. Điều đó dẫn đến nhiều nghi vấn về việc công ty này thực sự sử dụng dữ liệu gì để xây dựng mô hình.

OpenAI, dù trong tên gọi có chữ “open” – nghĩa là mở, nhưng lại không công khai hầu hết mô hình. Tuy nhiên, ngay sau khi DeepSeek gây tiếng vang, Giám đốc điều hành OpenAI – ông Sam Altman thừa nhận rằng, nhà sản xuất ChatGPT cần phải “tìm ra một chiến lược mã nguồn mở khác”. Ông nói thêm: “Cá nhân tôi nghĩ rằng chúng tôi đã đứng nhầm phía của lịch sử trong vấn đề này”.

LỢI ÍCH CỦA MÃ NGUỒN MỞ

Theo Bloomberg, những người ủng hộ phần mềm mã nguồn mở thường nhấn mạnh vào mức chi phí rẻ hơn cho người dùng bởi không phải trả phí cấp phép như hệ thống đóng.

Mức giá sử dụng thấp hơn sẽ mở đường cho ứng dụng AI rộng rãi hơn, đồng thời khuyến khích đổi mới sáng tạo.

Những người ủng hộ cũng cho rằng, cách tiếp cận này giúp tăng tính minh bạch và trách nhiệm giải trình của các nhà phát triển hệ thống AI khi người khác có thể hiểu rõ hơn cách mô hình vận hành.

Trong khi đó, các hệ thống đóng lại tiềm ẩn rủi ro tạo ra một thị trường AI bị thống trị bởi một số ít công ty quyền lực. Ông Aaron Levie, Giám đốc điều hành Công ty lưu trữ đám mây Box Inc., phân tích: “Trong thế giới AI đắt đỏ và độc quyền, các nhà cung cấp AI có thể sẽ giữ toàn bộ lợi ích kinh tế cho riêng mình và về cơ bản là loại bỏ cơ hội của các nhà phát triển và hệ sinh thái”.

Với những công ty như Meta, mã nguồn mở mang đến thêm lợi ích: mức độ phổ biến. Khi cho phép các nhà phát triển khác tự do truy cập và xây dựng trên nền tảng phần mềm mã nguồn mở của mình, Meta đã mở rộng được tầm ảnh hưởng trong toàn bộ hệ sinh thái AI.

Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP
Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP

Ở chiều ngược lại, những người chỉ trích phần mềm mã nguồn mở lập luận rằng mô hình này kém an toàn hơn.

Trong trường hợp của AI, một số ý kiến ở Mỹ lo ngại rằng việc sử dụng các mô hình từ đối thủ như Trung Quốc sẽ đe dọa an ninh quốc gia, ảnh hưởng đến sự an toàn của công dân. Ví dụ, các mô hình thu thập lượng lớn dữ liệu người dùng có thể bị khai thác cho mục đích giám sát.

Ngoài ra, cũng có lo ngại rằng các công ty Mỹ tung ra mô hình AI với nhiều mức độ mở khác nhau có thể vô tình trao cho các quốc gia đối thủ cơ hội tận dụng để vượt mặt Mỹ về công nghệ.

VÌ SAO DEEPSEEK CHỌN HƯỚNG ĐI MỞ?

Bằng việc áp dụng cách tiếp cận cởi mở hơn (dù có một số giới hạn), DeepSeek có thể đã làm dịu đi những lo ngại của người dùng toàn cầu về việc Trung Quốc kiểm soát quá chặt chẽ công nghệ.

Doanh nghiệp này cũng có khả năng mở rộng tầm ảnh hưởng của chatbot tại thị trường phương Tây bằng cách giúp các nhà phát triển khác dễ dàng điều chỉnh công nghệ nền tảng để đáp ứng nhu cầu của họ.

Nói cách khác, theo các tác giả trên Bloomberg, DeepSeek trên thực tế đã đi theo đúng công thức mà Meta sử dụng để chiếm lĩnh nhiều hơn hệ sinh thái AI – điều mà dường như CEO Meta Mark Zuckerberg không bỏ qua.

“Đây là một cuộc cạnh tranh địa chính trị khổng lồ, và Trung Quốc đang lao vào với tốc độ cực nhanh”, ông Zuckerberg từng nói trong một cuộc phỏng vấn trên The Joe Rogan Experience. “Nếu có một mô hình mã nguồn mở mà mọi người đều sử dụng, mô hình đó nên đến từ nước Mỹ”.

DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP
DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP

Giống như một số mô hình mới nhất từ các nhà phát triển Mỹ hàng đầu, bao gồm OpenAI và Google, R1 của DeepSeek được thiết kế để mô phỏng cách con người suy nghĩ, dành thời gian xử lý trước khi đưa ra câu trả lời cho câu hỏi của người dùng.

Tuy nhiên, phiên bản của DeepSeek được xây dựng trên nền tảng V3 mới được phát hành gần đây lại cho thấy hiệu suất khác biệt.

Nhóm phát triển đã có cách làm sáng tạo. Trong khi đối thủ sử dụng số lượng lớn chip máy tính hiệu năng cao để xây dựng các mô hình AI tương tự, nhóm của DeepSeek dường như đã tìm ra cách tận dụng hiệu quả lượng chip ít hơn và kém tiên tiến hơn mà họ có thể tiếp cận do lệnh kiểm soát xuất khẩu của Mỹ đối với các loại chip tối tân nhất.

Họ cũng tận dụng mạnh mẽ kỹ thuật được gọi là “học tăng cường” (reinforcement learning), trong đó hệ thống được “thưởng” cho câu trả lời đúng và “phạt” cho câu trả lời sai.

Theo Bloomberg, tại Mỹ, một số lãnh đạo công nghệ và chính sách đã thừa nhận những tiến bộ này, đồng thời đặt ra câu hỏi liệu công ty Trung Quốc có xây dựng chatbot dựa trên công nghệ phương Tây hay không, qua đó né tránh một phần chi phí khổng lồ trong việc phát triển các mô hình ngôn ngữ lớn – nền tảng của chatbot.

Công ty tư vấn hàng đầu thế giới Bain & Company đánh giá, hiệu suất của DeepSeek dựa trên một loạt các cải tiến kỹ thuật, giúp giảm đáng kể chi phí suy luận đồng thời cải thiện chi phí đào tạo. Kiến trúc hỗn hợp chuyên gia (MoE) của DeepSeek chỉ kích hoạt 37 tỷ trong số 671 tỷ tham số để xử lý mỗi token, giảm thiểu chi phí tính toán mà không làm giảm hiệu suất.

Công ty này cũng đã tối ưu hóa các kỹ thuật, cho phép chuyển giao khả năng suy luận từ các mô hình lớn hơn sang các mô hình nhỏ hơn. Bằng cách sử dụng học tăng cường, DeepSeek nâng cao hiệu suất mà không cần tinh chỉnh có giám sát mở rộng.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Bắc Kinh thúc đẩy trung tâm dữ liệu AI dùng “điện xanh”

Trung Quốc đang đẩy mạnh yêu cầu sử dụng năng lượng xanh đối với các trung tâm dữ liệu trí tuệ nhân tạo (AI). Nhu cầu điện phục vụ làn sóng AI ngày càng tạo sức ép lớn lên hệ thống điện quốc gia và mục tiêu giảm phát thải carbon của Bắc Kinh...

19:11 11/05/2026
TikTok đầu tư kỷ lục 25 tỷ USD vào Thái Lan, mở rộng hiện diện tại Đông Nam Á

TikTok vừa công bố kế hoạch đầu tư 25 tỷ USD vào các dự án hạ tầng dữ liệu tại Thái Lan, đánh dấu khoản đầu tư lớn nhất từ trước đến nay của nền tảng video ngắn này tại Đông Nam Á...

08:03 09/05/2026
AI đe dọa “giấc mơ phần mềm” từng tạo nên tầng lớp trung lưu Ấn Độ

Thứ từng là lợi thế lớn nhất của ngành phần mềm Ấn Độ – nguồn nhân lực đông đảo và giá rẻ – có nguy cơ trở thành điểm yếu trong kỷ nguyên AI...

08:03 09/05/2026
Big Fund Trung Quốc dẫn đầu đàm phán rót vốn, đưa DeepSeek lên định giá 45 tỷ USD

Điểm đáng chú ý là mức định giá của DeepSeek đã tăng mạnh chỉ trong thời gian ngắn. Khi bắt đầu quá trình gọi vốn cách đây vài tuần, startup này được định giá khoảng 20 tỷ USD…

15:56 07/05/2026
Samsung cán mốc vốn hóa 1.000 tỷ USD, gia nhập câu lạc bộ công ty hàng đầu cùng với TSMC

Đây là lần đầu tiên trong lịch sử hãng điện tử lớn nhất Hàn Quốc đạt được cột mốc này, đồng thời trở thành công ty châu Á thứ hai làm được điều đó, sau Taiwan Semiconductor Manufacturing Co...

15:56 07/05/2026
SEMI kêu gọi các quốc gia Đông Nam Á đầu tư xây dựng nhà máy bán dẫn

Theo thống kê, trong số 64 nhà máy mới dự kiến đi vào hoạt động tại châu Á đến năm 2029, chỉ có 6 cơ sở đặt tại Đông Nam Á, phần lớn còn lại tập trung ở Trung Quốc và Đài Loan (Trung Quốc)…

14:06 06/05/2026
Doanh số chip AI của Huawei tăng vọt

Động lực tăng trưởng của Huawei không chỉ đến từ nhu cầu thị trường, mà còn từ việc Nvidia gặp nhiều rào cản pháp lý với cả Washington và Bắc Kinh...

15:46 05/05/2026
Thị trường smartphone chững lại, robot trở thành “đường cong tăng trưởng” mới của Trung Quốc

Thị trường robot hình người đã bắt đầu tạo ra các đơn hàng thực tế cho chuỗi cung ứng điện tử Trung Quốc…

13:00 05/05/2026
Tòa án Trung Quốc: Doanh nghiệp không được sa thải lao động vì AI

Một tòa án tại Trung Quốc vừa ra phán quyết mang tính bước ngoặt: doanh nghiệp không thể đơn phương chấm dứt hợp đồng lao động với lý do thay thế con người bằng trí tuệ nhân tạo…

15:00 04/05/2026
Lợi nhuận hãng chip Trung Quốc tăng hơn 1.100% nhờ AI

Lợi nhuận ròng của doanh nghiệp chip Yuanjie Trung Quốc tăng tới 1.153% so với cùng kỳ năm trước...

15:04 29/04/2026