image Thứ Năm, 27/11/2025

DeepSeek và các mô hình mã nguồn mở đang thay đổi AI như thế nào?

Mai Anh

11/09/2025

Chia sẻ

Sự xuất hiện của DeepSeek và các mô hình có chi phí rẻ hơn dấy lên một cuộc đua mới không chỉ về hiệu suất giữa các mô hình AI…

Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg
Vị thế độc quyền của một số mô hình lớn từ Mỹ đã bị đe dọa kể từ khi DeepSeek ra đời. Ảnh: Bloomberg

Hồi đầu tháng 8 vừa qua, OpenAI thông báo phát hành hai mô hình ngôn ngữ tiên tiến có trọng số mở, lần đầu tiên kể từ khi triển khai GPT-2 vào năm 2019. Hai mô hình này, được gọi là gpt-oss-120b và gpt-oss-20b, chỉ có định dạng văn bản và được thiết kế để phục vụ các lựa chọn chi phí thấp hơn mà các nhà phát triển, nhà nghiên cứu và doanh nghiệp có thể dễ dàng tùy chỉnh.

“Nhìn thấy một hệ sinh thái phát triển thật thú vị, và chúng tôi rất vui khi được đóng góp vào hệ sinh thái đó, thúc đẩy ranh giới và xem điều gì sẽ xảy ra tiếp theo”, Chủ tịch OpenAI – ông Greg Brockman phát biểu trong cuộc họp báo công bố.

Một mô hình trí tuệ nhân tạo được xem là trọng số mở nếu các tham số, hoặc các yếu tố cải thiện kết quả đầu ra và dự đoán trong quá trình đào tạo, được công khai.

Các công ty công nghệ và giới học thuật từ lâu đã tranh luận về rủi ro và lợi ích khi xây dựng phần mềm mã nguồn mở. Nhưng làn sóng bùng nổ quanh trí tuệ nhân tạo tạo sinh đã mang lại ý nghĩa mới cho cuộc tranh luận này.

Làn sóng ấy được kích hoạt mạnh mẽ khi DeepSeek – một doanh nghiệp khởi nghiệp non trẻ của Trung Quốc và một số công ty khác tại thị trường này đã tung ra hàng loạt mô hình mã nguồn mở giá rẻ, cạnh tranh với phần mềm của các nhà phát triển AI hàng đầu Mỹ.

Để giành lại thị phần và người dùng, các ông lớn công nghệ của Mỹ cũng không thể nằm ngoài cuộc chơi, buộc phải tìm cách tung ra các mô hình có chi phí rẻ hơn, đơn cử như OpenAI. Chính quyền của Tổng thống Mỹ Donald Trump cũng kêu gọi nhiều công ty công nghệ Mỹ làm điều tương tự.

MÃ NGUỒN MỞ LÀ GÌ?

Thuật ngữ mã nguồn mở đề cập đến phần mềm có mã nguồn được công khai miễn phí để bất kỳ ai cũng có thể sử dụng hoặc chỉnh sửa. Theo Sáng kiến Mã nguồn mở (OSI), một tổ chức phi lợi nhuận có trụ sở tại California chuyên vận động cho lợi ích của cách làm này, để đáp ứng đủ các điều kiện được coi là mã nguồn mở, phần mềm phải tuân thủ những điều khoản cụ thể về phân phối và truy cập.

Đối với một mô hình AI được coi là thực sự mở, OSI cho rằng, các nhà phát triển phải cung cấp thông tin chi tiết về dữ liệu được dùng để huấn luyện, đồng thời, cho phép mọi người nghiên cứu, sử dụng và chỉnh sửa hệ thống cho bất kỳ mục đích nào.

Ngược lại, mã nguồn đóng đề cập đến phần mềm và mô hình được kiểm soát bởi nhà phát triển, không thể chỉnh sửa, và ít minh bạch hơn về nền tảng kỹ thuật.

AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke
AI nguồn mở không chỉ là một phong trào mà là được xem là bước tiến mới trong phát triển AI. Ảnh: Devluke

Hiện nay, nhiều công ty công nghệ quảng bá phần mềm AI là mã nguồn mở nhưng thực tế không phải doanh nghiệp nào cũng đáp ứng đầy đủ định nghĩa của thuật ngữ này.

Đơn cử, Meta Platforms, OpenAI của Mỹ, Mistral – một doanh nghiệp khởi nghiệp của Pháp hay DeepSeek đều đã phát hành các mô hình AI được giới thiệu là mã nguồn mở.

Tuy nhiên, các mô hình này chủ yếu ở dạng “open-weight”. Điều này có nghĩa rằng ngoài việc cung cấp mô hình và có thể cả một phần mã nguồn, các công ty còn công bố “trọng số” – tức những giá trị số học mà mô hình thu nhận và được điều chỉnh trong quá trình huấn luyện, giúp các nhà phát triển tùy biến tốt hơn. Tuy nhiên, các doanh nghiệp lại không tiết lộ chi tiết về dữ liệu thực tế đã được sử dụng để huấn luyện.

Ví dụ, Meta từng cung cấp trọng số và một phần mã nguồn cho dòng mô hình AI Llama, nhưng không cung cấp thông tin chi tiết về dữ liệu huấn luyện. Meta cũng từng bị OSI chỉ trích vì các điều khoản cấp phép có kèm theo một số hạn chế về mục đích thương mại.

Tương tự, hồi tháng 1, DeepSeek thông báo phát hành hệ thống R1 dưới dạng mô hình mã nguồn mở, nhưng lại không công bố mã nguồn hay dữ liệu huấn luyện. Điều đó dẫn đến nhiều nghi vấn về việc công ty này thực sự sử dụng dữ liệu gì để xây dựng mô hình.

OpenAI, dù trong tên gọi có chữ “open” – nghĩa là mở, nhưng lại không công khai hầu hết mô hình. Tuy nhiên, ngay sau khi DeepSeek gây tiếng vang, Giám đốc điều hành OpenAI – ông Sam Altman thừa nhận rằng, nhà sản xuất ChatGPT cần phải “tìm ra một chiến lược mã nguồn mở khác”. Ông nói thêm: “Cá nhân tôi nghĩ rằng chúng tôi đã đứng nhầm phía của lịch sử trong vấn đề này”.

LỢI ÍCH CỦA MÃ NGUỒN MỞ

Theo Bloomberg, những người ủng hộ phần mềm mã nguồn mở thường nhấn mạnh vào mức chi phí rẻ hơn cho người dùng bởi không phải trả phí cấp phép như hệ thống đóng.

Mức giá sử dụng thấp hơn sẽ mở đường cho ứng dụng AI rộng rãi hơn, đồng thời khuyến khích đổi mới sáng tạo.

Những người ủng hộ cũng cho rằng, cách tiếp cận này giúp tăng tính minh bạch và trách nhiệm giải trình của các nhà phát triển hệ thống AI khi người khác có thể hiểu rõ hơn cách mô hình vận hành.

Trong khi đó, các hệ thống đóng lại tiềm ẩn rủi ro tạo ra một thị trường AI bị thống trị bởi một số ít công ty quyền lực. Ông Aaron Levie, Giám đốc điều hành Công ty lưu trữ đám mây Box Inc., phân tích: “Trong thế giới AI đắt đỏ và độc quyền, các nhà cung cấp AI có thể sẽ giữ toàn bộ lợi ích kinh tế cho riêng mình và về cơ bản là loại bỏ cơ hội của các nhà phát triển và hệ sinh thái”.

Với những công ty như Meta, mã nguồn mở mang đến thêm lợi ích: mức độ phổ biến. Khi cho phép các nhà phát triển khác tự do truy cập và xây dựng trên nền tảng phần mềm mã nguồn mở của mình, Meta đã mở rộng được tầm ảnh hưởng trong toàn bộ hệ sinh thái AI.

Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP
Các mô hình có mã nguồn mở thường có chi phí sử dụng thấp hơn các mô hình đóng. Ảnh: SCMP

Ở chiều ngược lại, những người chỉ trích phần mềm mã nguồn mở lập luận rằng mô hình này kém an toàn hơn.

Trong trường hợp của AI, một số ý kiến ở Mỹ lo ngại rằng việc sử dụng các mô hình từ đối thủ như Trung Quốc sẽ đe dọa an ninh quốc gia, ảnh hưởng đến sự an toàn của công dân. Ví dụ, các mô hình thu thập lượng lớn dữ liệu người dùng có thể bị khai thác cho mục đích giám sát.

Ngoài ra, cũng có lo ngại rằng các công ty Mỹ tung ra mô hình AI với nhiều mức độ mở khác nhau có thể vô tình trao cho các quốc gia đối thủ cơ hội tận dụng để vượt mặt Mỹ về công nghệ.

VÌ SAO DEEPSEEK CHỌN HƯỚNG ĐI MỞ?

Bằng việc áp dụng cách tiếp cận cởi mở hơn (dù có một số giới hạn), DeepSeek có thể đã làm dịu đi những lo ngại của người dùng toàn cầu về việc Trung Quốc kiểm soát quá chặt chẽ công nghệ.

Doanh nghiệp này cũng có khả năng mở rộng tầm ảnh hưởng của chatbot tại thị trường phương Tây bằng cách giúp các nhà phát triển khác dễ dàng điều chỉnh công nghệ nền tảng để đáp ứng nhu cầu của họ.

Nói cách khác, theo các tác giả trên Bloomberg, DeepSeek trên thực tế đã đi theo đúng công thức mà Meta sử dụng để chiếm lĩnh nhiều hơn hệ sinh thái AI – điều mà dường như CEO Meta Mark Zuckerberg không bỏ qua.

“Đây là một cuộc cạnh tranh địa chính trị khổng lồ, và Trung Quốc đang lao vào với tốc độ cực nhanh”, ông Zuckerberg từng nói trong một cuộc phỏng vấn trên The Joe Rogan Experience. “Nếu có một mô hình mã nguồn mở mà mọi người đều sử dụng, mô hình đó nên đến từ nước Mỹ”.

DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP
DeepSeek dần cho thấy tiềm năng khi không chỉ có mức giá sử dụng rẻ hơn mà hiệu suất cũng tăng dần. Ảnh: SCMP

Giống như một số mô hình mới nhất từ các nhà phát triển Mỹ hàng đầu, bao gồm OpenAI và Google, R1 của DeepSeek được thiết kế để mô phỏng cách con người suy nghĩ, dành thời gian xử lý trước khi đưa ra câu trả lời cho câu hỏi của người dùng.

Tuy nhiên, phiên bản của DeepSeek được xây dựng trên nền tảng V3 mới được phát hành gần đây lại cho thấy hiệu suất khác biệt.

Nhóm phát triển đã có cách làm sáng tạo. Trong khi đối thủ sử dụng số lượng lớn chip máy tính hiệu năng cao để xây dựng các mô hình AI tương tự, nhóm của DeepSeek dường như đã tìm ra cách tận dụng hiệu quả lượng chip ít hơn và kém tiên tiến hơn mà họ có thể tiếp cận do lệnh kiểm soát xuất khẩu của Mỹ đối với các loại chip tối tân nhất.

Họ cũng tận dụng mạnh mẽ kỹ thuật được gọi là “học tăng cường” (reinforcement learning), trong đó hệ thống được “thưởng” cho câu trả lời đúng và “phạt” cho câu trả lời sai.

Theo Bloomberg, tại Mỹ, một số lãnh đạo công nghệ và chính sách đã thừa nhận những tiến bộ này, đồng thời đặt ra câu hỏi liệu công ty Trung Quốc có xây dựng chatbot dựa trên công nghệ phương Tây hay không, qua đó né tránh một phần chi phí khổng lồ trong việc phát triển các mô hình ngôn ngữ lớn – nền tảng của chatbot.

Công ty tư vấn hàng đầu thế giới Bain & Company đánh giá, hiệu suất của DeepSeek dựa trên một loạt các cải tiến kỹ thuật, giúp giảm đáng kể chi phí suy luận đồng thời cải thiện chi phí đào tạo. Kiến trúc hỗn hợp chuyên gia (MoE) của DeepSeek chỉ kích hoạt 37 tỷ trong số 671 tỷ tham số để xử lý mỗi token, giảm thiểu chi phí tính toán mà không làm giảm hiệu suất.

Công ty này cũng đã tối ưu hóa các kỹ thuật, cho phép chuyển giao khả năng suy luận từ các mô hình lớn hơn sang các mô hình nhỏ hơn. Bằng cách sử dụng học tăng cường, DeepSeek nâng cao hiệu suất mà không cần tinh chỉnh có giám sát mở rộng.


Tại sao một bộ phận người trẻ dần quay lưng với AI?

Phong trào 'AI vegans' đang gia tăng, phản đối AI vì lý do đạo đức và tác động môi trường, theo chia sẻ từ những người trẻ tại châu Âu.

19:30 26/11/2025
Liên minh công nghiệp công nghệ chủ quyền Châu Âu sẽ được thành lập trong năm 2026

Liên minh Công nghiệp Công nghệ Chủ quyền Châu Âu (ESTIA) sẽ chính thức ra mắt vào năm 2026, nhằm thúc đẩy chủ quyền công nghệ số tại châu lục.

19:29 26/11/2025
Khai thác Bitcoin âm thầm trở lại Trung Quốc bất chấp lệnh cấm

Trung Quốc trở lại vị trí thứ ba toàn cầu về khai thác Bitcoin, với 14% thị phần, nhờ nguồn điện rẻ và sự thay đổi trong chính sách.

09:58 26/11/2025
Hơn 90% lãnh đạo Singapore coi cải tổ dữ liệu là yếu tố quan trọng nhất giúp chiến lược AI thành công

Theo nghiên cứu của Salesforce, 91% lãnh đạo công nghệ Singapore cho rằng cải tổ dữ liệu là yếu tố quyết định cho thành công của chiến lược AI.

09:57 26/11/2025
Các hãng chip Hàn Quốc, Đài Loan, Trung Quốc chạy đua tăng lương, thưởng cho kỹ sư bán dẫn

Các hãng chip Hàn Quốc, Đài Loan và Trung Quốc đang chạy đua tăng lương, thưởng cho kỹ sư bán dẫn giữa bối cảnh thiếu hụt nhân lực trầm trọng.

14:23 24/11/2025
Mỹ chạy đua đào tạo nhân lực công nghệ để làm việc trong các nhà máy sản xuất

Mỹ đối mặt thiếu hụt 1,4 triệu lao động công nghệ cao đến 2030, trong bối cảnh AI và chính sách nhập cư gây khó khăn cho ngành sản xuất.

10:49 22/11/2025
Huawei mở rộng mạng lưới bán dẫn: Tham vọng xây chuỗi cung ứng chip độc lập của Trung Quốc

Huawei đóng vai trò trung tâm trong nỗ lực tự chủ công nghệ bán dẫn của Trung Quốc, với các đầu tư và thâu tóm mạnh mẽ trong ngành công nghiệp chip.

09:14 20/11/2025
Bên trong cuộc cách mạng chip của Mỹ đang diễn ra tại 'Sa mạc Silicon"

TSMC và Intel đầu tư mạnh vào Arizona, biến vùng đất sa mạc thành trung tâm sản xuất chip tiên tiến, tạo ra hàng chục nghìn việc làm mới.

09:13 20/11/2025
Doanh thu hãng chip Trung Quốc tăng hơn 500%, cổ phiếu nhảy vọt 765% nhờ lệnh cấm của Mỹ

Doanh thu Cambricon tăng 500% trong 12 tháng, cổ phiếu tăng 765% nhờ chính sách bảo hộ và lệnh cấm chip từ Mỹ.

09:03 20/11/2025
Gần 1/3 công ty sẽ thay thế vai trò của HR bằng AI

Nghiên cứu từ AI Resume Builder cho thấy 30% doanh nghiệp sẽ tự động hóa vai trò HR vào năm 2026, ảnh hưởng đến 65% lực lượng lao động.

10:46 18/11/2025