image Thứ Năm, 26/03/2026

Khái niệm mới "chưng cất AI" khiến nhiều gã khổng lồ công nghệ lo lắng

Sơn Trần

08/02/2025

Chia sẻ

Việc một công ty AI ra đời, sử dụng kỹ thuật nhằm "chưng cất" kiến thức của một số mô hình AI đi trước đang gây nhiều lo ngại…

Một số chatbot AI phổ biến hiện nay
Một số chatbot AI phổ biến hiện nay

Ngành công nghệ và thị trường chứng khoán hiện nay đang cố gắng lý giải cách một công ty nhỏ bé của Trung Quốc, ít được biết đến, lại có thể phát triển ra chatbot trí tuệ nhân tạo (AI) với chi phí thấp hơn rất nhiều các tập đoàn khác trên thế giới, theo Kr Asia.

Mô hình AI mới được phát triển bởi DeepSeek, công ty khởi nghiệp công nghệ mới được thành lập cách đây một năm. Dù tuổi đời ngắn, sức mạnh của DeepSeek có thể sánh ngang hoặc thậm chí vượt trội so với những mô hình AI nổi tiếng như ChatGPT của OpenAI, Gemini của Google, CoPilot của Microsoft hay Llama của Meta.

PHƯƠNG PHÁP “CHƯNG CẤT”

Một trong những giả thuyết được giới chuyên gia trong ngành nhận định đây là phương pháp chưng cất (distillation), một kỹ thuật huấn luyện AI sử dụng mô hình "mẹ" lớn hơn để huấn luyện mô hình "con" nhỏ hơn nhưng có khả năng hoạt động nhanh hơn.

DeepSeek tuyên bố đạt được mức độ hiệu suất tương đương với mô hình o1 của OpenAI với chi phí chỉ bằng một phần nhỏ thông qua “thiết kế tối ưu hóa thuật toán, khung và phần cứng”.

Sự kiện này dẫn đến đợt bán tháo mạnh mẽ trên thị trường chứng khoán công nghệ khi các nhà đầu tư bắt đầu phân vân về việc liệu phương pháp tiết kiệm chi phí của công ty Trung Quốc có phải là dấu hiệu cho thấy cuộc đua đầu tư AI và sự thống trị của các ông lớn công nghệ Hoa Kỳ sắp kết thúc.

Một số người trong ngành nghi ngờ rằng công ty có thể đã lợi dụng thành tựu của OpenAI. Sự nghi ngờ ngày càng tăng khi Bloomberg đưa tin rằng Microsoft và OpenAI tiến hành điều tra liệu DeepSeek có thu thập dữ liệu từ OpenAI bất hợp pháp để huấn luyện mô hình hay không. Hôm 28/1, OpenAI xác nhận với Financial Times rằng họ thấy dấu hiệu của việc chưng cất, mặc dù không công bố chi tiết bằng chứng.

Microsoft và DeepSeek chưa phản hồi yêu cầu bình luận.

Chưng cất thực tế không phải là kỹ thuật mới và không quá gây tranh cãi. Minitron của Nvidia và Falcon 3, phát triển bởi Viện Sáng tạo Công nghệ UAE, đều sử dụng phương pháp này, dùng mô hình ngôn ngữ lớn (LLM) của riêng họ làm mô hình "mẹ". Phương pháp này trở nên phổ biến từ năm 2024 trong bối cảnh nhu cầu sử dụng LLM trong doanh nghiệp ngày càng lớn.

Tuy nhiên, mô hình LLM lớn lại “khó xử lý và bạn sẽ cần số lượng đơn vị xử lý đồ họa (GPU) khổng lồ để triển khai”, kỹ sư tại một công ty AI ở Nhật Bản cho biết.

GPU là lý do chính khiến hệ thống AI trở nên đắt đỏ. Ví dụ, chip H100 đặc trưng của Nvidia có giá từ 30.000 đến 35.000 USD mỗi chiếc. Kỹ thuật chưng cất giúp giảm đáng kể thời gian và chi phí phát triển, đồng thời tạo ra mô hình có khả năng vận hành nhanh hơn so với đối thủ.

NĂNG LỰC THỰC SỰ CỦA DEEPSEEK?

“Vậy liệu DeepSeek cùng mô hình chi phí thấp có phụ thuộc nhiều vào phương pháp chưng cất hơn là đổi mới sáng tạo hay không?” ông Kirk Boodry, nhà phân tích tại Astris Advisory Japan, cho biết với Nikkei Asia. “Điều này đang được bàn luận khá nhiều. Mọi người đều tự hỏi: ‘Tôi không biết bao nhiêu phần trong số này thực sự tiên tiến’”.

Ông Kazuhiro Sugiyama, Giám đốc Tư vấn tại Omdia, tỏ ra hoài nghi về khả năng DeepSeek có thể thay đổi mạnh mẽ hệ sinh thái AI hiện tại. Ông cho rằng tác động của công ty này là “tạm thời và hạn chế”, hơn nữa ông chỉ ra rằng mặc dù chatbot của công ty Trung Quốc cho thấy những dấu hiệu đổi mới ấn tượng, nhưng ngành công nghiệp vẫn cần kiểm chứng thêm dưới góc độ bền vững.

Các nhà phân tích cũng đặt câu hỏi liệu chatbot DeepSeek có thực sự được phát triển với chỉ một phần ngân sách so với đối thủ phương Tây hay không.

“Khi mọi người nói về những con số gây chú ý của DeepSeek, như vài tháng phát triển hay chi tiêu 6 triệu USD, họ đang nói đến một mô hình rất cụ thể”, ông Boodry từ Astris chia sẻ. “Các con số mà mọi người nhắc đến có lẽ là quá thấp”.

Công ty Trung Quốc này đã công bố bài báo vào tháng 12 năm 2024, trong đó ghi nhận chi phí cho mô hình V3 của họ là 5,6 triệu USD. Tuy nhiên, con số này không bao gồm chi phí liên quan đến nghiên cứu và thử nghiệm trước đó. Trong khi, chi phí huấn luyện cho GPT-4 của OpenAI được ước tính vượt quá 100 triệu USD.

Ông Sugiyama dự đoán sẽ có nhiều công ty gia nhập cuộc đua phát triển mô hình ngôn ngữ lớn (LLM), nhưng vị trí thị trường của các ông lớn như OpenAI sẽ không thay đổi. Ông nhận định các mô hình AI sẽ dần "phân cực". 

Một số công ty lớn như Microsoft và Google tiếp tục đầu tư vào mô hình lớn, mạnh mẽ hơn để sử dụng trong các dịch vụ của họ, trong khi những doanh nghiệp nhỏ hơn sẽ phát triển mô hình nhỏ hơn, rẻ hơn và hiệu quả hơn, phù hợp với thị trường cụ thể.

THÀNH TỰU ĐÁNG GHI NHẬN

Nhiều chuyên gia cho rằng, dù ít hay nhiều, DeepSeek xứng đáng được công nhận.
Nhiều chuyên gia cho rằng, dù ít hay nhiều, DeepSeek xứng đáng được công nhận.

Mặc dù có sự phóng đại nhưng giới chuyên gia không nghi ngờ về việc DeepSeek đã đạt được điều gì đó xứng đáng được công nhận.

Ngay cả khi công ty sử dụng phương pháp chưng cất, điều đó vẫn không đủ để phát triển thành mô hình hoàn chỉnh. “Công ty cần có kiến thức chuyên môn để sử dụng GPU một cách hiệu quả và cần tìm ra cách thực hiện huấn luyện phức tạp”, chẳng hạn như kết hợp nhiều mô hình khác nhau để đưa ra câu trả lời tốt hơn, một kỹ sư giấu tên cho hay.

Một kỹ sư AI khác nói rằng anh “không ngạc nhiên” khi một công ty như DeepSeek xuất hiện đột ngột. “Bởi xu hướng hiện nay là giảm kích thước mô hình AI… Theo thời gian, sẽ có nhiều cách để đạt mục tiêu này”.


OpenAI đột ngột "khai tử" ứng dụng tạo video Sora

Bất chấp việc ký thỏa thuận kéo dài ba năm với The Walt Disney Company cho phép người dùng tạo video với hơn 200 nhân vật Disney, OpenAI vẫn đóng cửa ứng dụng từng làm mưa làm gió Sora…

13:30 26/03/2026
OpenClaw được Trung Quốc phổ cập rộng rãi tới người dùng đại chúng

Trung Quốc đang đẩy mạnh phổ cập trí tuệ nhân tạo trên quy mô lớn, và các “big tech” công nghệ nước này đang trực tiếp tổ chức nhiều sự kiện công khai để giúp người dân tiếp cận OpenClaw – trợ lý số cá nhân đang gây sốt…

07:59 25/03/2026
Tokenomics: “Nền kinh tế token” đang nhanh chóng nổi lên trong kỷ nguyên AI

Khi trí tuệ nhân tạo bước vào giai đoạn thương mại hóa quy mô lớn, “token” – đơn vị dữ liệu nhỏ nhất mà mô hình AI xử lý – đang nổi lên như một loại hàng hóa mới...

23:57 24/03/2026
Từ vệ tinh đến trung tâm dữ liệu ngoài không gian: Kinh tế LEO đang hút hàng tỷ USD đầu tư

Hơn 400 tỷ USD đã được đầu tư vào nền kinh tế không gian kể từ năm 2009, theo Space Capital. Các chuyên gia cho rằng ngành này vẫn đang ở “giai đoạn đầu của một chu kỳ hạ tầng kéo dài nhiều thập kỷ”...

15:07 23/03/2026
Australia công bố nguyên mẫu pin lượng tử đầu tiên: Bước tiến lớn hướng tới sạc siêu nhanh

Các nhà khoa học Australia vừa phát triển nguyên mẫu pin lượng tử đầu tiên trên thế giới, mở ra loạt ứng dụng đột phá, giúp xe điện sạc pin nhanh hơn cả thời gian đổ xăng vào xe chạy xăng...

10:41 22/03/2026
Bất động sản Việt Nam 2026: Khi Quản trị dữ liệu và ESG trở thành "hệ điều hành" mới

Trong bối cảnh thị trường bất động sản đang chuyển mình mạnh mẽ, việc tối ưu hóa dữ liệu công trình và các tiêu chuẩn bền vững (ESG) không còn là những khái niệm xa xỉ mà đã trở thành động lực tăng trưởng cốt lõi...

18:46 19/03/2026
Robot Trung Quốc tăng tốc với OpenClaw

Trung Quốc đang chứng kiến sự hội tụ nhanh chóng giữa trí tuệ nhân tạo và robot, khi các tác tử AI như OpenClaw được đưa vào thế giới vật lý…

16:29 19/03/2026
Thị trường kính AI "cất cánh": Lượng hàng xuất xưởng tăng trưởng kỷ lục 322%

Sự gia tăng mạnh mẽ của kính AI được thúc đẩy bởi thị trường Trung Quốc, nơi hàng loạt sản phẩm mới ra mắt...

09:17 18/03/2026
Trung Quốc lần đầu phê duyệt thiết bị cấy ghép giao diện não – máy tính

Trung Quốc vừa ghi dấu mốc quan trọng trong lĩnh vực công nghệ thần kinh khi lần đầu tiên cấp phép thương mại thiết bị cấy ghép giao diện não – máy tính (BCI) nhằm giúp bệnh nhân chấn thương tủy sống phục hồi chức năng vận động bàn tay...

15:51 16/03/2026
Meta ra mắt hàng loạt chip AI riêng

Phó Chủ tịch Kỹ thuật Yee Jiun Song cho biết các chip này giúp Meta đa dạng hóa nguồn cung silicon và phần nào giảm tác động từ biến động giá…

14:03 14/03/2026