image Thứ Ba, 10/02/2026

DeepSeek ra mắt mô hình AI thế hệ tiếp theo

Bảo Ngọc

03/10/2025

Chia sẻ

DeepSeek vừa công bố vào đầu tuần phiên bản thử nghiệm mô hình thế hệ tiếp theo của DeepSeek-V3.1-Terminus…

DeepSeek ra mắt mô hình AI mới - DeepSeek-V3.2-Exp.
DeepSeek ra mắt mô hình AI mới - DeepSeek-V3.2-Exp.

Startup Trung Quốc DeepSeek cho biết mô hình thử nghiệm mới hứa hẹn sẽ tăng hiệu suất, giúp AI xử lý khối lượng thông tin lớn với chi phí rẻ hơn nhiều. Tuy nhiên, vẫn còn nhiều câu hỏi về mức độ hiệu quả và an toàn của kiến trúc này, theo CNBC.

Trước đó, DeepSeek từng gây chấn động Thung lũng Silicon vào năm ngoái khi bất ngờ tung ra mô hình đầu tiên R1, minh chứng rõ về khả năng huấn luyện mô hình ngôn ngữ lớn (LLM) nhanh chóng trên những con chip ít mạnh mẽ và với ít tài nguyên hơn.

Theo bài đăng trên diễn đàn AI Hugging Face, công ty vừa phát hành DeepSeek-V3.2-Exp, phiên bản thử nghiệm kế tiếp của V3.1-Terminus, nhằm tiếp tục theo đuổi mục tiêu tối ưu hiệu quả trong hệ thống AI.

“DeepSeek V3.2 vẫn tập trung vào hiệu suất, giảm chi phí và chia sẻ mã nguồn mở”, Bà Adina Yakefu, phụ trách cộng đồng Trung Quốc tại Hugging Face, chia sẻ với CNBC. “Điểm cải tiến lớn nhất là tính năng mới DSA (DeepSeek Sparse Attention), giúp AI xử lý tốt hơn văn bản dài và hội thoại phức tạp. Mô hình cũng giảm một nửa chi phí vận hành so với phiên bản trước”.

“Điều này rất quan trọng vì mô hình vừa nhanh hơn vừa tiết kiệm chi phí mà hiệu năng không giảm đáng kể”, ông Nick Patience, Phó Chủ tịch phụ trách mảng AI tại The Futurum Group, nhận xét. “Khi đó, AI mạnh mẽ sẽ dễ tiếp cận hơn với nhà phát triển, nhà nghiên cứu và cả doanh nghiệp nhỏ, mở đường cho nhiều ứng dụng sáng tạo”.

ƯU VÀ NHƯỢC ĐIỂM CỦA “SPARSE ATTENTION”

Sparse Attention là mô hình AI đưa ra quyết định dựa trên dữ liệu huấn luyện và thông tin mới, chẳng hạn như lời truy vấn. Ví dụ, một hãng hàng không muốn tìm lộ trình tốt nhất từ A đến B. Trong nhiều lựa chọn, không phải tất cả đều khả thi. Nếu loại bỏ những tuyến không phù hợp, hãng sẽ tiết kiệm được rất nhiều thời gian, nhiên liệu và chi phí. Sparse Attention cũng hoạt động tương tự như vậy: chỉ xử lý dữ liệu được cho là quan trọng, thay vì “cày” toàn bộ dữ liệu như các mô hình trước.

“Nói đơn giản là cắt bỏ những gì bạn nghĩ rằng không quan trọng”, bà Ekaterina Almasque, đồng sáng lập kiêm Giám đốc quỹ đầu tư BlankPage Capital, giải thích.

Sparse Attention giúp tăng hiệu suất và mở rộng quy mô AI nhưng cần ít tài nguyên hơn. Tuy nhiên, lo ngại đặt ra là tính năng có thể làm giảm độ tin cậy, bởi không rõ AI loại bỏ dữ liệu theo cơ chế nào và có bỏ sót thông tin quan trọng hay không.

“Thực tế mô hình đã mất đi nhiều sắc thái”, bà Almasque, người từng sớm đầu tư vào Dataiku, Darktrace và Graphcore, thẳng thắn bày tỏ. “Câu hỏi lớn là: liệu chúng có loại bỏ đúng dữ liệu ‘không quan trọng’ hay lại loại nhầm thông tin cốt lõi, khiến kết quả trở nên kém chính xác?”

Vị Giám đốc cũng nhấn mạnh điều này có thể gây rủi ro cho an toàn AI và tính bao trùm, đồng thời cảnh báo đây có thể không phải là mô hình “tối ưu hay an toàn nhất” so với các kiến trúc truyền thống.

LỢI THẾ VÀ THÁCH THỨC CỦA DEEPSEEK

DeepSeek khẳng định mô hình thử nghiệm hoạt động ngang ngửa với V3.1-Terminus. Bất chấp lo ngại “bong bóng AI”, lĩnh vực vẫn đang là trung tâm của cuộc cạnh tranh địa chính trị Mỹ – Trung.

Bà Yakefu cho biết mô hình của DeepSeek có thể “vận hành ngay lập tức” trên chip AI sản xuất tại Trung Quốc như Ascend hay Cambricon, nghĩa là có thể chạy trực tiếp trên phần cứng nội địa mà không cần cài đặt thêm.

Công ty công khai mã lập trình cũng như công cụ để sử dụng mô hình, cho phép tất cả nhà phát triển học hỏi và cải tiến thêm.

Tuy nhiên, bà Almasque cho rằng điều này khiến công nghệ khó giữ lợi thế cạnh tranh. “Phương pháp không quá mới mẻ”, vị chuyên gia nói, lưu ý rằng ngành AI đã bàn về mô hình sparse từ năm 2015. Do mã nguồn mở nên DeepSeek không thể đăng ký bản quyền. Vì vậy, lợi thế của hãng phải nằm ở cách xác định dữ liệu nào cần giữ lại trong tính năng Spare Attention.

Theo bài đăng trên Hugging Face, DeepSeek thừa nhận V3.2-Exp chỉ là bước trung gian hướng tới kiến trúc thế hệ mới.

Như ông Patience nhận định: “Đây chính là giá trị mà DeepSeek mang lại: hiệu quả đang trở nên quan trọng ngang với sức mạnh thô”.

Bà Yakefu bổ sung: “DeepSeek đang đi đường dài nhằm giữ cộng đồng gắn bó với sự phát triển của hãng. Người dùng sẽ luôn chọn giải pháp rẻ, đáng tin cậy và hiệu quả”.


Anthropic lấn sân mảng pháp lý, loạt cổ phiếu ngành dữ liệu và tài chính chao đảo

Pearson, Experian cùng nhiều doanh nghiệp xuất bản và dữ liệu lớn tại châu Âu chứng kiến giá cổ phiếu giảm mạnh sau khi startup AI của Hoa Kỳ giới thiệu phần mềm tự động hóa hàng loạt dịch vụ chuyên môn…

18:52 06/02/2026
Moltbook: Mạng xã hội dành cho AI gây chia rẽ giới công nghệ toàn cầu

Moltbook - mạng xã hội dành cho AI agent đang đặt ra nhiều câu hỏi: khi AI bắt đầu “nói chuyện” với nhau trên mạng xã hội, ranh giới giữa trình diễn, công nghệ và tương lai của trí tuệ nhân tạo thực sự nằm ở đâu?...

18:52 06/02/2026
OpenClaw là tác nhân AI đang gây ra nỗi lo ngại toàn cầu

Từ dự án cá nhân ít người biết tới, OpenClaw nay trở thành một trong những công cụ được nhắc đến nhiều nhất trong thế giới trí tuệ nhân tạo năm nay…

09:13 04/02/2026
4 bước ngoặt tách biệt người dẫn dắt và kẻ tụt hậu trong cuộc đua AI

Dù được ca ngợi là công nghệ mang tính cách mạng, AI tạo sinh vẫn đang bị nhiều doanh nghiệp đối xử như một công cụ thử nghiệm đơn lẻ…

09:09 04/02/2026
CEO Anthropic: Nhân loại cần phải "thức tỉnh" trước mối đe dọa từ AI

Ông Dario Amodei, CEO của Anthropic, cảnh báo nhân loại cần sớm kiểm soát việc phát triển và sử dụng trí tuệ nhân tạo (AI), nếu không, công nghệ này có thể bị sử dụng sai mục đích…

10:18 03/02/2026
AI, trung tâm dữ liệu vừa là nguồn cơn vừa là giải pháp cho vấn đề năng lượng

Nhiệt từ làn sóng AI không chỉ làm nóng trung tâm dữ liệu, mà còn tạo ra hướng đi mới cho năng lượng đô thị: biến nhiệt thải từ chip AI thành nguồn sưởi sạch…

11:44 30/01/2026
Người dùng nội bộ trở thành “điểm yếu” lớn nhất về an ninh mạng trong doanh nghiệp

Phần lớn Giám đốc An ninh Thông tin (CISO) tin rằng mình nắm khá rõ mức độ sử dụng công cụ trong tổ chức nhưng khi nhóm bảo mật chuyên nghiệp vào cuộc, thực tế hoàn toàn khác lộ ra…

17:04 27/01/2026
Công cụ mua sắm bằng AI của Amazon vấp phải phản ứng dữ dội vì bán “sản phẩm ảo”

Amazon đang khiến không ít nhà bán lẻ trực tuyến phẫn nộ, khi nhiều doanh nghiệp cho biết họ không hề đồng ý để sản phẩm của mình bị “quét dữ liệu” và đưa lên niêm yết trên hệ sinh thái thương mại điện tử khổng lồ của công ty…

18:01 18/01/2026
Đây là câu hỏi về trí tuệ nhân tạo mà mọi ứng viên xin việc cần chuẩn bị

Trong kỷ nguyên AI, câu hỏi quan trọng nhất không còn là “ứng viên có làm được việc hay không”, mà là “bạn làm tốt hơn AI ở điểm nào”...

15:17 17/01/2026
CES 2026: AMD định vị AI như một phần mặc định của máy tính cá nhân và điện toán biên

Tại CES 2026, AMD đã phác họa tầm nhìn khá rõ ràng khi trí tuệ nhân tạo không còn là tính năng “xa xỉ” chỉ xuất hiện trên những hệ thống đắt tiền hay trong trung tâm dữ liệu, mà sẽ trở thành một phần mặc định của cả máy tính cá nhân lẫn hệ thống thương mại…

16:26 08/01/2026