image Thứ Tư, 10/12/2025

DeepSeek ra mắt mô hình AI thế hệ tiếp theo

Bảo Ngọc

03/10/2025

Chia sẻ

DeepSeek vừa công bố vào đầu tuần phiên bản thử nghiệm mô hình thế hệ tiếp theo của DeepSeek-V3.1-Terminus…

DeepSeek ra mắt mô hình AI mới - DeepSeek-V3.2-Exp.
DeepSeek ra mắt mô hình AI mới - DeepSeek-V3.2-Exp.

Startup Trung Quốc DeepSeek cho biết mô hình thử nghiệm mới hứa hẹn sẽ tăng hiệu suất, giúp AI xử lý khối lượng thông tin lớn với chi phí rẻ hơn nhiều. Tuy nhiên, vẫn còn nhiều câu hỏi về mức độ hiệu quả và an toàn của kiến trúc này, theo CNBC.

Trước đó, DeepSeek từng gây chấn động Thung lũng Silicon vào năm ngoái khi bất ngờ tung ra mô hình đầu tiên R1, minh chứng rõ về khả năng huấn luyện mô hình ngôn ngữ lớn (LLM) nhanh chóng trên những con chip ít mạnh mẽ và với ít tài nguyên hơn.

Theo bài đăng trên diễn đàn AI Hugging Face, công ty vừa phát hành DeepSeek-V3.2-Exp, phiên bản thử nghiệm kế tiếp của V3.1-Terminus, nhằm tiếp tục theo đuổi mục tiêu tối ưu hiệu quả trong hệ thống AI.

“DeepSeek V3.2 vẫn tập trung vào hiệu suất, giảm chi phí và chia sẻ mã nguồn mở”, Bà Adina Yakefu, phụ trách cộng đồng Trung Quốc tại Hugging Face, chia sẻ với CNBC. “Điểm cải tiến lớn nhất là tính năng mới DSA (DeepSeek Sparse Attention), giúp AI xử lý tốt hơn văn bản dài và hội thoại phức tạp. Mô hình cũng giảm một nửa chi phí vận hành so với phiên bản trước”.

“Điều này rất quan trọng vì mô hình vừa nhanh hơn vừa tiết kiệm chi phí mà hiệu năng không giảm đáng kể”, ông Nick Patience, Phó Chủ tịch phụ trách mảng AI tại The Futurum Group, nhận xét. “Khi đó, AI mạnh mẽ sẽ dễ tiếp cận hơn với nhà phát triển, nhà nghiên cứu và cả doanh nghiệp nhỏ, mở đường cho nhiều ứng dụng sáng tạo”.

ƯU VÀ NHƯỢC ĐIỂM CỦA “SPARSE ATTENTION”

Sparse Attention là mô hình AI đưa ra quyết định dựa trên dữ liệu huấn luyện và thông tin mới, chẳng hạn như lời truy vấn. Ví dụ, một hãng hàng không muốn tìm lộ trình tốt nhất từ A đến B. Trong nhiều lựa chọn, không phải tất cả đều khả thi. Nếu loại bỏ những tuyến không phù hợp, hãng sẽ tiết kiệm được rất nhiều thời gian, nhiên liệu và chi phí. Sparse Attention cũng hoạt động tương tự như vậy: chỉ xử lý dữ liệu được cho là quan trọng, thay vì “cày” toàn bộ dữ liệu như các mô hình trước.

“Nói đơn giản là cắt bỏ những gì bạn nghĩ rằng không quan trọng”, bà Ekaterina Almasque, đồng sáng lập kiêm Giám đốc quỹ đầu tư BlankPage Capital, giải thích.

Sparse Attention giúp tăng hiệu suất và mở rộng quy mô AI nhưng cần ít tài nguyên hơn. Tuy nhiên, lo ngại đặt ra là tính năng có thể làm giảm độ tin cậy, bởi không rõ AI loại bỏ dữ liệu theo cơ chế nào và có bỏ sót thông tin quan trọng hay không.

“Thực tế mô hình đã mất đi nhiều sắc thái”, bà Almasque, người từng sớm đầu tư vào Dataiku, Darktrace và Graphcore, thẳng thắn bày tỏ. “Câu hỏi lớn là: liệu chúng có loại bỏ đúng dữ liệu ‘không quan trọng’ hay lại loại nhầm thông tin cốt lõi, khiến kết quả trở nên kém chính xác?”

Vị Giám đốc cũng nhấn mạnh điều này có thể gây rủi ro cho an toàn AI và tính bao trùm, đồng thời cảnh báo đây có thể không phải là mô hình “tối ưu hay an toàn nhất” so với các kiến trúc truyền thống.

LỢI THẾ VÀ THÁCH THỨC CỦA DEEPSEEK

DeepSeek khẳng định mô hình thử nghiệm hoạt động ngang ngửa với V3.1-Terminus. Bất chấp lo ngại “bong bóng AI”, lĩnh vực vẫn đang là trung tâm của cuộc cạnh tranh địa chính trị Mỹ – Trung.

Bà Yakefu cho biết mô hình của DeepSeek có thể “vận hành ngay lập tức” trên chip AI sản xuất tại Trung Quốc như Ascend hay Cambricon, nghĩa là có thể chạy trực tiếp trên phần cứng nội địa mà không cần cài đặt thêm.

Công ty công khai mã lập trình cũng như công cụ để sử dụng mô hình, cho phép tất cả nhà phát triển học hỏi và cải tiến thêm.

Tuy nhiên, bà Almasque cho rằng điều này khiến công nghệ khó giữ lợi thế cạnh tranh. “Phương pháp không quá mới mẻ”, vị chuyên gia nói, lưu ý rằng ngành AI đã bàn về mô hình sparse từ năm 2015. Do mã nguồn mở nên DeepSeek không thể đăng ký bản quyền. Vì vậy, lợi thế của hãng phải nằm ở cách xác định dữ liệu nào cần giữ lại trong tính năng Spare Attention.

Theo bài đăng trên Hugging Face, DeepSeek thừa nhận V3.2-Exp chỉ là bước trung gian hướng tới kiến trúc thế hệ mới.

Như ông Patience nhận định: “Đây chính là giá trị mà DeepSeek mang lại: hiệu quả đang trở nên quan trọng ngang với sức mạnh thô”.

Bà Yakefu bổ sung: “DeepSeek đang đi đường dài nhằm giữ cộng đồng gắn bó với sự phát triển của hãng. Người dùng sẽ luôn chọn giải pháp rẻ, đáng tin cậy và hiệu quả”.


CEO Elon Musk chỉ ra ba yếu tố quan trọng nhất đối với AI

Tỷ phú Elon Musk nhấn mạnh tầm quan trọng của sự thật, cái đẹp và sự tò mò trong phát triển AI, đồng thời cảnh báo về nguy cơ tiềm ẩn từ công nghệ này.

09:49 10/12/2025
Chuyên gia Trung Quốc kêu gọi tăng cường minh bạch trong quản trị AI

Nhóm nghiên cứu từ DeepSeek và Alibaba cảnh báo về rủi ro mô hình AI, kêu gọi tăng cường minh bạch và quy định rõ ràng hơn trong quản trị.

17:10 04/12/2025
Các cửa hàng bán lẻ ứng dụng AI tại Philipines chứng kiến doanh số tăng 46%

Theo Packworks, doanh số cửa hàng bán lẻ tại Philippines tăng 46% nhờ ứng dụng AI, giúp tiểu thương tối ưu tồn kho và cải thiện hiệu quả bán hàng.

08:44 03/12/2025
Năm 2026 là phép thử cho tương lai AI

Năm 2026 sẽ là bước ngoặt cho ngành AI, khi doanh nghiệp cần minh bạch hơn trong đầu tư và quản trị để tạo ra giá trị bền vững.

11:02 29/11/2025
Microsoft không thể tận dụng vị thế doanh nghiệp để biến Copilot trở thành nền tảng phổ biến

Tại Hội nghị Ignite, chuyên gia CNTT chỉ ra rào cản lớn khiến Microsoft chưa thể phổ biến Copilot, mặc dù có hơn 150 triệu người dùng.

09:56 26/11/2025
Google DeepMind mở phòng thí nghiệm nghiên cứu AI tại Singapore, thúc đẩy AI ở châu Á – Thái Bình Dương

Google DeepMind mở phòng thí nghiệm nghiên cứu AI tại Singapore, tập trung vào phát triển công nghệ phục vụ nhu cầu đa dạng của khu vực châu Á – Thái Bình Dương.

14:24 24/11/2025
OpenAI và Microsoft hợp tác với các tiểu bang Hoa Kỳ thành lập lực lượng đặc nhiệm về an toàn AI

Lực lượng Đặc nhiệm về AI được thành lập bởi OpenAI, Microsoft và hai Tổng chưởng lý tiểu bang Hoa Kỳ nhằm đảm bảo an toàn cho người dùng, đặc biệt là trẻ em.

11:15 18/11/2025
Ấn Độ đưa chương trình giảng dạy AI vào bậc tiểu học

Bắt đầu từ năm học 2026-2027, Ấn Độ sẽ đưa AI trở thành môn học bắt buộc từ lớp 3, nhằm nâng cao kỹ năng cho học sinh trong bối cảnh cạnh tranh toàn cầu.

09:45 13/11/2025
Nguồn tiền khổng lồ từ quảng cáo đang ‘nuôi lớn’ cơn sốt AI

Làn sóng đầu tư vào AI đang bùng nổ, với 92% tăng trưởng GDP Mỹ dự kiến đến từ lĩnh vực này. Các 'ông lớn' như Google, Meta, Amazon đang tái đầu tư vào AI để bảo vệ mô hình quảng cáo.

10:12 09/11/2025
Chatbot Trung Quốc có xu hướng "nịnh người dùng" hơn chatbot Hoa Kỳ

Nghiên cứu từ Đại học Stanford và Carnegie Mellon cho thấy chatbot Trung Quốc có xu hướng đồng tình cao hơn, ảnh hưởng đến khả năng tự đánh giá của người dùng.

09:28 06/11/2025