Mô hình AI mới của DeepSeek bị hoãn ra mắt vì trục trặc với chip
16/08/2025
DeepSeek đang mất lợi thế cạnh tranh so với các đối thủ do mô hình AI bị trì hoãn ra mắt...

Theo Financial Times, công ty trí tuệ nhân tạo (AI) hàng đầu của Trung Quốc là DeepSeek đã phải trì hoãn ra mắt mô hình mới sau khi gặp khó khăn trong việc huấn luyện bằng chip của Huawei, điều này nhấn mạnh những hạn chế trong nỗ lực của Bắc Kinh nhằm thay thế công nghệ Mỹ.
DeepSeek đã được chính quyền khuyến khích chuyển sang sử dụng bộ xử lý Ascend của Huawei thay vì hệ thống của Nvidia sau khi công ty này phát hành mô hình R1 vào tháng 1 năm nay.
Tuy nhiên, startup Trung Quốc đã gặp phải các vấn đề kỹ thuật liên tục trong quá trình huấn luyện mô hình R2 bằng chip Ascend, dẫn đến việc họ phải sử dụng chip Nvidia cho giai đoạn huấn luyện và chip Huawei cho giai đoạn suy luận (inference).
Các vấn đề này là nguyên nhân chính khiến việc ra mắt mô hình bị trì hoãn từ tháng 5. DeepSeek đang mất lợi thế cạnh tranh so với các đối thủ do mô hình bị trì hoãn.
Quá trình huấn luyện liên quan đến việc mô hình học từ một bộ dữ liệu lớn, trong khi suy luận đề cập đến bước sử dụng mô hình đã huấn luyện để đưa ra dự đoán hoặc tạo phản hồi, chẳng hạn như trong các truy vấn chatbot.
Financial Times cho rằng những khó khăn của DeepSeek cho thấy chip Trung Quốc vẫn còn tụt hậu so với các đối thủ Mỹ trong các nhiệm vụ quan trọng, nhấn mạnh những thách thức mà Trung Quốc đang đối mặt trong nỗ lực đạt được sự tự chủ về công nghệ.
Mới đây, chính quyền Bắc Kinh đã gửi thông báo đến nhiều công ty địa phương, khuyến nghị tránh sử dụng bộ xử lý H20 của Nvidia Corp., đặc biệt trong các dự án liên quan đến chính phủ và an ninh quốc gia, nhằm khuyến khích họ ưu tiên các lựa chọn thay thế từ Huawei và Cambricon.
Bắc Kinh đã hỏi các công ty về động lực như tại sao họ mua chip H20 của Nvidia thay vì lựa chọn nội địa, liệu đó có phải là lựa chọn cần thiết khi có các lựa chọn trong nước, và liệu họ có phát hiện vấn đề an ninh nào trong phần cứng Nvidia hay không.
Cổ phiếu của nhà thiết kế chip AI Trung Quốc Cambricon Technologies Corp. đã tăng kịch trần 20% sau tin tức về hướng dẫn của Trung Quốc, dẫn dắt đà tăng của các công ty cùng ngành như Semiconductor Manufacturing International Corp. (SMIC).
Tuy nhiên, các chuyên gia trong ngành cho biết chip Trung Quốc đang gặp vấn đề về độ ổn định, tốc độ kết nối giữa các chip chậm hơn và phần mềm kém chất lượng so với sản phẩm của Nvidia.
Huawei đã cử một đội ngũ kỹ sư đến văn phòng của DeepSeek để hỗ trợ công ty sử dụng chip AI Ascend trong việc phát triển mô hình R2. Dù có đội ngũ tại chỗ, DeepSeek vẫn không thể thực hiện thành công một lần huấn luyện trên chip Ascend.
DeepSeek hiện vẫn đang hợp tác với Huawei để làm cho mô hình tương thích với Ascend ở giai đoạn suy luận.
Người sáng lập DeepSeek, Liang Wenfeng, đã bày tỏ sự không hài lòng nội bộ về tiến độ của R2 và đang thúc đẩy việc dành thêm thời gian để xây dựng một mô hình tiên tiến có thể duy trì vị thế dẫn đầu của công ty trong lĩnh vực AI.
Việc ra mắt R2 cũng bị trì hoãn do quá trình gắn nhãn dữ liệu cho mô hình cập nhật kéo dài hơn dự kiến. Các báo cáo từ truyền thông Trung Quốc cho thấy mô hình này có thể được phát hành trong những tuần tới.
"Mô hình AI là những hàng hóa có thể dễ dàng thay thế", Ritwik Gupta, một nhà nghiên cứu AI tại Đại học California, Berkeley, nhận xét. "Nhiều lập trình viên đang sử dụng Qwen3 của Alibaba, vốn mạnh mẽ và linh hoạt hơn”.
Ông Gupta lưu ý rằng Qwen3 đã áp dụng các khái niệm cốt lõi từ DeepSeek, chẳng hạn như thuật toán huấn luyện giúp mô hình có khả năng suy luận, nhưng đã làm chúng hiệu quả hơn trong sử dụng.
Gupta, chuyên theo dõi hệ sinh thái AI của Huawei, cho biết công ty này đang trải qua "những khó khăn ban đầu" trong việc sử dụng chip Ascend để huấn luyện mô hình AI, dù ông dự đoán nhà vô địch quốc gia Trung Quốc này cuối cùng sẽ vượt qua khó khăn.
"Chỉ vì chúng ta chưa thấy các mô hình hàng đầu được huấn luyện trên Huawei hôm nay không có nghĩa là điều đó sẽ không xảy ra trong tương lai. Đó chỉ là vấn đề thời gian", ông nói.
Nvidia, nhà sản xuất chip nằm ở trung tâm của cuộc chiến địa chính trị giữa Bắc Kinh và Washington, gần đây đã đồng ý chia sẻ một phần doanh thu với chính phủ Mỹ để tiếp tục bán chip H20 cho Trung Quốc.
Khám phá cách DeepSeek và mô hình mã nguồn mở đang thay đổi cuộc chơi AI với chi phí thấp hơn và hiệu suất vượt trội.
Khám phá cách thương chiến Mỹ - Trung thúc đẩy doanh nghiệp Trung Quốc mở rộng ra châu Âu và cơ hội mới cho ngành điện tử.
Khám phá cách thuế nhập khẩu mới của Trung Quốc ảnh hưởng đến giá hàng hóa và mô hình kinh doanh thương mại điện tử tại Mỹ.
Mỹ đề xuất quy định mới về xuất khẩu chip cho Samsung và SK Hynix tại Trung Quốc. Tìm hiểu chi tiết ngay!
Khám phá cơ hội Nhật Bản thu hút nhân tài công nghệ Ấn Độ giữa bối cảnh thiếu hụt kỹ sư. Đừng bỏ lỡ thông tin hấp dẫn này!
Khám phá động thái quan trọng của Trung Quốc trong nghiên cứu stablecoin và ảnh hưởng đến tài chính toàn cầu.
Khám phá 6 rào cản chính khiến ngành y tế APAC khó áp dụng AI. Tìm hiểu giải pháp để vượt qua thách thức này.
Khám phá nỗi lo về bong bóng AI từ các chuyên gia và dữ liệu mới nhất. Đọc ngay để hiểu rõ hơn về tình hình thị trường.
Khám phá cách các thành phố Trung Quốc, như Ôn Châu, đang đầu tư vào AI để phát triển kinh tế và công nghệ. Đọc ngay!
Washington điều tra tác động của chatbot AI đến trẻ em, yêu cầu OpenAI, Meta cung cấp tài liệu. Tìm hiểu chi tiết tại đây.