16/08/2025
Theo Financial Times, công ty trí tuệ nhân tạo (AI) hàng đầu của Trung Quốc là DeepSeek đã phải trì hoãn ra mắt mô hình mới sau khi gặp khó khăn trong việc huấn luyện bằng chip của Huawei, điều này nhấn mạnh những hạn chế trong nỗ lực của Bắc Kinh nhằm thay thế công nghệ Mỹ.
DeepSeek đã được chính quyền khuyến khích chuyển sang sử dụng bộ xử lý Ascend của Huawei thay vì hệ thống của Nvidia sau khi công ty này phát hành mô hình R1 vào tháng 1 năm nay.
Tuy nhiên, startup Trung Quốc đã gặp phải các vấn đề kỹ thuật liên tục trong quá trình huấn luyện mô hình R2 bằng chip Ascend, dẫn đến việc họ phải sử dụng chip Nvidia cho giai đoạn huấn luyện và chip Huawei cho giai đoạn suy luận (inference).
Các vấn đề này là nguyên nhân chính khiến việc ra mắt mô hình bị trì hoãn từ tháng 5. DeepSeek đang mất lợi thế cạnh tranh so với các đối thủ do mô hình bị trì hoãn.
Quá trình huấn luyện liên quan đến việc mô hình học từ một bộ dữ liệu lớn, trong khi suy luận đề cập đến bước sử dụng mô hình đã huấn luyện để đưa ra dự đoán hoặc tạo phản hồi, chẳng hạn như trong các truy vấn chatbot.
Financial Times cho rằng những khó khăn của DeepSeek cho thấy chip Trung Quốc vẫn còn tụt hậu so với các đối thủ Mỹ trong các nhiệm vụ quan trọng, nhấn mạnh những thách thức mà Trung Quốc đang đối mặt trong nỗ lực đạt được sự tự chủ về công nghệ.
Mới đây, chính quyền Bắc Kinh đã gửi thông báo đến nhiều công ty địa phương, khuyến nghị tránh sử dụng bộ xử lý H20 của Nvidia Corp., đặc biệt trong các dự án liên quan đến chính phủ và an ninh quốc gia, nhằm khuyến khích họ ưu tiên các lựa chọn thay thế từ Huawei và Cambricon.
Bắc Kinh đã hỏi các công ty về động lực như tại sao họ mua chip H20 của Nvidia thay vì lựa chọn nội địa, liệu đó có phải là lựa chọn cần thiết khi có các lựa chọn trong nước, và liệu họ có phát hiện vấn đề an ninh nào trong phần cứng Nvidia hay không.
Cổ phiếu của nhà thiết kế chip AI Trung Quốc Cambricon Technologies Corp. đã tăng kịch trần 20% sau tin tức về hướng dẫn của Trung Quốc, dẫn dắt đà tăng của các công ty cùng ngành như Semiconductor Manufacturing International Corp. (SMIC).
Tuy nhiên, các chuyên gia trong ngành cho biết chip Trung Quốc đang gặp vấn đề về độ ổn định, tốc độ kết nối giữa các chip chậm hơn và phần mềm kém chất lượng so với sản phẩm của Nvidia.
Huawei đã cử một đội ngũ kỹ sư đến văn phòng của DeepSeek để hỗ trợ công ty sử dụng chip AI Ascend trong việc phát triển mô hình R2. Dù có đội ngũ tại chỗ, DeepSeek vẫn không thể thực hiện thành công một lần huấn luyện trên chip Ascend.
DeepSeek hiện vẫn đang hợp tác với Huawei để làm cho mô hình tương thích với Ascend ở giai đoạn suy luận.
Người sáng lập DeepSeek, Liang Wenfeng, đã bày tỏ sự không hài lòng nội bộ về tiến độ của R2 và đang thúc đẩy việc dành thêm thời gian để xây dựng một mô hình tiên tiến có thể duy trì vị thế dẫn đầu của công ty trong lĩnh vực AI.
Việc ra mắt R2 cũng bị trì hoãn do quá trình gắn nhãn dữ liệu cho mô hình cập nhật kéo dài hơn dự kiến. Các báo cáo từ truyền thông Trung Quốc cho thấy mô hình này có thể được phát hành trong những tuần tới.
"Mô hình AI là những hàng hóa có thể dễ dàng thay thế", Ritwik Gupta, một nhà nghiên cứu AI tại Đại học California, Berkeley, nhận xét. "Nhiều lập trình viên đang sử dụng Qwen3 của Alibaba, vốn mạnh mẽ và linh hoạt hơn”.
Ông Gupta lưu ý rằng Qwen3 đã áp dụng các khái niệm cốt lõi từ DeepSeek, chẳng hạn như thuật toán huấn luyện giúp mô hình có khả năng suy luận, nhưng đã làm chúng hiệu quả hơn trong sử dụng.
Gupta, chuyên theo dõi hệ sinh thái AI của Huawei, cho biết công ty này đang trải qua "những khó khăn ban đầu" trong việc sử dụng chip Ascend để huấn luyện mô hình AI, dù ông dự đoán nhà vô địch quốc gia Trung Quốc này cuối cùng sẽ vượt qua khó khăn.
"Chỉ vì chúng ta chưa thấy các mô hình hàng đầu được huấn luyện trên Huawei hôm nay không có nghĩa là điều đó sẽ không xảy ra trong tương lai. Đó chỉ là vấn đề thời gian", ông nói.
Nvidia, nhà sản xuất chip nằm ở trung tâm của cuộc chiến địa chính trị giữa Bắc Kinh và Washington, gần đây đã đồng ý chia sẻ một phần doanh thu với chính phủ Mỹ để tiếp tục bán chip H20 cho Trung Quốc.
Tham gia sự kiện AI lớn nhất tại TP.HCM, kết nối doanh nghiệp và chuyên gia quốc tế, khám phá ứng dụng AI trong kinh doanh.
Khám phá cuộc đua xây dựng cơ sở hạ tầng AI khổng lồ và những thách thức trong việc đáp ứng nhu cầu công nghệ mới.
Khám phá lý do sinh viên CNTT gặp khó khăn trong tìm việc làm và tác động của AI đến thị trường lao động.
Khám phá xu hướng đầu tư mới tại Hàn Quốc khi nhà đầu tư cá nhân chuyển từ cổ phiếu Big Tech sang stablecoin đầy tiềm năng.
Khám phá làn sóng IPO kỷ lục của công ty công nghệ Trung Quốc tại Hồng Kông trong năm nay. Tìm hiểu lý do và tác động ngay hôm nay!
Tuyên bố của Tổng thống Donald Trump về việc áp thuế 100% lên chip bán dẫn nhập khẩu đã gây chấn động ngành công nghệ toàn cầu...
Các tổ chức tinh gọn nhờ công nghệ có thể có kết quả kinh doanh tốt nhưng khả năng chống chịu, đầu tư cho nghiên cứu sẽ là rủi ro lớn trong dài hạn…
Cam kết đầu tư mới của Apple là một bước tiến quan trọng trong chiến lược kinh tế “Nước Mỹ trên hết” của Tổng thống Trump, nhưng vẫn chưa đáp ứng được kỳ vọng về việc chuyển toàn bộ hoạt động sản xuất về Mỹ...
Acer chính thức công bố sự kiện Acer Day 2025 với chủ đề đầy cảm hứng #BreakALimit diễn ra trên khắp khu vực Châu Á – Thái Bình Dương. Năm nay đánh dấu lần thứ 9 Acer Day được tổ chức và tiếp tục củng cố cam kết về sự kết nối của thương hiệu với tệp khách hàng đa dạng, trung thành thông qua đổi mới, cảm hứng và gắn kết cộng đồng...
Trung Quốc đang đứng trước cơ hội lớn thúc đẩy quốc tế hóa đồng nhân dân tệ qua stablecoin, đặc biệt thông qua các thử nghiệm tại Hong Kong. Tuy nhiên, những lo ngại về dòng vốn thoát ra ngoài và rủi ro rửa tiền đang kìm hãm tốc độ phát triển của công nghệ này…
Tech Lifestyle
Tech Lifestyle
Tech Lifestyle