Huawei đã biến lệnh trừng phạt thành mối đe dọa cho Nvidia như thế nào?
Kiến trúc điện toán mới của Huawei đang nổi lên như một đối trọng đáng gờm với Nvidia, đồng thời cho thấy nỗ lực của hãng trong việc vượt qua các hạn chế công nghệ từ Hoa Kỳ…

Nỗ lực đầy tham vọng của Huawei trong lĩnh vực điện toán AI hiệu năng cao vừa có bước tiến lớn với kiến trúc Supernode 384, đưa gã khổng lồ công nghệ Trung Quốc trở thành đối thủ đáng gờm với vị trí dẫn đầu thị trường mà Nvidia đang nắm giữ, bất chấp mọi lệnh trừng phạt từ phía Hoa Kỳ.
Tech Wire Asia đưa tin, tại Hội nghị Nhà phát triển Kunpeng Ascend tổ chức vào cuối tuần trước, công ty có trụ sở tại Thâm Quyến công bố chi tiết về khung tính toán mới, trong đó lãnh đạo tập đoàn đã chia sẻ cách hệ thống Supernode 384 giải quyết điểm nghẽn quan trọng vốn là trở ngại lớn trong quá trình huấn luyện AI quy mô lớn từ trước đến nay.
“Khi quy mô xử lý song song tăng lên, băng thông giữa các máy trong kiến trúc máy chủ truyền thống trở thành điểm nghẽn nghiêm trọng trong huấn luyện”, ông Zhang Dixuan, Chủ tịch mảng tính toán Ascend của Huawei, phát biểu trong bài diễn văn khai mạc.
BƯỚC NGOẶT SO VỚI TÍNH TOÁN TRUYỀN THỐNG
Supernode 384 đánh dấu sự rời bỏ phương pháp tính toán truyền thống. Thay vì dựa vào kiến trúc Von Neumann – vốn tách biệt giữa đơn vị xử lý, bộ nhớ và bus dữ liệu – hệ thống của Huawei áp dụng mô hình tính toán ngang hàng (peer-to-peer) được tối ưu hóa riêng cho khối lượng công việc AI thế hệ mới.
Sự thay đổi này đặc biệt phù hợp với mô hình AI kiểu Mixture-of-Experts (MoE) – những hệ thống máy học sử dụng nhiều mạng con chuyên biệt để giải quyết vấn đề phức tạp. Những mô hình này ngày càng trở nên quan trọng khi ứng dụng AI phát triển ngày một tinh vi và đòi hỏi cao hơn.
Thông số kỹ thuật của hệ thống cũng rất ấn tượng. Hệ thống CloudMatrix 384 của Huawei, được xây dựng trên nền tảng Supernode 384, bao gồm 384 bộ xử lý AI Ascend phân bổ trong 12 tủ máy tính và 4 tủ bus.
Cấu hình này mang lại công suất tính toán lên tới 300 petaflops, tương đương 300 triệu tỷ phép tính mỗi giây, cùng với 48 terabyte bộ nhớ băng thông cao.
HIỆU NĂNG VƯỢT TRỘI
Các kết quả đo hiệu suất công bố tại hội nghị nhà phát triển đã làm nổi bật lợi thế cạnh tranh của hệ thống mới. Với một số mô hình AI phức tạp như LLaMA 3 của Meta, Supernode 384 đạt tốc độ 132 token mỗi giây trên mỗi thẻ xử lý – nhanh hơn gấp 2,5 lần so với các hệ thống cụm máy chủ truyền thống.
Với những ứng dụng đòi hỏi giao tiếp dữ liệu cao như Qwen của Alibaba hay DeepSeek, hiệu suất đạt 600 đến 750 token/giây/thẻ. Cải tiến này một phần đến từ việc Huawei thay thế kết nối Ethernet truyền thống bằng kết nối bus tốc độ cao, giúp tăng băng thông truyền thông lên gấp 15 lần.
Bên cạnh đó, công ty còn giảm độ trễ giao tiếp một bước (single-hop latency) từ 2 micro-giây xuống còn 200 nano-giây, tốt hơn gấp 10 lần, cho phép cụm máy CloudMatrix 384 hoạt động như một thực thể tính toán thống nhất.
Thời điểm ra mắt và vị thế của Supernode 384 không thể tách rời với bối cảnh căng thẳng địa chính trị toàn cầu. Lệnh hạn chế công nghệ từ Hoa Kỳ khiến Huawei bị cắt giảm nghiêm trọng quyền tiếp cận công nghệ bán dẫn tiên tiến, buộc công ty phải sáng tạo trong khuôn khổ sẵn có.
Theo giới phân tích, hệ thống CloudMatrix 384 nhiều khả năng sử dụng bộ xử lý AI Ascend 910C mới nhất của Huawei. Dù hiệu năng đơn lẻ của chip có thể kém hơn đối thủ cao cấp, nhưng báo cáo cho rằng Huawei có thể bù đắp bằng ưu thế kiến trúc tổng thể.
“Huawei tụt hậu một thế hệ về chip, nhưng giải pháp mở rộng quy mô của họ có thể vượt trước một thế hệ so với sản phẩm hiện tại của Nvidia và AMD”, báo cáo của SemiAnalysis nhận định.
TÁC ĐỘNG TỚI CỤC DIỆN AI TOÀN CẦU

Sáng tạo kiến trúc của Huawei mang theo hệ quả lớn đối với thị trường điện toán AI toàn cầu. Hãng này đã triển khai hệ thống CloudMatrix 384 tại các trung tâm dữ liệu ở tỉnh An Huy, Nội Mông và Quý Châu, chứng minh khả năng ứng dụng thực tế đã thành hiện thực.
Tiềm năng mở rộng của Supernode 384 – có thể kết nối hàng chục nghìn bộ xử lý – giúp công nghệ trở thành nền tảng phù hợp cho việc huấn luyện mô hình AI ngày càng phức tạp. Khả năng này đặc biệt quan trọng trong bối cảnh doanh nghiệp đang tìm cách triển khai AI ở quy mô chưa từng có.
Đối với hệ sinh thái công nghệ toàn cầu, bước tiến của Huawei vừa là cơ hội, vừa là thách thức. Trong khi mang đến một lựa chọn thay thế vị thế áp đảo của Nvidia, nó cũng phản ánh xu hướng phân mảnh ngày càng rõ rệt của hạ tầng công nghệ toàn cầu trong bối cảnh căng thẳng địa chính trị kéo dài.
Bước tiến của Huawei mang đến cả cơ hội lẫn thách thức cho ngành công nghệ toàn cầu. Một mặt, hệ thống Supernode 384 cung cấp lựa chọn thay thế đáng gờm cho sự thống trị của Nvidia. Mặt khác, sự xuất hiện của những giải pháp công nghệ tách biệt như vậy cho thấy thế giới ngày càng bị chia cắt về mặt công nghệ do căng thẳng địa chính trị kéo dài.