Nvidia công bố chip mới phục vụ cho phát triển mô hình AI

Sơn Trần

20/03/2025

Tại Hội nghị AI thường niên dành cho các nhà phát triển - GPU Technology Conference (GTC) mới đây, Nvidia đã công bố những mẫu chip mới phục vụ cho việc xây dựng và phát triển mô hình trí tuệ nhân tạo…

Ông Jensen Huang, đồng sáng lập kiêm Giám đốc Điều hành Nvidia, phát biểu tại hội nghị GTC.

Giám đốc Điều hành Nvidia Jensen Huang chính thức giới thiệu Blackwell Ultra, dòng chip mới được phát hành vào nửa cuối năm nay, và Vera Rubin, bộ xử lý đồ họa thế hệ tiếp theo, dự kiến ra mắt vào năm 2026, theo CNBC.

Doanh thu của Nvidia tăng hơn sáu lần kể từ khi công ty chuyển mình, sau sự xuất hiện của ChatGPT hồi cuối năm 2022. Được sử dụng trong quá trình huấn luyện mô hình, "GPU lớn" của Nvidia luôn chiếm ưu thế trên thị trường AI tiên tiến.

Giới nhà phát triển phần mềm và nhà đầu tư đang theo dõi sát sao các mẫu chip mới của công ty để xem liệu chúng có mang lại hiệu suất, hiệu quả đủ thuyết phục những khách hàng lớn nhất - công ty điện toán đám mây như Microsoft, Google và Amazon - tiếp tục chi hàng tỷ USD xây dựng trung tâm dữ liệu sử dụng chip Nvidia hay không?

Thông tin hôm thứ Ba (18/3) cũng là bài kiểm tra cho chu kỳ phát hành sản phẩm của Nvidia. Công ty đang nỗ lực công bố các dòng chip mới hàng năm. Trước khi AI bùng nổ, Nvidia chỉ phát hành chip mới hai năm một lần.

Hội nghị GTC ở San Jose, California cũng là dịp để Nvidia thể hiện sức mạnh. Đây là hội nghị trực tiếp thứ hai mà Nvidia tổ chức kể từ khi đại dịch, ước tính có khoảng 25.000 người tham dự cùng hàng trăm công ty thảo luận về cách họ sử dụng phần cứng Nvidia để phát triển AI. Hãng sản xuất ô tô Hoa Kỳ General Motors khẳng định sẽ sử dụng dịch vụ của Nvidia cho những chiếc xe thế hệ mới.

Kiến trúc chip Rubin sẽ mang tên nhà vật lý Richard Feynman, Nvidia chia sẻ tại sự kiện, tiếp tục truyền thống đặt tên các dòng chip theo tên nhà khoa học. Chip Feynman của Nvidia dự kiến có mặt trên thị trường vào năm 2028, theo nội dung trên slide mà ông Huang trình bày.

Ngoài ra, Nvidia cũng trưng bày một số sản phẩm và dịch vụ khác tại sự kiện. Hai chiếc PC được hỗ trợ bởi AI mang tên DGX Spark và DGX Station, có thể chạy mô hình AI lớn như Llama hoặc DeepSeek. Cùng với đó, bản cập nhật nhằm kết nối hàng trăm, hàng nghìn GPU với nhau nhằm hoạt động như một hệ thống thống nhất, cùng gói phần mềm Dynamo giúp người dùng tận dụng tối đa hiệu suất của chip cũng được giới thiệu.

VERA RUBIN

Nvidia dự kiến xuất xưởng các hệ thống sử dụng dòng GPU thế hệ mới vào nửa cuối năm 2026. Hệ thống này bao gồm hai thành phần chính: một CPU mang tên Vera, và một thiết kế GPU mới, gọi là Rubin. Trong đó, tên Rubin được đặt theo tên nhà thiên văn học Vera Rubin.

Vera là thiết kế CPU tùy chỉnh đầu tiên của Nvidia và dựa trên thiết kế lõi mà hãng đặt tên là Olympus, công ty cho biết.

Trước đây, khi cần CPU, Nvidia thường sử dụng thiết kế có sẵn từ Arm. Các công ty phát triển thiết kế lõi Arm tùy chỉnh, như Qualcomm và Apple, cho biết chúng có thể được tối ưu hóa và mang lại hiệu suất tốt hơn.

Thiết kế tùy chỉnh Vera nhanh gấp đôi so với CPU sử dụng trong các chip Grace Blackwell năm ngoái, theo thông báo từ Nvidia.

Khi kết hợp với Vera, Rubin có thể xử lý 50 petaflops khi thực hiện suy luận (inference), gấp đôi so với 20 petaflops của chip Blackwell hiện tại. Rubin có thể hỗ trợ tới 288 gigabyte bộ nhớ tốc độ cao, một trong những thông số quan trọng mà nhà phát triển AI thường quan tâm.

Nvidia cũng đang thực hiện một số thay đổi, như Rubin thực tế là hai GPU. GPU Blackwell hiện tại trên thị trường thực chất là hai con chip riêng biệt được lắp ráp lại và làm việc như một chip duy nhất.

Bắt đầu từ Rubin, Nvidia sẽ gọi khi kết hợp hai hoặc nhiều die (lõi) tạo thành một chip duy nhất là GPU tách biệt. Vào nửa cuối năm 2027, Nvidia dự kiến phát hành chip "Rubin Next", kết hợp bốn die thành một chip, giúp tốc độ Rubin tăng gấp đôi, và công ty sẽ gọi đó là bốn GPU.

Nvidia thông báo, sản phẩm này sẽ được đóng gói trong giá đỡ gọi là Vera Rubin NVL144. Các phiên bản trước đây của giá đỡ Nvidia được gọi là NVL72.

CEO Jensen Huang cùng một số sản phẩm mới tại sự kiện.

BLACKWELL ULTRA

Bên cạnh Vera RuBin, Nvidia còn công bố phiên bản mới của dòng chip Blackwell, có tên là Blackwell Ultra.

Con chip này có khả năng sản xuất nhiều token hơn mỗi giây, có nghĩa là có thể tạo ra nhiều nội dung hơn trong cùng một khoảng thời gian so với phiên bản tiền nhiệm, theo thông báo của công ty.

Từ đây, nhà cung cấp dịch vụ đám mây có thể sử dụng Blackwell Ultra để cung cấp dịch vụ AI cao cấp cho ứng dụng nhạy cảm về thời gian, cho phép họ tạo ra doanh thu gấp 50 lần so với thế hệ chip Hopper, được phát hành năm 2023.

Blackwell Ultra có phiên bản kết hợp hai chip với CPU Nvidia Arm, gọi là GB300, và phiên bản chỉ có GPU, gọi là B300. Sản phẩm cũng sở hữu phiên bản với tám GPU trong một blade máy chủ và phiên bản rack với 72 chip Blackwell.

Bốn công ty đám mây lớn nhất đã triển khai gấp ba lần số lượng chip Blackwell so với chip Hopper, Nvidia cho biết.

DEEPSEEK

Mô hình DeepSeek R1 của Trung Quốc có thể khiến nhà đầu tư Nvidia lo ngại, nhưng Nvidia lại “hoan nghênh” phần mềm này. Nhà sản xuất chip tuyên bố sẽ sử dụng mô hình R1 để kiểm tra hiệu suất sản phẩm mới của mình.

Nhiều quan sát viên AI cho rằng mô hình DeepSeek, vốn được cho là yêu cầu ít chip hơn so với mô hình sản xuất tại Hoa Kỳ, đang đe dọa đến hoạt động kinh doanh của Nvidia.

Tuy nhiên, đầu năm nay, ông Huang khẳng định DeepSeek thực sự là tín hiệu tốt cho Nvidia. Bởi DeepSeek sử dụng quy trình "reasoning" (suy luận), yêu cầu nhiều sức mạnh tính toán hơn để cung cấp câu trả lời tối ưu cho người dùng. Hơn nữa, các chip Blackwell Ultra mới rất phù hợp với mô hình suy luận, Nvidia cho biết.

Công ty đã tập trung phát triển chip để sản phẩm hiệu quả hơn khi thực hiện suy luận, vì vậy mô hình suy luận mới yêu cầu nhiều sức mạnh tính toán hơn trong quá trình triển khai, và chip Nvidia có thể xử lý được.

"Trong 2 đến 3 năm qua, một bước đột phá lớn đã xảy ra, một tiến bộ cơ bản trong trí tuệ nhân tạo đã xảy ra. Chúng tôi gọi nó là AI tác nhân (agentic AI)", CEO Huang nói. "Công nghệ có thể lý luận về cách trả lời hoặc giải quyết vấn đề vượt trội".

Chủ tịch CMC trao quyết định bổ nhiệm Tổng giám đốc Tập đoàn cho ông Đặng Tùng Sơn

CMC bổ nhiệm CEO 8X, tăng tốc chiến lược chuyển đổi AI toàn cầu

Tập đoàn Công nghệ CMC bổ nhiệm ông Đặng Tùng Sơn làm Tổng giám đốc trong bối cảnh doanh nghiệp bước vào giai đoạn đổi mới lần thứ hai, đặt mục tiêu trở thành công ty chuyển đổi AI quy mô toàn cầu...

16:06 05/06/2026

Garena Việt Nam chính thức công bố mảng đầu tư mạo hiểm.

Garena Việt Nam công bố mảng Đầu tư mạo hiểm, đồng hành cùng các game studio Việt Nam

Garena Việt Nam mở rộng cam kết với ngành game nội địa thông qua hoạt động đầu tư, ươm tạo và xây dựng cộng đồng dành cho các nhà phát triển game tại Việt Nam.

14:31 05/06/2026

Chủ tịch HĐQT, Chủ tịch điều hành Tập đoàn Công nghệ CMC Nguyễn Trung Chính phát biểu tại Lễ kỷ niệm 33 năm thành lập CMC, tổ chức tại Hoàng thành Thăng Long

CMC vượt mốc doanh thu 10.500 tỷ đồng

Lần đầu vượt mốc doanh thu hơn 10.500 tỷ đồng sau 33 năm phát triển, CMC đặt mục tiêu bước vào chu kỳ đổi mới lần hai, lấy AI-X làm động lực tăng trưởng mới.

17:31 30/05/2026

Tổng thư ký Tạp chí Kinh tế Việt Nam/VnEconomy Đào Quang Bính chia sẻ với ông Lê Hồng Quang, Tổng Giám đốc Tập đoàn MISA về bộ giải pháp AI Made in Vietnam Askonomy dành cho doanh nghiệp và tổ chức - Ảnh Việt Dũng.

Askonomy nhận được sự quan tâm lớn tại Vietnam –Asia DX Summit 2026

Xuất hiện tại không gian triển lãm của Diễn đàn Vietnam – Asia DX Summit 2026, bộ giải pháp AI Made in Vietnam Askonomy đã thu hút sự quan tâm của giới chức và các doanh nghiệp công nghệ hàng đầu khi trình diễn năng lực tự động hóa thông minh dựa trên nền tảng công nghệ lõi tự phát triển...

16:22 28/05/2026

Robot hình người hiện là một phần quan trọng trong chiến lược công nghiệp dài hạn của Bắc Kinh.

Đào tạo nghề cho robot: Trung Quốc chuẩn bị đưa máy móc gia nhập lực lượng lao động

Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…

18:45 22/05/2026

Hạ tầng AI đang định hình lại căn bản cách điện năng được cung cấp

ADI chi 1,5 tỷ USD mua lại Empower Semiconductor, mở rộng giải pháp nguồn điện cho AI

Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.

18:45 22/05/2026

Tính đến mùa giải 2026, VinFuture có 17.154 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ trên cả 5 châu lục, tăng khoảng 16% so với năm 2025

VinFuture 2026 nhận 1.819 đề cử từ 117 quốc gia và vùng lãnh thổ

Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...

20:48 19/05/2026

Asian Hackathon for Green Future hướng tới trở thành nền tảng thúc đẩy giao lưu, hợp tác xuyên biên giới của giới trẻ khu vực để phát triển những giải pháp thiết thực cho cộng đồng. Ảnh: Trường ĐH VinUni.

Gần 450 đội thi từ khắp châu Á tham gia Asian Hackathon for Green Future 2026

Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...

20:48 19/05/2026

Mạng lưới sức mạnh tính toán quốc gia được mô tả như một “phiên bản điện toán của lưới điện quốc gia”

Trung Quốc tăng tốc xây dựng mạng lưới sức mạnh tính toán quốc gia

Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...

10:19 18/05/2026

Đội ngũ IoT/Smart Devices Lab của CMC ATI phát triển các giải pháp AI ứng dụng cho thiết bị thông minh và định danh số

Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026