Nvidia ra mắt Rubin CPX – GPU tối ưu cho AI xử lý ngữ cảnh lớn

Sơn Trần

12/09/2025

Nvidia ra mắt Rubin CPX, dòng GPU thế hệ mới mở ra kỷ nguyên xử lý AI ngữ cảnh lớn (long-context), hứa hẹn tạo bước nhảy vọt về hiệu năng và khả năng ứng dụng…

CEO Jensen Huang khẳng định Rubin CPX sẽ mở ra kỷ nguyên mới trong tính toán AI

Tập đoàn công nghệ Hoa Kỳ Nvidia vừa giới thiệu Rubin CPX, một dòng GPU hoàn toàn mới được thiết kế riêng cho tác vụ AI đòi hỏi xử lý ngữ cảnh cực lớn. Đây là loại chip có khả năng làm việc với mô hình cần xử lý hàng triệu token trong một lần - từ việc tạo mã cho cả dự án phần mềm đến xử lý video dài tới một giờ đồng hồ, theo Tech Wire Tech.

Rubin CPX hoạt động song song với CPU Vera và GPU Rubin trong nền tảng Vera Rubin NVL144 CPX. Tủ rack duy nhất mang lại 8 exaflop sức mạnh tính toán AI, cao gấp 7,5 lần so với hệ thống Nvidia GB300 NVL72 trước đó, đi kèm 100 terabyte bộ nhớ tốc độ cao và băng thông 1,7 petabyte/giây. Ngoài ra, Rubin CPX cũng có thể triển khai theo nhiều cấu hình khác nhau, tận dụng cả hạ tầng sẵn có của khách hàng.

Ông Jensen Huang, nhà sáng lập kiêm CEO Nvidia, khẳng định đây là một bước ngoặt quan trọng: “Nền tảng Vera Rubin sẽ mở ra kỷ nguyên mới trong tính toán AI, chúng tôi không chỉ giới thiệu thế hệ GPU Rubin mà đây còn là hạng mục bộ xử lý hoàn toàn mới mang tên CPX. Giống như RTX từng tạo ra cuộc cách mạng trong đồ họa và AI vật lý, Rubin CPX là GPU CUDA đầu tiên được xây dựng để xử lý AI ngữ cảnh khổng lồ, nơi mô hình có thể suy luận dựa trên hàng triệu token kiến thức cùng lúc”.

TỪ LẬP TRÌNH ĐẾN TẠO VIDEO

Hiện nay, nhu cầu xử lý ngữ cảnh lớn (long-context) đang bùng nổ. Các công cụ lập trình AI chủ yếu hoạt động trên những đoạn mã nhỏ, nhưng Rubin CPX được thiết kế để quản lý cả dự án lớn, có thể quét và tối ưu toàn bộ kho lưu trữ code.

Trong lĩnh vực video, nơi một giờ nội dung có thể tương đương 1 triệu token, Rubin CPX tích hợp khả năng mã hóa, giải mã và suy luận ngay trên cùng một chip, giúp tác vụ như tìm kiếm video hay chỉnh sửa bằng AI trở nên thực tiễn hơn.

GPU này sử dụng thiết kế monolithic die dựa trên kiến trúc Rubin, được tích hợp tài nguyên tính toán NVFP4 cho hiệu suất cao. Sản phẩm cung cấp tới 30 petaflop sức mạnh tính toán ở độ chính xác NVFP4, đi kèm 128 GB bộ nhớ GDDR7. So với hệ thống GB300 NVL72, Rubin CPX nhanh gấp 3 lần trong xử lý cơ chế attention, giúp mô hình làm việc với chuỗi dữ liệu dài mà không bị chậm lại.

Rubin CPX có thể triển khai với hạ tầng InfiniBand hoặc Spectrum-X Ethernet của Nvidia để mở rộng khả năng tính toán quy mô lớn. Trong hệ thống NVL144 CPX cao cấp, Nvidia ước tính khách hàng có thể tạo ra 5 tỷ USD doanh thu token cho mỗi 100 triệu USD đầu tư.

Hình ảnh GPU Rubin CPX mới được Nvidia ra mắt

KỶ LỤC MỚI TRONG CÁC THỬ NGHIỆM AI

Bên cạnh Rubin CPX, Nvidia cũng công bố kết quả từ bộ kiểm chuẩn MLPerf Inference mới nhất. Dòng Blackwell Ultra lập kỷ lục ở các bài kiểm tra suy luận phức tạp như DeepSeek R1 và Llama 3.1 405B, đồng thời là nền tảng duy nhất báo cáo kết quả ở các kịch bản tương tác nặng nhất.

Công ty cũng ghi nhận thành tích vượt trội ở các thử nghiệm Llama 3.8B, Whisper chuyển giọng nói thành văn bản, và mạng nơ-ron đồ thị (GNN). Nvidia cho biết thành công này một phần nhờ kỹ thuật disaggregated serving - tách riêng giai đoạn xử lý ngữ cảnh (nặng về tính toán) và giai đoạn tạo nội dung (nặng về băng thông); nhờ tối ưu riêng biệt, hiệu suất mỗi GPU tăng gần 50%.

Ví dụ, một GPU miễn phí với hiệu suất bằng 1/4 Blackwell vẫn có thể tạo ra khoảng 8 triệu USD doanh thu token trong 3 năm, trong khi khoản đầu tư 3 triệu USD vào hạ tầng GV200 có thể mang lại tới 30 triệu USD. Nvidia nhấn mạnh rằng hiệu suất chính là đòn bẩy quan trọng nhất cho lợi nhuận trong “nhà máy AI”.

Rubin CPX được định vị là sản phẩm đầu tiên trong lớp “GPU ngữ cảnh” mới trên lộ trình của Nvidia. Ngoài ra, công ty còn đang phát triển Rubin Ultra GPU, CPU Vera, NVLink Switch, Spectrum-X Ethernet và CX9 SuperNIC - tất cả đều được thiết kế đồng bộ trong chu kỳ nâng cấp hàng năm. Điều này thể hiện định hướng của Nvidia: không chỉ bán chip đơn lẻ, mà công ty còn cung cấp giải pháp cho toàn bộ hệ sinh thái.

Một loạt doanh nghiệp AI đang nhanh chóng đón đầu Rubin CPX với kỳ vọng mở ra những bước tiến mới trong hoạt động phát triển công nghệ. Cursor, đơn vị đứng sau trình soạn thảo code AI, tin rằng GPU này sẽ thúc đẩy tốc độ sinh mã và tăng cường khả năng cộng tác của lập trình viên.

CEO Michael Truell cho biết, với Rubin CPX, Cursor có thể mang đến khả năng tạo mã “nhanh như chớp” cùng hỗ trợ sâu sát cho nhà phát triển, từ đó thay đổi cách phần mềm được xây dựng.

Trong khi đó, Runway - công ty AI tạo sinh chuyên về video - coi Rubin CPX là hạt nhân cho quy trình sáng tạo thế hệ mới. CEO Cristóbal Valenzuela nhấn mạnh rằng việc tạo video đang tiến rất nhanh tới ngữ cảnh lớn, quy trình linh hoạt, và Rubin CPX sẽ trở thành bước nhảy vọt trong việc xây dựng các công cụ sáng tạo thông minh, toàn diện.

Magic, công ty AI phát triển mô hình nền tảng cho agent phần mềm, cũng đặt kỳ vọng vào khả năng xử lý ngữ cảnh khổng lồ. CEO Eric Steinberger cho biết, với ngữ cảnh 100 triệu token, mô hình của Magic có thể hiểu toàn bộ một kho code, kết hợp cả lịch sử tương tác nhiều năm, tài liệu và thư viện - tất cả được đặt trong cùng một bối cảnh mà không cần điều chỉnh.

TÍCH HỢP TRONG HỆ SINH THÁI AI

Rubin CPX được kết nối trực tiếp với hệ sinh thái AI toàn diện của NVIDIA, bao gồm phần mềm và công cụ cho nhà phát triển. GPU sẽ hỗ trợ các mô hình đa phương tiện Nemotron, được phân phối qua Nvidia AI Enterprise. Sản phẩm cũng liên kết với nền tảng Dynamo, vốn giúp tối ưu hiệu quả suy luận và giảm chi phí cho AI vận hành thực tế.

Được hậu thuẫn bởi thư viện CUDA-X cùng cộng đồng hàng triệu lập trình viên, Rubin CPX đang mở rộng tầm ảnh hưởng của Nvidia trong lĩnh vực AI quy mô lớn. Đây sẽ là công cụ mới cho các ngành mà kích thước ngữ cảnh và hiệu suất quyết định khả năng đổi mới.

CEO Nvidia nhận định OpenClaw “chắc chắn sẽ là ChatGPT tiếp theo”

OpenClaw được Trung Quốc phổ cập rộng rãi tới người dùng đại chúng

Trung Quốc đang đẩy mạnh phổ cập trí tuệ nhân tạo trên quy mô lớn, và các “big tech” công nghệ nước này đang trực tiếp tổ chức nhiều sự kiện công khai để giúp người dân tiếp cận OpenClaw – trợ lý số cá nhân đang gây sốt…

07:59 25/03/2026

Nếu dầu được đo bằng thùng, thì AI sẽ được đo bằng token.

Tokenomics: “Nền kinh tế token” đang nhanh chóng nổi lên trong kỷ nguyên AI

Khi trí tuệ nhân tạo bước vào giai đoạn thương mại hóa quy mô lớn, “token” – đơn vị dữ liệu nhỏ nhất mà mô hình AI xử lý – đang nổi lên như một loại hàng hóa mới...

23:57 24/03/2026

Quỹ đạo Trái Đất thấp (LEO) nổi lên như một trong những môi trường chiến lược quan trọng nhất của nền kinh tế số toàn cầu.

Từ vệ tinh đến trung tâm dữ liệu ngoài không gian: Kinh tế LEO đang hút hàng tỷ USD đầu tư

Hơn 400 tỷ USD đã được đầu tư vào nền kinh tế không gian kể từ năm 2009, theo Space Capital. Các chuyên gia cho rằng ngành này vẫn đang ở “giai đoạn đầu của một chu kỳ hạ tầng kéo dài nhiều thập kỷ”...

15:07 23/03/2026

Đây là mẫu pin lượng tử thử nghiệm hoạt động hoàn chỉnh đầu tiên trên thế giới do CSIRO và các cộng sự chế tạo.

Australia công bố nguyên mẫu pin lượng tử đầu tiên: Bước tiến lớn hướng tới sạc siêu nhanh

Các nhà khoa học Australia vừa phát triển nguyên mẫu pin lượng tử đầu tiên trên thế giới, mở ra loạt ứng dụng đột phá, giúp xe điện sạc pin nhanh hơn cả thời gian đổ xăng vào xe chạy xăng...

10:41 22/03/2026

Ảnh minh hoạ: Tiện ích thông minh, hạ tầng công nghệ và tiêu chuẩn xanh trở thành "bộ lọc" cạnh tranh trên thị trường bất động sản.

Bất động sản Việt Nam 2026: Khi Quản trị dữ liệu và ESG trở thành "hệ điều hành" mới

Trong bối cảnh thị trường bất động sản đang chuyển mình mạnh mẽ, việc tối ưu hóa dữ liệu công trình và các tiêu chuẩn bền vững (ESG) không còn là những khái niệm xa xỉ mà đã trở thành động lực tăng trưởng cốt lõi...

18:46 19/03/2026

Trong hai tháng đầu năm, Trung Quốc đã sản xuất 143.608 robot công nghiệp, tăng 31% so với cùng kỳ năm trước

Robot Trung Quốc tăng tốc với OpenClaw

Trung Quốc đang chứng kiến sự hội tụ nhanh chóng giữa trí tuệ nhân tạo và robot, khi các tác tử AI như OpenClaw được đưa vào thế giới vật lý…

16:29 19/03/2026

Kính AI đang chuyển từ thiết bị thử nghiệm sang thiết bị đeo hàng ngày. (Hình ảnh do AI tạo ra)

Thị trường kính AI "cất cánh": Lượng hàng xuất xưởng tăng trưởng kỷ lục 322%

Sự gia tăng mạnh mẽ của kính AI được thúc đẩy bởi thị trường Trung Quốc, nơi hàng loạt sản phẩm mới ra mắt...

09:17 18/03/2026

Quyết định này đánh dấu lần đầu tiên trên thế giới một hệ thống BCI xâm lấn được phép bán và sử dụng trên bệnh nhân như một sản phẩm thương mại

Trung Quốc lần đầu phê duyệt thiết bị cấy ghép giao diện não – máy tính

Trung Quốc vừa ghi dấu mốc quan trọng trong lĩnh vực công nghệ thần kinh khi lần đầu tiên cấp phép thương mại thiết bị cấy ghép giao diện não – máy tính (BCI) nhằm giúp bệnh nhân chấn thương tủy sống phục hồi chức năng vận động bàn tay...

15:51 16/03/2026

Trung tâm dữ liệu Hyperion công suất 5 gigawatt của Meta đang được xây dựng tại Richland Parish (Louisiana, Hoa Kỳ), ngày 9/1/2026. Nguồn: Meta.

Meta ra mắt hàng loạt chip AI riêng

Phó Chủ tịch Kỹ thuật Yee Jiun Song cho biết các chip này giúp Meta đa dạng hóa nguồn cung silicon và phần nào giảm tác động từ biến động giá…

14:03 14/03/2026

Ngành sản xuất thiết bị bán dẫn của Nhật Bản đang bùng nổ. Ảnh: Bloomberg

Nhật Bản muốn chiếm 1/3 thị phần bán dẫn toàn cầu

Nhật Bản đặt mục tiêu đạt hơn 250 tỷ USD doanh thu chip sản xuất trong nước vào năm 2040…

12:03 14/03/2026