Nvidia ra mắt Rubin CPX – GPU tối ưu cho AI xử lý ngữ cảnh lớn
Sơn Trần
12/09/2025
Nvidia ra mắt Rubin CPX, dòng GPU thế hệ mới mở ra kỷ nguyên xử lý AI ngữ cảnh lớn (long-context), hứa hẹn tạo bước nhảy vọt về hiệu năng và khả năng ứng dụng…


Tập đoàn công nghệ Hoa Kỳ Nvidia vừa giới thiệu Rubin CPX, một dòng GPU hoàn toàn mới được thiết kế riêng cho tác vụ AI đòi hỏi xử lý ngữ cảnh cực lớn. Đây là loại chip có khả năng làm việc với mô hình cần xử lý hàng triệu token trong một lần - từ việc tạo mã cho cả dự án phần mềm đến xử lý video dài tới một giờ đồng hồ, theo Tech Wire Tech.
Rubin CPX hoạt động song song với CPU Vera và GPU Rubin trong nền tảng Vera Rubin NVL144 CPX. Tủ rack duy nhất mang lại 8 exaflop sức mạnh tính toán AI, cao gấp 7,5 lần so với hệ thống Nvidia GB300 NVL72 trước đó, đi kèm 100 terabyte bộ nhớ tốc độ cao và băng thông 1,7 petabyte/giây. Ngoài ra, Rubin CPX cũng có thể triển khai theo nhiều cấu hình khác nhau, tận dụng cả hạ tầng sẵn có của khách hàng.
Ông Jensen Huang, nhà sáng lập kiêm CEO Nvidia, khẳng định đây là một bước ngoặt quan trọng: “Nền tảng Vera Rubin sẽ mở ra kỷ nguyên mới trong tính toán AI, chúng tôi không chỉ giới thiệu thế hệ GPU Rubin mà đây còn là hạng mục bộ xử lý hoàn toàn mới mang tên CPX. Giống như RTX từng tạo ra cuộc cách mạng trong đồ họa và AI vật lý, Rubin CPX là GPU CUDA đầu tiên được xây dựng để xử lý AI ngữ cảnh khổng lồ, nơi mô hình có thể suy luận dựa trên hàng triệu token kiến thức cùng lúc”.
TỪ LẬP TRÌNH ĐẾN TẠO VIDEO
Hiện nay, nhu cầu xử lý ngữ cảnh lớn (long-context) đang bùng nổ. Các công cụ lập trình AI chủ yếu hoạt động trên những đoạn mã nhỏ, nhưng Rubin CPX được thiết kế để quản lý cả dự án lớn, có thể quét và tối ưu toàn bộ kho lưu trữ code.
Trong lĩnh vực video, nơi một giờ nội dung có thể tương đương 1 triệu token, Rubin CPX tích hợp khả năng mã hóa, giải mã và suy luận ngay trên cùng một chip, giúp tác vụ như tìm kiếm video hay chỉnh sửa bằng AI trở nên thực tiễn hơn.
GPU này sử dụng thiết kế monolithic die dựa trên kiến trúc Rubin, được tích hợp tài nguyên tính toán NVFP4 cho hiệu suất cao. Sản phẩm cung cấp tới 30 petaflop sức mạnh tính toán ở độ chính xác NVFP4, đi kèm 128 GB bộ nhớ GDDR7. So với hệ thống GB300 NVL72, Rubin CPX nhanh gấp 3 lần trong xử lý cơ chế attention, giúp mô hình làm việc với chuỗi dữ liệu dài mà không bị chậm lại.
Rubin CPX có thể triển khai với hạ tầng InfiniBand hoặc Spectrum-X Ethernet của Nvidia để mở rộng khả năng tính toán quy mô lớn. Trong hệ thống NVL144 CPX cao cấp, Nvidia ước tính khách hàng có thể tạo ra 5 tỷ USD doanh thu token cho mỗi 100 triệu USD đầu tư.

KỶ LỤC MỚI TRONG CÁC THỬ NGHIỆM AI
Bên cạnh Rubin CPX, Nvidia cũng công bố kết quả từ bộ kiểm chuẩn MLPerf Inference mới nhất. Dòng Blackwell Ultra lập kỷ lục ở các bài kiểm tra suy luận phức tạp như DeepSeek R1 và Llama 3.1 405B, đồng thời là nền tảng duy nhất báo cáo kết quả ở các kịch bản tương tác nặng nhất.
Công ty cũng ghi nhận thành tích vượt trội ở các thử nghiệm Llama 3.8B, Whisper chuyển giọng nói thành văn bản, và mạng nơ-ron đồ thị (GNN). Nvidia cho biết thành công này một phần nhờ kỹ thuật disaggregated serving - tách riêng giai đoạn xử lý ngữ cảnh (nặng về tính toán) và giai đoạn tạo nội dung (nặng về băng thông); nhờ tối ưu riêng biệt, hiệu suất mỗi GPU tăng gần 50%.
Ví dụ, một GPU miễn phí với hiệu suất bằng 1/4 Blackwell vẫn có thể tạo ra khoảng 8 triệu USD doanh thu token trong 3 năm, trong khi khoản đầu tư 3 triệu USD vào hạ tầng GV200 có thể mang lại tới 30 triệu USD. Nvidia nhấn mạnh rằng hiệu suất chính là đòn bẩy quan trọng nhất cho lợi nhuận trong “nhà máy AI”.
Rubin CPX được định vị là sản phẩm đầu tiên trong lớp “GPU ngữ cảnh” mới trên lộ trình của Nvidia. Ngoài ra, công ty còn đang phát triển Rubin Ultra GPU, CPU Vera, NVLink Switch, Spectrum-X Ethernet và CX9 SuperNIC - tất cả đều được thiết kế đồng bộ trong chu kỳ nâng cấp hàng năm. Điều này thể hiện định hướng của Nvidia: không chỉ bán chip đơn lẻ, mà công ty còn cung cấp giải pháp cho toàn bộ hệ sinh thái.
Một loạt doanh nghiệp AI đang nhanh chóng đón đầu Rubin CPX với kỳ vọng mở ra những bước tiến mới trong hoạt động phát triển công nghệ. Cursor, đơn vị đứng sau trình soạn thảo code AI, tin rằng GPU này sẽ thúc đẩy tốc độ sinh mã và tăng cường khả năng cộng tác của lập trình viên.
CEO Michael Truell cho biết, với Rubin CPX, Cursor có thể mang đến khả năng tạo mã “nhanh như chớp” cùng hỗ trợ sâu sát cho nhà phát triển, từ đó thay đổi cách phần mềm được xây dựng.
Trong khi đó, Runway - công ty AI tạo sinh chuyên về video - coi Rubin CPX là hạt nhân cho quy trình sáng tạo thế hệ mới. CEO Cristóbal Valenzuela nhấn mạnh rằng việc tạo video đang tiến rất nhanh tới ngữ cảnh lớn, quy trình linh hoạt, và Rubin CPX sẽ trở thành bước nhảy vọt trong việc xây dựng các công cụ sáng tạo thông minh, toàn diện.
Magic, công ty AI phát triển mô hình nền tảng cho agent phần mềm, cũng đặt kỳ vọng vào khả năng xử lý ngữ cảnh khổng lồ. CEO Eric Steinberger cho biết, với ngữ cảnh 100 triệu token, mô hình của Magic có thể hiểu toàn bộ một kho code, kết hợp cả lịch sử tương tác nhiều năm, tài liệu và thư viện - tất cả được đặt trong cùng một bối cảnh mà không cần điều chỉnh.
TÍCH HỢP TRONG HỆ SINH THÁI AI
Rubin CPX được kết nối trực tiếp với hệ sinh thái AI toàn diện của NVIDIA, bao gồm phần mềm và công cụ cho nhà phát triển. GPU sẽ hỗ trợ các mô hình đa phương tiện Nemotron, được phân phối qua Nvidia AI Enterprise. Sản phẩm cũng liên kết với nền tảng Dynamo, vốn giúp tối ưu hiệu quả suy luận và giảm chi phí cho AI vận hành thực tế.
Được hậu thuẫn bởi thư viện CUDA-X cùng cộng đồng hàng triệu lập trình viên, Rubin CPX đang mở rộng tầm ảnh hưởng của Nvidia trong lĩnh vực AI quy mô lớn. Đây sẽ là công cụ mới cho các ngành mà kích thước ngữ cảnh và hiệu suất quyết định khả năng đổi mới.
Khám phá 9 lĩnh vực công nghệ mũi nhọn mà Trung Quốc đang đầu tư mạnh vào R&D để trở thành trung tâm đổi mới toàn cầu.
Khám phá cách AI cải thiện điều trị ung thư, giảm thời gian chờ đợi và nâng cao hiệu quả chăm sóc bệnh nhân.
Khám phá triển vọng tích cực của ngành năng lượng tái tạo Malaysia với các chính sách hỗ trợ và dự án mới. Đọc ngay!
OpenAI sẽ ra mắt tính năng giám sát cho phụ huynh, giúp bảo vệ thanh thiếu niên khỏi rủi ro khi sử dụng ChatGPT.
Khám phá mô hình AI đầu tiên của Microsoft, bước tiến độc lập trong cuộc đua trí tuệ nhân tạo. Tìm hiểu thêm ngay!
Khám phá lộ trình của Trung Quốc trong việc xây dựng ngành công nghiệp giao diện não-máy tính cạnh tranh quốc tế đến năm 2030.
Khám phá headset MR mới của Vivo, mở ra tiềm năng công nghệ và ứng dụng cho robot trong thế giới thực.
Khám phá sự chuyển mình của Trung Quốc thành quốc gia điện lực lớn nhất thế giới với năng lượng tái tạo vượt trội.