HomeTechNền tảng AI Rubin có gì hay?

Nền tảng AI Rubin có gì hay?

Sau Blackwell, NVIDIA không mất nhiều thời gian để mở ra chương tiếp theo của cuộc đua hạ tầng AI. Tại CES 2026, nền tảng Rubin chính thức lộ diện, không chỉ là một thế hệ chip mới mà là cách NVIDIA tái định nghĩa toàn bộ kiến trúc siêu máy tính AI, từ lõi xử lý cho tới rack trung tâm dữ liệu.

- Advertisement -

Sau thành công vang dội của Blackwell, nhiều người từng nghĩ NVIDIA sẽ tạm chững lại để khai thác tối đa lợi thế thị trường. Nhưng CES 2026 cho thấy điều ngược lại. Rubin xuất hiện như một lời khẳng định rằng NVIDIA không xem AI là cuộc chơi theo chu kỳ sản phẩm, mà là một quá trình tiến hóa liên tục của hạ tầng.

Điểm khác biệt lớn nhất của Rubin nằm ở chỗ nó không phải một con chip đơn lẻ. Đây là một nền tảng AI hoàn chỉnh, được thiết kế đồng bộ từ đầu với mục tiêu phục vụ huấn luyện và suy luận AI ở quy mô siêu lớn.

Rubin không phải chip, mà là hệ sinh thái

Nền tảng AI Rubin có gì hay?

NVIDIA mô tả Rubin như một kiến trúc “đồng bộ từ lõi đến rack”. Điều đó có nghĩa CPU, GPU, kết nối, mạng và bảo mật đều được phát triển song song, thay vì ghép nối các thành phần rời rạc như cách tiếp cận truyền thống.

Nền tảng Rubin bao gồm CPU NVIDIA Vera, GPU Rubin, NVLink thế hệ 6, card mạng ConnectX 9 SuperNIC, BlueField 4 DPU và switch Ethernet Spectrum 6. Khi kết hợp, các thành phần này tạo thành những cấu hình rack scale như Vera Rubin NVL72 hoặc hệ thống HGX Rubin NVL8, nhắm trực tiếp tới hyperscaler và trung tâm dữ liệu AI quy mô cực lớn.

Ở cấp độ này, NVIDIA không còn bán GPU. Họ đang bán một đơn vị năng lực tính toán hoàn chỉnh.

Vì sao Rubin được xem là bước nhảy lớn so với Blackwell

Theo NVIDIA, Rubin mang lại cải thiện không chỉ về sức mạnh, mà còn về hiệu quả vận hành. Chi phí suy luận AI tính theo mỗi token có thể giảm tới mười lần so với Blackwell. Với các mô hình Mixture of Experts, số GPU cần thiết cho huấn luyện có thể giảm tới bốn lần.

Những con số này không đến từ việc tăng xung hay thêm nhân đơn thuần. Chúng là kết quả của hàng loạt cải tiến diễn ra đồng thời, từ NVLink thế hệ 6 với băng thông cao hơn, Transformer Engine tối ưu cho mô hình lớn, cho tới cơ chế Confidential Computing giúp bảo vệ dữ liệu huấn luyện và suy luận.

Vai trò của CPU Vera cũng thay đổi đáng kể. Thay vì chỉ đóng vai trò điều phối, Vera trở thành một phần chủ động trong toàn bộ kiến trúc AI, giúp giảm độ trễ và tăng hiệu quả phân phối công việc giữa các thành phần.

Microsoft không đợi Rubin rồi mới chuẩn bị

Trong số các đối tác lớn, Microsoft là cái tên thể hiện sự chủ động rõ ràng nhất. Tập đoàn này xác nhận sẽ tích hợp các hệ thống Vera Rubin NVL72 vào thế hệ trung tâm dữ liệu AI tiếp theo của Azure ngay khi phần cứng sẵn sàng triển khai thương mại.

Điều đáng chú ý là Azure không chờ Rubin xuất hiện rồi mới điều chỉnh hạ tầng. Theo Microsoft, nhiều lớp kiến trúc quan trọng đã được tái thiết kế từ trước để sẵn sàng cho bước nhảy hiệu năng mà Rubin mang lại.

Kiến trúc rack của Azure hiện đã tối ưu cho NVLink thế hệ 6 với băng thông scale up lên tới khoảng 260 terabyte mỗi giây. Hệ thống làm mát, cấp nguồn và mật độ rack cũng được nâng cấp để đáp ứng yêu cầu nhiệt và công suất của bộ nhớ HBM4 và HBM4e.

Azure đồng thời chuẩn bị cho các cấu trúc mới như SOCAMM2, GPU kích thước reticle lớn và thiết kế đa die, vốn là những đặc trưng cốt lõi của Rubin.

Sức mạnh tính toán ở quy mô chưa từng có

Theo công bố, mỗi chip Vera Rubin có thể đạt tới 50 petaflops suy luận ở chuẩn NVFP4. Khi ghép thành rack NVL72, toàn bộ hệ thống đạt khoảng 3,6 exaflops, cao gấp gần năm lần so với cấu hình GB200 NVL72 của thế hệ trước.

Nền tảng AI Rubin có gì hay?

Ở tầng mạng, ConnectX 9 cho phép băng thông scale out lên tới 1.600 gigabit mỗi giây, giúp các cụm AI lớn giao tiếp hiệu quả hơn trong những bài toán huấn luyện và suy luận cực lớn, nơi chi phí truyền dữ liệu đôi khi còn quan trọng hơn sức mạnh xử lý thuần túy.

Rubin cho thấy NVIDIA đang chơi cuộc chơi khác

Sự xuất hiện của Rubin tại CES 2026 cho thấy NVIDIA không còn cạnh tranh ở cấp độ chip riêng lẻ. Họ đang xây dựng chuẩn hạ tầng cho toàn bộ ngành AI, nơi phần cứng, phần mềm và kiến trúc trung tâm dữ liệu gắn chặt với nhau.

Trong khi đó, việc Microsoft và các hyperscaler khác sẵn sàng triển khai Rubin cho thấy quyền lực trong kỷ nguyên AI đang dịch chuyển mạnh về phía những ai kiểm soát được hạ tầng quy mô lớn.

Rubin không phải là sản phẩm dành cho người dùng cuối. Nhưng chính những nền tảng như vậy sẽ quyết định AI có thể đi nhanh đến đâu, mạnh đến mức nào và ai là người thực sự nắm quyền trong cuộc chơi công nghệ toàn cầu sắp tới.

Cùng chuyên mục