image Thứ Sáu, 24/04/2026

Bên trong "siêu nhà máy AI" sẽ tạo bước ngoặt lớn cho công nghệ trí tuệ nhân tạo của Microsoft

Thanh Minh

14/11/2025

Chia sẻ

Tập đoàn Microsoft vừa khai trương trung tâm dữ liệu thế hệ mới – không đơn thuần là một toà nhà độc lập, mà là một mắt xích trong mạng lưới được thiết kế để hoạt động như một “siêu nhà máy AI”...

Thiết kế trung tâm dữ liệu AI của Fairwater có hai tầng. Ảnh: Microsoft
Thiết kế trung tâm dữ liệu AI của Fairwater có hai tầng. Ảnh: Microsoft

Theo Microsoft, tại Atlanta, trung tâm dữ liệu thuộc dòng “Fairwater” đã bắt đầu vận hành từ tháng 10 và là cơ sở thứ hai của dòng này, kiến trúc và thiết kế tương đồng với công trình ở Wisconsin. Nhưng điều đáng chú ý là các cơ sở Fairwater không hoạt động riêng lẻ mà được kết nối với nhau – và trong tương lai sẽ mở rộng đến nhiều nơi khác trên lãnh thổ Mỹ – bằng một mạng lưới chuyên biệt cho phép dữ liệu lưu chuyển với tốc độ rất cao.

Nhờ vậy, các cơ sở đặt tại các bang khác nhau có thể cùng nhau vận hành như một “siêu nhà máy AI” để đào tạo mô hình mới nhanh hơn, hoàn thành những nhiệm vụ vốn trước đây mất cả nhiều tháng, nay có thể rút xuống chỉ còn vài tuần.

MẠNG LƯỚI SIÊU NHÀ MÁY AI: KHI TRUNG TÂM DỮ LIỆU TRỞ THÀNH MỘT HỆ THỐNG PHÂN TÁN

Mạng lưới này sẽ kết nối nhiều địa điểm với hàng trăm ngàn GPU tiên tiến nhất, petabyte hay exabyte lưu trữ và hàng triệu nhân CPU cho các tác vụ vận hành - tất cả phối hợp để hỗ trợ OpenAI, nhóm Superintelligence của Microsoft, các tính năng Copilot và các workload AI hàng đầu khác.

Theo Alistair Speirs, Giám đốc phụ trách hạ tầng Azure tại Microsoft, đây là mạng lưới phân tán có thể đóng vai trò như một siêu máy tính ảo, để đối phó với những thách thức lớn của thế giới theo cách mà một cơ sở đơn lẻ không thể thực hiện được.

“Một trung tâm dữ liệu truyền thống được thiết kế để vận hành hàng triệu ứng dụng riêng biệt cho nhiều khách hàng khác nhau… Còn ở đây chúng tôi gọi nó là siêu nhà máy AI vì đang vận hành một công việc phức tạp duy nhất trên hàng triệu thiết bị phần cứng. Và nó không chỉ là một cơ sở đơn lẻ đang đào tạo một mô hình AI, mà là một mạng lưới các site hỗ trợ công việc duy nhất đó”, ông nói.

Như vậy, Microsoft đang vượt khỏi mô hình trung tâm dữ liệu “một site, nhiều ứng dụng” sang mô hình “nhiều site, một ứng dụng lớn” – nơi mà các thiết bị và mảng dữ liệu phân tán nhưng phải vận hành như một khối thống nhất.

THIẾT KẾ “ĐO NI ĐÓNG GIÀY” CHO AI: TỪ GPU, RACK CHO TỚI MẠNG LƯỚI LIÊN KẾT

Các trung tâm dữ liệu Fairwater của Microsoft được xây dựng từ đầu nhằm đáp ứng một nhiệm vụ duy nhất: đào tạo và vận hành các mô hình AI lớn. Sự phát triển nhanh chóng về số lượng tham số của mô hình và lượng dữ liệu huấn luyện ngày càng lớn đòi hỏi tương ứng một nguồn lực tính toán khổng lồ.

Thông tin được chia sẻ giữa tất cả GPU tại cơ sở Atlanta Fairwater bằng mạng lưới thông lượng cao, cực nhanh. Ảnh: Microsoft 
Thông tin được chia sẻ giữa tất cả GPU tại cơ sở Atlanta Fairwater bằng mạng lưới thông lượng cao, cực nhanh. Ảnh: Microsoft 

Tại Atlanta, cơ sở Fairwater được trang bị kiến trúc chip và rack mới đem lại thông lượng cao nhất mỗi rack so với bất kỳ nền tảng đám mây nào hiện có; hệ thống rack-kích thước quy mô sử dụng GPU NVIDIA NVL72 theo dòng GB200 mà có thể mở rộng tới hàng trăm ngàn GPU Blackwell; thiết kế hai tầng cho phép tăng mật độ GPU; làm mát bằng chất lỏng tiên tiến, sử dụng gần như không cần nước; cùng cấu trúc mạng thông minh cho phép giao tiếp nhanh giữa các GPU và liên kết trực tiếp với các cụm tính toán tại các site khác.

Microsoft cho biết, đào tạo AI không đơn thuần là “thêm GPU” mà là “xây dựng hạ tầng làm cho chúng hoạt động cùng nhau như một hệ thống”. Scott Guthrie, Phó Chủ tịch điều hành Cloud + AI tại Microsoft, nêu rõ: “Chúng tôi đã dành nhiều năm để tiên tiến hóa kiến trúc, phần mềm và mạng lưới cần thiết để đào tạo các mô hình lớn một cách tin cậy, để khách hàng có thể đổi mới với sự tin cậy. Fairwater phản ánh kỹ thuật đầu-cuối đó và được thiết kế để đáp ứng nhu cầu đang tăng với hiệu suất thực tế chứ không chỉ với năng lực lý thuyết”.

Một trong những điểm nổi bật là liên kết mạng giữa các site: Microsoft triển khai mạng cáp quang chuyên dụng gọi là “AI WAN” (AI Wide Area Network). Một số cáp quang mới được xây dựng; một số khác công ty đã mua lại từ nhiều năm trước và tái sử dụng. Tổng chiều dài của hệ thống hiện đạt khoảng 120.000 dặm (khoảng 193.000 km), tăng hơn 25% trong một năm.

Phần mềm điều phối dữ liệu và giao thức mạng cũng được tinh chỉnh để kết nối trực tiếp, giảm thiểu độ trễ. AI WAN kết nối các chip và rack tại một địa điểm tới kết cấu tương tự ở bang khác, với lưu lượng dữ liệu gần như không bị tắc nghẽn, từ đó nhiều site có thể hợp tác huấn luyện mô hình theo thời gian gần thực.

Trong mỗi site, hàng trăm ngàn GPU được liên kết rất chặt, mỗi GPU xử lý phần dữ liệu huấn luyện riêng và cần chia sẻ kết quả với các GPU khác, rồi cùng cập nhật mô hình. Nếu một phần chậm, toàn bộ công việc bị trì hoãn. Vì vậy, mục tiêu của Fairwater là giữ cho các GPU “luôn bận” và hòa nhịp với nhau.

Nếu trao đổi thông tin nhanh là cần thiết, tại sao không đặt các site gần nhau? Microsoft cho biết vì đất đai, nguồn điện và các điều kiện hạ tầng khác khiến việc phân tán địa lý là hấp dẫn và hiện tại là bắt buộc.

Thiết kế cũng xử lý thách thức làm mát và mật độ cao, các chip AI tỏa nhiệt nhiều hơn chip truyền thống. Vì vậy Microsoft đã phát triển hệ thống làm mát vòng kín, bơm chất lỏng nóng ra khỏi tòa nhà, làm lạnh và trả lại cho GPU. Mọi khía cạnh của trung tâm dữ liệu Fairwater và mạng liên kết đều được tối ưu để cung cấp sức mạnh tính toán AI lớn nhất với tài nguyên tối thiểu.

TƯƠNG LAI AI PHÂN TÁN VÀ Ý NGHĨA CHO NGÀNH CÔNG NGHIỆP

Việc Fairwater của Microsoft đi vào hoạt động ở Atlanta, cùng với cơ sở tại Wisconsin và những site đang xây dựng khác, mở ra một kỷ nguyên mới, nơi hạ tầng AI không chỉ là các trung tâm dữ liệu đơn lẻ, mà là một mạng lưới toàn quốc – hay thậm chí toàn cầu – hoạt động như một “siêu nhà máy AI”.

Những mô hình AI ngày nay – dùng hàng tỷ hoặc hàng trăm tỷ tham số, huấn luyện trên lượng dữ liệu rất lớn – đang trở thành động lực chính cho chatbot, trợ lý AI, trí tuệ doanh nghiệp, dự báo thiên tai, y học, vật liệu mới, năng lượng và nhiều lĩnh vực khác.

Sơ đồ kỹ thuật siêu nhà máy AI của Microsoft
Sơ đồ kỹ thuật siêu nhà máy AI của Microsoft

Mark Russinovich, Giám đốc Công nghệ, Phó Giám đốc An ninh Thông tin và là Chuyên gia Kỹ thuật cao cấp của Microsoft Azure, cho biết: “Để cải thiện khả năng của AI, bạn cần một hạ tầng lớn hơn và lớn hơn… lượng hạ tầng cần thiết hiện nay để huấn luyện các mô hình không còn là một trung tâm dữ liệu, không phải hai, mà là nhiều”.

Đối với ngành công nghiệp, mô hình này là một bước ngoặt. Trước đây, các trung tâm dữ liệu đám mây thường vận hành nhiều ứng dụng nhỏ – website, email, ứng dụng doanh nghiệp… Nhưng khi chuyển sang mô hình một công việc lớn chạy trên hàng triệu phần cứng, mạng lưới và kiến trúc phân tán trở thành điều thiết yếu. Microsoft cho rằng tương lai của AI sẽ được hình thành từ việc kết nối các trung tâm dữ liệu thành một hệ thống phân tán.

“Bằng cách làm cho các site AI của chúng tôi vận hành như một, chúng tôi có thể giúp khách hàng tạo ra các mô hình đột phá, mang lại kết quả có ý nghĩa trong thế giới thực và trao quyền để họ giải quyết thách thức và tạo cơ hội mới”, ông Mark Russinovich nói.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Amazon Leo phá thế độc tôn của Internet vệ tinh Starlink tại Đông Nam Á

Sau nhiều năm gần như “một mình một ngựa”, thị trường internet vệ tinh Đông Nam Á đang bước vào giai đoạn cạnh tranh thực sự khi Amazon Leo xuất hiện…

19:47 22/04/2026
Trung Quốc công bố chiến lược toàn diện, đưa AI vào lớp học đến năm 2030

Bắc Kinh đặt mục tiêu tích hợp trí tuệ nhân tạo trên toàn hệ thống giáo dục, từ phổ thông đến học tập suốt đời, với trọng tâm cá nhân hóa học tập, hỗ trợ giáo viên và dự báo nhu cầu nhân lực trong tương lai...

13:29 20/04/2026
Trung Quốc vận hành cụm siêu máy tính AI4S lớn nhất với 60.000 chip

Trung Quốc vừa đưa vào hoạt động một cụm siêu máy tính chuyên phục vụ “AI cho khoa học” (AI4S) tại tỉnh Hà Nam, đánh dấu bước tiến quan trọng trong chiến lược kết hợp trí tuệ nhân tạo với nghiên cứu khoa học…

07:00 18/04/2026
Cổ phiếu lượng tử bùng nổ nhờ “cú hích” AI từ Nvidia

Làn sóng tăng giá mạnh mẽ của các cổ phiếu điện toán lượng tử đang thu hút sự chú ý của giới đầu tư toàn cầu...

17:43 17/04/2026
AI và ESG đang "định hình lại" sức khỏe thương hiệu của các ngân hàng Việt

Sức khỏe thương hiệu của các ngân hàng Việt đang được dịch chuyển qua khả năng ứng dụng AI (Trí tuệ nhân tạo) để chuyển hóa trải nghiệm số thành hành vi sử dụng thực tế và thực thi chiến lược ESG (Môi trường - Xã hội - Quản trị) nhằm tạo dựng niềm tin bền vững, thay vì chỉ dựa vào mức độ nhận biết đơn thuần…

17:40 17/04/2026
Ứng dụng công nghệ bản sao số, AI vào ngành công nghiệp làm đẹp

Các doanh nghiệp làm đẹp đang tìm cách tận dụng công nghệ mô phỏng và trí tuệ nhân tạo để rút ngắn chu kỳ đổi mới trong bối cảnh cạnh tranh ngày càng gia tăng...

16:36 16/04/2026
Chatbot AI chẩn đoán sai trong hơn 80% trường hợp bệnh án ban đầu

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau cho thấy các chatbot AI dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa...

13:57 15/04/2026
Meta xây dựng “bản sao AI” của CEO Mark Zuckerberg để tương tác với nhân viên

Meta đang phát triển phiên bản "Mark Zuckerberg AI" có khả năng giao tiếp trực tiếp với nhân viên. Đây là một phần trong chiến lược lớn hơn nhằm tái định hình tập đoàn xoay quanh AI và tham vọng “siêu trí tuệ cá nhân”...

14:45 14/04/2026
Phần mềm phân tích cổ phiếu “All-in-One”: Dẫn lối đầu tư hiệu quả

Hầu hết những thua lỗ trên thị trường chứng khoán đến từ việc đầu tư theo cảm tính, bị cuốn đi bởi "lòng tham và nỗi sợ hãi". Không có một triết lý đầu tư phù hợp, khả năng phân tích và ra quyết định đúng dựa trên số liệu là hạn chế lớn nhất của các nhà đầu tư cá nhân...

15:51 13/04/2026
Trung Quốc thúc đẩy AI bằng năng lượng hạt nhân tiên tiến

Trung Quốc đang đẩy nhanh việc tích hợp giữa năng lượng và tính toán như một ưu tiên quốc gia...

19:52 11/04/2026