CEO Garman tiết lộ tham vọng về tương lai của AWS
Sơn Trần
06/12/2024
Mới đây, AWS đã công bố kế hoạch cho siêu máy tính AI, UltraCluster, chip Trainium 2 nhằm giảm phụ thuộc vào Nvidia…
Ông Matt Garman, Giám đốc Điều hành Amazon Web Services (AWS), chính thức đưa ra một số thông báo quan trọng của công ty tại hội nghị re:Invent hôm 3/12, theo Yahoo Tech.
Bài phát biểu kéo dài hai tiếng rưỡi của ông Garman trình bày về các phần mềm, phần cứng hiện tại và bản cập nhật của AWS, với sự góp mặt của nhiều khách hàng lớn như Apple và JPMorgan. Các đơn vị xử lý đồ họa (GPU), siêu máy tính và sự xuất hiện bất ngờ của Apple là những điểm nhấn nổi bật trong thông tin được công bố.
Amazon Web Services, đơn vị điện toán đám mây của Amazon, chịu trách nhiệm phát triển vi mạch bán dẫn chuyên biệt để phục vụ công tác huấn luyện trí tuệ nhân tạo (AI). Đầu tuần, ông Garman thông báo AWS đang tạo ra UltraServers - tương đương mỗi máy chủ chứa 64 chip Trainium 2 - giúp công ty mở rộng quy mô các hoạt động liên quan đến trí tuệ nhân tạo tạo sinh (GenAI).
Hơn nữa, AWS cũng xây dựng một siêu máy tính AI, có tên UltraCluster, bao gồm các UltraServers, hợp tác với công ty khởi nghiệp AI Anthropic. Dự án mang tên Project Rainier, khi hoàn thành, sẽ tạo ra "cụm máy tính AI lớn nhất thế giới được công bố, sẵn sàng để Anthropic xây dựng và triển khai một số mô hình trong tương lai", theo bài đăng trên blog của Amazon. Được biết, Amazon đã đầu tư 8 tỷ USD vào Anthropic.
Những bước tiến này có thể đẩy AWS vào cuộc đua cực kỳ khốc liệt với nhiều ông lớn công nghệ, trong đó có gã khổng lồ chip AI Nvidia. Theo giới nhận xét, dưới đây là bốn điểm nổi bật đáng chú ý trong bài phát biểu của CEO Matt Garman.
CHIP TRAINIUM CỦA AWS CÓ THỂ CẠNH TRANH VỚI NVIDIA
Hiện tại, Nvidia đang thống trị thị trường chip AI với loạt GPU được săn đón và có giá trị cao, nhưng trong bài phát biểu của mình, ông Garman ủng hộ sử dụng sản phẩm tự phát triển của AWS. Mục tiêu của công ty là giảm chi phí cho AI, ông Garman cho biết.
"Ngày nay, thực sự chỉ có một sự lựa chọn trên thị trường GPU, đó chính là Nvidia. Chúng tôi nghĩ rằng khách hàng sẽ đánh giá cao việc có nhiều lựa chọn khác nhau", ông Garman chia sẻ với Wall Street Journal.
AI đang phát triển thần tốc và nhu cầu chip phục vụ công nghệ này cũng tăng nhanh chóng. Một số công ty công nghệ lớn như Google và Microsoft cũng tham gia vào quá trình sản xuất chip nhằm tìm kiếm giải pháp thay thế cho Nvidia.
Tuy nhiên, ông Garman nói thêm rằng ông không kỳ vọng Trainium sẽ "soán ngôi" Nvidia "trong thời gian dài". "Nhưng hy vọng Trainium có thể tạo ra thị trường ngách tốt - nơi tôi nghĩ sẽ là sự lựa chọn tuyệt vời cho nhiều loại công việc". Đồng thời, AWS cũng giới thiệu Trainium3, thế hệ chip tiếp theo của hãng.
SIÊU MÁY TÍNH MỚI CỦA AWS CÓ THỂ ĐỐI ĐẦU VỚI xAI CỦA ELON MUSK
Theo The Journal, cụm chip mang tên Project Rainier dự kiến sẽ ra mắt vào năm 2025. Khi hoàn thành, Anthropic dự định sử dụng siêu máy tính này để huấn luyện mô hình AI.
Với "hàng trăm nghìn" chip Trainium, siêu máy tính này sẽ cạnh tranh trực tiếp với Colossus của xAI, công ty AI do tỷ phú Elon Musk sáng lập, vốn sử dụng 100.000 chip Hopper của Nvidia.
APPLE XEM XÉT TRAINIUM 2 ĐỂ ĐÀO TẠO APPLE INTELLIGENCE
Ông Garman cho biết Apple là một trong những khách hàng sử dụng chip AWS, như Amazon Graviton và Inferentia, cho các dịch vụ như Siri.
Ông Benoit Dupin, Giám đốc Cấp cao AI và học máy tại Apple, sau đó đã lên sân khấu tại hội nghị ở Las Vegas, khẳng định công ty đã hợp tác với AWS trong "hầu hết giai đoạn" vòng đời của AI và học máy.
"Một trong những yếu tố đặc biệt trong hoạt động kinh doanh của Apple là quy mô chúng tôi vận hành và tốc độ đổi mới của công ty", ông Dupin chia sẻ. "AWS giữ tốc độ phát triển tốt và chúng tôi là khách hàng của họ trong hơn một thập kỷ qua".
Ông Dupin nói thêm Apple đang trong giai đoạn thử nghiệm ban đầu chip Trainium 2 để có khả năng huấn luyện Apple Intelligence trong tương lai.
AMAZON NOVA - THẾ HỆ MÔ HÌNH NỀN TẢNG MỚI
Ngoài ra, Amazon còn công bố một số sản phẩm mới trong lĩnh vực GenAI.
Khách hàng của AWS có thể sử dụng các ứng dụng GenAI được hỗ trợ bởi Amazon Nova "để phân tích video, biểu đồ, tài liệu hoặc tạo ra video và các nội dung đa phương tiện khác", theo thông báo từ Amazon. Công ty cho biết Amazon Nova có nhiều mô hình tương ứng với các mức giá khác nhau để người dùng dễ dàng lựa chọn.
"Amazon Nova Micro, Amazon Nova Lite và Amazon Nova Pro có giá thấp hơn ít nhất 75% so với các mô hình hoạt động tốt nhất trên Amazon Bedrock", Amazon chia sẻ.
Từ khóa:
Microsoft vừa khép lại quý tệ nhất trên Phố Wall kể từ cuộc khủng hoảng tài chính năm 2008, khi giới đầu tư bắt đầu tỏ ra hoài nghi về triển vọng của hãng trong lĩnh vực trí tuệ nhân tạo…
Alibaba triển khai các “nhân viên số” tự động cho hàng triệu nhà bán hàng trên Taobao và Tmall…
Thanh toán số tại châu Á – Thái Bình Dương đang tăng tốc mạnh mẽ khi ví điện tử và chuyển tiền trực tiếp (A2A) dần lấn át thẻ truyền thống, không chỉ thay đổi thói quen chi tiêu mà còn tái định hình toàn bộ hệ sinh thái tài chính trong khu vực…
SK Hynix cho biết trong một hồ sơ rằng hãng đặt mục tiêu tiến hành niêm yết tại Hoa Kỳ trong năm 2026…
Indonesia đang phát đi thông điệp rõ ràng tới các nền tảng thương mại điện tử nước ngoài, đặc biệt là nền tảng có liên quan đến Trung Quốc, dù chưa đi đến mức cấm hoàn toàn, theo nhóm nhà phân tích thị trường từ Momentum Works…
Theo báo cáo được Diễn đàn châu Á Bác Ngao công bố đầu tuần này, tâm điểm phát triển trí tuệ nhân tạo (AI) trên toàn cầu đang dần chuyển từ châu Âu và Hoa Kỳ sang châu Á…
Đầu tư vốn tư nhân tại Đông Nam Á giảm xuống 14 tỷ USD trong năm 2025, phản ánh bối cảnh biến động và thận trọng trên toàn khu vực châu Á – Thái Bình Dương, theo báo cáo mới từ Bain & Company...
Giữa thị trường đầy bất ổn và thế “tiến thoái lưỡng nan”, Trung Quốc vẫn là mắt xích không thể thay thế trong chiến lược của Apple, từ sản xuất, tiêu thụ cho tới việc duy trì niềm tin của nhà đầu tư…
Sản lượng iPhone của Apple tại Ấn Độ tăng vọt 53% trong năm 2025, đạt 55 triệu máy – tương đương 1/4 sản lượng toàn cầu…
Khoảng 20% số việc làm bị cắt giảm từ đầu năm 2026 được cho là liên quan trực tiếp đến quá trình triển khai AI và tái cấu trúc hoạt động của các công ty công nghệ…