image Thứ Ba, 07/04/2026

Microsoft tăng hiệu suất ChatGPT với chip AI nội bộ, có thể cạnh tranh với Nvidia và Intel

Gia Linh

18/11/2023

Chia sẻ

Microsoft đã cho ra mắt hai loại chip mới là Maia 100 và Cobalt 100 Arm tại sự kiện Ignite, Seattle…

Chip Maia mới của Microsoft sẽ được sử dụng trong các trung tâm dữ liệu để tối ưu hóa hiệu suất AI
Chip Maia mới của Microsoft sẽ được sử dụng trong các trung tâm dữ liệu để tối ưu hóa hiệu suất AI

Trong sự kiện gần đây, Microsoft đã cho ra mắt hai loại chip AI nội bộ, nhằm mục đích tăng hiệu suất các sản phẩm AI như ChatGPT và giảm thiểu chi phí. Trong đó, chip AI Maia 100 được sử dụng để xử lý đồ họa AI, dùng trong các trung tâm dữ liệu, có thể cạnh tranh với chip do Nvidia sản xuất,. Với chip còn lại là Cobalt 100 Arm thì có những tác vụ tính toán, sử dụng trong các dịch vụ phần mềm dựa trên đám mây, nhằm cạnh tranh với bộ vi xử lý của Intel.

Việc gia công hàng loạt loại chip trên sẽ được thực hiện bởi công ty sản xuất chip Đài Loan, nhà sản xuất chip theo hợp đồng lớn nhất thế giới. Theo như chia sẻ của bà Rani Borkar, Phó Chủ tịch công ty trong một buổi phỏng vấn với CNBC, phiên bản máy ảo chạy trên chip Cobalt sẽ có sẵn trên thị trường thông qua đám mây Azure của Microsoft vào năm 2024. Tuy nhiên thời gian cụ thể phát hành chip Maia 100 vẫn chưa được thông báo. 

Hiện nay, việc áp dụng bộ xử lý Cobalt đang tiến hành nhanh hơn so với việc thử nghiệm chip AI Maia 100. Gã khổng lồ công nghệ này đã cho chạy thử ứng dụng Teams và dịch vụ cơ sở dữ liệu Azure SQL trên bộ chip mới. Và cho đến nay, chúng đã hoạt động tốt hơn cỡ 40% so với chip dựa trên Arm hiện có của Azure đến từ công ty khởi nghiệp Ampere.

Microsoft đang thử nghiệm cách Maia 100 đáp ứng nhu cầu của chatbot AI của công cụ tìm kiếm Bing (hiện được gọi là Copilot thay vì Bing Chat), trợ lý mã hóa GitHub Copilot và GPT-3.5-Turbo, một mô hình ngôn ngữ lớn từ OpenAI do Microsoft hậu thuẫn. OpenAI đã cung cấp cho các mô hình ngôn ngữ của mình một lượng lớn thông tin từ internet và chúng có thể tạo email, tóm tắt tài liệu và trả lời các câu hỏi bằng một vài lời hướng dẫn của con người.

Ngoài việc thiết kế chip Maia, Microsoft còn phát minh ra phần cứng làm mát bằng chất lỏng tùy chỉnh có tên Sidekicks, đặt vừa trong các giá đỡ ngay cạnh các giá đỡ chứa máy chủ Maia.

Với GPU, việc tận dụng tối đa không gian hạn chế của trung tâm dữ liệu có thể đặt ra nhiều thách thức. Steve Tuck, đồng sáng lập và CEO của công ty khởi nghiệp máy chủ Oxide Computer, cho biết: Các công ty đôi khi đặt một vài máy chủ chứa GPU ở dưới cùng của giá đỡ để tránh tình trạng quá nóng, thay vì chất đầy giá từ trên xuống dưới. 

Các công ty công nghệ giàu tiền mặt đã bắt đầu cung cấp cho khách hàng của họ nhiều lựa chọn hơn về cơ sở hạ tầng đám mây mà họ có thể sử dụng để chạy các ứng dụng. Việc sản xuất phần cứng AI nội bộ cho phép các công ty tăng hiệu quả xử lý dữ liệu và khả năng cạnh tranh của các dịch vụ như chatbot và phần mềm xử lý hình ảnh.

Nvidia có trụ sở tại Mỹ nắm giữ khoảng 80% thị trường chip AI. Nhu cầu đã tăng vọt cùng với sự bùng nổ của AI, với những con chip tiên tiến đôi khi được bán với giá từ 30.000 đến 40.000 USD. Đã có khoảng 10.000 con chip được cho là đã được sử dụng để phát triển ChatGPT, khiến chi phí của chúng trở thành gánh nặng đáng kể đối với các công ty AI.

Microsoft trước đây từng tham gia phát triển chip bán dẫn, chủ yếu dành cho máy chơi game và thực tế tăng cường. Nhưng phải đến động thái gần đây nhất mới thể hiện rõ sự thâm nhập toàn diện vào lĩnh vực này của gã khổng lồ, kết hợp các chip nội bộ vào cơ sở hạ tầng đóng vai trò là xương sống của phần mềm kinh doanh của họ.

Microsoft có liên minh kinh doanh và vốn với nhà phát triển OpenAI tại Mỹ của Chat GPT, cho phép công ty này cung cấp công nghệ AI của công ty khởi nghiệp cho các công ty và khách hàng khác thông qua đám mây và kết hợp AI vào công cụ tìm kiếm Bing của mình.

Hầu hết các dịch vụ AI đều dựa trên máy chủ của trung tâm dữ liệu. Bằng cách sử dụng các chip nội bộ chuyên dụng cho AI tổng quát trong các trung tâm dữ liệu của mình, Microsoft đặt mục tiêu vừa cải thiện hiệu suất vừa giảm chi phí mua sắm và vận hành.

Truyền thông Mỹ đưa tin, việc sử dụng chip nội bộ có thể giảm 1/3 chi phí vận hành các dịch vụ AI.

Tại sự kiện Ignite mới đây, Microsoft cũng đã công bố giới thiệu các chức năng AI cho phần mềm kinh doanh 365 của mình và sự hợp tác mới với các công ty chip lớn như Advanced Micro Devices và Nvidia.

Công ty cũng thông báo triển khai AI GPT-4 Turbo mới nhất của OpenAI, có thể xử lý các lời nhắc dài hơn.


Trung Quốc xây mạng lưới AI “giá rẻ”, cứu doanh nghiệp nhỏ khỏi áp lực chi phí

Mạng lưới này được thiết kế với mục tiêu phủ rộng, giảm chi phí và nâng cao chất lượng dịch vụ, qua đó hạ thấp rào cản tiếp cận tài nguyên tính toán cho các SME...

11:19 06/04/2026
SpaceX bí mật nộp hồ sơ chào bán cổ phiếu, dự báo thương vụ IPO lớn nhất lịch sử

Thương vụ này được cho là có thể huy động từ 40 tỷ đến 80 tỷ USD – con số đủ để đưa SpaceX vào nhóm những đợt IPO lớn nhất từng được thực hiện trên toàn cầu…

16:44 03/04/2026
Chương trình Đối tác 20 triệu USD của Esports Foundation chính thức có đại diện Việt Nam

GAM Esports vừa gia nhập danh sách 40 câu lạc bộ thuộc Chương trình Đối tác 20 triệu USD của Esports Foundation, tiếp cận mạng lưới hơn 300 triệu người hâm mộ toàn cầu...

16:44 03/04/2026
Cuộc đua khốc liệt tạo video bằng AI sau quyết định “khai tử” Sora AI của OpenAI

Sora nhanh chóng phải dừng lại khi tài nguyên được công ty mẹ ưu tiên sử dụng vào mục đích khác trong bối cảnh đối thủ cạnh tranh ngày càng mạnh…

15:31 02/04/2026
Ngành chip châu Á đối mặt “cú siết” nguồn cung naphtha

Cuộc khủng hoảng nguồn cung naphtha – nguyên liệu đầu vào quan trọng của ngành hóa dầu và sản xuất bán dẫn – đang lan rộng khắp châu Á trong bối cảnh căng thẳng địa chính trị tại Trung Đông leo thang...

16:37 01/04/2026
Sony bắt tay hãng Trung Quốc TCL, “chia đôi quyền lực” mảng TV BRAVIA

Điểm gây tranh cãi lớn nhất chính là cơ cấu sở hữu: TCL nắm 51% cổ phần, trong khi Sony giữ 49%...

16:34 01/04/2026
Đầu tư vào viễn thông Trung Quốc năm 2026 dự báo giảm mạnh nhất trong vòng 15 năm

Chi tiêu vốn (capex) của các nhà mạng quốc doanh Trung Quốc được dự báo sẽ giảm xuống mức thấp nhất trong vòng 15 năm vào năm 2026, khi làn sóng đầu tư cho hạ tầng 5G đã đi qua giai đoạn cao trào...

16:33 01/04/2026
Trung Quốc: Nhiều tổ chức kêu gọi chính phủ thiết lập "giới hạn đỏ" với AI

Các cố vấn chính phủ Trung Quốc cảnh báo việc phát triển và ứng dụng AI nếu thiếu kiểm soát có thể gây ra những hệ lụy nghiêm trọng về việc làm và an ninh dữ liệu. Họ kêu gọi thiết lập các “lằn ranh đỏ” cho công nghệ này…

09:51 31/03/2026
Doanh nghiệp lượng tử thế giới “đua” lên sàn

Làn sóng niêm yết của các công ty lượng tử diễn ra trong bối cảnh thị trường toàn cầu đầy biến động, khi các xung đột địa chính trị làm suy giảm niềm tin của nhà đầu tư, đặc biệt với các tài sản rủi ro cao như công nghệ mới nổi…

09:50 31/03/2026
Cổ phiếu chip nhớ “bốc hơi” 100 tỷ USD sau một nghiên cứu của Google Research

Nguyên nhân đến từ một nghiên cứu mới của Google Research, cho thấy các trung tâm dữ liệu AI trong tương lai có thể cần ít bộ nhớ hơn đáng kể so với kỳ vọng trước đó...

14:27 30/03/2026