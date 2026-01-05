Trong làn sóng AI hiện nay, sức mạnh tính toán không chỉ nằm ở con chip đơn lẻ, mà được quyết định bởi cách nhiều con chip được ghép lại thành một "khối tính toán" thống nhất. Bởi vậy, đóng gói, từng được xem là khâu hậu cần, nay đã vươn lên thành mặt trận trung tâm của chuỗi giá trị bán dẫn...

Doanh thu toàn cầu của ngành bán dẫn có thể tăng từ khoảng 650 tỷ USD năm 2024 lên hơn 1.000 tỷ USD vào cuối thập kỷ này. Tuy nhiên, tăng trưởng ngành cao không đồng nghĩa nguồn cung sẽ bùng nổ.

Theo các phân tích, chip AI chỉ chiếm chưa đến 0,2% tổng số wafer được sản xuất trong năm 2024, nhưng lại tạo ra tới khoảng 20% doanh thu toàn ngành bán dẫn, khiến dòng vốn và năng lực sản xuất đang dần tập trung vào phân khúc này, mà gia tăng tình trạng khan hiếm chip ở nhiều phân khúc khác. Do đó, bản chất khủng hoảng nguồn cung chip hiện nay khác hẳn so với giai đoạn thiếu GPU trong thời kỳ đại dịch.

Trong giai đoạn 2020–2021, nhu cầu của người tiêu dùng tăng đột biến, chuỗi cung ứng dù bị đứt gãy, nhưng phần lớn nhu cầu vẫn là các sản phẩm bán dẫn phổ thông, nên có thể nhanh chóng mở rộng sản xuất để đáp ứng nhu cầu thị trường.

Trong khi đó hiện nay, các công ty lại chuyển hướng sang phát triển chip AI. Tuy nhiên, sản xuất các bộ tăng tốc AI đòi hỏi những công nghệ tiên tiến bậc nhất. Điều này khiến việc tăng nguồn cung không chỉ khó khăn, mà còn kéo theo tác động dây chuyền khan hiếm trong các phân khúc khác.

Dĩ nhiên, các nhà sản xuất bộ nhớ cũng đang ưu tiên phát triển bộ nhớ băng thông cao (HBM) cho các bộ tăng tốc AI, kết quả là nguồn cung bộ nhớ DRAM thông dụng giảm đi đáng kể.

Tác động của sự khan hiếm không chỉ dừng lại ở các trung tâm dữ liệu siêu lớn, mà nhanh chóng lan sang PC, máy chủ và nhiều thiết bị khác. Đây là một trong những lý do khiến giá phần cứng tiêu dùng bị đẩy giá cao hơn trong thời gian gần đây.

Đáng chú ý, Micron, một trong ba nhà sản xuất DRAM lớn nhất thế giới, mới đây đã tuyên bố rút khỏi bộ nhớ tiêu dùng để dồn nguồn lực cho các dòng sản phẩm có biên lợi nhuận cao hơn như trong lĩnh vực AI. Động thái này đã phần nào phản ánh sự dịch chuyển trong ngành bộ nhớ.

Cùng với đó, HBM là bài toán khó cả về sản xuất lẫn đóng gói. So với DRAM tiêu chuẩn, HBM tiêu tốn nhiều tài nguyên wafer hơn. Theo Stacy Rasgon, Giám đốc điều hành kiêm nhà phân tích cấp cao tại Bernstein, để sản xuất một gigabyte HBM có thể cần lượng wafer “gấp ba hoặc bốn lần” so với sản xuất một gigabyte DDR5. Dù vậy, các dự báo chỉ ra, thị trường HBM có thể tăng trưởng gấp 4 lần, vượt mốc 100 tỷ USD vào năm 2030.

Chưa kể “ngành bán dẫn vốn rất thận trọng. Nỗi lo dư thừa công suất luôn khiến các doanh nghiệp chùn tay”, BenBajarin, nhà phân tích của Creative Strategies, nói với Tom’s Hardware. Xây dựng và vận hành một nhà máy sản xuất chip không chỉ tốn kém, mà còn cần nhiều năm chuẩn bị. Trong tình hình đó, dù nhu cầu đối với chip AI đang tăng mạnh, các hãng vẫn dè dặt mở rộng công suất nếu chưa nhìn thấy lợi nhuận dài hạn đủ chắc chắn. Nỗi lo dư thừa trong tương được cần cân nhắc kỹ lưỡng bất chấp tình hình khan hiếm hiện tại.

Bên cạnh đó, trong làn sóng AI hiện nay, sức mạnh tính toán cũng không còn chỉ nằm ở con chip đơn lẻ, mà được quyết định bởi cách nhiều con chip được ghép lại thành một "khối tính toán" thống nhất. Bởi vậy, đóng gói, từng được xem là khâu hậu cần, nay cũng đã vươn lên thành mặt trận trung tâm của chuỗi cung ứng bán dẫn.

Toàn ngành đang dốc sức mở rộng năng lực CoWoS, công nghệ đóng gói bán dẫn tiên tiến, song ngay cả các doanh nghiệp trực tiếp tham gia cũng thừa nhận: đây là cuộc đua khó tăng tốc trong thời gian ngắn.

CEO Nvidia Jensen Huang cho biết đến năm 2025 năng lực đóng gói tiên tiến của ngành đã tăng gấp bốn lần chỉ trong chưa đầy hai năm. Tuy nhiên, với Nvidia, CoWoS vẫn là điểm nghẽn lớn để gia tăng nguồn cung chip phục vụ AI. Nói cách khác, ngay cả khi chip logic đã sẵn, bộ nhớ đã có, thì khâu “lắp ráp” chúng thành các bộ tăng tốc AI hoàn chỉnh vẫn không theo kịp tốc độ bùng nổ của nhu cầu thị trường.

Theo dự báo của TrendForce, công suất CoWoS của gã khổng lồ TSMC có thể đạt khoảng 75.000 wafer mỗi tháng trong năm 2025, và tăng lên khoảng 120.000–130.000 wafer mỗi tháng vào cuối năm 2026. Đây là bước nhảy vọt về công suất so với hiện tại, nhưng theo giới phân tích, nguồn cung này vẫn khó có thể đáp ứng nhu cầu đang leo thang theo cấp số nhân từ các hệ thống AI quy mô lớn.

Chi tiêu vốn (CapEx) của bốn “ông lớn” điện toán đám mây Amazon, Google, Microsoft và Meta, đã tăng gấp đôi chỉ trong vòng hai năm, lên khoảng 600 tỷ USD mỗi năm. Dòng tiền khổng lồ này đang đổ dồn vào hạ tầng AI, kéo theo nhu cầu chưa từng có đối với chip AI tiên tiến và bộ nhớ HBM.

Câu hỏi về thời điểm thị trường tự điều chỉnh và nguồn cung trở lại trạng thái bình thường, như thường lệ trong ngành bán dẫn gần như không có câu trả lời chắc chắn. Theo các chuyên gia, chừng nào thế giới còn đang trong giai đoạn xây dựng hạ tầng xoay quanh AI, thì nguồn cung sẽ còn khan hiếm, ít nhất là trong tương lai gần. Lý do không chỉ nằm ở nhu cầu tăng nhanh, mà còn ở nỗi lo dư thừa công suất luôn thường trực, khiến các công ty trong ngành bán dẫn dù chuyển dịch hướng phát triển song không thể nhanh chóng gia tăng nguồn cung.