Các nhà sản xuất ô tô Trung Quốc đổ hàng tỷ USD vào cuộc đua điện toán và AI
"Kể từ nửa cuối năm nay, Li Auto đã gần như mua hết toàn bộ kho card GPU của các đại lý", một nguồn tin cho biết.
Cuộc chạy đua giành tài nguyên điện toán này, ban đầu do các công ty khởi nghiệp làm việc với các mô hình ngôn ngữ lớn thúc đẩy, giờ đã lan sang lĩnh vực ô tô. Các công ty như Li Auto, Huawei và Xpeng Motors cũng đang nỗ lực hết mình hướng tới khả năng tự hành hoàn toàn, đang đi đầu trong nỗ lực này.
Công nghệ lái xe thông minh toàn diện (E2E), hoạt động trên hàng tỷ thông số giống như các mô hình ngôn ngữ lớn (LLM), hướng đến quy mô lớn hơn nữa. Sức mạnh điện toán là nhiên liệu cho cỗ máy dữ liệu chuyên sâu này, biến cuộc săn tìm tài nguyên trở thành chiến trường mới trong lĩnh vực xe tự hành.
“Li Xiang thường hỏi tôi rằng chúng tôi có đủ sức mạnh tính toán không?”, Lang Xianpeng, giám đốc bộ phận lái xe thông minh tại Li Auto, cho biết. Li Auto được cho đã tích trữ hàng nghìn con chip hiệu suất cao và đang tích cực tìm kiếm các địa điểm mới để xây dựng trung tâm dữ liệu.
Vào tháng 7, năng lực điện toán đám mây của Li Auto đạt 2,4 exaflop (1 exaflop sẽ bằng 1.000 petaflop, tương đương 1 tỷ tỷ phép tính một giây). Đến cuối tháng 8, năng lực này đã tăng vọt lên 5,39 exaflop - tăng gần 3 exaflop trong vòng chưa đầy một tháng. Xpeng cũng có những mục tiêu đầy tham vọng tương tự, hướng đến mục tiêu mở rộng năng lực đám mây từ 2,51 lên 10 exaflop vào năm 2025. Huawei cũng tích cực không kém, tăng năng lực đào tạo từ 5 lên 7,5 exaflop chỉ trong hai tháng.
Các chuyên gia trong ngành nhấn mạnh rằng các nhà sản xuất ô tô chủ yếu dựa vào GPU H100 và A800 của Nvidia để đào tạo mô hình.
Với các hạn chế xuất khẩu của Mỹ có hiệu lực, A800 - mẫu máy cấp thấp của Nvidia - đã trở thành lựa chọn dễ tiếp cận nhất ở Trung Quốc. Một máy chủ được trang bị tám card A800 có giá khoảng 950.000 Nhân dân tệ (133.000 USD). Hoạt động ở độ chính xác FP16, mỗi card A800 cung cấp 320 teraflop, nghĩa là một exaflop sẽ cần khoảng 3.125 card A800 hoặc khoảng 390 mô-đun tám card.
Với mỗi mô-đun tám card có giá 950.000 Nhân dân tệ, việc đảm bảo một exaflop sức mạnh tính toán đòi hỏi khoản đầu tư khoảng 3,7 tỷ Nhân dân tệ (518 triệu USD). Điều này cho thấy, Li Auto đã chi hơn 1 tỷ Nhân dân tệ (140 triệu USD) cho chip GPU. Để Xpeng đạt được mục tiêu năm 2025, công ty sẽ cần đầu tư khoảng 3,7 tỷ Nhân dân tệ.
Bất chấp những khoản chi phí đáng kể này, các nhà sản xuất ô tô không thể chậm lại. Lái xe tự hành đã bước vào kỷ nguyên mới, được thúc đẩy bởi AI và dữ liệu thay vì lập trình dựa trên quy tắc. Để sản xuất hàng loạt các hệ thống lái xe tự hành E2E, các nhà sản xuất ô tô phải tăng gấp đôi cả thu thập dữ liệu và điện toán đám mây.
Tesla đã thiết lập chuẩn mực, với ước tính 67,5 exaflop sức mạnh tính toán AI, tương đương với khoảng 67.500 GPU Nvidia H100. Trong năm qua, tài nguyên GPU của Tesla đã tăng gấp sáu lần, giúp công ty này dẫn đầu. Sức mạnh tính toán hiện tại của Tesla là 67,5 exaflop, chiếm một phần đáng kể trong tổng số 910 exaflop toàn cầu của năm ngoái.
Mẫu xe tự lái hoàn toàn (FSD) mới nhất của Tesla, V12, được hỗ trợ bởi dữ liệu và khả năng tính toán khổng lồ này, mang đến trải nghiệm lái xe mượt mà hơn, giống con người hơn. Thành tựu này đã làm gia tăng sự cạnh tranh trong toàn ngành về dữ liệu và sức mạnh tính toán.
Nhu cầu dữ liệu của các nhà sản xuất ô tô
Lái xe tự động E2E phụ thuộc vào sự tương tác giữa dữ liệu và tài nguyên điện toán. Ví dụ, Tesla đã chỉ ra rằng các hệ thống tự động E2E mạnh mẽ đòi hỏi ít nhất một triệu đoạn video clip đa dạng, chất lượng cao. Với các tập dữ liệu được mở rộng thành mười triệu trường hợp, hiệu suất hệ thống được cải thiện đáng kể. Một chuyên gia trong ngành đã nói rằng mỗi đoạn video clip thường kéo dài 15–30 giây, mặc dù thời gian có thể thay đổi.
Quy mô thu thập dữ liệu của Tesla là vô song, với hàng triệu ô tô trên toàn cầu và ngay cả khi chỉ một phần nhỏ đóng góp dữ liệu, tiềm năng tích lũy một triệu đoạn clip đào tạo mỗi ngày. Một nguồn tin nói rằng việc đào tạo một mô hình 8 tỷ tham số trên đám mây cần ít nhất 10.000 giờ dữ liệu, được cập nhật hai tuần một lần.
Việc xây dựng vòng phản hồi dựa trên dữ liệu ngay từ đầu mang lại cho các nhà sản xuất ô tô lợi thế cạnh tranh, khiến các đối thủ khó có thể bắt kịp.
Li Auto đặt mục tiêu ra mắt hệ thống tự động E2E, được đào tạo trên hơn mười triệu đoạn clip, vào đầu năm tới. Người đứng đầu bộ phận lái xe thông minh của Xpeng, Li Liyun, gần đây đã thông báo rằng Xpeng đã tích lũy được 20 triệu clip để đào tạo mô hình.
Tuy nhiên, dữ liệu chất lượng cao không dễ có được. Elon Musk tiết lộ việc thu thập dữ liệu can thiệp có giá trị của người dùng - tài liệu đào tạo chất lượng cao - đang ngày càng trở nên khó khăn. Cứ mỗi 10.000 dặm lái xe, chỉ có một dặm hữu ích để đào tạo mạng nơ-ron FSD.
Li Auto cũng báo cáo rằng chỉ có 3% trong số 800.000 khách hàng của mình cung cấp dữ liệu chất lượng cao.
Các nhà sản xuất ô tô và các công ty AI thường dựa vào hai tập hợp dữ liệu chiến lược. Một cách tiếp cận khai thác dữ liệu từ những chiếc xe sản xuất, nơi các kỹ sư đặt ra các quy tắc cho hàng chục nghìn phương tiện đang hoạt động, lựa chọn và ẩn danh dữ liệu phù hợp với các tiêu chí này. Ngoài ra, các nhà cung cấp dịch vụ lái xe thông minh thường sử dụng những người lái xe có tay nghề cao để thu thập dữ liệu chất lượng cao, không có quyền truy cập vào những chiếc xe sản xuất.
Tuy nhiên, bản thân việc thu thập dữ liệu rất tốn kém. Một nhà cung cấp dịch vụ lái xe thông minh hàng đầu chi một khoản tiền chín con số Nhân dân tệ hàng năm chỉ cho việc truyền dữ liệu, trong khi các nhà sản xuất ô tô mới phải đối mặt với chi phí thậm chí còn cao hơn.
Việc trích xuất thông tin hữu ích từ khối lượng lớn dữ liệu hiện có cũng rất quan trọng, với dữ liệu chất lượng cao thúc đẩy các lần lặp lại hệ thống trên toàn bộ vòng phản hồi từ thu thập và làm sạch đến đào tạo, mô phỏng và xác thực.
Làm cho các hệ thống E2E có lợi nhuận
Các hệ thống tự hành E2E đang tiến gần hơn đến lợi nhuận. Tesla đã triển khai E2E FSD vào cuối năm 2023, với việc Musk chỉ đạo nhóm bán hàng cung cấp nhiều chuyến lái thử hơn do hiệu suất được cải thiện.
Năm 2024, Tesla đã giảm phí đăng ký hàng tháng từ 199 đô la xuống 99 USD và giá mua từ 12.000 USD xuống 4.500 USD để thúc đẩy việc áp dụng trên khắp Bắc Mỹ. Công ty cũng đã xác nhận kế hoạch ra mắt FSD tại Trung Quốc vào quý 1 năm 2025, điều này sẽ mở ra một ranh giới doanh thu mới.
Sự thay đổi này báo hiệu rằng công nghệ E2E đang tiến gần đến thương mại hóa hoàn toàn hơn bao giờ hết.
Tại Trung Quốc, các nỗ lực kiếm tiền đang được đẩy nhanh. Huawei đã thu được lợi nhuận sớm với sự hợp tác với Seres về Aito M7, đã đảm bảo 100.000 đơn đặt hàng trong vòng hai tháng, với hơn 60% lựa chọn phiên bản lái xe tự động.
Huawei cũng đã áp dụng mô hình đăng ký cho phần mềm lái xe thông minh của mình. Trong khi Tesla giảm giá, chi phí phần mềm của Huawei vẫn tăng đều đặn. Theo đại diện bán hàng của HarmonyOS, phần mềm lái xe tự động của Huawei có giá lần lượt là 3.000 Nhân dân tệ (420 USD), 6.000 Nhân dân tệ(840 USD) và 10.000 Nhân dân tệ (1.400 USD) cho phiên bản đầu tiên, thứ hai và thứ ba, với dự đoán sẽ còn tăng giá nữa.
Li Auto cũng đã củng cố thương hiệu của mình bằng tính năng lái xe thông minh, cung cấp khả năng E2E trên tất cả các mẫu xe Max. Do đó, mức độ hài lòng của người dùng đã tăng lên đáng kể.
Trong quý 2, Li Auto báo cáo rằng 70% số xe có giá trên 300.000 Nhân dân tệ (42.000 USD) được trang bị AD Max, hệ thống tự hành tiên tiến của hãng, có giá cao hơn 20.000 Nhân dân tệ (1.400 USD) so với mẫu xe Pro - phản ánh nhu cầu mạnh mẽ về các tính năng lái xe thông minh.
Mua GPU và xây dựng trung tâm dữ liệu
Ngoài việc bán xe để thu thập dữ liệu, các nhà sản xuất ô tô đang nhanh chóng xây dựng khả năng GPU của mình. Theo báo cáo thu nhập quý 3, Tesla hiện nắm giữ năng lực AI tương đương với 67.500 chip Nvidia H100 - tổng cộng khoảng 67,5 exaflop. Tesla đặt mục tiêu tăng năng lực này lên 88,5 exaflop bằng cách bổ sung thêm 21.000 chip H100 vào cuối tháng 10.
Ngoài các thương vụ mua lại GPU Nvidia đáng kể, Tesla cũng đang phát triển siêu máy tính Dojo nội bộ của mình, hướng đến mục tiêu đạt năng lực 100 exaflop, được hỗ trợ bởi 8.000 GPU H100 dự kiến vào cuối năm.
Cuộc cạnh tranh GPU ngày càng gay gắt này đang gây ra phản ứng từ các nhà sản xuất ô tô Trung Quốc. Do các hạn chế xuất khẩu của Hoa Kỳ, H100 của Nvidia khó mua hơn ở Trung Quốc, thúc đẩy các công ty ở đó phải dựa vào A800, một giải pháp thay thế giá cả phải chăng hơn nhưng kém mạnh mẽ hơn.
Hiện tại, Huawei dẫn đầu về sức mạnh điện toán tại Trung Quốc, với 7,5 exaflop có được từ cả GPU Nvidia và chip Ascend của riêng mình. Trong khi chuỗi công cụ của Ascend có những hạn chế, nguồn cung cấp độc quyền của Huawei đảm bảo tiến độ ổn định trong xử lý đám mây.
Sau Huawei, Li Auto nắm giữ 5,39 exaflop dung lượng, đạt được với khoảng 10.000 GPU Nvidia. Theo ước tính của ngành, để đạt được dung lượng này với chip A800 sẽ cần khoảng 16.800 đơn vị. GPU đám mây đã trở nên dễ tiếp cận hơn kể từ năm ngoái, với máy chủ A800 có giá khoảng 950.000 RMB cho mỗi mô-đun tám thẻ. Tuy nhiên, đạt được sức mạnh tính toán như vậy vẫn là một nỗ lực tài chính đáng kể đối với các nhà sản xuất ô tô Trung Quốc.
Li Auto đặt mục tiêu đạt 8 exaflop vào cuối năm, gần đây đã hợp tác với Volcano Engine để thành lập một trung tâm dữ liệu chung, với việc mở rộng hơn nữa đang được xem xét. Trong khi đó, Xpeng đã đạt 2,51 exaflop - khoảng 7.800 GPU A800 - và đặt mục tiêu đạt 10 exaflops vào năm 2025. Nio hiện đang tụt hậu với 1,4 exaflop, hay khoảng 4.300 thẻ A800.
Để biết bối cảnh, năng lực tính toán quốc gia của Trung Quốc là 246 exaflop tính đến tháng 6 năm 2024, tương đương với khoảng 492 exaflop ở độ chính xác FP16. Huawei, Li Auto, Xpeng và Nio cùng nhau đóng góp khoảng 3,5% tổng số quốc gia này.
Trong cuộc đua này, các công ty nhỏ hơn đang đạt được những bước tiến thông qua quan hệ đối tác: IM Motors hợp tác với Momenta và Great Wall Motors đã hợp tác với DeepRoute.ai để đẩy nhanh quá trình thâm nhập thị trường.
Bối cảnh mô hình AI toàn cầu đã đạt đến quy mô chưa từng có, với một số công ty Trung Quốc đầu tư hơn 50 triệu USD chỉ để tham gia vào lĩnh vực này. Các công ty AI hàng đầu của Trung Quốc hiện đang xây dựng các mô hình tham số nghìn tỷ, được thúc đẩy bởi các nguồn tài nguyên điện toán mở rộng, với các công ty như Kimi và Stepfun lắp ráp các cụm GPU khổng lồ hợp tác với các nhà cung cấp dịch vụ đám mây.
Một sự thay đổi song song đang nổi lên trong ngành công nghiệp ô tô. Các nhà sản xuất ô tô đang phát triển từ những người bán ô tô thông thường thành các công ty công nghệ do AI thúc đẩy, tận dụng dữ liệu khổng lồ và các nguồn tài nguyên điện toán để thúc đẩy các phương tiện hoàn toàn tự động và trí thông minh tích hợp.
Trong lĩnh vực cạnh tranh khốc liệt, biên lợi nhuận thấp này, việc theo đuổi sức mạnh điện toán lớn hơn là không ngừng nghỉ, với cuộc chiến giá cả đang diễn ra báo hiệu rằng sự khác biệt của AI có thể là chìa khóa cuối cùng. Đối với các nhà sản xuất ô tô, trò chơi điện toán có mức cược cao hiện chỉ mới bắt đầu.