Một công ty khởi nghiệp AI vẫn sống tốt dù không sử dụng chip của Nvidia
Hầu hết công ty trong lĩnh vực AI đều tin tưởng tuyệt đối vào chip Nvidia. Tuy nhiên, Giám đốc Điều hành Lamini AI Sharon Zhou là ngoại lệ khi lựa chọn GPU của AMD trên hành trình khởi nghiệp công ty…
Năm ngoái, trong cơn sốt và tham vọng trí tuệ nhân tạo, các CEO công nghệ đã dành rất nhiều thời gian để tìm kiếm và thương thảo với Nvidia, theo Business Insider.
Con chip của gã khổng lồ Santa Clara, được gọi là GPU, đã trở thành tài sản nóng nhất trong bối cảnh AI tạo sinh ngày càng bùng nổ. Một số nhân vật quyền lực như Mark Zuckerberg và Sam Altman đang chạy đua để đảm bảo nguồn tài nguyên điện toán cần thiết, cung cấp năng lượng cho một số mô hình AI như ChatGPT.
Tuy nhiên, có một công ty khởi nghiệp AI không chịu khuất phục trước tỷ phú Jensen Huang, Nvidia và đế chế GPU trị giá 2,2 nghìn tỷ USD. Đó chính là Sharon Zhou.
THÀNH CÔNG Ở TUỔI 30
CEO Sharon Zhou gây dựng sự nghiệp khá thành công dù mới 30 tuổi. Cô là người đầu tiên tốt nghiệp hai chuyên ngành văn học cổ điển và khoa học máy tính tại Đại học Harvard (Hoa Kỳ). Cô nhận bằng tiến sĩ AI tạo sinh tại Đại học Stanford dưới sự hướng dẫn của giáo sư Andrew Ng, nhà nghiên cứu tiên phong trong lĩnh vực học máy. Cô còn là giảng viên thỉnh giảng tại Stanford, dành thời gian cho việc giảng dạy trực tuyến và đầu tư mạo hiểm.
Trước đó, cô nhận được lời mời tham gia nhóm sáng lập ban đầu từ Anthropic, đối thủ OpenAI vừa thành công huy động thêm 2,75 tỷ USD từ Amazon. Tuy nhiên, tham vọng lớn đã đưa cô theo đuổi con đường khác - xây dựng công ty khởi nghiệp AI của riêng mình.
AI CẦN CHIP CỦA NVIDIA?
Tháng 4 năm ngoái, doanh nhân trẻ Zhou và người đồng sáng lập Greg Diamos chính thức trình làng Lamini AI. Công ty tham vọng trở thành đơn vị cung cấp một nền tảng giúp doanh nghiệp dễ dàng đào tạo và xây dựng mô hình ngôn ngữ tùy chỉnh chỉ với "vài dòng mã".
Hiểu một cách đơn giản rằng, doanh nghiệp có thể sử dụng mô hình nền tảng như GPT từ OpenAI và dễ dàng tinh chỉnh mô hình đó bằng dữ liệu của riêng mình. "Những gì chúng tôi đang làm giúp mọi doanh nghiệp có cơ sở dữ liệu của OpenAI nhưng chứa nhiều thông tin nội bộ", cô Zhou chia sẻ.
Tuy nhiên, một thông tin thú vị khác xuất hiện vài tháng sau đó. Vào tháng 9, cô Zhou tiết lộ nền tảng Lamini xây dựng mô hình ngôn ngữ lớn (LLM) tùy chỉnh với khách hàng trong năm qua bằng cách sử dụng độc quyền GPU từ đối thủ chính của Nvidia - AMD, gã khổng lồ chip do nữ CEO Lisa Su điều hành.
Đó là vấn đề lớn vì hầu hết mọi hãng công nghệ đều mong muốn H100 - GPU mà Nvidia đã phải vật lộn để đáp ứng nhu cầu trong bối cảnh nguồn cung hạn chế. Tiết lộ của Lamini thậm chí còn đi kèm với video Sharon Zhou trêu chọc Nvidia về sự thiếu hụt.
Tuy nhiên, CEO Lamini thừa nhận, việc bỏ qua lựa chọn mà bất cứ ai trong lĩnh vực AI tạo sinh đều khao khát quả không phải quyết định dễ dàng. "Để ra quyết định cần quá trình cân nhắc kỹ lưỡng, đây không phải là quyết định nhỏ", cô nói.
NVIDIA KHÔNG CÒN “ĐỘC TÔN”
Dẫu vậy, có một vài yếu tố góp phần thúc đẩy quyết định này. Đầu tiên, người đồng sáng lập Diamos đóng vai trò quan trọng khi khẳng định các GPU không phải của Nvidia vẫn có thể hoạt động tốt.
Là cựu kiến trúc sư phần mềm tại Nvidia, anh Diamos hiểu rằng mặc dù phần cứng GPU rất quan trọng để hiệu suất các mô hình AI đạt tối đa. Tuy nhiên anh cũng chỉ ra sức mạnh tính toán, phần mềm quan trọng không kém thông qua bài báo về "quy luật mở rộng" do chính anh là đồng tác giả.
Anh còn là nhân chứng cho điều đó khi làm việc trên CUDA, phần mềm được Nvidia phát triển lần đầu từ những năm 2000. Giải pháp giúp việc sử dụng mô hình AI với GPU như H100 và chip Blackwell mới của Nvidia trở nên đơn giản như hệ thống plug-and-play (tính năng tự động nhận diện và cấu hình các thiết bị khi chúng được kết nối vào hệ thống).
Vì vậy, rõ ràng nếu một công ty khác có thể xây dựng hệ sinh thái phần mềm tương tự xung quanh GPU, không có lý do gì mà họ không thể cạnh tranh với Nvidia. Sau khi tham khảo ý kiến của người cộng sự, CEO Zhou nhận thấy AMD đang từng bước xây dựng hệ thống cạnh tranh với Nvidia và có kế hoạch thử nghiệm sau này.
CEO Lamini nhận ra các doanh nghiệp rất "hào hứng sử dụng mô hình ngôn ngữ lớn", nhưng nhiều người có thể không muốn hoặc không đủ khả năng để chờ đợi Nvidia đáp ứng đủ GPU cần thiết.
Ngoài ra, AMD cũng chứng minh được giá trị công ty đối với tham vọng của nữ doanh nhân. Nhờ lượng GPU có sẵn, cô tự tin Lamini có thể cung cấp "cơ sở hạ tầng giúp đáp ứng nhu cầu tăng vọt" với LLM.
"Điều này là do Lamini sử dụng toàn bộ khả năng tính toán LLM với hiệu suất gấp 10 lần, giúp mở rộng quy mô nhanh chóng mà không bị hạn chế về nguồn cung, thông qua tùy chọn tính toán không phụ thuộc vào nhà cung cấp, tức là khách hàng không thể nhận ra khi sử dụng Lamini trên GPU Nvidia hay AMD", cô giải thích.
Không có gì ngạc nhiên khi công ty sẵn sàng tăng cường hợp tác với AMD. Đầu năm, Sharon Zhou chia sẻ trên mạng xã hội X về hình ảnh MI300X - chip mới của AMD, được CEO Lisa Su công bố lần đầu vào tháng 12 năm ngoái với tư cách là "bộ tăng tốc hiệu suất cao nhất thế giới", hiện đang sản xuất tại Lamini.
Tỷ phú Jensen Huang đang lãnh đạo một trong những công ty quyền lực nhất tại Thung lũng Silicon, nhưng sự cạnh tranh đang dần đến, như cách Sharon Zhou nói về AMD: "Họ có con ngựa chiến mạnh mẽ trong cuộc đua này".