Startup Ấn Độ ra mắt nền tảng AI không cần GPU
Hoàng Hà
07/05/2025
Bud Runtime cho phép các tổ chức tận dụng hạ tầng phần cứng hiện có – chủ yếu là CPU – để triển khai các mô hình AI mà không cần phụ thuộc vào GPU...
Bud Ecosystem, một công ty khởi nghiệp nghiên cứu trí tuệ nhân tạo sáng tạo (GenAI) đến từ Ấn Độ, vừa công bố Bud Runtime, một giải pháp tiên phong cho phép triển khai các mô hình AI sáng tạo trên hạ tầng dựa trên CPU. Giải pháp này không chỉ giúp giảm đáng kể chi phí mà còn tăng khả năng tiếp cận công nghệ GenAI, đặc biệt cho các tổ chức không đủ nguồn lực để đầu tư vào các đơn vị xử lý đồ họa (GPU) đắt đỏ.
GIẢI QUYẾT THÁCH THỨC CHI PHÍ VÀ MÔI TRƯỜNG
Với sự bùng nổ của GenAI, chi phí tài chính và tác động môi trường của việc triển khai các mô hình AI ngày càng trở thành rào cản lớn. Các mô hình GenAI thường yêu cầu GPU chuyên dụng, vốn không chỉ đắt tiền mà còn khan hiếm do nhu cầu toàn cầu tăng cao. Bud Runtime ra đời để giải quyết vấn đề này, cho phép các tổ chức tận dụng hạ tầng phần cứng hiện có – chủ yếu là CPU – để triển khai các mô hình AI mà không cần phụ thuộc vào GPU.
Nền tảng này hỗ trợ suy luận trên CPU (CPU inference) bên cạnh các loại phần cứng khác như GPU, HPU (Habana Processing Unit), TPU (Tensor Processing Unit), và NPU (Neural Processing Unit) từ các nhà cung cấp hàng đầu như Nvidia, Intel, AMD, và Huawei. Điểm nổi bật của Bud Runtime là tính năng heterogeneous cluster parallelism, cho phép phân phối khối lượng công việc AI trên các môi trường phần cứng hỗn hợp. Điều này không chỉ giúp mở rộng quy mô dễ dàng mà còn giảm áp lực lên nguồn cung GPU khan hiếm.
Chia sẻ về quá trình phát triển, Jithin VG, Giám đốc điều hành của Bud Ecosystem, cho biết: “Chúng tôi bắt đầu hành trình GenAI vào đầu năm 2023 và nhanh chóng nhận ra chi phí cao của GPU là một rào cản lớn”.
Để vượt qua thách thức này, đội ngũ Bud Ecosystem đã xây dựng phiên bản đầu tiên của Bud Runtime, được thiết kế để chạy các mô hình AI nhỏ trên hạ tầng hiện có. Họ cũng tối ưu hóa để hỗ trợ các mô hình tầm trung trên CPU và đảm bảo khả năng tương thích với phần cứng từ nhiều nhà sản xuất, bao gồm Nvidia, AMD, Intel, và Huawei. Nhờ đó, Bud Runtime mang lại một giải pháp linh hoạt, phù hợp với nhiều loại hình tổ chức, từ startup đến viện nghiên cứu.
Một trong những lợi thế lớn nhất của Bud Runtime là chi phí triển khai thấp. Các công ty có thể bắt đầu dự án GenAI với mức chi phí chỉ từ 200 USD/tháng, thấp hơn đáng kể so với các giải pháp dựa trên GPU truyền thống. Điều này đặc biệt có ý nghĩa với các startup và tổ chức nghiên cứu, vốn thường bị loại khỏi cuộc chơi AI do chi phí cao.
HỢP TÁC VỚI CÁC ÔNG LỚN CÔNG NGHỆ
Sự ra mắt của Bud Runtime là kết quả của những nỗ lực hợp tác lâu dài giữa Bud Ecosystem và các gã khổng lồ công nghệ như Intel, Microsoft, Infosys và LTIM. Trong 18 tháng qua, Bud Ecosystem đã làm việc chặt chẽ với Intel để tối ưu hóa suy luận GenAI trên CPU Intel Xeon và bộ tăng tốc Gaudi. Sự hợp tác này không chỉ giúp nâng cao hiệu suất của Bud Runtime mà còn củng cố vị thế của công ty trong lĩnh vực AI sáng tạo.
Linson Joseph, Giám đốc chiến lược của Bud Ecosystem, cho biết công ty muốn “dân chủ hóa GenAI” trên quy mô lớn bằng cách biến AI thành hàng hóa (commoditization). “Điều này chỉ khả thi nếu chúng ta sử dụng phần cứng thông dụng để triển khai GenAI một cách rộng rãi”, Giám đốc chiến lược Linson Joseph cho biết.
Tầm nhìn của Bud Ecosystem không chỉ dừng lại ở việc giảm chi phí mà còn hướng tới việc làm cho GenAI trở nên dễ tiếp cận hơn, đặc biệt ở các thị trường đang phát triển như Ấn Độ và các khu vực có nguồn lực hạn chế.
Theo Techcrunch, được thành lập với trọng tâm là nghiên cứu AI cơ bản, Bud Ecosystem đã đạt được nhiều bước tiến đáng kể trong các lĩnh vực như Kiến trúc transformer cho môi trường tài nguyên thấp; Mô hình suy luận lai (hybrid inference models) và Hệ thống AI phân tán (decentralized AI systems).
Công ty đã công bố nhiều bài nghiên cứu và phát hành hơn 20 mô hình mã nguồn mở, đóng góp tích cực cho cộng đồng AI toàn cầu. Đáng chú ý, Bud Ecosystem là công ty khởi nghiệp Ấn Độ duy nhất từng đứng đầu bảng xếp hạng LLM của Hugging Face với một mô hình có hiệu suất ngang ngửa GPT-3.5, khẳng định năng lực cạnh tranh với các gã khổng lồ công nghệ quốc tế.
Bud Runtime không chỉ là một giải pháp kỹ thuật mà còn là một bước tiến chiến lược để định hình lại cách các tổ chức tiếp cận GenAI. Bằng cách giảm sự phụ thuộc vào GPU và tận dụng phần cứng thông dụng, Bud Ecosystem đang mở ra cơ hội cho các doanh nghiệp nhỏ, viện nghiên cứu và các thị trường mới nổi tham gia vào cuộc cách mạng AI. Với mức chi phí thấp và khả năng tương thích đa dạng, nền tảng này hứa hẹn sẽ thúc đẩy sự đổi mới trong nhiều lĩnh vực, từ chăm sóc sức khỏe, giáo dục đến tài chính và logistics.
Sự hợp tác với các đối tác lớn như Intel và Microsoft, cùng với những thành tựu nghiên cứu ấn tượng, cho thấy Bud Ecosystem không chỉ là một công ty khởi nghiệp mà còn là một nhân tố quan trọng trong hệ sinh thái GenAI toàn cầu. Techcrunch cho rằng trong bối cảnh các công nghệ AI ngày càng trở nên thiết yếu, Bud Runtime có thể trở thành một công cụ thay đổi cuộc chơi, giúp GenAI không còn là sân chơi của những gã khổng lồ mà là tài sản chung của mọi tổ chức.
Các doanh nghiệp làm đẹp đang tìm cách tận dụng công nghệ mô phỏng và trí tuệ nhân tạo để rút ngắn chu kỳ đổi mới trong bối cảnh cạnh tranh ngày càng gia tăng...
Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau cho thấy các chatbot AI dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa...
Meta đang phát triển phiên bản "Mark Zuckerberg AI" có khả năng giao tiếp trực tiếp với nhân viên. Đây là một phần trong chiến lược lớn hơn nhằm tái định hình tập đoàn xoay quanh AI và tham vọng “siêu trí tuệ cá nhân”...
Hầu hết những thua lỗ trên thị trường chứng khoán đến từ việc đầu tư theo cảm tính, bị cuốn đi bởi "lòng tham và nỗi sợ hãi". Không có một triết lý đầu tư phù hợp, khả năng phân tích và ra quyết định đúng dựa trên số liệu là hạn chế lớn nhất của các nhà đầu tư cá nhân...
Trung Quốc đang đẩy nhanh việc tích hợp giữa năng lượng và tính toán như một ưu tiên quốc gia...
Trong bối cảnh cạnh tranh nhân tài ngày càng gay gắt, trải nghiệm nhân viên (EX – Employee Experience) được đánh giá không chỉ là một xu hướng, mà đang trở thành yếu tố cốt lõi quyết định sự gắn bó, giữ chân nhân tài và hiệu suất của đội ngũ…
Các vụ mua lại được kỳ vọng giúp Canva gia tăng sức mạnh vượt trội về tác nhân AI (AI Agent), hạ tầng dữ liệu và khả năng tương tác khách hàng, từ đó giúp hãng tiến hóa mạnh mẽ từ một công cụ thiết kế đơn thuần trở thành một hệ thống toàn diện...
Công trình được đặt ở độ sâu 10 mét dưới mặt nước. Tổng vốn đầu tư lên tới 1,6 tỷ nhân dân tệ (khoảng 232 triệu USD), với công suất thiết kế đạt 24 MW...
Việt Nam đang thu hút sự quan tâm như một thị trường hạ tầng số mới nổi, được hỗ trợ bởi chi phí xây dựng cạnh tranh và tiềm năng tăng trưởng dài hạn…
Không chỉ đặt mục tiêu chen chân vào nhóm dẫn đầu ngành bán dẫn toàn cầu, Rapidus, công ty được Chính phủ Nhật Bản hậu thuẫn, còn theo đuổi một giấc mơ táo bạo hơn: xây dựng nhà máy sản xuất chip trên Mặt Trăng...