Mô hình AI cỡ nhỏ và vừa ngày càng thu hút đầu tư của các công ty toàn cầu

Hoàng Hà
Chia sẻ

Theo các chuyên gia, đối với một số trường hợp sử dụng AI cho các nhiệm vụ hẹp, các mô hình quy mô nhỏ và vừa sẽ hợp lý hơn. Đặc biệt, chúng sử dụng ít sức mạnh tính toán hơn nên tốn ít chi phí vận hành hơn...

Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn
Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn

Các mô hình AI cỡ nhỏ và vừa đang được các công ty trên toàn cầu ưa chuộng. Theo Wall Street Journal, ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn, hào nhoáng đã tạo nên làn sóng trong những ngày đầu bùng nổ AI.

MỘT MÔ HÌNH NGÔN NGỮ LỚN KHỔNG LỒ CÓ THỂ QUÁ MỨC CẦN THIẾT

Không giống như các mô hình nền tảng như GPT-4 của OpenAI - tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ tham số, thước đo kích thước của mô hình - các mô hình AI nhỏ hơn được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Gần như tất cả các nhà cung cấp công cụ AI, bao gồm Microsoft, Google và các công ty khởi nghiệp như Mistral, Anthropic và Cohere, đang chuyển sang cung cấp nhiều loại mô hình “con” này hơn.

Giám đốc thông tin các công ty cho biết đối với một số trường hợp sử dụng AI phổ biến nhất, thường liên quan đến các nhiệm vụ hẹp, lặp đi lặp lại như phân loại tài liệu, thì các mô hình quy mô nhỏ và vừa, đơn giản là hợp lý hơn. Đặc biệt, bởi vì chúng sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ hơn có thể tốn ít chi phí vận hành hơn.

Sự thay đổi này diễn ra khi các công ty đang dần chuyển sang triển khai nhiều ứng dụng AI hơn, đồng thời họ cũng chịu áp lực quản lý chi phí và lợi nhuận từ công nghệ đắt tiền.

Robert Blumofe, Giám đốc công nghệ của công ty an ninh mạng, phân phối nội dung và điện toán đám mây Akamai cho biết: “Một LLM [mô hình ngôn ngữ lớn] khổng lồ được đào tạo trên toàn bộ World Wide Web có thể là quá mức cần thiết”. Theo ông, đối với các trường hợp sử dụng của doanh nghiệp, hầu hết không cần một mô hình AI biết toàn bộ dàn diễn viên “Bố già” hay phải biết mọi bộ phim từng được thực hiện, biết mọi chương trình truyền hình từng được công chiếu.

TRIỂN KHAI MÔ HÌNH NHỎ VÀ VỪA CHO CÁC NHIỆM VỤ ĐẶC THÙ

Oliver Parker, Phó Chủ tịch phụ trách thị trường AI toàn cầu của Google Cloud, cho biết ông đã chứng kiến các doanh nghiệp chuyển sang mô hình cỡ trung bình trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp.

Giám đốc Thông tin Sridhar Sharma của Mr Cooper, một công ty cho vay thế chấp có trụ sở tại Dallas, cho biết công ty đang thử nghiệm khả năng của các mô hình AI cỡ trung bình tại trung tâm cuộc gọi, để phân tích dữ liệu giọng nói nhằm giúp các nhân viên chăm sóc khách hàng hiểu được các cuộc trò chuyện có thể diễn ra ở đâu và những gì khách hàng có thể hỏi.

“Chúng tôi không cần thiết kế quá mức để tạo thành một mô hình lớn cho những nhiệm vụ đặc thù”, lãnh đạo thông tin của Mr Cooper nói đồng thời cho biết thêm Mr Cooper cũng đang sử dụng các mô hình nền tảng lớn cho các trường hợp sử dụng phức tạp hơn.

TD Bank cho đến nay vẫn đang sử dụng dòng mô hình GPT của OpenAI và các mô hình khác, bao gồm cả việc sử dụng GPT-4, để giúp nhân viên tổng đài trả lời các câu hỏi của khách hàng nhanh hơn. Nhưng gần đây, Maksims Volkovs, nhà khoa học AI trưởng của TD cho biết ngân hàng cũng đã ký hợp tác với nhà cung cấp mô hình AI Cohere và sẽ xem xét liệu các mô hình cỡ nhỏ hoặc trung bình của Cohere có hiệu quả hơn và tiết kiệm chi phí hơn hay không.

Ông Volkovs cho biết sẽ đánh giá các mô hình của Cohere cùng với các dịch vụ của OpenAI về chi phí, độ chính xác và độ trễ. Theo ông dự đoán, các mô hình cỡ trung sẽ giành chiến thắng trong một số trường hợp, và khi đó “sự đánh đổi giữa độ chính xác và chi phí sẽ hiệu quả hơn”.

Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa
Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa

Stephan Pretorius, Giám đốc Công nghệ của công ty dịch vụ tiếp thị WPP cho biết, một năm trước, các doanh nghiệp thường nhắm tới một số mô hình lớn. Điều đó sẽ phù hợp khi các công ty tiến hành thí điểm với số lượng hạn chế, nhưng giờ đây khi mở rộng quy mô, chi phí cho các mẫu AI lớn có thể nhanh chóng vượt khỏi tầm kiểm soát. WPP đang sử dụng một số mô hình từ dòng Gemini của Google, bao gồm cả mô hình cỡ trung, Flash.

Flash phù hợp cho các mục đích sử dụng như phân tích thói quen mua sắm ở các quốc gia khác nhau và sử dụng các kết quả tìm được để viết bản sao web có liên quan cho các sản phẩm nhất định.

Tất nhiên, các mô hình lớn vẫn phù hợp và có giá trị đối với các trường hợp sử dụng phức tạp đòi hỏi nhiều dữ liệu, tính sáng tạo và diễn giải. Ví dụ, một mô hình AI lớn sẽ phù hợp để tiếp thu tất cả các tác phẩm của Shakespeare và phân tích các nhân vật nữ so với nhân vật nam theo thời gian. Nhưng công dụng đó đó không có trong danh sách việc cần làm của WPP. 

Khởi nghiệp

Hồ sơ Startup

Citigo là công ty công nghệ cung cấp những giải pháp đơn giản với chi phí tiết kiệm, giúp khách hàng nâng cao hiệu quả kinh doanh. Citigo hướng tới tầm nhìn trở thành công ty cung cấp giải pháp công nghệ cho doanh nghiệp phổ biến tại Đông Nam Á
ESBT là công ty hoạt động trọng lĩnh vực công nghệ thông tin, chúng tôi xây dựng những sản phẩm phần mềm cho cộng đồng và cung cấp dịch vụ phát triển phần mềm cho các doanh nghiệp
Lozi là một trong những ứng dụng thương mại điện tử được yêu thích nhất tại Việt Nam, kết nối hàng triệu người mua và người bán nhằm phục vụ nhu cầu mua bán trực tuyến ngày càng cao. Không chỉ là một cầu nối thương mại điện tử đáng tin cậy, Lozi còn cung cấp dịch vụ giao hàng nhanh chóng và tiện lợi chỉ trong 1 giờ, đem đến cho khách hàng những trải nghiệm mua sắm trực tuyến hiệu quả và tối ưu
Bắt nguồn từ mong muốn mang chất lượng dạy Tiếng Anh tại Trường Quốc tế đến với mọi học sinh Việt Nam, để các bạn nhỏ dù không có điều kiện kinh tế theo học tại các Trường Quốc Tế hay Trung Tâm đắt tiền vẫn có thể sử dụng Tiếng Anh tốt như người bản ngữ. Đây chính là hành trang chuẩn bị cho các em tương lai vươn ra thế giới. Chính vì lý do trên, đội ngũ sáng lập đã bắt tay vào xây dựng sản phẩm đầu tiên có tên “Chương trình học Tiếng Anh Online EDUPIA”.
Công ty TNHH SA-ACH định vị về lĩnh vững trồng rừng, phát triển gồm 3 loại cây và bốn tầng cây trên một hecta đất nhằm tạo hệ sinh thái bền vững, và nâng cao thu nhập cho bà con