image Thứ Ba, 16/12/2025

Mô hình AI cỡ nhỏ và vừa ngày càng thu hút đầu tư của các công ty toàn cầu

Hoàng Hà

18/07/2024

Chia sẻ

Theo các chuyên gia, đối với một số trường hợp sử dụng AI cho các nhiệm vụ hẹp, các mô hình quy mô nhỏ và vừa sẽ hợp lý hơn. Đặc biệt, chúng sử dụng ít sức mạnh tính toán hơn nên tốn ít chi phí vận hành hơn...

Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn
Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn

Các mô hình AI cỡ nhỏ và vừa đang được các công ty trên toàn cầu ưa chuộng. Theo Wall Street Journal, ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn, hào nhoáng đã tạo nên làn sóng trong những ngày đầu bùng nổ AI.

MỘT MÔ HÌNH NGÔN NGỮ LỚN KHỔNG LỒ CÓ THỂ QUÁ MỨC CẦN THIẾT

Không giống như các mô hình nền tảng như GPT-4 của OpenAI - tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ tham số, thước đo kích thước của mô hình - các mô hình AI nhỏ hơn được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Gần như tất cả các nhà cung cấp công cụ AI, bao gồm Microsoft, Google và các công ty khởi nghiệp như Mistral, Anthropic và Cohere, đang chuyển sang cung cấp nhiều loại mô hình “con” này hơn.

Giám đốc thông tin các công ty cho biết đối với một số trường hợp sử dụng AI phổ biến nhất, thường liên quan đến các nhiệm vụ hẹp, lặp đi lặp lại như phân loại tài liệu, thì các mô hình quy mô nhỏ và vừa, đơn giản là hợp lý hơn. Đặc biệt, bởi vì chúng sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ hơn có thể tốn ít chi phí vận hành hơn.

Sự thay đổi này diễn ra khi các công ty đang dần chuyển sang triển khai nhiều ứng dụng AI hơn, đồng thời họ cũng chịu áp lực quản lý chi phí và lợi nhuận từ công nghệ đắt tiền.

Robert Blumofe, Giám đốc công nghệ của công ty an ninh mạng, phân phối nội dung và điện toán đám mây Akamai cho biết: “Một LLM [mô hình ngôn ngữ lớn] khổng lồ được đào tạo trên toàn bộ World Wide Web có thể là quá mức cần thiết”. Theo ông, đối với các trường hợp sử dụng của doanh nghiệp, hầu hết không cần một mô hình AI biết toàn bộ dàn diễn viên “Bố già” hay phải biết mọi bộ phim từng được thực hiện, biết mọi chương trình truyền hình từng được công chiếu.

TRIỂN KHAI MÔ HÌNH NHỎ VÀ VỪA CHO CÁC NHIỆM VỤ ĐẶC THÙ

Oliver Parker, Phó Chủ tịch phụ trách thị trường AI toàn cầu của Google Cloud, cho biết ông đã chứng kiến các doanh nghiệp chuyển sang mô hình cỡ trung bình trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp.

Giám đốc Thông tin Sridhar Sharma của Mr Cooper, một công ty cho vay thế chấp có trụ sở tại Dallas, cho biết công ty đang thử nghiệm khả năng của các mô hình AI cỡ trung bình tại trung tâm cuộc gọi, để phân tích dữ liệu giọng nói nhằm giúp các nhân viên chăm sóc khách hàng hiểu được các cuộc trò chuyện có thể diễn ra ở đâu và những gì khách hàng có thể hỏi.

“Chúng tôi không cần thiết kế quá mức để tạo thành một mô hình lớn cho những nhiệm vụ đặc thù”, lãnh đạo thông tin của Mr Cooper nói đồng thời cho biết thêm Mr Cooper cũng đang sử dụng các mô hình nền tảng lớn cho các trường hợp sử dụng phức tạp hơn.

TD Bank cho đến nay vẫn đang sử dụng dòng mô hình GPT của OpenAI và các mô hình khác, bao gồm cả việc sử dụng GPT-4, để giúp nhân viên tổng đài trả lời các câu hỏi của khách hàng nhanh hơn. Nhưng gần đây, Maksims Volkovs, nhà khoa học AI trưởng của TD cho biết ngân hàng cũng đã ký hợp tác với nhà cung cấp mô hình AI Cohere và sẽ xem xét liệu các mô hình cỡ nhỏ hoặc trung bình của Cohere có hiệu quả hơn và tiết kiệm chi phí hơn hay không.

Ông Volkovs cho biết sẽ đánh giá các mô hình của Cohere cùng với các dịch vụ của OpenAI về chi phí, độ chính xác và độ trễ. Theo ông dự đoán, các mô hình cỡ trung sẽ giành chiến thắng trong một số trường hợp, và khi đó “sự đánh đổi giữa độ chính xác và chi phí sẽ hiệu quả hơn”.

Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa
Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa

Stephan Pretorius, Giám đốc Công nghệ của công ty dịch vụ tiếp thị WPP cho biết, một năm trước, các doanh nghiệp thường nhắm tới một số mô hình lớn. Điều đó sẽ phù hợp khi các công ty tiến hành thí điểm với số lượng hạn chế, nhưng giờ đây khi mở rộng quy mô, chi phí cho các mẫu AI lớn có thể nhanh chóng vượt khỏi tầm kiểm soát. WPP đang sử dụng một số mô hình từ dòng Gemini của Google, bao gồm cả mô hình cỡ trung, Flash.

Flash phù hợp cho các mục đích sử dụng như phân tích thói quen mua sắm ở các quốc gia khác nhau và sử dụng các kết quả tìm được để viết bản sao web có liên quan cho các sản phẩm nhất định.

Tất nhiên, các mô hình lớn vẫn phù hợp và có giá trị đối với các trường hợp sử dụng phức tạp đòi hỏi nhiều dữ liệu, tính sáng tạo và diễn giải. Ví dụ, một mô hình AI lớn sẽ phù hợp để tiếp thu tất cả các tác phẩm của Shakespeare và phân tích các nhân vật nữ so với nhân vật nam theo thời gian. Nhưng công dụng đó đó không có trong danh sách việc cần làm của WPP. 


Hàn Quốc khởi động quỹ quốc gia hơn 100 tỷ USD, thúc đẩy AI, chip, robot

Quỹ đầu tư 150.000 tỷ won của Hàn Quốc nhằm phát triển AI, bán dẫn và công nghệ sinh học, định vị lại nền kinh tế trong bối cảnh cạnh tranh toàn cầu.

18:53 12/12/2025
Sức mạnh về điện và data center có thể đưa Trung Quốc vượt Mỹ trong cuộc đua AI

Chuyên gia Allen Zhu dự đoán Trung Quốc có thể vượt Mỹ về AI trong 10 năm tới nhờ tốc độ mở rộng hạ tầng năng lượng và trung tâm dữ liệu nhanh chóng.

18:53 12/12/2025
Lộ diện ‘những người chơi’ giành thị phần mảng chip với Nvidia

Nvidia giữ vững vị thế dẫn đầu trong mảng chip AI, nhưng sự cạnh tranh từ Google, Amazon và các đối thủ nhỏ hơn đang gia tăng.

18:53 12/12/2025
EU mở cuộc điều tra Google chống độc quyền, nhắm vào AI Overviews và AI Mode

Ủy ban châu Âu khởi động điều tra Google về việc sử dụng nội dung cho AI mà không bồi thường, đe dọa quyền lợi nhà xuất bản.

11:57 11/12/2025
Gần một nửa lãnh đạo doanh nghiệp châu Á cho biết AI là ưu tiên hàng đầu trong năm 2026

Gần một nửa lãnh đạo doanh nghiệp châu Á xác định AI là ưu tiên hàng đầu cho năm 2026, theo báo cáo từ Viện Diligent.

09:49 10/12/2025
Trào lưu “khởi nghiệp một mình” bùng nổ tại Trung Quốc nhờ làn sóng AI

Sự bùng nổ AI tại Trung Quốc thúc đẩy trào lưu khởi nghiệp một mình, mở ra cơ hội cho giới trẻ trong bối cảnh thị trường việc làm khó khăn.

14:24 09/12/2025
Công ty mẹ của Tiktok rót 37 tỷ đô xây trung tâm dữ liệu tại Brazil

ByteDance cam kết 37 tỷ USD xây dựng trung tâm dữ liệu tại Pecém, Brazil, củng cố vị thế AI khu vực Nam Mỹ giữa bối cảnh cạnh tranh toàn cầu.

19:28 08/12/2025
Amazon tung chip thiết kế riêng, hâm nóng đường đua chip AI

Amazon công bố chip AI Trainium3 tại hội nghị, hứa hẹn giảm 50% chi phí huấn luyện mô hình AI, tạo áp lực lên Nvidia.

19:20 08/12/2025
Vì sao sự bùng nổ của AI vẫn gây lo lắng dù đã vượt qua nhiều cột mốc?

Nvidia báo cáo lợi nhuận kỷ lục, nhưng lo ngại về sự phát triển nhanh chóng của AI vẫn hiện hữu. Các chuyên gia cảnh báo về rủi ro tài chính trong ngành.

19:17 08/12/2025
AI sẽ tái định hình lực lượng lao động Đông Nam Á nhanh hơn mọi dự đoán

Đông Nam Á chuẩn bị cho cuộc chuyển đổi lớn khi AI trở thành yêu cầu thiết yếu trong lực lượng lao động, hứa hẹn nhiều cơ hội và thách thức mới.

19:14 08/12/2025