image Thứ Hai, 15/06/2026

Mô hình AI cỡ nhỏ và vừa ngày càng thu hút đầu tư của các công ty toàn cầu

Hoàng Hà

18/07/2024

Chia sẻ

Theo các chuyên gia, đối với một số trường hợp sử dụng AI cho các nhiệm vụ hẹp, các mô hình quy mô nhỏ và vừa sẽ hợp lý hơn. Đặc biệt, chúng sử dụng ít sức mạnh tính toán hơn nên tốn ít chi phí vận hành hơn...

Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn
Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn

Các mô hình AI cỡ nhỏ và vừa đang được các công ty trên toàn cầu ưa chuộng. Theo Wall Street Journal, ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn, hào nhoáng đã tạo nên làn sóng trong những ngày đầu bùng nổ AI.

MỘT MÔ HÌNH NGÔN NGỮ LỚN KHỔNG LỒ CÓ THỂ QUÁ MỨC CẦN THIẾT

Không giống như các mô hình nền tảng như GPT-4 của OpenAI - tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ tham số, thước đo kích thước của mô hình - các mô hình AI nhỏ hơn được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Gần như tất cả các nhà cung cấp công cụ AI, bao gồm Microsoft, Google và các công ty khởi nghiệp như Mistral, Anthropic và Cohere, đang chuyển sang cung cấp nhiều loại mô hình “con” này hơn.

Giám đốc thông tin các công ty cho biết đối với một số trường hợp sử dụng AI phổ biến nhất, thường liên quan đến các nhiệm vụ hẹp, lặp đi lặp lại như phân loại tài liệu, thì các mô hình quy mô nhỏ và vừa, đơn giản là hợp lý hơn. Đặc biệt, bởi vì chúng sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ hơn có thể tốn ít chi phí vận hành hơn.

Sự thay đổi này diễn ra khi các công ty đang dần chuyển sang triển khai nhiều ứng dụng AI hơn, đồng thời họ cũng chịu áp lực quản lý chi phí và lợi nhuận từ công nghệ đắt tiền.

Robert Blumofe, Giám đốc công nghệ của công ty an ninh mạng, phân phối nội dung và điện toán đám mây Akamai cho biết: “Một LLM [mô hình ngôn ngữ lớn] khổng lồ được đào tạo trên toàn bộ World Wide Web có thể là quá mức cần thiết”. Theo ông, đối với các trường hợp sử dụng của doanh nghiệp, hầu hết không cần một mô hình AI biết toàn bộ dàn diễn viên “Bố già” hay phải biết mọi bộ phim từng được thực hiện, biết mọi chương trình truyền hình từng được công chiếu.

TRIỂN KHAI MÔ HÌNH NHỎ VÀ VỪA CHO CÁC NHIỆM VỤ ĐẶC THÙ

Oliver Parker, Phó Chủ tịch phụ trách thị trường AI toàn cầu của Google Cloud, cho biết ông đã chứng kiến các doanh nghiệp chuyển sang mô hình cỡ trung bình trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp.

Giám đốc Thông tin Sridhar Sharma của Mr Cooper, một công ty cho vay thế chấp có trụ sở tại Dallas, cho biết công ty đang thử nghiệm khả năng của các mô hình AI cỡ trung bình tại trung tâm cuộc gọi, để phân tích dữ liệu giọng nói nhằm giúp các nhân viên chăm sóc khách hàng hiểu được các cuộc trò chuyện có thể diễn ra ở đâu và những gì khách hàng có thể hỏi.

“Chúng tôi không cần thiết kế quá mức để tạo thành một mô hình lớn cho những nhiệm vụ đặc thù”, lãnh đạo thông tin của Mr Cooper nói đồng thời cho biết thêm Mr Cooper cũng đang sử dụng các mô hình nền tảng lớn cho các trường hợp sử dụng phức tạp hơn.

TD Bank cho đến nay vẫn đang sử dụng dòng mô hình GPT của OpenAI và các mô hình khác, bao gồm cả việc sử dụng GPT-4, để giúp nhân viên tổng đài trả lời các câu hỏi của khách hàng nhanh hơn. Nhưng gần đây, Maksims Volkovs, nhà khoa học AI trưởng của TD cho biết ngân hàng cũng đã ký hợp tác với nhà cung cấp mô hình AI Cohere và sẽ xem xét liệu các mô hình cỡ nhỏ hoặc trung bình của Cohere có hiệu quả hơn và tiết kiệm chi phí hơn hay không.

Ông Volkovs cho biết sẽ đánh giá các mô hình của Cohere cùng với các dịch vụ của OpenAI về chi phí, độ chính xác và độ trễ. Theo ông dự đoán, các mô hình cỡ trung sẽ giành chiến thắng trong một số trường hợp, và khi đó “sự đánh đổi giữa độ chính xác và chi phí sẽ hiệu quả hơn”.

Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa
Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa

Stephan Pretorius, Giám đốc Công nghệ của công ty dịch vụ tiếp thị WPP cho biết, một năm trước, các doanh nghiệp thường nhắm tới một số mô hình lớn. Điều đó sẽ phù hợp khi các công ty tiến hành thí điểm với số lượng hạn chế, nhưng giờ đây khi mở rộng quy mô, chi phí cho các mẫu AI lớn có thể nhanh chóng vượt khỏi tầm kiểm soát. WPP đang sử dụng một số mô hình từ dòng Gemini của Google, bao gồm cả mô hình cỡ trung, Flash.

Flash phù hợp cho các mục đích sử dụng như phân tích thói quen mua sắm ở các quốc gia khác nhau và sử dụng các kết quả tìm được để viết bản sao web có liên quan cho các sản phẩm nhất định.

Tất nhiên, các mô hình lớn vẫn phù hợp và có giá trị đối với các trường hợp sử dụng phức tạp đòi hỏi nhiều dữ liệu, tính sáng tạo và diễn giải. Ví dụ, một mô hình AI lớn sẽ phù hợp để tiếp thu tất cả các tác phẩm của Shakespeare và phân tích các nhân vật nữ so với nhân vật nam theo thời gian. Nhưng công dụng đó đó không có trong danh sách việc cần làm của WPP. 


Từ scam đến deepfake, AI đang tạo ra những mối đe dọa mạng mới ở châu Á

Một trong những xu hướng đáng lo ngại nhất hiện nay là sự xuất hiện của các bộ công cụ lừa đảo (phishing kits) được tạo ra bằng AI cùng với các nội dung deepfake có độ chân thực rất cao...

10:50 12/06/2026
Các nhà máy Trung Quốc xây dựng thương hiệu toàn cầu qua TikTok Shop như thế nào?

Ngày càng nhiều nhà sản xuất Trung Quốc tận dụng TikTok Shop để tiếp cận khách hàng toàn cầu, xây dựng thương hiệu riêng và phát triển sản phẩm dựa trên phản hồi thị trường theo thời gian thực...

16:27 11/06/2026
TSMC lần đầu lọt top 10 doanh nghiệp giá trị nhất thế giới nhờ làn sóng AI

Nhu cầu mạnh mẽ đối với các thiết bị AI và chất bán dẫn là động lực chính giúp vốn hóa của TSMC tăng gấp đôi trong vòng một năm...

17:37 10/06/2026
Apple hợp tác với Google và Nvidia, xây dựng mô hình AI tiên tiến nhất

Thay vì cạnh tranh trực diện với OpenAI, Google hay Anthropic bằng việc xây dựng các mô hình lớn nhất thế giới, Apple tận dụng công nghệ từ những đối tác hàng đầu như Google và Nvidia...

16:51 09/06/2026
EU công bố chiến lược chủ quyền công nghệ quy mô lớn

Liên minh châu Âu (EU) vừa công bố gói chính sách toàn diện nhằm tăng cường năng lực công nghệ nội khối, hướng tới mục tiêu xây dựng “chủ quyền công nghệ” trong các lĩnh vực chiến lược như bán dẫn, trí tuệ nhân tạo (AI), điện toán đám mây và phần mềm nguồn mở...

08:06 05/06/2026
Cuộc đua xây trung tâm dữ liệu AI tại Mỹ “mắt kẹt”, hàng loạt dự án chậm tiến độ

Đằng sau những con số đầu tư khổng lồ là hàng loạt nút thắt về điện năng, hạ tầng và thủ tục khiến tiến độ xây dựng các trung tâm dữ liệu trên khắp nước Mỹ đang bị chậm đáng kể…

08:06 05/06/2026
Mỹ "vá lỗ hổng" mua chip AI qua nước thứ ba của các công ty Trung Quốc

Theo giới quan sát, động thái mới cho thấy Washington đang ngày càng thận trọng trước nguy cơ các doanh nghiệp Trung Quốc tiếp cận năng lực tính toán AI tiên tiến thông qua mạng lưới công ty con và đối tác hoạt động tại nước ngoài...

09:18 03/06/2026
Anthropic nộp hồ sơ IPO: Cuộc đua nghìn tỷ USD của các đế chế AI bước vào giai đoạn quyết định

Anthropic, công ty đứng sau chatbot Claude, đã chính thức nộp hồ sơ phát hành cổ phiếu lần đầu ra công chúng (IPO), mở đường cho một trong những thương vụ niêm yết được chờ đợi nhất trên Phố Wall…

06:08 03/06/2026
Doanh nghiệp chip nhớ vượt mặt các ông lớn dầu khí về giá trị thị trường

Ba nhà sản xuất chip nhớ lớn nhất thế giới gồm Micron Technology, Samsung Electronics và SK Hynix hiện sở hữu tổng vốn hóa thị trường vượt mốc 1.000 tỷ USD...

08:36 02/06/2026
Trung Quốc bùng nổ “công nghệ du lịch”

Sự trỗi dậy mạnh mẽ của các lĩnh vực trí tuệ nhân tạo (AI), xe điện, robot và sản xuất thông minh tại Trung Quốc đang tạo ra một loại hình du lịch hoàn toàn mới: du lịch công nghệ...

08:35 02/06/2026