image Thứ Hai, 25/05/2026

Mô hình AI cỡ nhỏ và vừa ngày càng thu hút đầu tư của các công ty toàn cầu

Hoàng Hà

18/07/2024

Chia sẻ

Theo các chuyên gia, đối với một số trường hợp sử dụng AI cho các nhiệm vụ hẹp, các mô hình quy mô nhỏ và vừa sẽ hợp lý hơn. Đặc biệt, chúng sử dụng ít sức mạnh tính toán hơn nên tốn ít chi phí vận hành hơn...

Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn
Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn

Các mô hình AI cỡ nhỏ và vừa đang được các công ty trên toàn cầu ưa chuộng. Theo Wall Street Journal, ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn, hào nhoáng đã tạo nên làn sóng trong những ngày đầu bùng nổ AI.

MỘT MÔ HÌNH NGÔN NGỮ LỚN KHỔNG LỒ CÓ THỂ QUÁ MỨC CẦN THIẾT

Không giống như các mô hình nền tảng như GPT-4 của OpenAI - tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ tham số, thước đo kích thước của mô hình - các mô hình AI nhỏ hơn được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Gần như tất cả các nhà cung cấp công cụ AI, bao gồm Microsoft, Google và các công ty khởi nghiệp như Mistral, Anthropic và Cohere, đang chuyển sang cung cấp nhiều loại mô hình “con” này hơn.

Giám đốc thông tin các công ty cho biết đối với một số trường hợp sử dụng AI phổ biến nhất, thường liên quan đến các nhiệm vụ hẹp, lặp đi lặp lại như phân loại tài liệu, thì các mô hình quy mô nhỏ và vừa, đơn giản là hợp lý hơn. Đặc biệt, bởi vì chúng sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ hơn có thể tốn ít chi phí vận hành hơn.

Sự thay đổi này diễn ra khi các công ty đang dần chuyển sang triển khai nhiều ứng dụng AI hơn, đồng thời họ cũng chịu áp lực quản lý chi phí và lợi nhuận từ công nghệ đắt tiền.

Robert Blumofe, Giám đốc công nghệ của công ty an ninh mạng, phân phối nội dung và điện toán đám mây Akamai cho biết: “Một LLM [mô hình ngôn ngữ lớn] khổng lồ được đào tạo trên toàn bộ World Wide Web có thể là quá mức cần thiết”. Theo ông, đối với các trường hợp sử dụng của doanh nghiệp, hầu hết không cần một mô hình AI biết toàn bộ dàn diễn viên “Bố già” hay phải biết mọi bộ phim từng được thực hiện, biết mọi chương trình truyền hình từng được công chiếu.

TRIỂN KHAI MÔ HÌNH NHỎ VÀ VỪA CHO CÁC NHIỆM VỤ ĐẶC THÙ

Oliver Parker, Phó Chủ tịch phụ trách thị trường AI toàn cầu của Google Cloud, cho biết ông đã chứng kiến các doanh nghiệp chuyển sang mô hình cỡ trung bình trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp.

Giám đốc Thông tin Sridhar Sharma của Mr Cooper, một công ty cho vay thế chấp có trụ sở tại Dallas, cho biết công ty đang thử nghiệm khả năng của các mô hình AI cỡ trung bình tại trung tâm cuộc gọi, để phân tích dữ liệu giọng nói nhằm giúp các nhân viên chăm sóc khách hàng hiểu được các cuộc trò chuyện có thể diễn ra ở đâu và những gì khách hàng có thể hỏi.

“Chúng tôi không cần thiết kế quá mức để tạo thành một mô hình lớn cho những nhiệm vụ đặc thù”, lãnh đạo thông tin của Mr Cooper nói đồng thời cho biết thêm Mr Cooper cũng đang sử dụng các mô hình nền tảng lớn cho các trường hợp sử dụng phức tạp hơn.

TD Bank cho đến nay vẫn đang sử dụng dòng mô hình GPT của OpenAI và các mô hình khác, bao gồm cả việc sử dụng GPT-4, để giúp nhân viên tổng đài trả lời các câu hỏi của khách hàng nhanh hơn. Nhưng gần đây, Maksims Volkovs, nhà khoa học AI trưởng của TD cho biết ngân hàng cũng đã ký hợp tác với nhà cung cấp mô hình AI Cohere và sẽ xem xét liệu các mô hình cỡ nhỏ hoặc trung bình của Cohere có hiệu quả hơn và tiết kiệm chi phí hơn hay không.

Ông Volkovs cho biết sẽ đánh giá các mô hình của Cohere cùng với các dịch vụ của OpenAI về chi phí, độ chính xác và độ trễ. Theo ông dự đoán, các mô hình cỡ trung sẽ giành chiến thắng trong một số trường hợp, và khi đó “sự đánh đổi giữa độ chính xác và chi phí sẽ hiệu quả hơn”.

Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa
Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa

Stephan Pretorius, Giám đốc Công nghệ của công ty dịch vụ tiếp thị WPP cho biết, một năm trước, các doanh nghiệp thường nhắm tới một số mô hình lớn. Điều đó sẽ phù hợp khi các công ty tiến hành thí điểm với số lượng hạn chế, nhưng giờ đây khi mở rộng quy mô, chi phí cho các mẫu AI lớn có thể nhanh chóng vượt khỏi tầm kiểm soát. WPP đang sử dụng một số mô hình từ dòng Gemini của Google, bao gồm cả mô hình cỡ trung, Flash.

Flash phù hợp cho các mục đích sử dụng như phân tích thói quen mua sắm ở các quốc gia khác nhau và sử dụng các kết quả tìm được để viết bản sao web có liên quan cho các sản phẩm nhất định.

Tất nhiên, các mô hình lớn vẫn phù hợp và có giá trị đối với các trường hợp sử dụng phức tạp đòi hỏi nhiều dữ liệu, tính sáng tạo và diễn giải. Ví dụ, một mô hình AI lớn sẽ phù hợp để tiếp thu tất cả các tác phẩm của Shakespeare và phân tích các nhân vật nữ so với nhân vật nam theo thời gian. Nhưng công dụng đó đó không có trong danh sách việc cần làm của WPP. 


Hacker sử dụng AI: Cơn ác mộng của thị trường crypto 130 tỷ USD

Lĩnh vực tài chính phi tập trung – hiện có quy mô khoảng 130 tỷ USD – đang trở thành mục tiêu đặc biệt hấp dẫn đối với các nhóm tội phạm mạng...

10:19 18/05/2026
Xuất khẩu công nghệ AI của Trung Quốc bùng nổ

Không chỉ hàng hóa công nghệ tăng mạnh, các dịch vụ viễn thông, máy tính và công nghệ thông tin cũng tăng, nhờ nhu cầu ngày càng lớn đối với các mô hình AI của Trung Quốc trên thị trường quốc tế...

23:26 15/05/2026
Bắc Kinh thúc đẩy trung tâm dữ liệu AI dùng “điện xanh”

Trung Quốc đang đẩy mạnh yêu cầu sử dụng năng lượng xanh đối với các trung tâm dữ liệu trí tuệ nhân tạo (AI). Nhu cầu điện phục vụ làn sóng AI ngày càng tạo sức ép lớn lên hệ thống điện quốc gia và mục tiêu giảm phát thải carbon của Bắc Kinh...

19:11 11/05/2026
TikTok đầu tư kỷ lục 25 tỷ USD vào Thái Lan, mở rộng hiện diện tại Đông Nam Á

TikTok vừa công bố kế hoạch đầu tư 25 tỷ USD vào các dự án hạ tầng dữ liệu tại Thái Lan, đánh dấu khoản đầu tư lớn nhất từ trước đến nay của nền tảng video ngắn này tại Đông Nam Á...

08:03 09/05/2026
AI đe dọa “giấc mơ phần mềm” từng tạo nên tầng lớp trung lưu Ấn Độ

Thứ từng là lợi thế lớn nhất của ngành phần mềm Ấn Độ – nguồn nhân lực đông đảo và giá rẻ – có nguy cơ trở thành điểm yếu trong kỷ nguyên AI...

08:03 09/05/2026
Big Fund Trung Quốc dẫn đầu đàm phán rót vốn, đưa DeepSeek lên định giá 45 tỷ USD

Điểm đáng chú ý là mức định giá của DeepSeek đã tăng mạnh chỉ trong thời gian ngắn. Khi bắt đầu quá trình gọi vốn cách đây vài tuần, startup này được định giá khoảng 20 tỷ USD…

15:56 07/05/2026
Samsung cán mốc vốn hóa 1.000 tỷ USD, gia nhập câu lạc bộ công ty hàng đầu cùng với TSMC

Đây là lần đầu tiên trong lịch sử hãng điện tử lớn nhất Hàn Quốc đạt được cột mốc này, đồng thời trở thành công ty châu Á thứ hai làm được điều đó, sau Taiwan Semiconductor Manufacturing Co...

15:56 07/05/2026
SEMI kêu gọi các quốc gia Đông Nam Á đầu tư xây dựng nhà máy bán dẫn

Theo thống kê, trong số 64 nhà máy mới dự kiến đi vào hoạt động tại châu Á đến năm 2029, chỉ có 6 cơ sở đặt tại Đông Nam Á, phần lớn còn lại tập trung ở Trung Quốc và Đài Loan (Trung Quốc)…

14:06 06/05/2026
Doanh số chip AI của Huawei tăng vọt

Động lực tăng trưởng của Huawei không chỉ đến từ nhu cầu thị trường, mà còn từ việc Nvidia gặp nhiều rào cản pháp lý với cả Washington và Bắc Kinh...

15:46 05/05/2026
Thị trường smartphone chững lại, robot trở thành “đường cong tăng trưởng” mới của Trung Quốc

Thị trường robot hình người đã bắt đầu tạo ra các đơn hàng thực tế cho chuỗi cung ứng điện tử Trung Quốc…

13:00 05/05/2026