Mô hình AI cỡ nhỏ và vừa ngày càng thu hút đầu tư của các công ty toàn cầu

Hoàng Hà

18/07/2024

Theo các chuyên gia, đối với một số trường hợp sử dụng AI cho các nhiệm vụ hẹp, các mô hình quy mô nhỏ và vừa sẽ hợp lý hơn. Đặc biệt, chúng sử dụng ít sức mạnh tính toán hơn nên tốn ít chi phí vận hành hơn...

Ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn

Các mô hình AI cỡ nhỏ và vừa đang được các công ty trên toàn cầu ưa chuộng. Theo Wall Street Journal, ngày càng nhiều công ty triển khai các mô hình trí tuệ nhân tạo tổng hợp cỡ nhỏ và trung bình, ưu tiên công nghệ thu nhỏ, tiết kiệm chi phí hơn so với các mô hình AI lớn, hào nhoáng đã tạo nên làn sóng trong những ngày đầu bùng nổ AI.

MỘT MÔ HÌNH NGÔN NGỮ LỚN KHỔNG LỒ CÓ THỂ QUÁ MỨC CẦN THIẾT

Không giống như các mô hình nền tảng như GPT-4 của OpenAI - tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ tham số, thước đo kích thước của mô hình - các mô hình AI nhỏ hơn được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Gần như tất cả các nhà cung cấp công cụ AI, bao gồm Microsoft, Google và các công ty khởi nghiệp như Mistral, Anthropic và Cohere, đang chuyển sang cung cấp nhiều loại mô hình “con” này hơn.

Giám đốc thông tin các công ty cho biết đối với một số trường hợp sử dụng AI phổ biến nhất, thường liên quan đến các nhiệm vụ hẹp, lặp đi lặp lại như phân loại tài liệu, thì các mô hình quy mô nhỏ và vừa, đơn giản là hợp lý hơn. Đặc biệt, bởi vì chúng sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ hơn có thể tốn ít chi phí vận hành hơn.

Sự thay đổi này diễn ra khi các công ty đang dần chuyển sang triển khai nhiều ứng dụng AI hơn, đồng thời họ cũng chịu áp lực quản lý chi phí và lợi nhuận từ công nghệ đắt tiền.

Robert Blumofe, Giám đốc công nghệ của công ty an ninh mạng, phân phối nội dung và điện toán đám mây Akamai cho biết: “Một LLM [mô hình ngôn ngữ lớn] khổng lồ được đào tạo trên toàn bộ World Wide Web có thể là quá mức cần thiết”. Theo ông, đối với các trường hợp sử dụng của doanh nghiệp, hầu hết không cần một mô hình AI biết toàn bộ dàn diễn viên “Bố già” hay phải biết mọi bộ phim từng được thực hiện, biết mọi chương trình truyền hình từng được công chiếu.

TRIỂN KHAI MÔ HÌNH NHỎ VÀ VỪA CHO CÁC NHIỆM VỤ ĐẶC THÙ

Oliver Parker, Phó Chủ tịch phụ trách thị trường AI toàn cầu của Google Cloud, cho biết ông đã chứng kiến các doanh nghiệp chuyển sang mô hình cỡ trung bình trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp.

Giám đốc Thông tin Sridhar Sharma của Mr Cooper, một công ty cho vay thế chấp có trụ sở tại Dallas, cho biết công ty đang thử nghiệm khả năng của các mô hình AI cỡ trung bình tại trung tâm cuộc gọi, để phân tích dữ liệu giọng nói nhằm giúp các nhân viên chăm sóc khách hàng hiểu được các cuộc trò chuyện có thể diễn ra ở đâu và những gì khách hàng có thể hỏi.

“Chúng tôi không cần thiết kế quá mức để tạo thành một mô hình lớn cho những nhiệm vụ đặc thù”, lãnh đạo thông tin của Mr Cooper nói đồng thời cho biết thêm Mr Cooper cũng đang sử dụng các mô hình nền tảng lớn cho các trường hợp sử dụng phức tạp hơn.

TD Bank cho đến nay vẫn đang sử dụng dòng mô hình GPT của OpenAI và các mô hình khác, bao gồm cả việc sử dụng GPT-4, để giúp nhân viên tổng đài trả lời các câu hỏi của khách hàng nhanh hơn. Nhưng gần đây, Maksims Volkovs, nhà khoa học AI trưởng của TD cho biết ngân hàng cũng đã ký hợp tác với nhà cung cấp mô hình AI Cohere và sẽ xem xét liệu các mô hình cỡ nhỏ hoặc trung bình của Cohere có hiệu quả hơn và tiết kiệm chi phí hơn hay không.

Ông Volkovs cho biết sẽ đánh giá các mô hình của Cohere cùng với các dịch vụ của OpenAI về chi phí, độ chính xác và độ trễ. Theo ông dự đoán, các mô hình cỡ trung sẽ giành chiến thắng trong một số trường hợp, và khi đó “sự đánh đổi giữa độ chính xác và chi phí sẽ hiệu quả hơn”.

Các doanh nghiệp chuyển sang mô hình AI nhỏ trong ba tháng qua, một phần vì các mô hình này đáp ứng tốt hơn các tiêu chí ứng dụng tại doanh nghiệp. Ảnh minh họa

Stephan Pretorius, Giám đốc Công nghệ của công ty dịch vụ tiếp thị WPP cho biết, một năm trước, các doanh nghiệp thường nhắm tới một số mô hình lớn. Điều đó sẽ phù hợp khi các công ty tiến hành thí điểm với số lượng hạn chế, nhưng giờ đây khi mở rộng quy mô, chi phí cho các mẫu AI lớn có thể nhanh chóng vượt khỏi tầm kiểm soát. WPP đang sử dụng một số mô hình từ dòng Gemini của Google, bao gồm cả mô hình cỡ trung, Flash.

Flash phù hợp cho các mục đích sử dụng như phân tích thói quen mua sắm ở các quốc gia khác nhau và sử dụng các kết quả tìm được để viết bản sao web có liên quan cho các sản phẩm nhất định.

Tất nhiên, các mô hình lớn vẫn phù hợp và có giá trị đối với các trường hợp sử dụng phức tạp đòi hỏi nhiều dữ liệu, tính sáng tạo và diễn giải. Ví dụ, một mô hình AI lớn sẽ phù hợp để tiếp thu tất cả các tác phẩm của Shakespeare và phân tích các nhân vật nữ so với nhân vật nam theo thời gian. Nhưng công dụng đó đó không có trong danh sách việc cần làm của WPP.

Từ khóa:

DeepSeek là doanh nghiệp AI Trung Quốc từng gây tiếng vang lớn đầu năm 2025 và tiếp tục giới thiệu mô hình mới vào tháng 4. Ảnh: CNBC

Doanh nghiệp Mỹ chuyển hướng sang mô hình AI Trung Quốc nhờ lợi thế chi phí

Nhờ chi phí vận hành tối ưu cùng tính năng ngày càng tiệm cận các mô hình hàng đầu tại Mỹ, các giải pháp AI từ Trung Quốc đang dần trở thành lựa chọn ưu tiên của nhiều doanh nghiệp Mỹ...

15:18 09/07/2026

Những doanh nghiệp được hưởng lợi lớn nhất từ xu hướng này là các "ông lớn" đang xây dựng hạ tầng AI tại Trung Quốc như Tencent, Alibaba và Huawei. Ảnh: Bloomberg

Doanh nghiệp Trung Quốc tăng tốc thay thế Nvidia bằng chip AI nội địa

Các doanh nghiệp Trung Quốc dự kiến sẽ dành 46% ngân sách mua chip, bộ tăng tốc AI trong 12 tháng tới cho các sản phẩm nội địa. Con số này tăng mạnh so với mức 30% hiện nay...

15:17 09/07/2026

Thị trường tiền mã hóa toàn cầu hiện có quy mô khoảng 2.000 tỷ USD, vận hành trên nền tảng blockchain với các cơ chế mã hóa được phát triển từ nhiều thập kỷ trước. Ảnh minh họa

Nguy cơ máy tính lượng tử áp sát, ngành tiền số gấp rút gia cố “lá chắn” bảo mật

Sự phát triển nhanh chóng của máy tính lượng tử đang buộc ngành công nghiệp tiền mã hóa phải chuẩn bị cho một kịch bản từng được xem là còn rất xa mới xảy ra: các thuật toán mã hóa hiện nay bị bẻ khóa, kéo theo nguy cơ hàng nghìn tỷ USD tài sản số bị đe dọa...

11:47 09/07/2026

Tổng thống Hàn Quốc Lee Jae Myung phát biểu trong cuộc họp báo về tầm nhìn phát triển ngành công nghiệp bán dẫn. Ảnh: Reuters

Hàn Quốc lập quỹ tương lai từ nguồn thu tăng thêm nhờ bùng nổ bán dẫn

Quỹ sẽ trở thành công cụ tài chính quan trọng để triển khai các dự án đầu tư quy mô lớn của quốc gia, đồng thời nâng cao sức cạnh tranh dài hạn của Hàn Quốc...

16:33 07/07/2026

Ấn Độ đang lựa chọn cách huy động dòng vốn và công nghệ quốc tế nhằm rút ngắn khoảng cách với các quốc gia dẫn đầu AI. Ảnh: CNBC

Các chính phủ đang trải thảm đỏ chào đón các “gã khổng lồ AI”

Các nhà lãnh đạo quốc gia ngày càng dành nhiều thời gian gặp gỡ CEO các tập đoàn công nghệ lớn, coi họ là những đối tác chiến lược trong quá trình xây dựng năng lực AI quốc gia...

16:27 06/07/2026

Công nghệ lượng tử được xác định là một trong những lĩnh vực then chốt cần được đầu tư mạnh nhằm đảm bảo năng lực cạnh tranh dài hạn của Trung Quốc. Ảnh: SCMP

Các địa phương Trung Quốc tăng tốc cạnh tranh trong ngành lượng tử

Nhiều địa phương trên khắp Trung Quốc đang đẩy nhanh việc xây dựng các cụm công nghiệp lượng tử nhằm thu hút doanh nghiệp, nhân tài và nguồn vốn đầu tư…

19:43 03/07/2026

Ứớc tính Việt Nam hiện có khoảng 33 triệu lao động phi chính thức và con số này được dự báo sẽ tiếp tục gia tăng trong thời gian tới. Ảnh minh họa

Khi thuật toán chi phối thu nhập: Thách thức mới của thị trường lao động Việt Nam

Cùng với sự phát triển của các nền tảng số, thuật toán ngày càng đảm nhận vai trò phân bổ công việc, đánh giá hiệu suất, xác định thu nhập và thậm chí quyết định việc một người có tiếp tục được làm việc trên nền tảng hay không...

19:43 03/07/2026

Sự bùng nổ của các đợt IPO mới cho thấy Hong Kong đang dần khôi phục vai trò là trung tâm huy động vốn hàng đầu của châu Á. Ảnh: Reuters

Doanh nghiệp công nghệ Trung Quốc tăng tốc IPO tại Hong Kong

Chỉ trong một ngày có tới năm doanh nghiệp công nghệ Trung Quốc đồng loạt khởi động kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) tại Hong Kong...

21:48 02/07/2026

Nhiều tổ chức đã bắt đầu xem xét kỹ hơn hiệu quả chi tiêu cho trí tuệ nhân tạo. Ảnh minh họa

Doanh nghiệp lớn có xu hướng kiểm soát ngân sách chi tiêu cho AI

Doanh nghiệp hiện đang áp dụng một số hình thức kiểm soát chi tiêu AI bằng cách thiết lập các cơ chế bảo vệ hoặc giới hạn sử dụng...

21:47 02/07/2026

Nhiệt độ tăng cao trong những ngày gần đây đã cho thấy mức độ phụ thuộc của hạ tầng hiện đại vào điều kiện thời tiết. Ảnh: CNBC

Thời tiết cực đoan trở thành mối đe dọa hàng đầu với hạ tầng AI

Nghiên cứu cho thấy 79% công suất trung tâm dữ liệu trên toàn cầu đang đối mặt với mức độ rủi ro cao từ các hiểm họa khí hậu cấp tính như lũ lụt, gió mạnh và cháy rừng...

11:40 02/07/2026