image Thứ Sáu, 19/12/2025

Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"

Mai Anh

07/11/2025

Chia sẻ

Làn sóng trí tuệ nhân tạo hiện đại đang chứng kiến một nghịch lý: những mô hình phức tạp đang được các công ty sử dụng để tạo ra hiệu quả làm việc và cắt giảm nhân sự lại không phải là những mô hình nổi tiếng có nhiều sự chú ý…

Mô hình ngôn ngữ nhỏ có thể dễ dàng điều chỉnh theo các tác vụ cụ thể. Ảnh: Shutterstock
Mô hình ngôn ngữ nhỏ có thể dễ dàng điều chỉnh theo các tác vụ cụ thể. Ảnh: Shutterstock

Những mô hình tiên tiến và có khả năng suy luận nhanh hơn, tốt hơn liên tục xuất hiện trên câu chủ đề của các tờ báo nhờ khả năng liên tục phá vỡ các kỷ lục về nhận thức và phân tích. Những mô hình này thậm chí còn vượt qua các kỳ thi về luật và y học, hay cả Olympic toán học.

Lãnh đạo của các phòng thí nghiệm trí tuệ nhân tạo (AI) hàng đầu, từ ông Sam Altman của OpenAI, ông Dario Amodei của Anthropic, ông Demis Hassabis của DeepMind (thuộc Google) cho đến tỷ phú Elon Musk của xAI, đều nói về một tương lai với AGI – trí tuệ nhân tạo tổng quát. Đó là viễn cảnh nơi máy móc thông minh ngang ngửa con người.

Theo giả thuyết, chính những “bộ não khổng lồ” này của AI sẽ là mối đe dọa lớn nhất đối với việc làm của con người.

Thế nhưng, khi trò chuyện với các giám đốc điều hành tại những công ty đang ứng dụng AI mỗi ngày, một câu chuyện hoàn toàn khác đang diễn ra trên thực tế, tác giả Christopher Mims viết trên tờ The Wall Street Journal (WSJ).

Với phần lớn tác vụ, không phải những mô hình AI lớn nhất và thông minh nhất đang chiếm ưu thế, mà là những mô hình đơn giản hơn. Những “anh hùng thầm lặng” này của AI – những mô hình thực sự đang thay đổi quy trình kinh doanh và lực lượng lao động – lại là những mô hình nhỏ nhất, nhanh nhất và rẻ nhất.

“Thực tế là, với rất nhiều hoạt động tính toán mà chúng ta cần hiện nay, chúng ta không nhất thiết phải dùng đến các mô hình ngôn ngữ lớn”, ông Kyle Lo, một nhà khoa học nghiên cứu tại Viện Allen về AI, cho biết.

Các công ty ứng dụng AI thành công thường xây dựng phần mềm và dịch vụ như một dây chuyền sản xuất AI: thông tin đi vào một đầu, và rồi dữ liệu, hành động hoặc sản phẩm đi ra ở đầu kia. Ở giữa, hàng loạt AI nhỏ hơn, đơn giản hơn, chuyên biệt hơn, nhanh hơn và rẻ hơn đang làm toàn bộ công việc.

Những doanh nghiệp cần triển khai AI ở quy mô lớn đang phát hiện ra rằng, các mô hình ngôn ngữ nhỏ hoàn toàn đủ khả năng để đảm nhiệm các nhiệm vụ đó. Hơn nữa, doanh nghiệp cũng nhận ra rằng họ gần như không có lựa chọn nào khác, bởi những mô hình này rẻ hơn và trong nhiều trường hợp, còn phù hợp hơn với yêu cầu thực tế.

Đó chính là cách mà tương lai của AI tự động được hình thành – theo từng quy trình một.

XÂY DỰNG NHÀ MÁY AI TỪ MÔ HÌNH NGÔN NGỮ NHỎ

Có thể trông như thể các hệ thống AI đang ngày càng mạnh mẽ hơn vì những mô hình nền tảng thông minh hơn, và sự thật đúng là các mô hình lớn đang tiếp tục phát triển.

Tuy nhiên, trong nhiều trường hợp, sự thật đằng sau năng suất tăng trưởng của doanh nghiệp lại nằm ở việc các kỹ sư đang ngày càng giỏi hơn trong việc kết nối các mô hình AI nhỏ, đơn giản để đạt được hiệu quả cao.

Đơn cử, Aurelian – một startup ở Seattle – đã sử dụng AI tạo sinh để tự động phản hồi các cuộc gọi không khẩn cấp tới trung tâm 911. Ở San Francisco, Gong dùng AI để quét và phân tích tất cả cuộc gọi bán hàng của khách hàng nhằm cải thiện doanh số. Airbnb thì sử dụng AI, bao gồm cả các mô hình mã nguồn mở từ Alibaba, để tự động xử lý phần lớn các vấn đề chăm sóc khách hàng nhanh hơn con người.

Ngay cả Meta cũng đang sử dụng các mô hình nhỏ như vậy. Trong cuộc họp báo cáo kết quả kinh doanh gần đây, Giám đốc tài chính Susan Li cho biết, công ty không dùng những mô hình AI lớn nhất để phân phối quảng cáo vì “kích thước và độ phức tạp khiến chi phí quá cao”. Thay vào đó, Meta dùng các mô hình lớn để huấn luyện, rồi chuyển giao kiến thức cho các mô hình nhỏ hơn, nhẹ hơn, chuyên biệt hơn để sử dụng thực tế.

Meta đã sử dụng các mô hình AI nhỏ trong hệ thống phân phối quảng cáo. Ảnh: AP
Meta đã sử dụng các mô hình AI nhỏ trong hệ thống phân phối quảng cáo. Ảnh: AP

Điểm chung của các công ty này là đều đã xây dựng được “nhà máy tri thức” nội bộ - nơi mà các mô hình AI nhỏ được nối tiếp nhau như các công đoạn trong dây chuyền.

Nếu trong nhà máy truyền thống, sản phẩm đi qua băng chuyền và được công nhân điều chỉnh dần, thì trong “nhà máy AI”, dữ liệu được luân chuyển qua nhiều tầng phần mềm, và mỗi AI nhỏ lại xử lý, phân loại hay chuyển đổi nó theo một cách khác nhau.

Ở đây, “băng chuyền” là phần mềm thông thường mà các công ty đã phát triển qua nhiều năm, còn “công nhân” là các công cụ AI chạy bằng mô hình ngôn ngữ nhỏ.

Một nhóm nhà nghiên cứu từ Nvidia và Viện Công nghệ Georgia gần đây đã nhận định rằng, sự trỗi dậy của các tác nhân AI đang mở ra “hàng loạt ứng dụng, trong đó các mô hình ngôn ngữ thực hiện lặp đi lặp lại một số nhiệm vụ chuyên biệt với rất ít biến thể”.

Nhóm nghiên cứu kết luận rằng, các mô hình ngôn ngữ nhỏ “đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn” cho những công việc như vậy.

ỨNG DỤNG MÔ HÌNH NGÔN NGỮ NHỎ TRONG THỰC TẾ

Gong – công ty giúp khách hàng tăng doanh số - là một trong những ví dụ tiêu biểu. Nhà đồng sáng lập – ông Eilon Reshef cho biết, khách hàng như Google hay Cisco có thể hỏi hệ thống AI hội thoại những câu như: “Tại sao tôi đang mất đơn hàng?”

Để trả lời, Gong kết hợp giữa các công cụ AI tiên tiến và đắt tiền với những mô hình nhỏ hơn, rẻ hơn. Hệ thống sẽ giao những nhiệm vụ phức tạp hơn cho các mô hình thông minh hơn, giống như người quản lý giao việc tùy theo trình độ của nhân viên.

Phần mềm của Gong bắt đầu bằng cách gửi câu hỏi của người dùng, ví dụ “Vì sao doanh số của tôi giảm?”, đến một trong những mô hình AI tiên tiến của Anthropic hoặc OpenAI. Mô hình này sẽ đưa ra kế hoạch tổng quát để trả lời. Do các mô hình lớn rất đắt và tốn thời gian suy luận, Gong chỉ dùng khi thật sự cần.

Sau đó, hệ thống của Gong tự động khởi động, rà soát hàng chục nghìn cuộc gọi bán hàng đã ghi âm, dùng các mô hình ngôn ngữ nhỏ hơn để tóm tắt nội dung, rồi một mô hình khác sẽ đọc và phân tích những bản tóm tắt đó.

Cuối cùng, tất cả dữ liệu này được đưa trở lại cho mô hình AI lớn để tạo ra một bản báo cáo – bản báo cáo mà trước đây sẽ cần hàng trăm giờ làm việc của con người có chuyên môn.

“Bạn có thể dùng mô hình rẻ nhất để xem cuộc gọi có liên quan không, mô hình trung bình để tìm thông tin quan trọng, rồi mô hình đắt nhất để viết ra tài liệu hành động”, ông Reshef giải thích.

Các mô hình ngôn ngữ nhỏ đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn khi ứng dụng trong đời sống. Ảnh: Shutterstock
Các mô hình ngôn ngữ nhỏ đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn khi ứng dụng trong đời sống. Ảnh: Shutterstock

MÔ HÌNH AI DỰA VÀO NGÔN NGỮ NHỎ NHANH HƠN, RẺ HƠN

Sự khác biệt về chi phí giữa các mô hình lớn, phức tạp và các mô hình nhỏ, đơn giản là rất lớn.

Theo ước tính trung bình của ngành, GPT-5 Nano của OpenAI – mô hình nhỏ và nhanh nhất – có giá khoảng 0,1 USD cho mỗi triệu token, trong khi GPT-5 đầy đủ và tiên tiến có giá khoảng 3,44 USD cho cùng số lượng. Token là đơn vị cơ bản mà AI dùng để xử lý văn bản.

Hơn nữa, các mô hình lớn có thể tiêu tốn gấp hàng nghìn lần số token để hoàn thành một tác vụ, vì các mô hình này cần “tự trò chuyện nội tâm” để suy luận ra câu trả lời.

Cần lưu ý rằng “nhỏ và ít thông minh hơn” không đồng nghĩa với “kém hiệu quả hơn”. Các mô hình nhỏ hoàn toàn có thể được tinh chỉnh trong quá trình huấn luyện hoặc thông qua các hướng dẫn chi tiết để trở nên cực kỳ phù hợp với nhiệm vụ cụ thể.

“Các mô hình ngôn ngữ lớn cực kỳ thông minh, nhưng không mang lại cho chúng tôi cách tận dụng dữ liệu độc quyền hoặc để đưa phản hồi của biên tập viên vào hệ thống một cách hiệu quả”, ông Don MacKinnon, Giám đốc điều hành Hark Audio, cho biết.

Nhóm của ông đã xây dựng một thư viện hàng chục nghìn đoạn podcast được chọn lọc và biên tập thủ công, dùng chính dữ liệu này để tinh chỉnh mô hình AI tùy chỉnh có thể tự động hóa toàn bộ quy trình.

Qua trao đổi với nhiều công ty đang sử dụng mô hình nhỏ, có thể thấy họ đều xây dựng hệ thống của theo cách rất giống nhau. Điều đó cho thấy rằng có lẽ chỉ có một số mô hình hoạt động thực sự hiệu quả, và gần như tất cả đều bao gồm các mô hình ngôn ngữ nhỏ.


Marcom AI lọt Top 10 Sản phẩm – Dịch vụ Tiên phong 2025: Dấu ấn AI Việt trong lĩnh vực truyền thông

Marcom AI được vinh danh trong Top 10 Sản phẩm – Dịch vụ Tiên phong 2025, phản ánh xu hướng AI Việt trong truyền thông và quản trị nội dung số.

21:21 18/12/2025
Tích hợp Blockchain trên VNeID, ứng dụng rộng rãi trong khu vực dịch vụ công - tư

Công nghệ Blockchain được tích hợp trên VNeID, phục vụ truy xuất nguồn gốc tiền chất, hoá chất, nâng cao hiệu quả quản lý nhà nước.

21:21 18/12/2025
Doanh nghiệp kiến nghị lập bảng so sánh chính sách để Việt Nam thành Digital & AI Hub của khu vực

Chủ tịch CMC kiến nghị lập bảng so sánh chính sách dữ liệu giữa Việt Nam và các trung tâm khu vực nhằm nâng cao năng lực cạnh tranh và thu hút đầu tư.

14:04 17/12/2025
Cuộc đua đưa trung tâm dữ liệu AI lên quỹ đạo không gian

Jeff Bezos và Elon Musk cạnh tranh đưa trung tâm dữ liệu AI lên quỹ đạo, mở ra cơ hội mới cho ngành không gian thương mại và công nghệ.

10:45 16/12/2025
Sự bùng nổ của AI có nhiều điểm khác biệt so với thời "bong bóng" dot-com

Thung lũng Silicon đang bùng nổ AI, nhưng điều gì khiến cơn sốt này khác biệt so với bong bóng dot-com năm 2000? Tìm hiểu những yếu tố quyết định.

10:44 16/12/2025
Kính AI của Google: Bước tiến tiếp theo sau kỷ nguyên smartphone?

Google giới thiệu kính thông minh tích hợp AI, mở ra kỷ nguyên mới cho máy tính cá nhân, thay đổi cách chúng ta tương tác với thông tin.

09:59 15/12/2025
Chống lại vi khuẩn kháng kháng sinh: Sức mạnh AI đang thay đổi cuộc chiến?

WHO cảnh báo kháng kháng sinh tăng 15% hàng năm. AI đang giúp thiết kế kháng sinh mới, nhưng cần thêm đầu tư để thương mại hóa.

09:58 15/12/2025
Muốn giảm rác điện tử phải bắt đầu từ khâu thiết kế

Rác thải điện tử chứa khoáng sản quý đang gia tăng, cần thiết kế bền vững và quy trình mua sắm hiệu quả để giảm thiểu tác động môi trường.

09:49 10/12/2025
Các công ty hàng đầu chưa có kế hoạch kiểm soát siêu trí tuệ nhân tạo

Báo cáo Winter AI Safety Index 2025 chỉ ra rằng các công ty AI lớn như OpenAI và Google DeepMind không có chiến lược đáng tin cậy để kiểm soát rủi ro siêu trí tuệ.

14:23 09/12/2025