Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"

Mai Anh

07/11/2025

Làn sóng trí tuệ nhân tạo hiện đại đang chứng kiến một nghịch lý: những mô hình phức tạp đang được các công ty sử dụng để tạo ra hiệu quả làm việc và cắt giảm nhân sự lại không phải là những mô hình nổi tiếng có nhiều sự chú ý…

Mô hình ngôn ngữ nhỏ có thể dễ dàng điều chỉnh theo các tác vụ cụ thể. Ảnh: Shutterstock

Những mô hình tiên tiến và có khả năng suy luận nhanh hơn, tốt hơn liên tục xuất hiện trên câu chủ đề của các tờ báo nhờ khả năng liên tục phá vỡ các kỷ lục về nhận thức và phân tích. Những mô hình này thậm chí còn vượt qua các kỳ thi về luật và y học, hay cả Olympic toán học.

Lãnh đạo của các phòng thí nghiệm trí tuệ nhân tạo (AI) hàng đầu, từ ông Sam Altman của OpenAI, ông Dario Amodei của Anthropic, ông Demis Hassabis của DeepMind (thuộc Google) cho đến tỷ phú Elon Musk của xAI, đều nói về một tương lai với AGI – trí tuệ nhân tạo tổng quát. Đó là viễn cảnh nơi máy móc thông minh ngang ngửa con người.

Theo giả thuyết, chính những “bộ não khổng lồ” này của AI sẽ là mối đe dọa lớn nhất đối với việc làm của con người.

Thế nhưng, khi trò chuyện với các giám đốc điều hành tại những công ty đang ứng dụng AI mỗi ngày, một câu chuyện hoàn toàn khác đang diễn ra trên thực tế, tác giả Christopher Mims viết trên tờ The Wall Street Journal (WSJ).

Với phần lớn tác vụ, không phải những mô hình AI lớn nhất và thông minh nhất đang chiếm ưu thế, mà là những mô hình đơn giản hơn. Những “anh hùng thầm lặng” này của AI – những mô hình thực sự đang thay đổi quy trình kinh doanh và lực lượng lao động – lại là những mô hình nhỏ nhất, nhanh nhất và rẻ nhất.

“Thực tế là, với rất nhiều hoạt động tính toán mà chúng ta cần hiện nay, chúng ta không nhất thiết phải dùng đến các mô hình ngôn ngữ lớn”, ông Kyle Lo, một nhà khoa học nghiên cứu tại Viện Allen về AI, cho biết.

Các công ty ứng dụng AI thành công thường xây dựng phần mềm và dịch vụ như một dây chuyền sản xuất AI: thông tin đi vào một đầu, và rồi dữ liệu, hành động hoặc sản phẩm đi ra ở đầu kia. Ở giữa, hàng loạt AI nhỏ hơn, đơn giản hơn, chuyên biệt hơn, nhanh hơn và rẻ hơn đang làm toàn bộ công việc.

Những doanh nghiệp cần triển khai AI ở quy mô lớn đang phát hiện ra rằng, các mô hình ngôn ngữ nhỏ hoàn toàn đủ khả năng để đảm nhiệm các nhiệm vụ đó. Hơn nữa, doanh nghiệp cũng nhận ra rằng họ gần như không có lựa chọn nào khác, bởi những mô hình này rẻ hơn và trong nhiều trường hợp, còn phù hợp hơn với yêu cầu thực tế.

Đó chính là cách mà tương lai của AI tự động được hình thành – theo từng quy trình một.

XÂY DỰNG NHÀ MÁY AI TỪ MÔ HÌNH NGÔN NGỮ NHỎ

Có thể trông như thể các hệ thống AI đang ngày càng mạnh mẽ hơn vì những mô hình nền tảng thông minh hơn, và sự thật đúng là các mô hình lớn đang tiếp tục phát triển.

Tuy nhiên, trong nhiều trường hợp, sự thật đằng sau năng suất tăng trưởng của doanh nghiệp lại nằm ở việc các kỹ sư đang ngày càng giỏi hơn trong việc kết nối các mô hình AI nhỏ, đơn giản để đạt được hiệu quả cao.

Đơn cử, Aurelian – một startup ở Seattle – đã sử dụng AI tạo sinh để tự động phản hồi các cuộc gọi không khẩn cấp tới trung tâm 911. Ở San Francisco, Gong dùng AI để quét và phân tích tất cả cuộc gọi bán hàng của khách hàng nhằm cải thiện doanh số. Airbnb thì sử dụng AI, bao gồm cả các mô hình mã nguồn mở từ Alibaba, để tự động xử lý phần lớn các vấn đề chăm sóc khách hàng nhanh hơn con người.

Ngay cả Meta cũng đang sử dụng các mô hình nhỏ như vậy. Trong cuộc họp báo cáo kết quả kinh doanh gần đây, Giám đốc tài chính Susan Li cho biết, công ty không dùng những mô hình AI lớn nhất để phân phối quảng cáo vì “kích thước và độ phức tạp khiến chi phí quá cao”. Thay vào đó, Meta dùng các mô hình lớn để huấn luyện, rồi chuyển giao kiến thức cho các mô hình nhỏ hơn, nhẹ hơn, chuyên biệt hơn để sử dụng thực tế.

Meta đã sử dụng các mô hình AI nhỏ trong hệ thống phân phối quảng cáo. Ảnh: AP

Điểm chung của các công ty này là đều đã xây dựng được “nhà máy tri thức” nội bộ - nơi mà các mô hình AI nhỏ được nối tiếp nhau như các công đoạn trong dây chuyền.

Nếu trong nhà máy truyền thống, sản phẩm đi qua băng chuyền và được công nhân điều chỉnh dần, thì trong “nhà máy AI”, dữ liệu được luân chuyển qua nhiều tầng phần mềm, và mỗi AI nhỏ lại xử lý, phân loại hay chuyển đổi nó theo một cách khác nhau.

Ở đây, “băng chuyền” là phần mềm thông thường mà các công ty đã phát triển qua nhiều năm, còn “công nhân” là các công cụ AI chạy bằng mô hình ngôn ngữ nhỏ.

Một nhóm nhà nghiên cứu từ Nvidia và Viện Công nghệ Georgia gần đây đã nhận định rằng, sự trỗi dậy của các tác nhân AI đang mở ra “hàng loạt ứng dụng, trong đó các mô hình ngôn ngữ thực hiện lặp đi lặp lại một số nhiệm vụ chuyên biệt với rất ít biến thể”.

Nhóm nghiên cứu kết luận rằng, các mô hình ngôn ngữ nhỏ “đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn” cho những công việc như vậy.

ỨNG DỤNG MÔ HÌNH NGÔN NGỮ NHỎ TRONG THỰC TẾ

Gong – công ty giúp khách hàng tăng doanh số - là một trong những ví dụ tiêu biểu. Nhà đồng sáng lập – ông Eilon Reshef cho biết, khách hàng như Google hay Cisco có thể hỏi hệ thống AI hội thoại những câu như: “Tại sao tôi đang mất đơn hàng?”

Để trả lời, Gong kết hợp giữa các công cụ AI tiên tiến và đắt tiền với những mô hình nhỏ hơn, rẻ hơn. Hệ thống sẽ giao những nhiệm vụ phức tạp hơn cho các mô hình thông minh hơn, giống như người quản lý giao việc tùy theo trình độ của nhân viên.

Phần mềm của Gong bắt đầu bằng cách gửi câu hỏi của người dùng, ví dụ “Vì sao doanh số của tôi giảm?”, đến một trong những mô hình AI tiên tiến của Anthropic hoặc OpenAI. Mô hình này sẽ đưa ra kế hoạch tổng quát để trả lời. Do các mô hình lớn rất đắt và tốn thời gian suy luận, Gong chỉ dùng khi thật sự cần.

Sau đó, hệ thống của Gong tự động khởi động, rà soát hàng chục nghìn cuộc gọi bán hàng đã ghi âm, dùng các mô hình ngôn ngữ nhỏ hơn để tóm tắt nội dung, rồi một mô hình khác sẽ đọc và phân tích những bản tóm tắt đó.

Cuối cùng, tất cả dữ liệu này được đưa trở lại cho mô hình AI lớn để tạo ra một bản báo cáo – bản báo cáo mà trước đây sẽ cần hàng trăm giờ làm việc của con người có chuyên môn.

“Bạn có thể dùng mô hình rẻ nhất để xem cuộc gọi có liên quan không, mô hình trung bình để tìm thông tin quan trọng, rồi mô hình đắt nhất để viết ra tài liệu hành động”, ông Reshef giải thích.

Các mô hình ngôn ngữ nhỏ đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn khi ứng dụng trong đời sống. Ảnh: Shutterstock

MÔ HÌNH AI DỰA VÀO NGÔN NGỮ NHỎ NHANH HƠN, RẺ HƠN

Sự khác biệt về chi phí giữa các mô hình lớn, phức tạp và các mô hình nhỏ, đơn giản là rất lớn.

Theo ước tính trung bình của ngành, GPT-5 Nano của OpenAI – mô hình nhỏ và nhanh nhất – có giá khoảng 0,1 USD cho mỗi triệu token, trong khi GPT-5 đầy đủ và tiên tiến có giá khoảng 3,44 USD cho cùng số lượng. Token là đơn vị cơ bản mà AI dùng để xử lý văn bản.

Hơn nữa, các mô hình lớn có thể tiêu tốn gấp hàng nghìn lần số token để hoàn thành một tác vụ, vì các mô hình này cần “tự trò chuyện nội tâm” để suy luận ra câu trả lời.

Cần lưu ý rằng “nhỏ và ít thông minh hơn” không đồng nghĩa với “kém hiệu quả hơn”. Các mô hình nhỏ hoàn toàn có thể được tinh chỉnh trong quá trình huấn luyện hoặc thông qua các hướng dẫn chi tiết để trở nên cực kỳ phù hợp với nhiệm vụ cụ thể.

“Các mô hình ngôn ngữ lớn cực kỳ thông minh, nhưng không mang lại cho chúng tôi cách tận dụng dữ liệu độc quyền hoặc để đưa phản hồi của biên tập viên vào hệ thống một cách hiệu quả”, ông Don MacKinnon, Giám đốc điều hành Hark Audio, cho biết.

Nhóm của ông đã xây dựng một thư viện hàng chục nghìn đoạn podcast được chọn lọc và biên tập thủ công, dùng chính dữ liệu này để tinh chỉnh mô hình AI tùy chỉnh có thể tự động hóa toàn bộ quy trình.

Qua trao đổi với nhiều công ty đang sử dụng mô hình nhỏ, có thể thấy họ đều xây dựng hệ thống của theo cách rất giống nhau. Điều đó cho thấy rằng có lẽ chỉ có một số mô hình hoạt động thực sự hiệu quả, và gần như tất cả đều bao gồm các mô hình ngôn ngữ nhỏ.

Từ khóa:

Trung tâm dữ liệu Hyperion công suất 5 gigawatt của Meta đang được xây dựng tại Richland Parish (Louisiana, Hoa Kỳ), ngày 9/1/2026. Nguồn: Meta.

Meta ra mắt hàng loạt chip AI riêng

Phó Chủ tịch Kỹ thuật Yee Jiun Song cho biết các chip này giúp Meta đa dạng hóa nguồn cung silicon và phần nào giảm tác động từ biến động giá…

14:03 14/03/2026

Ngành sản xuất thiết bị bán dẫn của Nhật Bản đang bùng nổ. Ảnh: Bloomberg

Nhật Bản muốn chiếm 1/3 thị phần bán dẫn toàn cầu

Nhật Bản đặt mục tiêu đạt hơn 250 tỷ USD doanh thu chip sản xuất trong nước vào năm 2040…

12:03 14/03/2026

Copilot Cowork đang được thử nghiệm với một nhóm nhỏ khách hàng doanh nghiệp trước khi chính thức triển khai diện rộng

Khám phá các tác nhân AI bên trong Microsoft 365 Copilot

Microsoft đang thử nghiệm Copilot Cowork – bước tiến mới của AI văn phòng, cho phép hệ thống không chỉ hỗ trợ viết nội dung mà còn tự thực hiện công việc trong phần mềm. Nếu thành công, AI có thể trở thành “đồng nghiệp số” thực sự trong môi trường doanh nghiệp…

11:58 14/03/2026

UAV chỉ huy có thể chỉ huy phi đội nhiều UAV chữa cháy có mặt tại hiện trường theo một kịch bản chữa cháy và cứu nạn tối ưu đã được dạy cho AI phòng cháy chữa cháy

"UAV bầy đàn": Giải pháp ứng dụng AI, chữa cháy tại các hẻm nhỏ ở thành phố lớn

CT UAV, thành viên của CT Group, đã phát triển một giải pháp "UAV chữa cháy bầy đàn" đầu tiên tại Việt Nam dùng AI để điều khiển phi đội UAV tiếp cận nhanh, xử lý các đám cháy ở sâu trong ngõ nhỏ, hẻm sâu...

11:48 14/03/2026

Bắc Kinh đã xác định “trí tuệ hiện thân” (embodied intelligence) là một trong sáu ngành công nghiệp tương lai trong Kế hoạch 5 năm 2026–2030

Bên trong các phòng thí nghiệm AI chuyên huấn luyện robot hình người của Trung Quốc

Trung Quốc đang xây dựng hàng loạt trung tâm thu thập dữ liệu và “nông trại huấn luyện” robot nhằm tạo ra bộ dữ liệu khổng lồ để phát triển robot hình người…

13:48 13/03/2026

Nhà sản xuất Trung Quốc nuôi tham vọng về điện thoại robot?

Honor ra mắt chiếc điện thoại có cánh tay robot cùng với mẫu robot hình người tại Mobile World Congress 2026…

09:33 13/03/2026

Ý tưởng của Moltbook khá đơn giản: tạo ra một môi trường nơi các AI agent có thể tương tác trực tiếp với nhau.

Giải mã Moltbook, "sân chơi" mạng xã hội dành riêng cho bot đang gây sốt toàn cầu

Moltbook, một mạng xã hội nơi người dùng không phải con người mà là các tác nhân AI (AI agent) đang trở thành chủ đề nóng trong giới công nghệ...

09:31 13/03/2026

Bằng các kỹ thuật chế tạo tiên tiến, Trung Quốc đã thu nhỏ điện cực cổng của transistor xuống kích thước chỉ 1 nanomet

Trung Quốc phát triển transistor 1 nm nhỏ nhất thế giới, hứa hẹn định hình chip AI thế hệ mới

Các nhà nghiên cứu tại Đại học Bắc Kinh đã phát triển transistor ferroelectric có cổng chỉ 1 nanomet – nhỏ nhất và tiết kiệm năng lượng nhất hiện nay...

16:23 06/03/2026

Một công nhân đang làm việc trên dây chuyền sản xuất của một công ty sản xuất chip bán dẫn tại Suqian, tỉnh Giang Tô.

Kế hoạch 5 năm mới của Trung Quốc nhấn mạnh vào AI, 6G, robot hình người, điện toán lượng tử

Kế hoạch 5 năm được công bố cùng thời điểm khai mạc kỳ họp Quốc hội của Trung Quốc cho thấy tham vọng Bắc Kinh trong việc giành “vị trí chỉ huy” trong cuộc cạnh tranh công nghệ toàn cầu…

16:22 06/03/2026

Vị thế về AI của Việt Nam đang lớn mạnh khi trở thành trung tâm cung ứng toàn cầu nhờ lực lượng lao động trẻ và chi phí hiệu quả

Việt Nam tiên phong tại Đông Nam Á với khung pháp lý AI toàn diện đầu tiên trong khu vực

Tạp chí Mugglehead nhận định, bước đi này đưa Việt Nam vào vị thế dẫn trước các nước láng giềng ASEAN trong việc quản lý sự phát triển nhanh chóng của trí tuệ nhân tạo...

10:24 06/03/2026