Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"
Mai Anh
07/11/2025
Làn sóng trí tuệ nhân tạo hiện đại đang chứng kiến một nghịch lý: những mô hình phức tạp đang được các công ty sử dụng để tạo ra hiệu quả làm việc và cắt giảm nhân sự lại không phải là những mô hình nổi tiếng có nhiều sự chú ý…
Những mô hình tiên tiến và có khả năng suy luận nhanh hơn, tốt hơn liên tục xuất hiện trên câu chủ đề của các tờ báo nhờ khả năng liên tục phá vỡ các kỷ lục về nhận thức và phân tích. Những mô hình này thậm chí còn vượt qua các kỳ thi về luật và y học, hay cả Olympic toán học.
Lãnh đạo của các phòng thí nghiệm trí tuệ nhân tạo (AI) hàng đầu, từ ông Sam Altman của OpenAI, ông Dario Amodei của Anthropic, ông Demis Hassabis của DeepMind (thuộc Google) cho đến tỷ phú Elon Musk của xAI, đều nói về một tương lai với AGI – trí tuệ nhân tạo tổng quát. Đó là viễn cảnh nơi máy móc thông minh ngang ngửa con người.
Theo giả thuyết, chính những “bộ não khổng lồ” này của AI sẽ là mối đe dọa lớn nhất đối với việc làm của con người.
Thế nhưng, khi trò chuyện với các giám đốc điều hành tại những công ty đang ứng dụng AI mỗi ngày, một câu chuyện hoàn toàn khác đang diễn ra trên thực tế, tác giả Christopher Mims viết trên tờ The Wall Street Journal (WSJ).
Với phần lớn tác vụ, không phải những mô hình AI lớn nhất và thông minh nhất đang chiếm ưu thế, mà là những mô hình đơn giản hơn. Những “anh hùng thầm lặng” này của AI – những mô hình thực sự đang thay đổi quy trình kinh doanh và lực lượng lao động – lại là những mô hình nhỏ nhất, nhanh nhất và rẻ nhất.
“Thực tế là, với rất nhiều hoạt động tính toán mà chúng ta cần hiện nay, chúng ta không nhất thiết phải dùng đến các mô hình ngôn ngữ lớn”, ông Kyle Lo, một nhà khoa học nghiên cứu tại Viện Allen về AI, cho biết.
Các công ty ứng dụng AI thành công thường xây dựng phần mềm và dịch vụ như một dây chuyền sản xuất AI: thông tin đi vào một đầu, và rồi dữ liệu, hành động hoặc sản phẩm đi ra ở đầu kia. Ở giữa, hàng loạt AI nhỏ hơn, đơn giản hơn, chuyên biệt hơn, nhanh hơn và rẻ hơn đang làm toàn bộ công việc.
Những doanh nghiệp cần triển khai AI ở quy mô lớn đang phát hiện ra rằng, các mô hình ngôn ngữ nhỏ hoàn toàn đủ khả năng để đảm nhiệm các nhiệm vụ đó. Hơn nữa, doanh nghiệp cũng nhận ra rằng họ gần như không có lựa chọn nào khác, bởi những mô hình này rẻ hơn và trong nhiều trường hợp, còn phù hợp hơn với yêu cầu thực tế.
Đó chính là cách mà tương lai của AI tự động được hình thành – theo từng quy trình một.
XÂY DỰNG NHÀ MÁY AI TỪ MÔ HÌNH NGÔN NGỮ NHỎ
Có thể trông như thể các hệ thống AI đang ngày càng mạnh mẽ hơn vì những mô hình nền tảng thông minh hơn, và sự thật đúng là các mô hình lớn đang tiếp tục phát triển.
Tuy nhiên, trong nhiều trường hợp, sự thật đằng sau năng suất tăng trưởng của doanh nghiệp lại nằm ở việc các kỹ sư đang ngày càng giỏi hơn trong việc kết nối các mô hình AI nhỏ, đơn giản để đạt được hiệu quả cao.
Đơn cử, Aurelian – một startup ở Seattle – đã sử dụng AI tạo sinh để tự động phản hồi các cuộc gọi không khẩn cấp tới trung tâm 911. Ở San Francisco, Gong dùng AI để quét và phân tích tất cả cuộc gọi bán hàng của khách hàng nhằm cải thiện doanh số. Airbnb thì sử dụng AI, bao gồm cả các mô hình mã nguồn mở từ Alibaba, để tự động xử lý phần lớn các vấn đề chăm sóc khách hàng nhanh hơn con người.
Ngay cả Meta cũng đang sử dụng các mô hình nhỏ như vậy. Trong cuộc họp báo cáo kết quả kinh doanh gần đây, Giám đốc tài chính Susan Li cho biết, công ty không dùng những mô hình AI lớn nhất để phân phối quảng cáo vì “kích thước và độ phức tạp khiến chi phí quá cao”. Thay vào đó, Meta dùng các mô hình lớn để huấn luyện, rồi chuyển giao kiến thức cho các mô hình nhỏ hơn, nhẹ hơn, chuyên biệt hơn để sử dụng thực tế.
Điểm chung của các công ty này là đều đã xây dựng được “nhà máy tri thức” nội bộ - nơi mà các mô hình AI nhỏ được nối tiếp nhau như các công đoạn trong dây chuyền.
Nếu trong nhà máy truyền thống, sản phẩm đi qua băng chuyền và được công nhân điều chỉnh dần, thì trong “nhà máy AI”, dữ liệu được luân chuyển qua nhiều tầng phần mềm, và mỗi AI nhỏ lại xử lý, phân loại hay chuyển đổi nó theo một cách khác nhau.
Ở đây, “băng chuyền” là phần mềm thông thường mà các công ty đã phát triển qua nhiều năm, còn “công nhân” là các công cụ AI chạy bằng mô hình ngôn ngữ nhỏ.
Một nhóm nhà nghiên cứu từ Nvidia và Viện Công nghệ Georgia gần đây đã nhận định rằng, sự trỗi dậy của các tác nhân AI đang mở ra “hàng loạt ứng dụng, trong đó các mô hình ngôn ngữ thực hiện lặp đi lặp lại một số nhiệm vụ chuyên biệt với rất ít biến thể”.
Nhóm nghiên cứu kết luận rằng, các mô hình ngôn ngữ nhỏ “đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn” cho những công việc như vậy.
ỨNG DỤNG MÔ HÌNH NGÔN NGỮ NHỎ TRONG THỰC TẾ
Gong – công ty giúp khách hàng tăng doanh số - là một trong những ví dụ tiêu biểu. Nhà đồng sáng lập – ông Eilon Reshef cho biết, khách hàng như Google hay Cisco có thể hỏi hệ thống AI hội thoại những câu như: “Tại sao tôi đang mất đơn hàng?”
Để trả lời, Gong kết hợp giữa các công cụ AI tiên tiến và đắt tiền với những mô hình nhỏ hơn, rẻ hơn. Hệ thống sẽ giao những nhiệm vụ phức tạp hơn cho các mô hình thông minh hơn, giống như người quản lý giao việc tùy theo trình độ của nhân viên.
Phần mềm của Gong bắt đầu bằng cách gửi câu hỏi của người dùng, ví dụ “Vì sao doanh số của tôi giảm?”, đến một trong những mô hình AI tiên tiến của Anthropic hoặc OpenAI. Mô hình này sẽ đưa ra kế hoạch tổng quát để trả lời. Do các mô hình lớn rất đắt và tốn thời gian suy luận, Gong chỉ dùng khi thật sự cần.
Sau đó, hệ thống của Gong tự động khởi động, rà soát hàng chục nghìn cuộc gọi bán hàng đã ghi âm, dùng các mô hình ngôn ngữ nhỏ hơn để tóm tắt nội dung, rồi một mô hình khác sẽ đọc và phân tích những bản tóm tắt đó.
Cuối cùng, tất cả dữ liệu này được đưa trở lại cho mô hình AI lớn để tạo ra một bản báo cáo – bản báo cáo mà trước đây sẽ cần hàng trăm giờ làm việc của con người có chuyên môn.
“Bạn có thể dùng mô hình rẻ nhất để xem cuộc gọi có liên quan không, mô hình trung bình để tìm thông tin quan trọng, rồi mô hình đắt nhất để viết ra tài liệu hành động”, ông Reshef giải thích.
MÔ HÌNH AI DỰA VÀO NGÔN NGỮ NHỎ NHANH HƠN, RẺ HƠN
Sự khác biệt về chi phí giữa các mô hình lớn, phức tạp và các mô hình nhỏ, đơn giản là rất lớn.
Theo ước tính trung bình của ngành, GPT-5 Nano của OpenAI – mô hình nhỏ và nhanh nhất – có giá khoảng 0,1 USD cho mỗi triệu token, trong khi GPT-5 đầy đủ và tiên tiến có giá khoảng 3,44 USD cho cùng số lượng. Token là đơn vị cơ bản mà AI dùng để xử lý văn bản.
Hơn nữa, các mô hình lớn có thể tiêu tốn gấp hàng nghìn lần số token để hoàn thành một tác vụ, vì các mô hình này cần “tự trò chuyện nội tâm” để suy luận ra câu trả lời.
Cần lưu ý rằng “nhỏ và ít thông minh hơn” không đồng nghĩa với “kém hiệu quả hơn”. Các mô hình nhỏ hoàn toàn có thể được tinh chỉnh trong quá trình huấn luyện hoặc thông qua các hướng dẫn chi tiết để trở nên cực kỳ phù hợp với nhiệm vụ cụ thể.
“Các mô hình ngôn ngữ lớn cực kỳ thông minh, nhưng không mang lại cho chúng tôi cách tận dụng dữ liệu độc quyền hoặc để đưa phản hồi của biên tập viên vào hệ thống một cách hiệu quả”, ông Don MacKinnon, Giám đốc điều hành Hark Audio, cho biết.
Nhóm của ông đã xây dựng một thư viện hàng chục nghìn đoạn podcast được chọn lọc và biên tập thủ công, dùng chính dữ liệu này để tinh chỉnh mô hình AI tùy chỉnh có thể tự động hóa toàn bộ quy trình.
Qua trao đổi với nhiều công ty đang sử dụng mô hình nhỏ, có thể thấy họ đều xây dựng hệ thống của theo cách rất giống nhau. Điều đó cho thấy rằng có lẽ chỉ có một số mô hình hoạt động thực sự hiệu quả, và gần như tất cả đều bao gồm các mô hình ngôn ngữ nhỏ.
Lần đầu vượt mốc doanh thu hơn 10.500 tỷ đồng sau 33 năm phát triển, CMC đặt mục tiêu bước vào chu kỳ đổi mới lần hai, lấy AI-X làm động lực tăng trưởng mới.
Xuất hiện tại không gian triển lãm của Diễn đàn Vietnam – Asia DX Summit 2026, bộ giải pháp AI Made in Vietnam Askonomy đã thu hút sự quan tâm của giới chức và các doanh nghiệp công nghệ hàng đầu khi trình diễn năng lực tự động hóa thông minh dựa trên nền tảng công nghệ lõi tự phát triển...
Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…
Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.
Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...
Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...
Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...
CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.
CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...
Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...