Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"
Mai Anh
07/11/2025
Làn sóng trí tuệ nhân tạo hiện đại đang chứng kiến một nghịch lý: những mô hình phức tạp đang được các công ty sử dụng để tạo ra hiệu quả làm việc và cắt giảm nhân sự lại không phải là những mô hình nổi tiếng có nhiều sự chú ý…
Những mô hình tiên tiến và có khả năng suy luận nhanh hơn, tốt hơn liên tục xuất hiện trên câu chủ đề của các tờ báo nhờ khả năng liên tục phá vỡ các kỷ lục về nhận thức và phân tích. Những mô hình này thậm chí còn vượt qua các kỳ thi về luật và y học, hay cả Olympic toán học.
Lãnh đạo của các phòng thí nghiệm trí tuệ nhân tạo (AI) hàng đầu, từ ông Sam Altman của OpenAI, ông Dario Amodei của Anthropic, ông Demis Hassabis của DeepMind (thuộc Google) cho đến tỷ phú Elon Musk của xAI, đều nói về một tương lai với AGI – trí tuệ nhân tạo tổng quát. Đó là viễn cảnh nơi máy móc thông minh ngang ngửa con người.
Theo giả thuyết, chính những “bộ não khổng lồ” này của AI sẽ là mối đe dọa lớn nhất đối với việc làm của con người.
Thế nhưng, khi trò chuyện với các giám đốc điều hành tại những công ty đang ứng dụng AI mỗi ngày, một câu chuyện hoàn toàn khác đang diễn ra trên thực tế, tác giả Christopher Mims viết trên tờ The Wall Street Journal (WSJ).
Với phần lớn tác vụ, không phải những mô hình AI lớn nhất và thông minh nhất đang chiếm ưu thế, mà là những mô hình đơn giản hơn. Những “anh hùng thầm lặng” này của AI – những mô hình thực sự đang thay đổi quy trình kinh doanh và lực lượng lao động – lại là những mô hình nhỏ nhất, nhanh nhất và rẻ nhất.
“Thực tế là, với rất nhiều hoạt động tính toán mà chúng ta cần hiện nay, chúng ta không nhất thiết phải dùng đến các mô hình ngôn ngữ lớn”, ông Kyle Lo, một nhà khoa học nghiên cứu tại Viện Allen về AI, cho biết.
Các công ty ứng dụng AI thành công thường xây dựng phần mềm và dịch vụ như một dây chuyền sản xuất AI: thông tin đi vào một đầu, và rồi dữ liệu, hành động hoặc sản phẩm đi ra ở đầu kia. Ở giữa, hàng loạt AI nhỏ hơn, đơn giản hơn, chuyên biệt hơn, nhanh hơn và rẻ hơn đang làm toàn bộ công việc.
Những doanh nghiệp cần triển khai AI ở quy mô lớn đang phát hiện ra rằng, các mô hình ngôn ngữ nhỏ hoàn toàn đủ khả năng để đảm nhiệm các nhiệm vụ đó. Hơn nữa, doanh nghiệp cũng nhận ra rằng họ gần như không có lựa chọn nào khác, bởi những mô hình này rẻ hơn và trong nhiều trường hợp, còn phù hợp hơn với yêu cầu thực tế.
Đó chính là cách mà tương lai của AI tự động được hình thành – theo từng quy trình một.
XÂY DỰNG NHÀ MÁY AI TỪ MÔ HÌNH NGÔN NGỮ NHỎ
Có thể trông như thể các hệ thống AI đang ngày càng mạnh mẽ hơn vì những mô hình nền tảng thông minh hơn, và sự thật đúng là các mô hình lớn đang tiếp tục phát triển.
Tuy nhiên, trong nhiều trường hợp, sự thật đằng sau năng suất tăng trưởng của doanh nghiệp lại nằm ở việc các kỹ sư đang ngày càng giỏi hơn trong việc kết nối các mô hình AI nhỏ, đơn giản để đạt được hiệu quả cao.
Đơn cử, Aurelian – một startup ở Seattle – đã sử dụng AI tạo sinh để tự động phản hồi các cuộc gọi không khẩn cấp tới trung tâm 911. Ở San Francisco, Gong dùng AI để quét và phân tích tất cả cuộc gọi bán hàng của khách hàng nhằm cải thiện doanh số. Airbnb thì sử dụng AI, bao gồm cả các mô hình mã nguồn mở từ Alibaba, để tự động xử lý phần lớn các vấn đề chăm sóc khách hàng nhanh hơn con người.
Ngay cả Meta cũng đang sử dụng các mô hình nhỏ như vậy. Trong cuộc họp báo cáo kết quả kinh doanh gần đây, Giám đốc tài chính Susan Li cho biết, công ty không dùng những mô hình AI lớn nhất để phân phối quảng cáo vì “kích thước và độ phức tạp khiến chi phí quá cao”. Thay vào đó, Meta dùng các mô hình lớn để huấn luyện, rồi chuyển giao kiến thức cho các mô hình nhỏ hơn, nhẹ hơn, chuyên biệt hơn để sử dụng thực tế.
Điểm chung của các công ty này là đều đã xây dựng được “nhà máy tri thức” nội bộ - nơi mà các mô hình AI nhỏ được nối tiếp nhau như các công đoạn trong dây chuyền.
Nếu trong nhà máy truyền thống, sản phẩm đi qua băng chuyền và được công nhân điều chỉnh dần, thì trong “nhà máy AI”, dữ liệu được luân chuyển qua nhiều tầng phần mềm, và mỗi AI nhỏ lại xử lý, phân loại hay chuyển đổi nó theo một cách khác nhau.
Ở đây, “băng chuyền” là phần mềm thông thường mà các công ty đã phát triển qua nhiều năm, còn “công nhân” là các công cụ AI chạy bằng mô hình ngôn ngữ nhỏ.
Một nhóm nhà nghiên cứu từ Nvidia và Viện Công nghệ Georgia gần đây đã nhận định rằng, sự trỗi dậy của các tác nhân AI đang mở ra “hàng loạt ứng dụng, trong đó các mô hình ngôn ngữ thực hiện lặp đi lặp lại một số nhiệm vụ chuyên biệt với rất ít biến thể”.
Nhóm nghiên cứu kết luận rằng, các mô hình ngôn ngữ nhỏ “đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn” cho những công việc như vậy.
ỨNG DỤNG MÔ HÌNH NGÔN NGỮ NHỎ TRONG THỰC TẾ
Gong – công ty giúp khách hàng tăng doanh số - là một trong những ví dụ tiêu biểu. Nhà đồng sáng lập – ông Eilon Reshef cho biết, khách hàng như Google hay Cisco có thể hỏi hệ thống AI hội thoại những câu như: “Tại sao tôi đang mất đơn hàng?”
Để trả lời, Gong kết hợp giữa các công cụ AI tiên tiến và đắt tiền với những mô hình nhỏ hơn, rẻ hơn. Hệ thống sẽ giao những nhiệm vụ phức tạp hơn cho các mô hình thông minh hơn, giống như người quản lý giao việc tùy theo trình độ của nhân viên.
Phần mềm của Gong bắt đầu bằng cách gửi câu hỏi của người dùng, ví dụ “Vì sao doanh số của tôi giảm?”, đến một trong những mô hình AI tiên tiến của Anthropic hoặc OpenAI. Mô hình này sẽ đưa ra kế hoạch tổng quát để trả lời. Do các mô hình lớn rất đắt và tốn thời gian suy luận, Gong chỉ dùng khi thật sự cần.
Sau đó, hệ thống của Gong tự động khởi động, rà soát hàng chục nghìn cuộc gọi bán hàng đã ghi âm, dùng các mô hình ngôn ngữ nhỏ hơn để tóm tắt nội dung, rồi một mô hình khác sẽ đọc và phân tích những bản tóm tắt đó.
Cuối cùng, tất cả dữ liệu này được đưa trở lại cho mô hình AI lớn để tạo ra một bản báo cáo – bản báo cáo mà trước đây sẽ cần hàng trăm giờ làm việc của con người có chuyên môn.
“Bạn có thể dùng mô hình rẻ nhất để xem cuộc gọi có liên quan không, mô hình trung bình để tìm thông tin quan trọng, rồi mô hình đắt nhất để viết ra tài liệu hành động”, ông Reshef giải thích.
MÔ HÌNH AI DỰA VÀO NGÔN NGỮ NHỎ NHANH HƠN, RẺ HƠN
Sự khác biệt về chi phí giữa các mô hình lớn, phức tạp và các mô hình nhỏ, đơn giản là rất lớn.
Theo ước tính trung bình của ngành, GPT-5 Nano của OpenAI – mô hình nhỏ và nhanh nhất – có giá khoảng 0,1 USD cho mỗi triệu token, trong khi GPT-5 đầy đủ và tiên tiến có giá khoảng 3,44 USD cho cùng số lượng. Token là đơn vị cơ bản mà AI dùng để xử lý văn bản.
Hơn nữa, các mô hình lớn có thể tiêu tốn gấp hàng nghìn lần số token để hoàn thành một tác vụ, vì các mô hình này cần “tự trò chuyện nội tâm” để suy luận ra câu trả lời.
Cần lưu ý rằng “nhỏ và ít thông minh hơn” không đồng nghĩa với “kém hiệu quả hơn”. Các mô hình nhỏ hoàn toàn có thể được tinh chỉnh trong quá trình huấn luyện hoặc thông qua các hướng dẫn chi tiết để trở nên cực kỳ phù hợp với nhiệm vụ cụ thể.
“Các mô hình ngôn ngữ lớn cực kỳ thông minh, nhưng không mang lại cho chúng tôi cách tận dụng dữ liệu độc quyền hoặc để đưa phản hồi của biên tập viên vào hệ thống một cách hiệu quả”, ông Don MacKinnon, Giám đốc điều hành Hark Audio, cho biết.
Nhóm của ông đã xây dựng một thư viện hàng chục nghìn đoạn podcast được chọn lọc và biên tập thủ công, dùng chính dữ liệu này để tinh chỉnh mô hình AI tùy chỉnh có thể tự động hóa toàn bộ quy trình.
Qua trao đổi với nhiều công ty đang sử dụng mô hình nhỏ, có thể thấy họ đều xây dựng hệ thống của theo cách rất giống nhau. Điều đó cho thấy rằng có lẽ chỉ có một số mô hình hoạt động thực sự hiệu quả, và gần như tất cả đều bao gồm các mô hình ngôn ngữ nhỏ.
Tatinta giới thiệu mô hình Trawell kết hợp du lịch và sức khỏe tại ITB Asia 2025, hướng tới trải nghiệm sâu sắc và toàn diện cho du khách.
Mỹ công bố khoản đầu tư 50 triệu USD vào Vulcan Elements, bước đi chiến lược nhằm giảm phụ thuộc vào Trung Quốc trong sản xuất nam châm đất hiếm.
Sora 2, trình tạo video AI mới của OpenAI, đạt 1 triệu lượt tải trong 5 ngày, mở ra cơ hội và thách thức cho ngành sáng tạo nội dung.
Google công bố thuật toán mới cho thấy máy tính lượng tử có thể vượt trội hơn siêu máy tính truyền thống, mở ra cơ hội đầu tư lớn trong lĩnh vực này.
Vì sao ngành công nghệ sinh học Trung Quốc đang thu hút sự chú ý toàn cầu? Khám phá những thỏa thuận kỷ lục và tiềm năng phát triển trong tương lai.
Khám phá sự mơ hồ xung quanh AGI và tác động của nó đến tương lai công nghệ. Liệu AGI có thể thay đổi cuộc sống con người trong thập kỷ tới?
Golden Communication Group, doanh nghiệp Việt duy nhất, nhận giải thưởng ZeroDX 2025, khẳng định vị thế toàn cầu bên GE và Bayer.