Các công ty trí tuệ nhân tạo tìm kiếm lợi nhuận lớn từ các mô hình ngôn ngữ nhỏ

22/05/2024

Các gã khổng lồ công nghệ Microsoft, Meta và Google đã phát hành các phiên bản ngôn ngữ mới với ít 'tham số' hơn, chi phí xây dựng và đào tạo rẻ hơn – Mô hình ngôn ngữ nhỏ (SLMs - small language models)…

Các công ty trí tuệ nhân tạo tìm kiếm lợi nhuận lớn từ các mô hình ngôn ngữ nhỏ

Theo Financial Times, các công ty trí tuệ nhân tạo từng chi hàng tỷ USD để xây dựng mô hình ngôn ngữ lớn, hiện đang chuyển hướng đi mới để tăng doanh thu: phát triển mô hình ngôn ngữ nhỏ (SLM).

Apple, Microsoft, Meta và Google gần đây đều đã phát hành các mô hình AI mới với ít “tham số” hơn - số lượng biến được sử dụng để huấn luyện hệ thống AI và định hình đầu ra của nó. Động thái mới của các công ty công nghệ này được cho là cũng nhằm khuyến khích các doanh nghiệp đang lo ngại về chi phí cũng có thể áp dụng AI để tự động hoá các quy trình.

SLM thường nhỏ hơn LLM từ 5 đến 10 lần. Tuy nhiên, kích thước giảm không hẳn là nhược điểm. SLM vẫn sở hữu những khả năng và trong một số trường hợp nhất định, có thể hoạt động ngang bằng với các LLM lớn hơn.

CÁC VẤN ĐỀ CỦA MÔ HÌNH NGÔN NGỮ LỚN

Mặc dù LLM đã xuất sắc trong việc xử lý, tóm tắt và phân tích khối lượng lớn dữ liệu, đồng thời đưa ra những hiểu biết sâu sắc có giá trị cho việc ra quyết định. Tuy nhiên, LLM cũng tồn tại những bất lợi lớn đối với doanh nghiệp. Một là độ chính xác và chất lượng của kết quả đầu ra mô hình. Điều này không chỉ bao gồm sự thiên vị trong các mô hình mà còn giải quyết vấn đề “ảo giác”. Đây là những trường hợp mà mô hình tạo ra thông tin hợp lý nhưng thực tế không chính xác hoặc vô nghĩa.

Tiếp theo, LLM có thể quá khái quát. Lý do là dữ liệu đào tạo chủ yếu được lấy từ internet công cộng. Việc thiếu khả năng tùy chỉnh có thể dẫn đến lỗ hổng về mức độ hiệu quả mà các mô hình này hiểu và phản hồi với các thuật ngữ, quy trình và sắc thái dữ liệu cụ thể của ngành.

Sau đó, có những lo ngại về bảo mật và quyền riêng tư. Khi doanh nghiệp sử dụng LLM, nó sẽ truyền dữ liệu qua API và điều này có nguy cơ bị lộ thông tin nhạy cảm.

SLM CÓ THỂ GIẢM THIỂU NHỮNG NỖI LO KHI SỬ DỤNG LLM

Điều này đã khiến các công ty công nghệ như Meta và Google đưa ra các mô hình ngôn ngữ nhỏ chỉ với vài tỷ tham số dưới dạng các lựa chọn thay thế rẻ hơn, có thể tùy chỉnh, cần ít năng lượng hơn để đào tạo và chạy và các hệ thống và có thể ngăn chặn dữ liệu nhạy cảm.

SLM cung cấp một tập huấn luyện tập trung hơn. Mô hình này được điều chỉnh phù hợp với các bộ dữ liệu dành riêng cho doanh nghiệp. Chúng có thể bao gồm từ mô tả sản phẩm và phản hồi của khách hàng đến thông tin liên lạc nội bộ như tin nhắn Slack. Trái ngược với nền tảng kiến thức rộng lớn của LLM, SML làm giảm đáng kể khả năng xảy ra sai sót và ảo giác.

SML đòi hỏi chi phí thấp hơn, đồng thời trả về kết quả tập trung hơn

Với mô hình nhỏ hơn, việc tạo, triển khai và quản lý sẽ tiết kiệm chi phí hơn. Điều này rất quan trọng do chi phí lớn cho cơ sở hạ tầng như GPU (bộ xử lý đồ họa). Trên thực tế, SLM có thể chạy trên phần cứng thông dụng rẻ tiền—chẳng hạn như CPU—hoặc nó có thể được lưu trữ trên nền tảng đám mây

Theo đó,.Phó chủ tịch công ty AI Azure của Microsoft, Eric Boyd cho biết: “Vẫn có thể thực hiện các lệnh phức tap nhưng với mức chi phí thấp hơn, các mô hình ngôn ngữ nhỏ cho phép khách hàng truy cập mà không cần đầu tư quá nhiều”.

Ưu điểm của SLM vượt xa hiệu quả chi phí. Chúng có khả năng thích ứng cao hơn, cho phép điều chỉnh dễ dàng hơn dựa trên phản hồi của người dùng. Những mô hình này cũng cho thấy độ trễ thấp hơn.

Điều này không có nghĩa là SLM không phải không có nhược điểm. Một lần nữa, công nghệ này còn khá mới và vẫn còn những vấn đề cũng như lĩnh vực cần được sàng lọc và cải tiến.

CÁC CÔNG TY CHẠY ĐUA ĐỂ SẢN XUẤT MÔ HÌNH NGÔN NGỮ NHỎ

Charlotte Marshall, Cộng tác viên quản lý Addleshaw Goddard, một công ty luật chuyên tư vấn cho các ngân hàng, nói rằng “một trong những thách thức mà tôi nghĩ nhiều khách hàng của chúng tôi đã gặp phải” khi áp dụng các sản phẩm AI tạo sinh là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu.

Bà cho biết các mô hình nhỏ hơn mang lại “cơ hội cho các doanh nghiệp vượt qua” những lo ngại về pháp lý và chi phí. Đồng thời các mô hình này cũng cho phép các tính năng AI chạy trên các thiết bị như điện thoại di động. Chẳng hạn như mô hình “Gemini Nano” của Google đã được nhúng bên trong điện thoại Pixel mới nhất và điện thoại thông minh S24 mới nhất của Samsung.

Apple tiết lộ họ cũng đang phát triển các mô hình AI để chạy trên chiếc iPhone bán chạy nhất của mình. Tháng trước, gã khổng lồ Thung lũng Silicon đã phát hành mô hình OpenELM, một mô hình nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.

Phó chủ tịch công ty AI Azure của Microsoft, Eric Boyd cho biết các mẫu máy nhỏ hơn sẽ mang đến “các ứng dụng thú vị, cho đến điện thoại và máy tính xách tay”.

Baidu tuyên bố ra mắt chip mới trong bối cảnh chiến lược phát triển AI của Trung Quốc thay đổi.

Baidu ra mắt chip M100 và M300 trong bối cảnh chiến lược phát triển AI của Trung Quốc thay đổi

Baidu công bố chip M100 và M300, đánh dấu bước chuyển trong chiến lược phát triển AI của Trung Quốc, hướng tới tự chủ công nghệ và xây dựng hệ sinh thái độc lập.

10:49 18/11/2025

Colossus 2 - trung tâm dữ liệu khổng lồ thứ hai của xAI. Ảnh: WSJ

Những mối quan hệ tài chính chằng chịt phía sau 3 siêu trung tâm dữ liệu tại Phố Wall

Các tập đoàn công nghệ đang tìm cách huy động vốn khổng lồ cho AI, với những thỏa thuận tài chính phức tạp tại Phố Wall.

09:37 18/11/2025

Nvidia đã tối ưu hóa các dòng chip này để xử lý giai đoạn “suy luận”. Ảnh: NBC News

Bí mật giúp Nvidia giữ ngôi vương về chip

Nvidia đạt định giá 5 nghìn tỷ USD nhờ chip AI Blackwell, khẳng định vị thế dẫn đầu trong ngành công nghệ cao giữa cơn sốt đầu tư.

15:51 17/11/2025

Thiết kế trung tâm dữ liệu AI của Fairwater có hai tầng. Ảnh: Microsoft

Bên trong "siêu nhà máy AI" sẽ tạo bước ngoặt lớn cho công nghệ trí tuệ nhân tạo của Microsoft

Trung tâm dữ liệu Fairwater của Microsoft tại Atlanta hoạt động như siêu nhà máy AI, kết nối nhiều địa điểm, tối ưu hóa đào tạo mô hình lớn.

10:57 14/11/2025

Kimi K2 Thinking có thể trở thành đối thủ nặng ký của ChatGPT và Claude.

Một mô hình AI Trung Quốc tiếp tục phá kỷ lục trong các bài kiểm tra

Mô hình AI Trung Quốc Kimi K2 Thinking vượt qua GPT-5 và Claude Sonnet 4.5, chỉ tốn 4,6 triệu USD để huấn luyện, mở ra cuộc cạnh tranh mới trong ngành AI.

10:11 14/11/2025

Các dự án AI của chính quyền Dubai chỉ mất vài tháng để triển khai trên diện rộng

Dubai chuyển đổi số dịch vụ công bằng AI với tốc độ cực nhanh

Chính quyền Dubai triển khai các dự án AI chỉ trong vài tháng, với mục tiêu 96% cơ quan áp dụng AI vào năm 2025, mang lại lợi ích cho người dân.

09:44 13/11/2025

Việc sử dụng công cụ trí tuệ nhân tạo có thể đẩy nhanh quá trình phát hiện kháng thể từ vài tháng xuống còn vài tuần. Ảnh: Đại học Washington

Bước tiến mới của điều trị ung thư: Trí tuệ nhân tạo giúp tạo ra kháng thể

Nhóm nghiên cứu Đại học Washington đã thành công trong việc sử dụng AI để tạo ra kháng thể chống ung thư, rút ngắn thời gian phát triển thuốc.

09:43 13/11/2025

Buổi tập huấn nghiệp vụ cho thẩm phán, thẩm tra viên, thư ký và hòa giải viên ngày 28/6/2025, AI Tra Cứu Luật được giới thiệu như công cụ hỗ trợ tra cứu và phân tích văn bản pháp luật.

Kỹ sư Việt phát triển AI tra cứu luật, truy xuất pháp lý chính xác 90%

Dự án AI Tra Cứu Luật Pro ra mắt với công nghệ VERA và SIFAI, giúp truy xuất 350.000 văn bản pháp luật Việt Nam chính xác 90%.

09:42 13/11/2025

Mô hình chip lượng tử tại trung tâm dữ liệu lượng tử của IBM Đức. Ảnh: Marijan Murat/Zuma Pres

Điều gì khiến máy tính lượng tử chưa thể thật sự bứt phá bất chấp nhiều tin tốt?

Ngành máy tính lượng tử đang thu hút sự chú ý với những bước tiến lớn, nhưng vẫn còn nhiều thách thức cần vượt qua trước khi bứt phá.

15:46 11/11/2025

Bản vẽ máy tính lượng tử Helios của Quantinuum

Hệ thống máy tính lượng tử mới ra mắt, được đánh giá “tối tân nhất hiện nay”

Quantinuum ra mắt Helios, hệ thống máy tính lượng tử tiên tiến với 98 qubit vật lý, đánh dấu bước tiến quan trọng trong ứng dụng thực tiễn công nghệ lượng tử.

15:25 07/11/2025