Mô hình ngôn ngữ nhỏ, hướng đi mới của các "ông lớn" trong cuộc đua AI
Quỳnh Anh
21/05/2024, 10:20
Microsoft, Meta và Google đều đang nhắm đến mục tiêu này nhằm tăng lợi nhuận trước cuộc đua trí tuệ nhân tạo ngày càng nóng…
Các tập đoàn công nghệ đang tìm thấy một hướng đi mới nhằm tăng doanh thu trong cuộc đua trí tuệ nhân tạo: mô hình ngôn ngữ nhỏ (SLM).
Các công ty trí tuệ nhân tạo đã chi hàng tỷ USD để xây dựng mô hình ngôn ngữ lớn (LLM) nhằm cung cấp năng lượng cho các sản phẩm AI. Hiện giờ họ đang tìm thấy một hướng đi mới nhằm tăng doanh thu trong cuộc đua trí tuệ nhân tạo: mô hình ngôn ngữ nhỏ (SLM).
MÔ HÌNH NGÔN NGỮ NHỎ GIÚP TĂNG DOANH THU, GIẢM CHI PHÍ
Apple, Microsoft, Meta và Google gần đây đều đã phát hành các mô hình AI mới với ít tham số hơn (là số lượng biến được sử dụng để đào tạo hệ thống AI và định hình đầu ra của nó) nhưng vẫn có khả năng mạnh mẽ.
Động thái này là nỗ lực của các "ông lớn" công nghệ nhằm khuyến khích các doanh nghiệp áp dụng AI. Nhiều công ty vẫn còn đang lo ngại về chi phí và nguồn lực cần thiết để chạy các mô hình ngôn ngữ lớn - loại công nghệ làm nền tảng cho các chatbot phổ biến như Chat GPT của OpenAI.
Thực tế số lượng tham số càng cao thì hiệu suất của phần mềm AI càng tốt và các nhiệm vụ của nó càng phức tạp và nhiều sắc thái hơn. Mẫu GPT-4o mới nhất của OpenAI và Gemini 1.5 Pro của Google, cả hai đều được công bố trong tuần này, được ước tính có hơn 1 nghìn tỷ tham số và Meta đang đào tạo phiên bản 400 tỷ tham số của mô hình Llama mới ra mắt gần đây.
Bảng định giá các mô hình AI hiện nay - Nguồn: FT.
Ngoài việc đấu tranh để thuyết phục một số khách hàng doanh nghiệp trả số tiền lớn cần thiết để chạy các sản phẩm AI tổng hợp, cũng có những lo ngại về dữ liệu và bản quyền đang cản trở việc áp dụng.
Điều đó đã khiến các nhóm công nghệ như Meta và Google đưa ra các mô hình ngôn ngữ nhỏ chỉ với vài tỷ tham số với chi phí rẻ hơn, tiết kiệm năng lượng, có thể tùy chỉnh, cần ít năng lượng hơn để đào tạo và chạy, vừa có thể ngăn chặn dữ liệu nhạy cảm.
Google, Meta, Microsoft và công ty khởi nghiệp Mistral của Pháp cũng đã phát hành các mô hình ngôn ngữ nhỏ thể hiện khả năng tiến bộ và có thể tập trung tốt hơn vào các ứng dụng cụ thể.
Nick Clegg, chủ tịch phụ trách các vấn đề toàn cầu của Meta, cho biết mô hình 8 tỷ tham số mới của Llama 3 có thể so sánh với GPT-4. Microsoft cho biết mô hình Phi-3 nhỏ của họ với 7 tỷ tham số đang hoạt động tốt hơn GPT-3.5, phiên bản trước đó của mô hình OpenAI.
TIỀM NĂNG VỚI CÁC "ÔNG LỚN" RA SAO?
Các mô hình nhỏ có thể xử lý các tác vụ cục bộ trên thiết bị thay vì gửi thông tin lên đám mây, điều này có thể thu hút những khách hàng quan tâm đến quyền riêng tư muốn đảm bảo thông tin được lưu giữ trong mạng nội bộ.
Charlotte Marshall, quản lý tại Addleshaw Goddard - Công ty luật tư vấn cho các ngân hàng cho biết: “một trong những thách thức mà nhiều khách hàng của chúng tôi đã gặp phải khi áp dụng các sản phẩm AI sáng tạo là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu”. Bà cho biết các mô hình nhỏ hơn mang lại cơ hội cho các doanh nghiệp vượt qua những lo ngại về pháp lý và chi phí.
Các mẫu nhỏ hơn cũng cho phép các tính năng AI chạy trên các thiết bị như điện thoại di động. Mẫu “Gemini Nano” của Google được trang bị bên trong điện thoại Pixel mới nhất và điện thoại thông minh S24 mới nhất của Samsung.
Apple đã ám chỉ rằng họ cũng đang phát triển các mô hình AI để chạy trên chiếc iPhone bán chạy nhất của mình. Tháng trước, gã khổng lồ Thung lũng Silicon đã phát hành mô hình OpenELM, một mô hình nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.
Boyd của Microsoft cho biết các mẫu máy nhỏ hơn sẽ mang đến các ứng dụng thú vị, cho đến điện thoại và máy tính xách tay.
Giám đốc OpenAI Sam Altman cho biết vào tháng 11 rằng công ty khởi nghiệp có trụ sở tại San Francisco này đã cung cấp các mô hình AI có quy mô khác nhau cho khách hàng và phục vụ các mục đích riêng biệt. Họ sẽ tiếp tục xây dựng và bán các tùy chọn này.
“Có một số điều mà các mô hình nhỏ hơn sẽ hoạt động thực sự tốt. Tôi rất vui mừng vì điều đó”, ông nói thêm.
Tuy nhiên, Altman cho biết thêm OpenAI sẽ vẫn tập trung vào việc xây dựng các mô hình AI lớn hơn với khả năng mở rộng quy mô, bao gồm khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ và cuối cùng đạt được trí thông minh ở cấp độ con người.
CEO Appian: Trí tuệ nhân tạo không phải sân chơi chỉ dành cho big tech
19:52, 13/05/2024
Vì sao khoảng 70% các dự án về trí tuệ nhân tạo và dữ liệu lớn thất bại?
17:12, 04/05/2024
Lý giải nguyên nhân Google chậm chân trong cuộc đua trí tuệ nhân tạo với Microsoft và OpenAI
Tin tặc đánh cắp thông tin hàng triệu khách hàng của Gucci, Balenciaga và McQueen
Các tin tặc tự xưng là nhóm "Shiny Hunters" tiết lộ đang nắm giữ dữ liệu liên quan đến 7,4 triệu thông tin khách hàng của tập đoàn xa xỉ Kering…
Nhiều tập đoàn lớn của Trung Quốc muốn hợp tác với Việt Nam trong lĩnh vực AI, điện toán đám mây
Đại diện nhiều tập đoàn lớn của Trung Quốc đã chia sẻ kế hoạch đầu tư và mong muốn cùng Việt Nam phát triển các lĩnh vực trí tuệ nhân tạo, điện toán đám mây, kinh tế số và năng lượng tái tạo...
Nhiều giải pháp công nghệ ứng dụng trong đời sống trình diễn tại Tech4Life 2025
Tech4life 2025 với chủ đề “Công nghệ nâng tầm cuộc sống” thu hút hơn 2.500 lượt khách mời, 60 doanh nghiệp trưng bày các giải pháp công nghệ, hơn 100 dự án khởi nghiệp đổi mới sáng tạo và R&D của 30 trường đại học, cao đẳng…
Đà Nẵng đặt mục tiêu kinh doanh tài sản số bằng NFT
Trong số 65 chỉ tiêu mà Đà Nẵng đặt ra đến năm 2030, có nhiều chỉ tiêu đáng chú ý như có ít nhất một doanh nghiệp công nghệ số với nhân lực 15000 người hoặc đạt doanh thu hai tỷ USD/năm; thí điểm và tiến đến triển khai kinh doanh tài sản số bằng NFT…
Các con số nổi bật tại sự kiện “9/9 Ngày siêu mua sắm” trên Shopee
Các chương trình mua sắm - giải trí đa dạng cùng nhiều ưu đãi hấp dẫn từ thương hiệu và người bán đã tạo nên sức hút cho sự kiện “9/9 Ngày siêu mua sắm” trên Shopee.
Sáu giải pháp phát triển nhanh và bền vững ngành năng lượng
Việt Nam đang đứng trước cơ hội lớn để phát triển năng lượng xanh, sạch nhằm đảm bảo an ninh năng lượng và phát triển bền vững. Ông Nguyễn Ngọc Trung chia sẻ với Tạp chí Kinh tế Việt Nam/VnEconomy về sáu giải pháp để phát triển nhanh và bền vững ngành năng lượng nói chung và các nguồn năng lượng tái tạo, năng lượng mới nói riêng…
Nhân lực là “chìa khóa” phát triển điện hạt nhân thành công và hiệu quả
Trao đổi với Tạp chí Kinh tế Việt Nam/VnEconomy, TS. Trần Chí Thành, Viện trưởng Viện Năng lượng nguyên tử Việt Nam, nhấn mạnh vấn đề quan trọng nhất khi phát triển điện hạt nhân ở Việt Nam là nguồn nhân lực, xây dựng năng lực, đào tạo nhân lực giỏi để tham gia vào triển khai, vận hành dự án...
Phát triển năng lượng tái tạo, xanh, sạch: Nền tảng cho tăng trưởng kinh tế trong dài hạn
Quốc hội đã chốt chỉ tiêu tăng trưởng kinh tế 8% cho năm 2025 và tăng trưởng hai chữ số cho giai đoạn 2026 – 2030. Để đạt được mục tiêu này, một trong những nguồn lực có tính nền tảng và huyết mạch chính là điện năng và các nguồn năng lượng xanh, sạch…
Nhà đầu tư điện gió ngoài khơi tại Việt Nam vẫn đang ‘mò mẫm trong bóng tối’
Trả lời VnEconomy bên lề Diễn đàn năng lượng xanh Việt Nam 2025, đại diện doanh nghiệp đầu tư năng lượng tái tạo nhận định rằng Chính phủ cần nhanh chóng ban hành các thủ tục và quy trình pháp lý nếu muốn nhà đầu tư nước ngoài rót vốn vào các dự án điện gió ngoài khơi của Việt Nam...
Tìm lộ trình hợp lý nhất cho năng lượng xanh tại Việt Nam
Chiều 31/3, tại Hà Nội, Hội Khoa học Kinh tế Việt Nam, Hiệp hội Năng lượng sạch Việt Nam chủ trì, phối hợp với Tạp chí Kinh tế Việt Nam tổ chức Diễn đàn Năng lượng Việt Nam 2025 với chủ đề: “Năng lượng xanh, sạch kiến tạo kỷ nguyên kinh tế mới - Giải pháp thúc đẩy phát triển nhanh các nguồn năng lượng mới”...
Thuế đối ứng của Mỹ có ảnh hướng thế nào đến chứng khoán?
Chính sách thuế quan mới của Mỹ, đặc biệt với mức thuế đối ứng 20% áp dụng từ ngày 7/8/2025 (giảm từ 46% sau đàm phán),
có tác động đáng kể đến kinh tế Việt Nam do sự phụ thuộc lớn vào xuất khẩu sang Mỹ (chiếm ~30% kim ngạch xuất khẩu).
Dưới đây là phân tích ngắn gọn về các ảnh hưởng chính: