Google lên kế hoạch cho mô hình ngôn ngữ AI khổng lồ hỗ trợ 1.000 thứ tiếng
Bảo Ngọc
07/11/2022
Đây là một dự án đầy tham vọng, nhưng có thể sẽ mang lại lợi ích trên toàn bộ hệ sinh thái sản phẩm của Google...
Theo The Verge, Google đã công bố một dự án mới đầy tham vọng nhằm phát triển mô hình AI độc quyền hỗ trợ tới "1.000 ngôn ngữ được sử dụng nhiều nhất trên thế giới". Bước đầu hướng tới mục tiêu, công ty đã công bố mô hình AI được đào tạo trên hơn 400 ngôn ngữ, được cho là "phạm vi ngôn ngữ lớn nhất được áp dụng trong mô hình AI giọng nói ngày nay". Rõ ràng, ngôn ngữ và AI luôn là trọng tâm trong các sản phẩm Google.
Google đã bắt đầu tích hợp mô hình này vào các sản phẩm như Google Search, đồng thời phản bác lại những lời chỉ trích về chức năng của hệ thống. Các mô hình ngôn ngữ tự động thường đi kèm với một số sai sót, bao gồm xu hướng làm dấy lên những thành kiến xã hội tiêu cực như phân biệt chủng tộc và không có khả năng phân tích ngôn ngữ với sự nhạy cảm của con người.
Tuy nhiên, các mô hình này có khả năng thực hiện nhiều tác vụ, từ tạo ngôn ngữ (như GPT-3 của OpenAI) đến dịch thuật (với tiêu chí “không để ngôn ngữ nào bị bỏ lại phía sau” của Meta). "Sáng kiến 1.000 ngôn ngữ" của Google không tập trung vào bất kỳ chức năng cụ thể nào, mà thay vào đó tạo ra một hệ thống duy nhất với bề rộng kiến thức khổng lồ về các ngôn ngữ trên thế giới.
Ông Zoubin Ghahramani, Phó Chủ tịch nghiên cứu tại Google AI, cho biết công ty tin rằng việc tạo ra một mô hình có quy mô lớn sẽ giúp dễ dàng đưa các chức năng AI khác nhau vào các ngôn ngữ được thể hiện kém trong không gian trực tuyến và bộ dữ liệu đào tạo AI.
Nghiên cứu trước đây đã cho thấy hiệu quả và quy mô lợi ích mà Google có thể mang lại. Một dự án khác có sức cạnh tranh là nỗ lực của Meta nhằm xây dựng một "dịch giả với giọng nói phổ thông".
Tuy nhiên, quyền truy cập vào dữ liệu là một vấn đề khi đào tạo trên rất nhiều ngôn ngữ và Google cho biết để hỗ trợ công việc trên quy mô 1.000 ngôn ngữ, công ty sẽ tài trợ cho việc thu thập dữ liệu các ngôn ngữ có tài nguyên thấp, bao gồm cả bản ghi âm và văn bản viết.
Công ty chưa có kế hoạch trực tiếp về cách áp dụng chức năng của mô hình này, tuy nhiên họ hy vọng sẽ mang lại lợi ích trên các sản phẩm từ Google Dịch đến phụ đề YouTube và hơn thế nữa.
Phó chủ tịch Ghahramani nói: "Một trong những điều thực sự thú vị về các mô hình ngôn ngữ lớn và nghiên cứu ngôn ngữ nói chung là có thể thực hiện rất nhiều nhiệm vụ khác nhau. Cùng một mô hình ngôn ngữ có thể biến các lệnh khác cho robot; giải toán học hay dịch thuật. Chúng đang trở thành những kho chứa kiến thức. Khám phá theo những cách khác nhau, bạn có thể tiếp cận các chức năng hữu ích khác nhau".
Google cũng chia sẻ một số nghiên cứu mới về các mô hình chuyển văn bản thành video, trợ lý viết AI có tên Wordcraft và bản cập nhật cho ứng dụng AI Test Kitchen, cho phép người dùng truy cập vào các mô hình AI đang được phát triển như mô hình chuyển văn bản thành hình ảnh.
Sự hợp tác được thúc đẩy bởi nhu cầu hiện đại hóa và tình trạng thiếu hụt nhân sự tại Nhật Bản, giữa lúc Việt Nam nổi lên là điểm đến tối ưu nhờ năng lực chuyên môn, khả năng mở rộng đội ngũ và kinh nghiệm làm việc dày dặn với khách hàng Nhật...
Hackathon nhấn mạnh cách tiếp cận giải quyết vấn đề từ thực tiễn, việc sử dụng AI một cách có trách nhiệm và đạo đức, cũng như sự phù hợp của giải pháp với điều kiện khí hậu và bối cảnh địa phương của Đồng bằng sông Cửu Long...
Trung Quốc có thể trở thành một trong những thị trường đầu tiên trên thế giới phê duyệt một loại thuốc được thiết kế hoàn toàn bằng trí tuệ nhân tạo ngay trong năm 2026…
Trong nhiều năm, Apple luôn tỏ ra thận trọng, thậm chí có phần né tránh với trí tuệ nhân tạo dạng trò chuyện. Hãng tin rằng người dùng không muốn phải “bước vào một khung chat” chỉ để hoàn thành những thao tác hàng ngày…
ChatGPT có thể sớm hiển thị quảng cáo sản phẩm mà hệ thống cho rằng người dùng muốn mua...
Làn sóng đầu tư hiện nay cho thấy Trung Quốc đang đặt cược lớn vào tương lai năng lượng, kỳ vọng nắm trong tay nguồn năng lượng sạch, gần như vô hạn của thế kỷ 21...
Myth Avenue Gaming (Malaysia) và Fancy United Esports (Việt Nam) lần lượt giành chức vô địch tại bộ môn DOTA 2 và VALORANT và Việt Nam là quốc gia tiếp theo đăng cai tổ chức giải đấu thể thao điện tử Predator League 2027…
Apple đang hợp tác với Google để sử dụng các mô hình Gemini cho phiên bản Siri hỗ trợ trí tuệ nhân tạo…
Intel đang đặt cược lớn vào chip Core Ultra Series 3 như chìa khóa để lấy lại vị thế trong kỷ nguyên trí tuệ nhân tạo. Không chỉ nhắm tới laptop, hãng còn kỳ vọng chip mới sẽ mở đường cho AI trên robot và nhiều thiết bị khác trong tương lai…
OpenAI giới thiệu ChatGPT Health dành cho dữ liệu về sức khỏe. Thông tin sức khỏe được tách riêng và không dùng để huấn luyện…