14:57 07/11/2022

Google lên kế hoạch cho mô hình ngôn ngữ AI khổng lồ hỗ trợ 1.000 thứ tiếng

Bảo Ngọc

Đây là một dự án đầy tham vọng, nhưng có thể sẽ mang lại lợi ích trên toàn bộ hệ sinh thái sản phẩm của Google...

Ảnh: The Verge
Ảnh: The Verge

Theo The Verge, Google đã công bố một dự án mới đầy tham vọng nhằm phát triển mô hình AI độc quyền hỗ trợ tới "1.000 ngôn ngữ được sử dụng nhiều nhất trên thế giới". Bước đầu hướng tới mục tiêu, công ty đã công bố mô hình AI được đào tạo trên hơn 400 ngôn ngữ, được cho là "phạm vi ngôn ngữ lớn nhất được áp dụng trong mô hình AI giọng nói ngày nay". Rõ ràng, ngôn ngữ và AI luôn là trọng tâm trong các sản phẩm Google.

Google đã bắt đầu tích hợp mô hình này vào các sản phẩm như Google Search, đồng thời phản bác lại những lời chỉ trích về chức năng của hệ thống. Các mô hình ngôn ngữ tự động thường đi kèm với một số sai sót, bao gồm xu hướng làm dấy lên những thành kiến xã hội tiêu cực như phân biệt chủng tộc và không có khả năng phân tích ngôn ngữ với sự nhạy cảm của con người. 

Tuy nhiên, các mô hình này có khả năng thực hiện nhiều tác vụ, từ tạo ngôn ngữ (như GPT-3 của OpenAI) đến dịch thuật (với tiêu chí “không để ngôn ngữ nào bị bỏ lại phía sau” của Meta). "Sáng kiến 1.000 ngôn ngữ" của Google không tập trung vào bất kỳ chức năng cụ thể nào, mà thay vào đó tạo ra một hệ thống duy nhất với bề rộng kiến thức khổng lồ về các ngôn ngữ trên thế giới.

Ông Zoubin Ghahramani, Phó Chủ tịch nghiên cứu tại Google AI, cho biết công ty tin rằng việc tạo ra một mô hình có quy mô lớn sẽ giúp dễ dàng đưa các chức năng AI khác nhau vào các ngôn ngữ được thể hiện kém trong không gian trực tuyến và bộ dữ liệu đào tạo AI.

Nghiên cứu trước đây đã cho thấy hiệu quả và quy mô lợi ích mà Google có thể mang lại. Một dự án khác có sức cạnh tranh là nỗ lực của Meta nhằm xây dựng một "dịch giả với giọng nói phổ thông".

Tuy nhiên, quyền truy cập vào dữ liệu là một vấn đề khi đào tạo trên rất nhiều ngôn ngữ và Google cho biết để hỗ trợ công việc trên quy mô 1.000 ngôn ngữ, công ty sẽ tài trợ cho việc thu thập dữ liệu các ngôn ngữ có tài nguyên thấp, bao gồm cả bản ghi âm và văn bản viết.

Công ty chưa có kế hoạch trực tiếp về cách áp dụng chức năng của mô hình này, tuy nhiên họ hy vọng sẽ mang lại lợi ích trên các sản phẩm từ Google Dịch đến phụ đề YouTube và hơn thế nữa.

Phó chủ tịch Ghahramani nói: "Một trong những điều thực sự thú vị về các mô hình ngôn ngữ lớn và nghiên cứu ngôn ngữ nói chung là có thể thực hiện rất nhiều nhiệm vụ khác nhau. Cùng một mô hình ngôn ngữ có thể biến các lệnh khác cho robot; giải toán học hay dịch thuật. Chúng đang trở thành những kho chứa kiến thức. Khám phá theo những cách khác nhau, bạn có thể tiếp cận các chức năng hữu ích khác nhau".

Google cũng chia sẻ một số nghiên cứu mới về các mô hình chuyển văn bản thành video, trợ lý viết AI có tên Wordcraft và bản cập nhật cho ứng dụng AI Test Kitchen, cho phép người dùng truy cập vào các mô hình AI đang được phát triển như mô hình chuyển văn bản thành hình ảnh.