Việt Nam sẽ có “ChatGPT phiên bản Việt”
Dự kiến một “ChatGPT phiên bản Việt” sẽ được mở cho cộng đồng truy cập, thử nghiệm. Người dùng có thể hỏi đáp các thông tin đặc thù của Việt Nam (quy định, văn bản pháp luật), hoặc các thông tin mang tính bản địa...
Ngày 21/8/2023, Công ty CP VinBigdata công bố xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, đặt nền móng cho việc xây dựng các giải pháp tích hợp AI tạo sinh. Với thành công này, VinBigdata trở thành đơn vị đầu tiên tại Việt Nam làm chủ công nghệ AI tạo sinh, đánh dấu bước phát triển đầu tiên của một “ChatGPT phiên bản Việt”.
AI tạo sinh (Generative AI) là một dạng trí tuệ nhân tạo có khả năng tạo ra nội dung và ý tưởng mới ở nhiều hình thái khác nhau (văn bản, hình ảnh, âm thanh...). Những sản phẩm ứng dụng AI tạo sinh có thể trả ra kết quả tương đương như khi được tạo ra bởi con người. Ngoài khả năng sáng tạo nội dung, AI tạo sinh cũng được sử dụng để cải thiện chất lượng hình ảnh kỹ thuật số, xây dựng các nguyên mẫu cho quá trình sản xuất và nhiều khả năng khác.
Mô hình ngôn ngữ lớn (LLM) là mô hình được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản hoặc hình ảnh khổng lồ. Mô hình này có khả năng hiểu tri thức, tự tạo văn bản và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. Đây được xem như chìa khóa để phát triển công nghệ AI tạo sinh- công nghệ đứng sau sự thành công của các giải pháp đột phá như ChatGPT.
Việc làm chủ hoàn toàn về mặt công nghệ, tự phát triển từ những bước đầu tiên, xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, được xem như một bước tiến quan trọng giúp VinBigdata đưa công nghệ AI tạo sinh vào hệ sinh thái các sản phẩm, dịch vụ đã và đang cung cấp ra thị trường.
Theo đó, đơn vị này sẽ tích hợp công nghệ để đưa nền tảng trí tuệ nhân tạo đa nhận thức toàn diện VinBase thành nền tảng AI tạo sinh đầu tiên tại Việt Nam, đồng thời cung cấp các giải pháp phát triển trên nền công nghệ AI tạo sinh như Generative AI chatbot, callbot, Trợ lý ảo ViVi thế hệ mới… Công nghệ này giúp tăng tính tự nhiên trong giao tiếp của máy, đồng thời hỗ trợ người dùng tìm kiếm, tổng hợp thông tin một cách nhanh chóng và đơn giản hơn nhiều so với trước đây.
Nằm trong lộ trình xây dựng hệ sinh thái các sản phẩm ứng dụng AI tạo sinh quy mô lớn, dự kiến trong tháng 12/2023, đơn vị này sẽ công bố ra cộng đồng nền tảng AI tạo sinh đa nhận thức VinBase 2.0 với các giải pháp phục vụ doanh nghiệp, cơ quan chính phủ và ứng dụng ViGPT- “ChatGPT phiên bản Việt”. Ứng dụng sẽ được mở cho cộng đồng truy cập, thử nghiệm. Người dùng có thể hỏi đáp các thông tin đặc thù của Việt Nam (quy định, văn bản pháp luật), hoặc các thông tin mang tính bản địa (lịch sử, văn học, danh lam thắng cảnh, đặc sản địa phương…).
Theo GS.Vũ Hà Văn, Giám đốc Khoa học Công ty VinBigdata, trên thế giới có một số tập đoàn lớn đã nghiên cứu thành công và công bố các sản phẩm dựa trên mô hình ngôn ngữ lớn như OpenAI với ChatGPT hay Google với Bard. Tại Việt Nam, việc xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt tập trung giải quyết ba vấn đề cốt lõi: cải thiện tính chính xác, giảm chi phí hạ tầng tính toán một cách tối đa và đảm bảo tính bảo mật.
Thay vì cần tới khoảng 175 tỷ tham số như ChatGPT, VinBigdata có thể tạo ra mô hình ngôn ngữ lớn với vài tỷ tham số nhưng vẫn có khả năng sinh ra các văn bản có tính xác thực cao, tập trung vào dữ liệu và tri thức của người Việt.