image Thứ Bảy, 20/06/2026

Xây dựng AI đáng tin cậy là con đường cho các mô hình ngôn ngữ lớn tại Việt Nam

Bảo Bình

09/12/2025

Chia sẻ

Trong bối cảnh cuộc đua trí tuệ nhân tạo toàn cầu ngày càng nóng, Việt Nam đang trở thành một thị trường được các “ông lớn” công nghệ đặc biệt chú ý...

Việt Nam đang ở một thời điểm đặc biệt thú vị trong hành trình phát triển AI. Ảnh minh họa
Việt Nam đang ở một thời điểm đặc biệt thú vị trong hành trình phát triển AI. Ảnh minh họa

Những mô hình AI hàng đầu thế giới như ChatGPT, Gemini hay Claude đều nhanh chóng bổ sung hỗ trợ tiếng Việt, cho thấy sức hấp dẫn của thị trường hơn 100 triệu dân và nhu cầu số hóa tăng mạnh. Tuy vậy, chính sự quan tâm này cũng đặt ra bài toán mới: Việt Nam cần làm gì để không chỉ trở thành người dùng, mà còn là chủ thể sáng tạo và cạnh tranh trong kỷ nguyên AI?

KHẢ NĂNG HIỂU SÂU NGÔN NGỮ VÀ VĂN HÓA VIỆT CỦA CHATGPT HAY GEMINI VẪN “CÒN NHIỀU HẠN CHẾ”

Theo ông Lưu Anh Tuấn, Phó Giáo sư tại Đại học Công nghệ Nanyang, Singapore, mặc dù các mô hình AI lớn như ChatGPT hay Gemini đã hỗ trợ tiếng Việt, song khả năng hiểu sâu về ngôn ngữ và văn hóa Việt vẫn “còn nhiều hạn chế”.

“Việt Nam sở hữu nhiều đặc thù ngôn ngữ và văn hóa khiến các mô hình AI “đóng” của nước ngoài khó xử lý chính xác”, PGS Lưu Anh Tuấn nói. Ông cũng là Giám đốc điều hành Trung tâm Nghiên cứu Trí tuệ nhân tạo tại Trường Đại học VinUni.

Ông cho biết tiếng Việt có sự đa dạng lớn về phương ngữ và giọng vùng miền – từ Bắc, Trung, Nam đến các biến thể địa phương. Bên cạnh đó, hệ thống xưng hô, phong tục và các biểu đạt văn hóa lại mang nhiều tầng nghĩa xã hội (từ các cách xưng hô như cô, dì, chú, bác…), đòi hỏi AI phải có khả năng hiểu ngữ cảnh sâu.

“Kho dữ liệu về lịch sử và văn hóa Việt Nam vốn rất hạn chế trong các bộ dữ liệu huấn luyện của Big Tech, khiến mô hình trả lời tốt các câu hỏi phổ quát nhưng lại lúng túng trước những vấn đề mang tính bản địa”, PGS Tuấn nói.

Ông cho rằng để xây dựng các mô hình AI phục vụ người Việt thực sự hiệu quả, việc thu thập và phát triển dữ liệu đặc trưng – từ phương ngữ, vùng miền đến lịch sử và văn hóa – là yếu tố quyết định chất lượng và khả năng ứng dụng của hệ thống.

Theo PGS Lưu Anh Tuấn, hiện nay, Việt Nam đang ở một thời điểm đặc biệt thú vị trong hành trình phát triển AI. Việt Nam đã có Chiến lược quốc gia về AI đến năm 2030 với tầm nhìn vươn lên dẫn đầu khu vực Đông Nam Á. Cùng với đó là tốc độ chuyển đổi số rất nhanh trong nhiều lĩnh vực trọng yếu như giáo dục, tài chính, pháp lý và hành chính công.

Việt Nam cũng đang triển khai các sáng kiến LLM trong nước như PhoGPT, ViGPT, VinaLLaMA, vi-Mistral-X…, cho thấy sự chuyển dịch mạnh mẽ từ việc chỉ là “người dùng AI” sang trở thành “người tạo ra AI”.

“Những điều đó có được là nhờ nhiều lợi thế nội tại”, ông Tuấn nói. “Việt Nam có dân số trẻ, nền tảng khoa học – công nghệ ngày càng mạnh, và đặc biệt là sự đầu tư lớn từ Chính phủ cũng như từ khu vực công nghiệp. Tất cả tạo nên cơ hội rất đặc biệt để Việt Nam có thể xây dựng nền tảng AI đáng tin cậy ngay từ đầu”.

XÂY DỰNG AI ĐÁNG TIN CẬY LÀ CON ĐƯỜNG CHO CÁC MÔ HÌNH NGÔN NGỮ LỚN TẠI VIỆT NAM

Đáng chú ý, theo ông Lưu Anh Tuấn, “AI đáng tin cậy” rất quan trọng. “AI ngày càng ảnh hưởng sâu rộng đến các quyết định trong mọi lĩnh vực của đời sống, từ doanh nghiệp đến khu vực công.

Trong bối cảnh thông tin sai lệch lan truyền rất nhanh trên mạng xã hội, các hệ thống AI nếu không được xây dựng đúng cách hoàn toàn có thể khuếch đại hoặc tái sản sinh sai lệch đó. Khi đó niềm tin của người dùng vào AI sẽ suy giảm nhanh chóng”, ông nói và nhấn mạnh “muốn AI được chấp nhận rộng rãi thì nó phải chính xác, nhất quán, tương thích với thực tế và đáng tin”.

PGS Lưu Anh Tuấn
PGS Lưu Anh Tuấn

AI triển khai tại Việt Nam phải phù hợp với văn hóa và các giá trị của người Việt.

Các mô hình ngôn ngữ lớn (LLM) dù đạt nhiều thành tựu nhưng vẫn tồn tại rủi ro: có thể tạo ra thông tin sai lệch, phản ánh thiên lệch từ dữ liệu không cân bằng, làm lộ dữ liệu nhạy cảm khi cơ chế bảo vệ dữ liệu chưa hoàn thiện, và thiếu cơ chế quy trách nhiệm rõ ràng khi xảy ra sự cố.

Gần đây, Việt Nam chứng kiến sự gia tăng mạnh của các vụ lừa đảo sử dụng giọng nói và văn bản do AI tạo ra. Điều đó cho thấy yêu cầu về “niềm tin số” là vô cùng cấp thiết.

Thậm chí, không chỉ các mô hình AI thế giới, mà ngay cả khi triển khai AI tại Việt Nam, nhiều thách thức đặc thù về ngôn ngữ cũng đang đặt ra. Đó là thách thức về các phương ngữ lớn cùng các biến thể giọng nói, từ vựng khác nhau; các đặc trưng ngôn ngữ liên quan đến đại từ nhân xưng, thứ bậc xã hội, ngữ cảnh giao tiếp.

Tuy vậy, đây cũng chính là cơ hội cho AI Việt Nam, khi các mô hình nước ngoài khó có thể hiểu chính xác những đặc thù này.

Việt Nam cũng có một lợi thế “đi sau” đặc biệt, nên có thể bắt đầu với “tờ giấy trắng”, không bị ràng buộc bởi những di sản dữ liệu cũ như nhiều quốc gia khác. Điều này cho phép Việt Nam thiết kế hệ thống AI theo hướng sạch, minh bạch và phù hợp văn hóa ngay từ đầu, đồng thời tiếp thu các chuẩn mực quốc tế mới nhất để rút ngắn khoảng cách phát triển.

5 LỘ TRÌNH PHÁT TRIỂN AI ĐÁNG TIN CẬY TẠI VIỆT NAM

Theo PGS Lưu Anh Tuấn, hệ thống Trustworthy AI là sự kết hợp của năm trụ cột: an toàn, bảo mật, công bằng, minh bạch, và phù hợp văn hóa – xã hội Việt Nam. Những giá trị như tính nhân văn, tinh thần cộng đồng và trách nhiệm xã hội phải được tích hợp trực tiếp vào thiết kế AI. Ông cũng đề xuất lộ trình hiện thực hóa mục tiêu phát triển AI đáng tin cậy.

Thứ nhất, chủ động xây dựng các bộ dữ liệu tiếng Việt chất lượng cao, sạch và đa dạng. Dữ liệu phải đại diện cho nhiều lĩnh vực như pháp luật, y tế, tài chính, lịch sử, giáo dục, đồng thời bao quát đầy đủ các giọng vùng miền và tiếng nói của cộng đồng thiểu số.

Việt Nam cũng cần cơ chế cấp phép và thu thập dữ liệu minh bạch, loại bỏ thông tin sai lệch ngay từ đầu vào, ưu tiên sử dụng các nguồn có độ tin cậy cao như văn bản luật, tin tức kiểm chứng và dữ liệu chuyên gia.

Thứ hai, phát triển các mô hình AI minh bạch, mã nguồn mở để cơ quan quản lý, giới nghiên cứu và doanh nghiệp có thể kiểm tra, đánh giá, tái tạo và đóng góp cải thiện. Cách làm này giúp tăng khả năng tự chủ công nghệ và giảm phụ thuộc vào mô hình nước ngoài.

Việc công bố mô hình cần đi kèm hướng dẫn phát hành an toàn và cơ chế chứng nhận để bảo đảm mô hình được kiểm định trước khi sử dụng rộng rãi.

Thứ ba, xây dựng bộ tiêu chuẩn và khung đánh giá quốc gia cho AI, gồm các bài kiểm tra về an toàn, khả năng suy luận, tri thức lịch sử – xã hội Việt Nam, cũng như mức độ thiên lệch và các yếu tố liên quan đến đặc thù văn hóa. Đây sẽ là nền tảng đảm bảo mô hình AI hoạt động phù hợp với bối cảnh Việt Nam.

Thứ tư, tăng cường độ tin cậy của mô hình bằng cách ứng dụng kiến trúc RAG – hệ thống truy xuất và tham chiếu tài liệu thực. RAG cho phép AI trả lời dựa trên nguồn đã kiểm chứng, hạn chế hiện tượng “tự bịa”, đồng thời nâng cao tính minh bạch và độ chính xác.

Thứ năm, xây dựng khung quản trị AI cấp quốc gia với quy định rõ cho từng lĩnh vực, cơ chế giám sát việc triển khai mô hình và chỉ yêu cầu giám sát của con người trong các lĩnh vực nhạy cảm như y tế, giáo dục và hành chính công. Song song, cần nâng cao nhận thức của người dân về khả năng, hạn chế và rủi ro của AI. Việc phát triển AI đáng tin cậy phải là nỗ lực chung của Nhà nước, doanh nghiệp, giới học thuật và toàn xã hội.

PGS Lưu Anh Tuấn nhận định mục tiêu đưa Việt Nam trở thành điểm sáng AI của khu vực vào năm 2030 là hoàn toàn khả thi, nếu tận dụng đúng những lợi thế sẵn có. Ông cho biết Việt Nam sở hữu quy mô dân số hơn 100 triệu người và nguồn nhân lực chất lượng cao, thường đạt thành tích tốt tại các kỳ thi học thuật quốc tế. Đây là nền tảng quan trọng để phát triển AI trong dài hạn.

Theo ông, để hiện thực hóa mục tiêu, Việt Nam cần có chính sách hỗ trợ đúng trọng tâm, bao gồm đầu tư mạnh cho giáo dục, nghiên cứu, hạ tầng dữ liệu và môi trường khởi nghiệp. Quan trọng hơn, phải xây dựng chiến lược rõ ràng, tránh dàn trải nguồn lực và thúc đẩy sự tham gia của cả khu vực công lẫn tư.

“Nếu làm tốt, Việt Nam hoàn toàn có thể vươn lên nhóm dẫn đầu vào năm 2030”, PGS Lưu Anh Tuấn nhận định.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

"Lỗ hổng" hạ tầng sau làn sóng xe điện, AI và bài toán làm chủ năng lượng thông minh

Sự dịch chuyển mạnh mẽ sang xe điện hướng tới mục tiêu Net Zero cùng với sự phát triển của trí tuệ nhân tạo (AI) đang đặt ra những yêu cầu mới đối với hệ thống lưới điện, đòi hỏi những giải pháp công nghệ để tối ưu hóa hạ tầng năng lượng...

22:53 19/06/2026
Từ “hiện tượng Flappy Bird”, game Việt đang bước vào giai đoạn trưởng thành bền vững hơn

Từ dấu ấn toàn cầu của Nguyễn Hà Đông với Flappy Bird hơn một thập kỷ trước, ngành game Việt Nam đang bước sang một giai đoạn phát triển mới với tham vọng "Go Global" rõ nét hơn…

22:53 19/06/2026
Doanh nghiệp Việt góp phần định hình năng lực cạnh tranh số quốc gia

Các doanh nghiệp công nghệ Việt Nam ngày nay không chỉ cung cấp giải pháp công nghệ mà đang từng bước tham gia vào các thành phần quan trọng của hạ tầng quốc gia, từ định danh điện tử, xác thực giao dịch cho tới các nền tảng dữ liệu và nền tảng AI...

14:57 19/06/2026
Dữ liệu trở thành "tài sản mới" của nông sản Việt

Dữ liệu không chỉ là công cụ phục vụ sản xuất hay truy xuất nguồn gốc, mà còn là cơ sở để xây dựng tiếng nói chung cho toàn ngành nông nghiệp, từ đó nâng cao năng lực cạnh tranh trên thị trường quốc tế...

15:35 18/06/2026
Đồng thuận kiểm soát và bồi thường trong quản trị rủi ro an ninh mạng

Theo các chuyên gia, doanh nghiệp cần chuyển từ tư duy bảo vệ hệ thống truyền thống sang một cách tiếp cận toàn diện hơn trong quản trị rủi ro dữ liệu...

15:35 18/06/2026
[Trực tiếp] Tương lai hạ tầng sạc xe điện tại Việt Nam: Từ trạm sạc đến hệ sinh thái năng lượng thông minh

The WISE Talk số 19 với chủ đề “Tương lai hạ tầng sạc xe điện tại Việt Nam: Từ trạm sạc đến hệ sinh thái năng lượng thông minh” phát sóng trực tuyến trên trang chủ VnEconomy lúc 14:00, Thứ Năm, ngày 18/06/2026.

13:56 18/06/2026
Dữ liệu cá nhân đang được quản trị đến đâu trên website của các doanh nghiệp Việt?

Chỉ cần một cú nhấp chuột, người dùng đã đồng ý về các điều khoản dữ liệu mà các website đặt ra, nhưng lại cần đến nhiều bước để từ chối hoặc rút lại lựa chọn...

10:17 18/06/2026
Chủ tịch CMC được bổ nhiệm vào Hội đồng Tham nghị Liên đoàn Kinh tế Nhật Bản Keidanren

Việc bổ nhiệm một doanh nhân Việt Nam làm Shingiin (Thành viên Hội đồng Tham nghị) của Keidanren được cho là sẽ giúp mở thêm kênh kết nối chiến lược giữa doanh nghiệp Việt Nam và Nhật Bản trong lĩnh vực công nghệ, AI và hạ tầng số…

10:16 18/06/2026
Những cạm bẫy vì "quá tin AI": Khi con người lười tư duy trước công nghệ

Sự tiện lợi của AI đang tạo ra một chiếc bẫy tâm lý khi con người tin tưởng máy móc hơn chính phán đoán của mình. Thói quen mặc định phê duyệt này khiến tư duy phản biện bị mai một, trong khi con người vẫn phải gánh chịu mọi trách nhiệm khi hệ thống vận hành sai sót…

10:16 18/06/2026
Xác định đúng “điểm rơi” công nghệ để tạo đột phá trong lượng tử, hạt nhân

Nguồn lực có hạn, Việt Nam cần tập trung vào những lĩnh vực công nghệ chiến lược như lượng tử và hạt nhân, thúc đẩy liên kết giữa viện nghiên cứu và trường đại học, chấp nhận rủi ro để tạo ra các đột phá khoa học – công nghệ…

10:50 17/06/2026