

Việt Nam đang hướng tới thành lập thị trường giao dịch dữ liệu. Theo quan sát và đánh giá của ông, thị trường dữ liệu cũng như các mô hình sàn giao dịch dữ liệu hiện nay trên thế giới đang vận hành như thế nào?
Có thể nói, Trung Quốc là đất nước tiên phong thiết lập các sàn giao dịch dữ liệu, nhưng họ cũng phải vừa làm vừa điều chỉnh, chứ chưa thể tạo ra một mô hình chuẩn mực để các quốc gia khác đi theo. Khung pháp lý dù đã khá chặt chẽ, nhưng hiệu quả hoạt động của các sàn này vẫn đang được thử nghiệm để tìm ra công thức tối ưu.
Trung Quốc nhận ra tầm quan trọng của dữ liệu từ rất sớm, xuất phát từ thực tế họ là đất nước tỷ dân nên dữ liệu cũng cực kỳ khổng lồ. Với nguồn dữ liệu đồ sộ như vậy, Trung Quốc tự đặt ra bài toán là làm thế nào để khai thác hiệu quả nguồn dữ liệu rất lớn đó. Nhất là khi hiện nay dữ liệu được xem như tài sản có giá trị cao trong kỷ nguyên số. Các công nghệ như trí tuệ nhân tạo (AI), phân tích dữ liệu lớn (Big Data Mining) đều cần dữ liệu để vận hành, thúc đẩy tăng trưởng kinh tế, phát triển khoa học và cải thiện đời sống xã hội.
Châu Âu hiện nay cũng vẫn đang tranh cãi về cách quản lý dữ liệu. Điển hình là vụ việc Công ty AVAS bán dữ liệu người dùng cho bên thứ ba. Ban đầu, họ tuyên bố dữ liệu này không định danh, không ảnh hưởng đến quyền riêng tư cá nhân. Nhưng sau đó, các tổ chức độc lập chứng minh được dữ liệu này có thể được truy ngược lại danh tính người dùng, dẫn đến vụ kiện tụng. Kết quả là AVAS bị buộc phải đóng cửa và chịu khoản phạt lên đến 160 triệu USD.

Như vậy, nghĩa là dữ liệu – nguồn tài nguyên quan trọng ở Việt Nam lâu nay, ít nhất đến trước thời điểm 1/7/2025, khi Luật Dữ liệu có hiệu lực – chưa được quản lý và khai thác hiệu quả, cùng với đó là vấn đề bảo vệ dữ liệu?
Hiện nay, người dân chủ yếu sử dụng các nền tảng công nghệ từ nước ngoài, trong khi các nền tảng thuần Việt vẫn chiếm thị phần khá nhỏ, ngoại trừ một số cái tên như Zalo. Điều này đặt ra hai vấn đề lớn.
Một là, hành lang pháp lý cần được xây dựng sao cho các ứng dụng xuyên biên giới phải tuân thủ quy định tại Việt Nam.
Hai là, công nghệ kiểm soát dữ liệu, giám sát ẩn danh phải được phát triển đủ mạnh để đảm bảo dữ liệu được giao dịch, sử dụng đúng quy định.
Dữ liệu để đưa lên các sàn phải là không thể định danh. Nhưng tình hình thực tế chung là các biện pháp kỹ thuật và khung pháp lý vẫn còn chung chung. Tới đây, Luật Dữ liệu của Việt Nam sẽ chính thức có hiệu lực (1/7/2025), tuy nhiên, để Luật đi vào thực tế, cần có các nghị định hướng dẫn chi tiết, đặc biệt là cần thêm các quy chuẩn kỹ thuật, hợp đồng dữ liệu mẫu, cơ chế bảo hiểm dữ liệu và thử nghiệm sandbox. Nếu muốn đi nhanh, cần triển khai các bước một cách khẩn trương để tránh tình trạng “vừa làm vừa run”, gây cản trở sự phát triển.
Tất nhiên, chúng ta có thể áp dụng cơ chế sandbox – thử nghiệm, điều chỉnh và sửa sai theo thực tế. Tuy nhiên, khi liên quan đến dữ liệu, đặc biệt là dữ liệu cá nhân, mọi quyết định đều cần cân nhắc kỹ lưỡng.
Dữ liệu là tài sản vô giá, để khai thác hiệu quả mà vẫn bảo vệ được quyền lợi của người dân và lợi ích quốc gia là một bài toán khó. Điều này đòi hỏi sự phối hợp chặt chẽ giữa các cơ quan quản lý, doanh nghiệp và các bên liên quan. Nhà nước có thể định hướng chính sách, nhưng việc triển khai cụ thể, đặc biệt là khâu giám sát, vẫn cần các giải pháp công nghệ thực tiễn và khả thi.

Từ thực tiễn như ông chia sẻ, xây dựng một sàn giao dịch dữ liệu không phải điều đơn giản, ngay cả các quốc gia phát triển cũng còn nhiều vướng mắc. Vậy theo ông, đâu là những thách thức lớn nhất mà Việt Nam sẽ phải tính toán khi xây dựng sàn giao dịch dữ liệu?
Bất cập lớn nhất có thể thấy ngay chính là hành lang pháp lý chưa theo kịp tốc độ phát triển của công nghệ. Các quy định về an ninh mạng và an toàn thông tin của Việt Nam đã ra đời cách đây cả chục năm. Luật An ninh mạng mới nhất từ năm 2018, còn Luật An toàn thông tin từ năm 2015. Trong khi đó, công nghệ đã thay đổi rất nhanh, đặc biệt với sự bùng nổ của AI, khiến nhiều quy định cũ trở nên lỗi thời.
Một ví dụ điển hình là tranh cãi gần đây giữa Deepseek và OpenAI về việc Deepseek được cho là đã sử dụng câu trả lời của ChatGPT để huấn luyện mô hình AI của họ. Liệu đây có phải hành vi “đánh cắp” dữ liệu không? Câu hỏi này đến nay vẫn chưa có lời giải thỏa đáng.
Ngay cả trên thế giới, vấn đề sở hữu và sử dụng dữ liệu vẫn còn rất mơ hồ, tranh cãi chưa ngã ngũ. Điều này cho thấy việc xây dựng một hệ thống quy định chặt chẽ ngay từ đầu là vô cùng khó, đòi hỏi Việt Nam không chỉ phải đưa ra luật phù hợp mà còn cần đảm bảo tuân thủ thông lệ quốc tế.
Các nền tảng xuyên biên giới cung cấp dịch vụ trên quy mô hàng trăm quốc gia. Nếu quy định của Việt Nam không phù hợp hoặc quá khắt khe, có thể họ sẽ rời bỏ thị trường.
Về mặt công nghệ, tôi cho rằng chúng ta đã sẵn sàng. Việt Nam đã có các công ty sở hữu nền tảng xử lý dữ liệu, có năng lực huấn luyện AI và triển khai mô hình AI. Chỉ cần có hướng dẫn pháp lý cụ thể từ cơ quan quản lý, sàn giao dịch dữ liệu hoàn toàn có thể vận hành chính thức.
Nhìn chung, ngay cả các nước tiên tiến cũng đang loay hoay trong việc xây dựng luật điều chỉnh thị trường dữ liệu. Đây không chỉ là bài toán riêng của Việt Nam, nhưng nếu chúng ta hoàn thiện khung pháp lý sớm, thậm chí có thể đi trước một bước so với thế giới, thì có thể tạo lợi thế cạnh tranh đáng kể.

Dữ liệu ngày nay được xem như một loại tài sản, nhưng thường các doanh nghiệp lớn có lợi thế tiếp cận hơn so với doanh nghiệp nhỏ. Sàn giao dịch dữ liệu có thể tạo ra một sân chơi công bằng hơn cho tất cả doanh nghiệp không, thưa ông?
Dữ liệu bây giờ có thể nói không bao giờ đủ với cả doanh nghiệp lớn cũng như doanh nghiệp nhỏ. Chẳng hạn, một doanh nghiệp viễn thông chỉ sở hữu dữ liệu thuê bao, nhưng nếu muốn mở rộng sang các lĩnh vực khác như thương mại điện tử, hay tiếp thị thì dữ liệu đó là chưa đủ.
Tất nhiên, kể cả có sàn giao dịch dữ liệu thì lợi thế vẫn sẽ thuộc về các doanh nghiệp lớn vì họ có tiền để đầu tư mua dữ liệu từ bên khác, hoặc cũng là người nắm nhiều dữ liệu có thể khai thác, loại bỏ định danh để bán lại cho bên khác. Tuy nhiên, nó tạo ra cơ hội cho các doanh nghiệp nhỏ bằng cách giúp họ tiếp cận dữ liệu theo cách linh hoạt hơn.
Thay vì phải bỏ ra số tiền lớn để mua trọn vẹn một tập dữ liệu khổng lồ thì doanh nghiệp nhỏ có thể đặt hàng một phần dữ liệu cụ thể, phục vụ cho bài toán của mình. Điều này giúp họ giảm chi phí, tập trung vào khai thác giá trị thực sự mà không bị áp lực về công nghệ xử lý dữ liệu quy mô lớn.

Việc xây dựng sàn giao dịch dữ liệu sẽ tác động như thế nào đến hoạt động nghiên cứu và đổi mới sáng tạo tại Việt Nam, thưa ông?
Như tôi đã đề cập, đổi mới sáng tạo và chuyển đổi số đều xoay quanh dữ liệu. Nếu không có dữ liệu, dù công nghệ có tiên tiến đến đâu cũng không thể phát huy hết giá trị.
Sàn giao dịch dữ liệu sẽ đóng vai trò cung cấp nguồn tài nguyên thiết yếu, giúp các doanh nghiệp, tổ chức có thể khai thác dữ liệu một cách hợp pháp và minh bạch để nghiên cứu, phát triển công nghệ mới. Nói cách khác, dữ liệu chính là "nhiên liệu" giúp các động cơ đổi mới sáng tạo vận hành trơn tru. Khi sàn giao dịch dữ liệu đi vào hoạt động sẽ mở ra nhiều cơ hội cho các doanh nghiệp và tổ chức trong việc phát triển AI, phân tích dữ liệu lớn, tự động hóa, cũng như nhiều lĩnh vực công nghệ khác.
Việt Nam không thiếu dữ liệu để phát triển AI, vấn đề là phân tán và thiếu tập trung. Dữ liệu số hóa đã có từ lâu, nhưng vẫn rời rạc, nằm rải rác ở nhiều bộ, ngành và địa phương, chưa được liên thông để khai thác hiệu quả. Các doanh nghiệp cũng sở hữu lượng dữ liệu khổng lồ nhưng chưa thể khai thác tối ưu, giống như có mỏ vàng nhưng chưa có công cụ đào.
Tôi cho rằng việc Bộ Công an thành lập Trung tâm Cơ sở dữ liệu quốc gia là bước đi quan trọng giúp tập trung hóa các dữ liệu rời rạc, tạo điều kiện thuận lợi cho việc khai thác và ứng dụng AI.
Sàn giao dịch dữ liệu sẽ không phải là nơi lưu trữ tất cả dữ liệu, nhưng sẽ đóng vai trò trung tâm kết nối giữa các mạng lưới dữ liệu khác nhau. Khi cần dữ liệu, các tổ chức có thể truy vấn và kết nối với nguồn phù hợp, giải quyết bài toán dữ liệu phân tán hiện nay.
Tuy nhiên, dữ liệu trong nước chỉ chiếm khoảng 10% trong việc phát triển AI, phần còn lại phụ thuộc vào tri thức toàn cầu. Hiện nhiều hệ thống AI trên thế giới đã có xu hướng mở, như LLAMA hay Deepseek, thậm chí ChatGPT cũng có thể phải mở trong tương lai.
AI và dữ liệu gắn kết với nhau rất chặt chẽ, nếu không có dữ liệu thì không có AI và không có AI thì dữ liệu không phát huy được hết giá trị. Tôi hay ví AI giống như động cơ, còn dữ liệu là nhiên liệu, thiếu một trong hai sẽ không có cái còn lại.
Dù AI có thể thua con người ở khía cạnh cảm xúc, nhưng xét về hiệu suất, tốc độ xử lý và khả năng hoạt động không ngừng nghỉ, AI vượt trội hơn rất nhiều. Đây là lý do dù từng có những lời kêu gọi ngừng phát triển AI, nhưng thực tế không ai dừng lại, bởi AI mang đến lợi thế cạnh tranh khổng lồ.
Hiện tại, không ai trên thế giới nói rằng "đừng phát triển AI". Việt Nam không thể đứng ngoài cuộc đua này, nếu muốn lọt vào nhóm dẫn đầu về AI, chúng ta không thể chậm chân.

Theo ông, cơ chế vận hành sàn giao dịch dữ liệu nên như thế nào để vừa phù hợp, vừa đảm bảo hiệu quả, thúc đẩy phát triển kinh tế, vừa bảo vệ quyền lợi của các bên liên quan?
Hợp tác công tư (PPP) là hướng đi đúng đắn nhất, vì nếu chỉ dựa vào ngân sách nhà nước, mô hình này có thể thiếu linh hoạt và động lực phát triển. Thay vào đó, cần có sự tham gia của khu vực tư nhân để tận dụng nguồn lực, công nghệ và kinh nghiệm thị trường.
Như vậy, Nhà nước giữ vai trò quản lý, giám sát và đảm bảo tuân thủ pháp luật. Doanh nghiệp tư nhân chịu trách nhiệm khai thác kinh tế, đảm bảo vận hành hiệu quả và có động lực phát triển.
Chúng ta không cần tìm kiếm đâu xa, có thể tham khảo ngay mô hình của Trung Quốc. Họ triển khai hợp tác công tư rất hiệu quả, điển hình như Huawei - một doanh nghiệp công nghệ lớn nhận được sự hỗ trợ chiến lược từ Nhà nước nhưng vẫn vận hành theo cơ chế thị trường. Những mô hình như vậy giúp cân bằng giữa quản lý nhà nước và động lực đổi mới sáng tạo từ khu vực tư nhân, đảm bảo vừa kiểm soát chặt chẽ dữ liệu, vừa thúc đẩy sự phát triển của thị trường giao dịch dữ liệu.
Nếu các sàn giao dịch dữ liệu được đưa vào hoạt động, theo ông, quy mô thị trường này tại Việt Nam có thể đạt giá trị bao nhiêu?
Dữ liệu thì rất khó đo đếm được giá trị. Giao dịch dữ liệu tại Việt Nam sẽ do Bộ Công an quản lý, nên mục tiêu đầu tiên tôi cho rằng không phải lợi nhuận, mà là tạo nền tảng phát triển kinh tế và công nghệ. Vì thế, Chính phủ buộc phải đầu tư, giống như đầu tư vào hạ tầng giao thông hay viễn thông. Chưa thể dự đoán nhưng tôi cho rằng quy mô sàn sẽ rất lớn.

Mặc dù chưa có quy định chi tiết, nhưng thực tế việc mua bán dữ liệu vẫn diễn ra phổ biến. Theo ông, những bất cập nào đang tồn tại khi thị trường này chưa được hợp thức hóa?
Thực tế, việc mua bán dữ liệu trên chợ đen khá phổ biến, gây mất trật tự xã hội, đặc biệt việc mua bán còn phục vụ cả các mục đích lừa đảo. Một số doanh nghiệp có nhu cầu khai thác dữ liệu phục vụ hoạt động kinh doanh, sản xuất, cung cấp dịch vụ lại đang tìm cách tận dụng các quy định hiện hành để linh hoạt vận dụng. Do khung pháp lý về dữ liệu vẫn chưa đầy đủ, rõ ràng, họ dựa vào các điều khoản trong các luật hiện có để hợp thức hóa hoạt động chia sẻ dữ liệu. Chẳng hạn, một doanh nghiệp muốn chuyển dữ liệu cho một đơn vị khác có thể thực hiện thông qua mô hình công ty liên kết.
Tuy nhiên, phần lớn các giao dịch này không nhằm mục đích mua bán trực tiếp, mà chủ yếu phục vụ hợp tác. Một doanh nghiệp có thể cung cấp dữ liệu cho đối tác để đổi lại việc sử dụng dữ liệu đó nhằm phát triển sản phẩm, dịch vụ chung. Điều này giúp doanh nghiệp tận dụng tài nguyên sẵn có mà không vi phạm quy định cấm mua bán dữ liệu. Việt Nam hiện vẫn nghiêm cấm giao dịch dữ liệu dưới mọi hình thức trước khi có các quy định cụ thể.
Khi Luật Dữ liệu chưa có hiệu lực thi hành, mọi hoạt động mua bán, trao đổi dữ liệu hiện nay gần như là bất hợp pháp hoặc rơi vào vùng xám. Luật Dữ liệu được thi hành sẽ thống nhất các nguyên tắc quản lý, giúp định hình rõ ràng thị trường này.
Đến nay, các cơ quan quản lý cũng đang nỗ lực đẩy nhanh tiến trình hoàn thiện khung pháp lý cho dữ liệu, đặc biệt trong bối cảnh Nghị quyết 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia đã nhấn mạnh vai trò của dữ liệu như một tài sản quan trọng, tương đương năng lượng, dầu mỏ hay điện trong nền kinh tế số.
Việc thiếu một hệ thống quy định rõ ràng về dữ liệu, từ quyền quản lý, định giá đến tiêu chuẩn sử dụng, chẳng khác nào sản xuất ô tô mà chưa có tiêu chuẩn xăng dầu hay hệ thống phân phối nhiên liệu. Nếu muốn thúc đẩy chuyển đổi số và đổi mới sáng tạo, việc xây dựng khung pháp lý cho dữ liệu không thể chậm trễ.

Theo ông, khi đã đi vào hoạt động, sàn giao dịch dữ liệu có thể giải quyết triệt để vấn đề này không?
Việc mua bán dữ liệu trái phép trên chợ đen sẽ không thể biến mất hoàn toàn ngay cả khi sàn giao dịch dữ liệu đi vào hoạt động. Các tổ chức, cá nhân vẫn có thể tìm cách thu thập và trao đổi dữ liệu định danh một cách không chính thống. Do đó, bên cạnh việc vận hành sàn giao dịch dữ liệu, cần có hành lang pháp lý chặt chẽ để kiểm soát vấn đề này. Luật và các chế tài xử phạt sẽ đóng vai trò quan trọng trong việc hạn chế tình trạng mua bán dữ liệu trái phép, thay vì kỳ vọng sàn giao dịch dữ liệu có thể giải quyết triệt để vấn đề này.
Luật Dữ liệu sẽ tạo ra khung pháp lý, còn sàn giao dịch dữ liệu sẽ giúp minh bạch và hợp pháp hóa việc mua bán dữ liệu. Như đã đề cập, các yếu tố kỹ thuật để vận hành sàn giao dịch dữ liệu về cơ bản đã sẵn sàng. Tuy nhiên, để một sàn giao dịch dữ liệu thực sự hiệu quả, cần đảm bảo hai điều kiện quan trọng.
Thứ nhất, năng lực kỹ thuật. Sàn giao dịch phải đáp ứng nhu cầu của người dùng, bao gồm tốc độ truy vấn dữ liệu, khả năng mua bán linh hoạt, tính minh bạch trong giao dịch.
Thứ hai, vấn đề an ninh bảo mật. Đây là yếu tố then chốt. Nếu một sàn giao dịch dữ liệu bị tấn công, ai sẽ chịu trách nhiệm? Lấy ví dụ từ các sàn giao dịch tiền số, khi bị hack, thiệt hại thường rất lớn, người dùng muốn lấy lại tiền cũng không hề dễ dàng. Dữ liệu cũng vậy, một khi đã bị đánh cắp, tội phạm mạng có thể bán lại với giá rẻ hơn, khiến bên cung cấp dữ liệu mất hoàn toàn quyền kiểm soát và làm mất giá trị của dữ liệu.
Nếu dữ liệu trên sàn không được bảo vệ chặt chẽ, các tổ chức, cá nhân sở hữu dữ liệu sẽ e ngại đưa dữ liệu lên sàn. Ngược lại, bên mua cũng có tâm lý chờ đợi, dữ liệu bị hack có thể bán giá rẻ hơn. Một khi mất niềm tin vào sự an toàn của dữ liệu, thị trường sẽ khó có thể phát triển bền vững.
Về mặt công nghệ, tôi cho rằng Việt Nam đã sẵn sàng, nhưng về đảm bảo an ninh mạng cho các sàn giao dịch dữ liệu, đây là lĩnh vực còn khá mới mẻ với giới an ninh mạng Việt Nam. Hầu hết các đội ngũ bảo mật hiện nay chủ yếu tập trung vào bảo vệ hệ thống nội bộ doanh nghiệp, chưa có nhiều kinh nghiệm trong việc bảo vệ một sàn giao dịch mở với hàng loạt giao dịch diễn ra liên tục. Vừa rồi, nhiều vụ tấn công như vụ hack trên sàn tiền số đều khai thác lỗi logic trong giao dịch, tức là giao dịch hợp lệ, nhưng tội phạm đã sửa đổi nội dung để khai thác. Điều này cho thấy không chỉ dữ liệu mà cả bản thân giao dịch cũng cần được bảo vệ chặt chẽ.
Sắp tới, sàn giao dịch dữ liệu sẽ do Bộ Công an chủ trì. Do đó, việc tuân thủ các quy định pháp luật sẽ được đảm bảo, nhưng vẫn cần sự phối hợp, huy động lực lượng toàn xã hội, đặc biệt trong công tác đảm bảo an ninh mạng. Nhìn chung, sẽ cần có một cơ chế linh hoạt để huy động nguồn lực từ khu vực tư nhân, phối hợp với cơ quan quản lý để vận hành và bảo vệ sàn giao dịch dữ liệu.

VnEconomy 30/06/2025 09:00
Nội dung đầy đủ của bài viết được đăng tải trên Tạp chí Kinh tế Việt Nam số 26-2025 phát hành ngày 30/06/2025. Kính mời Quý độc giả tìm đọc tại đây:
https://postenp.phaha.vn/tap-chi-kinh-te-viet-nam/detail/1473
