image Thứ Bảy, 17/01/2026

"Khát" dữ liệu thực tế để huấn luyện AI, các công ty ra mắt ưu đãi miễn phí

Trần Thị Huyền Thương

22/08/2025

Chia sẻ

Các công ty như OpenAI, Google và Perplexity đang thiết lập quan hệ đối tác và cung cấp ưu đãi miễn phí để có dữ liệu tiêu dùng – loại dữ liệu không thể thu thập từ internet...

Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI
Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI

Trong bối cảnh cuộc cạnh tranh khốc liệt nhằm thống trị lĩnh vực trí tuệ nhân tạo (AI), các công ty AI đang xây dựng liên minh xuyên ngành và khu vực để thu thập dữ liệu thực tế – những thông tin không thể lấy từ các nguồn công khai trên mạng.

THIẾT LẬP QUAN HỆ ĐỐI TÁC ĐỂ THU THẬP DỮ LIỆU

Trong hai tháng qua, OpenAI đã ký kết hợp tác với các ông lớn thương mại điện tử như Shopee và Shopify. Trong khi đó, Google và Perplexity đã cung cấp quyền truy cập miễn phí vào các công cụ AI tiên tiến cho một số người dùng tại Ấn Độ. Các chuyên gia cho rằng những động thái này sẽ giúp các công ty tiếp cận những truy vấn tiêu dùng có cấu trúc, hành vi sản phẩm và dữ liệu giao dịch – những tín hiệu huấn luyện thường không có sẵn qua dữ liệu công khai.

"Những quan hệ đối tác này sẽ cung cấp cho họ các bộ dữ liệu đa dạng, giúp huấn luyện mô hình AI tốt hơn và tạo ra đầu ra chính xác hơn”, Sameer Patil, giám đốc Trung tâm An ninh, Chiến lược & Công nghệ tại tổ chức tư vấn toàn cầu Observer Research Foundation, chia sẻ.

"Điều này cũng sẽ giúp họ đổi mới các cách áp dụng mô hình AI trong một số lĩnh vực cụ thể. Đặc biệt là ở những ngành nhấn mạnh vào tùy chỉnh hóa siêu cá nhân hóa, chẳng hạn như fintech và chăm sóc sức khỏe”.

"Dân số trẻ, am hiểu công nghệ của châu Á cùng với tỷ lệ thâm nhập di động cao khiến khu vực này trở thành một trong những thị trường tăng trưởng nhanh nhất về áp dụng và đổi mới AI”, Oliver Jay, giám đốc điều hành OpenAI International, phát biểu trong thông cáo công bố quan hệ đối tác với Sea.

"Bằng cách áp dụng khả năng của OpenAI trong các lĩnh vực như thương mại, chúng tôi mong muốn hợp tác với Sea để trang bị cho nhiều doanh nghiệp hơn các công cụ thông minh nhằm quản lý hoạt động và tiếp cận khách hàng”.

Google, Perplexity và OpenAI không phản hồi các câu hỏi cụ thể về lý do họ tham gia các quan hệ đối tác toàn cầu hoặc cung cấp công cụ AI miễn phí cho một số người dùng. Theo chính sách bảo mật của họ, cả ba công ty đều thu thập dữ liệu người dùng vì các lý do như cải thiện trải nghiệm, tạo và quản lý tài khoản, cũng như huấn luyện mô hình. Người dùng có thể chọn không chia sẻ dữ liệu để huấn luyện mô hình.

Trung Quốc đã chứng minh cách tiếp cận dữ liệu ngành cụ thể có thể mang lại lợi thế cạnh tranh.

Đầu tháng này, các công ty ứng dụng AI để phát triển thuốc của Trung Quốc đã ký kết các thỏa thuận trị giá hàng tỷ đô la với các hãng dược phẩm như AstraZeneca, Pfizer và Sanofi.

Thành công này một phần nhờ vào việc các công ty Trung Quốc tiếp cận được bộ dữ liệu ngữ cảnh khổng lồ từ hệ thống bảo hiểm y tế quốc gia, bao phủ hơn 600 triệu người. Scott Moore, giám đốc chương trình Trung Quốc tại Đại học Pennsylvania, chia sẻ đây là "lợi thế cấu trúc", vì lượng bệnh nhân lớn có thể được sử dụng như một bộ huấn luyện khổng lồ cho các mô hình AI.

GOOGLE VÀ PERPLEXITY ĐẠT THÀNH CÔNG BAN ĐẦU VỚI CÁC ĐỢT RA MẮT MIỄN PHÍ 

Vào tháng 7, khi Perplexity công bố thỏa thuận với Bharti Airtel, công ty này ghi nhận lượng tải về hàng tháng lên đến 6,69 triệu lượt, so với chỉ 790.000 lượt vào tháng 6, theo dữ liệu từ công ty tình báo thị trường Sensor Tower.

"Tôi tải Perplexity về tháng trước vì giờ nó miễn phí với Airtel. Tôi vẫn dùng ChatGPT thường xuyên hơn", P. Sahay, một nhà khoa học dữ liệu làm việc tại một công ty tư vấn ở Bengaluru, cho biết.

"Tôi không quá lo lắng về dữ liệu của mình vì những thứ tôi dùng AI đều không nhạy cảm lắm. Tôi dùng nó để soạn email hoặc tin nhắn, debug code, lấy code sẵn, nghiên cứu thị trường…, không có thông tin bảo mật nào cả". Sahay cho biết anh không biết rằng các chatbot AI cung cấp tùy chọn tắt thu thập dữ liệu để huấn luyện.

Dù người dùng đang tận hưởng lợi ích từ các gã khổng lồ AI, các chuyên gia vẫn lo ngại về các vấn đề như chủ quyền dữ liệu và xu hướng các thị trường mới nổi trở thành nguồn cung cấp cho hệ thống AI toàn cầu mà không nhận được lợi ích công bằng.

Một số quốc gia đang phát triển ở châu Phi và châu Á đang phản đối sự kiểm soát dữ liệu toàn cầu của Big Tech. Nhiều quốc gia yêu cầu các công ty như Google, Microsoft và Amazon lưu trữ thông tin công dân địa phương tại chỗ.

"Điều này đòi hỏi các biện pháp bảo vệ vững chắc để bảo vệ quyền riêng tư và đảm bảo công bằng”, chuyên gia Patil nói. "Các công ty tham gia phải đảm bảo rằng bộ dữ liệu được phi cá nhân hóa và ẩn danh, đồng thời thiết lập các khung giám sát chặt chẽ để tránh thiên kiến trong việc thu thập dữ liệu”.

Theo The Wall Street Journal, dù vẫn còn tranh cãi về việc các ưu đãi miễn phí và quan hệ đối tác này có thể đưa các công ty AI đi xa đến đâu, cuộc chiến thống trị đã có bước ngoặt mới vào ngày 12/8, khi Perplexity đề nghị mua trình duyệt Chrome của Google với giá 34,5 tỷ USD. Giá đề nghị này gần gấp đôi giá trị của Perplexity là 18 tỷ USD.


Các công ty công nghệ đang “săn” nhân lực trong lĩnh vực năng lượng

Nhu cầu nhân lực năng lượng tăng mạnh khi Big Tech mở rộng hợp tác và thâu tóm doanh nghiệp để đảm bảo nguồn điện cho trung tâm dữ liệu.

11:20 15/01/2026
DeepSeek thu hút sự chú ý tại các quốc gia đang phát triển

DeepSeek, startup AI Trung Quốc, chiếm ưu thế tại Belarus, Nga, Syria, Iran và Ethiopia, theo báo cáo mới từ Microsoft.

11:19 15/01/2026
Google sẽ phát triển smartphone cao cấp tại Việt Nam

Google sẽ sản xuất smartphone Pixel tại Việt Nam, đánh dấu bước chuyển quan trọng trong chuỗi cung ứng toàn cầu, phản ánh sự trưởng thành mới.

14:32 14/01/2026
Trung Quốc và sự dịch chuyển quyền lực trên thị trường chip nhớ toàn cầu

ChangXin Memory Technologies (CXMT) đang nổi lên như một nhân tố quan trọng trong thị trường chip nhớ toàn cầu, định hình lại cán cân cung cầu trong bối cảnh bùng nổ AI.

11:27 14/01/2026
Gia tăng lừa đảo trực tuyến, Ấn Độ đề xuất buộc các hãng smartphone chia sẻ mã nguồn

Chính phủ Ấn Độ đề xuất yêu cầu các hãng smartphone chia sẻ mã nguồn phần mềm nhằm tăng cường bảo vệ dữ liệu người dùng giữa làn sóng lừa đảo trực tuyến gia tăng.

16:17 12/01/2026
OpenAI trả thù lao 1,5 triệu USD mỗi nhân viên, cao nhất lịch sử Silicon Valley

OpenAI dự kiến chi trả thù lao trung bình 1,5 triệu USD cho mỗi nhân viên vào năm 2025, phản ánh cuộc đua nhân tài AI khốc liệt.

16:09 09/01/2026
Trung Quốc xem xét thương vụ Meta mua Manus: Đòn bẩy mới trong cuộc cạnh tranh công nghệ Mỹ – Trung

Bộ Thương mại Trung Quốc xem xét thương vụ Meta mua Manus, khơi dậy lo ngại về kiểm soát công nghệ và ảnh hưởng đến cạnh tranh toàn cầu.

16:26 08/01/2026
Mỹ đề xuất các Big Tech tiêu hao ít điện hơn cho trung tâm dữ liệu, hoặc phải chịu rủi ro mất điện

Cơ quan lưới điện Mỹ cảnh báo nguy cơ mất điện nếu trung tâm dữ liệu không kiểm soát nhu cầu năng lượng. Các công ty công nghệ phản đối đề xuất cắt điện.

16:24 08/01/2026
Elon Musk có thể trở thành người đầu tiên trên thế giới đạt tài sản ròng 1.000 tỷ USD

Elon Musk tiến gần tới việc trở thành người đầu tiên sở hữu tài sản ròng 1.000 tỷ USD, nhờ vào sự phát triển của Tesla và SpaceX.

16:51 07/01/2026