"Khát" dữ liệu thực tế để huấn luyện AI, các công ty ra mắt ưu đãi miễn phí

Trần Thị Huyền Thương

22/08/2025

Các công ty như OpenAI, Google và Perplexity đang thiết lập quan hệ đối tác và cung cấp ưu đãi miễn phí để có dữ liệu tiêu dùng – loại dữ liệu không thể thu thập từ internet...

Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI

Trong bối cảnh cuộc cạnh tranh khốc liệt nhằm thống trị lĩnh vực trí tuệ nhân tạo (AI), các công ty AI đang xây dựng liên minh xuyên ngành và khu vực để thu thập dữ liệu thực tế – những thông tin không thể lấy từ các nguồn công khai trên mạng.

THIẾT LẬP QUAN HỆ ĐỐI TÁC ĐỂ THU THẬP DỮ LIỆU

Trong hai tháng qua, OpenAI đã ký kết hợp tác với các ông lớn thương mại điện tử như Shopee và Shopify. Trong khi đó, Google và Perplexity đã cung cấp quyền truy cập miễn phí vào các công cụ AI tiên tiến cho một số người dùng tại Ấn Độ. Các chuyên gia cho rằng những động thái này sẽ giúp các công ty tiếp cận những truy vấn tiêu dùng có cấu trúc, hành vi sản phẩm và dữ liệu giao dịch – những tín hiệu huấn luyện thường không có sẵn qua dữ liệu công khai.

"Những quan hệ đối tác này sẽ cung cấp cho họ các bộ dữ liệu đa dạng, giúp huấn luyện mô hình AI tốt hơn và tạo ra đầu ra chính xác hơn”, Sameer Patil, giám đốc Trung tâm An ninh, Chiến lược & Công nghệ tại tổ chức tư vấn toàn cầu Observer Research Foundation, chia sẻ.

"Điều này cũng sẽ giúp họ đổi mới các cách áp dụng mô hình AI trong một số lĩnh vực cụ thể. Đặc biệt là ở những ngành nhấn mạnh vào tùy chỉnh hóa siêu cá nhân hóa, chẳng hạn như fintech và chăm sóc sức khỏe”.

"Dân số trẻ, am hiểu công nghệ của châu Á cùng với tỷ lệ thâm nhập di động cao khiến khu vực này trở thành một trong những thị trường tăng trưởng nhanh nhất về áp dụng và đổi mới AI”, Oliver Jay, giám đốc điều hành OpenAI International, phát biểu trong thông cáo công bố quan hệ đối tác với Sea.

"Bằng cách áp dụng khả năng của OpenAI trong các lĩnh vực như thương mại, chúng tôi mong muốn hợp tác với Sea để trang bị cho nhiều doanh nghiệp hơn các công cụ thông minh nhằm quản lý hoạt động và tiếp cận khách hàng”.

Google, Perplexity và OpenAI không phản hồi các câu hỏi cụ thể về lý do họ tham gia các quan hệ đối tác toàn cầu hoặc cung cấp công cụ AI miễn phí cho một số người dùng. Theo chính sách bảo mật của họ, cả ba công ty đều thu thập dữ liệu người dùng vì các lý do như cải thiện trải nghiệm, tạo và quản lý tài khoản, cũng như huấn luyện mô hình. Người dùng có thể chọn không chia sẻ dữ liệu để huấn luyện mô hình.

Trung Quốc đã chứng minh cách tiếp cận dữ liệu ngành cụ thể có thể mang lại lợi thế cạnh tranh.

Đầu tháng này, các công ty ứng dụng AI để phát triển thuốc của Trung Quốc đã ký kết các thỏa thuận trị giá hàng tỷ đô la với các hãng dược phẩm như AstraZeneca, Pfizer và Sanofi.

Thành công này một phần nhờ vào việc các công ty Trung Quốc tiếp cận được bộ dữ liệu ngữ cảnh khổng lồ từ hệ thống bảo hiểm y tế quốc gia, bao phủ hơn 600 triệu người. Scott Moore, giám đốc chương trình Trung Quốc tại Đại học Pennsylvania, chia sẻ đây là "lợi thế cấu trúc", vì lượng bệnh nhân lớn có thể được sử dụng như một bộ huấn luyện khổng lồ cho các mô hình AI.

GOOGLE VÀ PERPLEXITY ĐẠT THÀNH CÔNG BAN ĐẦU VỚI CÁC ĐỢT RA MẮT MIỄN PHÍ

Vào tháng 7, khi Perplexity công bố thỏa thuận với Bharti Airtel, công ty này ghi nhận lượng tải về hàng tháng lên đến 6,69 triệu lượt, so với chỉ 790.000 lượt vào tháng 6, theo dữ liệu từ công ty tình báo thị trường Sensor Tower.

"Tôi tải Perplexity về tháng trước vì giờ nó miễn phí với Airtel. Tôi vẫn dùng ChatGPT thường xuyên hơn", P. Sahay, một nhà khoa học dữ liệu làm việc tại một công ty tư vấn ở Bengaluru, cho biết.

"Tôi không quá lo lắng về dữ liệu của mình vì những thứ tôi dùng AI đều không nhạy cảm lắm. Tôi dùng nó để soạn email hoặc tin nhắn, debug code, lấy code sẵn, nghiên cứu thị trường…, không có thông tin bảo mật nào cả". Sahay cho biết anh không biết rằng các chatbot AI cung cấp tùy chọn tắt thu thập dữ liệu để huấn luyện.

Dù người dùng đang tận hưởng lợi ích từ các gã khổng lồ AI, các chuyên gia vẫn lo ngại về các vấn đề như chủ quyền dữ liệu và xu hướng các thị trường mới nổi trở thành nguồn cung cấp cho hệ thống AI toàn cầu mà không nhận được lợi ích công bằng.

Một số quốc gia đang phát triển ở châu Phi và châu Á đang phản đối sự kiểm soát dữ liệu toàn cầu của Big Tech. Nhiều quốc gia yêu cầu các công ty như Google, Microsoft và Amazon lưu trữ thông tin công dân địa phương tại chỗ.

"Điều này đòi hỏi các biện pháp bảo vệ vững chắc để bảo vệ quyền riêng tư và đảm bảo công bằng”, chuyên gia Patil nói. "Các công ty tham gia phải đảm bảo rằng bộ dữ liệu được phi cá nhân hóa và ẩn danh, đồng thời thiết lập các khung giám sát chặt chẽ để tránh thiên kiến trong việc thu thập dữ liệu”.

Theo The Wall Street Journal, dù vẫn còn tranh cãi về việc các ưu đãi miễn phí và quan hệ đối tác này có thể đưa các công ty AI đi xa đến đâu, cuộc chiến thống trị đã có bước ngoặt mới vào ngày 12/8, khi Perplexity đề nghị mua trình duyệt Chrome của Google với giá 34,5 tỷ USD. Giá đề nghị này gần gấp đôi giá trị của Perplexity là 18 tỷ USD.

Từ khóa:

Dòng sự kiện:

Trí tuệ nhân tạo -AI

Làn sóng đầu tư mạnh mẽ vào AI trên toàn cầu đang tạo ra cơ hội tăng trưởng mới cho các doanh nghiệp công nghệ Trung Quốc. Ảnh: SCMP

AI thúc đẩy doanh nghiệp công nghệ Trung Quốc toàn cầu hóa

Nhiều công ty Trung Quốc đang từng bước giành vị trí trong cả hai mắt xích quan trọng của chuỗi giá trị AI toàn cầu: phần mềm và hạ tầng...

18:46 24/07/2026

Nhiều người đến gian hàng Moonshot AI để chiêm ngưỡng mô hình Kimi K3 tại Hội nghị Trí tuệ Nhân tạo Thế giới ở Thượng Hải. Ảnh: AFP

Trung Quốc cân nhắc "siết" xuất khẩu mô hình AI và công nghệ chip tiên tiến

Trung Quốc đang xem xét khả năng tăng cường kiểm soát xuất khẩu đối với các công nghệ trí tuệ nhân tạo (AI) và bán dẫn tiên tiến...

13:45 23/07/2026

Động thái của Pháp diễn ra trong bối cảnh nhiều quốc gia đang thúc đẩy các quy định tương tự nhằm kiểm soát việc trẻ em tiếp cận mạng xã hội. Ảnh: NYT

Pháp trở thành quốc gia châu Âu đầu tiên cấm trẻ dưới 15 tuổi dùng mạng xã hội

Việc Pháp thông qua đạo luật cấm trẻ em dưới 15 tuổi sử dụng mạng xã hội đánh dấu bước đi mạnh mẽ nhất của một quốc gia châu Âu trong nỗ lực bảo vệ trẻ vị thành niên trên không gian số…

13:44 23/07/2026

Các sản phẩm bột ngọt (MSG) của công ty thực phẩm Ajinomoto được trưng bày tại một siêu thị ở Tokyo vào ngày 20 tháng 1 năm 2020. Ảnh: AFP

Không sản xuất chip nhưng vẫn thắng lớn nhờ AI: Bài học từ Nhật Bản

Một số doanh nghiệp Nhật Bản hoạt động ở những lĩnh vực tưởng như không liên quan đến công nghệ cao lại đang trở thành những "ngôi sao" mới trên thị trường chứng khoán, nhờ AI...

13:44 23/07/2026

Một trung tâm dữ liệu của Meta tại bang Georgia. Khoản nợ ngoài bảng cân đối kế toán của công ty vào khoảng 420 tỷ đô la, gần gấp ba lần khoản nợ công khai của công ty. Ảnh: AP

Cuộc đua AI đẩy "nợ ẩn" của 5 đại gia công nghệ Mỹ lên 1.650 tỷ USD

Hàng nghìn tỷ USD đang được các tập đoàn công nghệ lớn nhất nước Mỹ cam kết cho cuộc đua AI nhưng chưa xuất hiện trên bảng cân đối kế toán...

10:55 21/07/2026

AI đang dần trở thành một phần trong hệ thống vận hành, giúp doanh nghiệp tự động hóa quy trình, nâng cao hiệu suất và hỗ trợ ra quyết định. Ảnh: Getty Images

AI bước vào giai đoạn mới: Cuộc chơi của niềm tin và quản trị

Khi AI bước ra khỏi giai đoạn thử nghiệm, bài toán lớn nhất không còn là khả năng ứng dụng, mà là cách doanh nghiệp quản trị dữ liệu, kiểm soát quyết định của AI và duy trì vai trò giám sát của con người...

20:11 20/07/2026

Sự xuất hiện của mô hình Kimi K3 do startup Moonshot AI phát triển đang thu hút sự chú ý trong cuộc đua trí tuệ nhân tạo toàn cầu. Ảnh: Nikkei

AI Trung Quốc tăng tốc, mô hình mở trở thành tâm điểm

Trọng tâm không còn chỉ nằm ở việc mô hình AI lớn đến đâu hay đạt điểm số benchmark cao như thế nào, mà chuyển sang cách các mô hình đó được ứng dụng trong thực tế...

20:10 20/07/2026

Các nhà đầu tư giao lưu với những người sáng lập công ty khởi nghiệp tại Ngày hội giới thiệu sản phẩm của Y Combinator ở San Francisco. Ảnh: WSJ.

Chiến lược "tặng không" tài nguyên của Big Tech và tham vọng chi phối startup AI

Khi cuộc cạnh tranh về mô hình AI ngày càng khốc liệt, các ông lớn như OpenAI, Anthropic, Google hay Microsoft không chỉ chạy đua về hiệu năng mà còn sẵn sàng chi hàng triệu USD dưới dạng tín dụng điện toán miễn phí để thu hút startup...

22:11 19/07/2026

6 tháng đầu năm 2026, Trung Quốc đã xuất khẩu 179,44 tỷ mạch tích hợp (IC), đạt tổng kim ngạch 177,28 tỷ USD, tăng hơn 96% so với cùng kỳ năm trước. Ảnh: SCMP

Trung Quốc: Xuất khẩu chip tăng gần gấp đôi nhờ AI

Không chỉ chip bán dẫn, nhóm máy xử lý dữ liệu tự động và linh kiện đi kèm – bao gồm máy tính, máy chủ, bộ nhớ và các thành phần phục vụ tính toán – cũng ghi nhận mức tăng trưởng vượt bậc...

22:11 19/07/2026

Kể từ khi ChatGPT ra đời, người lao động từ 55 tuổi trở lên làm việc trong các ngành nghề có mức độ tiếp xúc cao với AI có xu hướng rời bỏ công việc nhiều hơn trước. Ảnh: Getty Images

AI đang làm thay đổi toàn diện sự nghiệp của người lao động

AI không chỉ làm thay đổi cách người lao động làm việc mà còn có thể ảnh hưởng trực tiếp đến thời điểm nghỉ hưu, triển vọng nghề nghiệp và cả các chính sách an sinh xã hội trong tương lai...

16:39 16/07/2026

Tin liên quan

MIT: 95% các dự án thí điểm AI tạo sinh tại các doanh nghiệp đều thất bại

Tracxn: Hệ sinh thái khởi nghiệp Việt Nam đạt mốc 3,2 tỉ USD vốn đầu tư

Ai đang ‘chống lưng’ cho giấc mơ AI của các big tech?