"Khát" dữ liệu thực tế để huấn luyện AI, các công ty ra mắt ưu đãi miễn phí
Trần Thị Huyền Thương
22/08/2025
Các công ty như OpenAI, Google và Perplexity đang thiết lập quan hệ đối tác và cung cấp ưu đãi miễn phí để có dữ liệu tiêu dùng – loại dữ liệu không thể thu thập từ internet...
Trong bối cảnh cuộc cạnh tranh khốc liệt nhằm thống trị lĩnh vực trí tuệ nhân tạo (AI), các công ty AI đang xây dựng liên minh xuyên ngành và khu vực để thu thập dữ liệu thực tế – những thông tin không thể lấy từ các nguồn công khai trên mạng.
THIẾT LẬP QUAN HỆ ĐỐI TÁC ĐỂ THU THẬP DỮ LIỆU
Trong hai tháng qua, OpenAI đã ký kết hợp tác với các ông lớn thương mại điện tử như Shopee và Shopify. Trong khi đó, Google và Perplexity đã cung cấp quyền truy cập miễn phí vào các công cụ AI tiên tiến cho một số người dùng tại Ấn Độ. Các chuyên gia cho rằng những động thái này sẽ giúp các công ty tiếp cận những truy vấn tiêu dùng có cấu trúc, hành vi sản phẩm và dữ liệu giao dịch – những tín hiệu huấn luyện thường không có sẵn qua dữ liệu công khai.
"Những quan hệ đối tác này sẽ cung cấp cho họ các bộ dữ liệu đa dạng, giúp huấn luyện mô hình AI tốt hơn và tạo ra đầu ra chính xác hơn”, Sameer Patil, giám đốc Trung tâm An ninh, Chiến lược & Công nghệ tại tổ chức tư vấn toàn cầu Observer Research Foundation, chia sẻ.
"Điều này cũng sẽ giúp họ đổi mới các cách áp dụng mô hình AI trong một số lĩnh vực cụ thể. Đặc biệt là ở những ngành nhấn mạnh vào tùy chỉnh hóa siêu cá nhân hóa, chẳng hạn như fintech và chăm sóc sức khỏe”.
"Dân số trẻ, am hiểu công nghệ của châu Á cùng với tỷ lệ thâm nhập di động cao khiến khu vực này trở thành một trong những thị trường tăng trưởng nhanh nhất về áp dụng và đổi mới AI”, Oliver Jay, giám đốc điều hành OpenAI International, phát biểu trong thông cáo công bố quan hệ đối tác với Sea.
"Bằng cách áp dụng khả năng của OpenAI trong các lĩnh vực như thương mại, chúng tôi mong muốn hợp tác với Sea để trang bị cho nhiều doanh nghiệp hơn các công cụ thông minh nhằm quản lý hoạt động và tiếp cận khách hàng”.
Google, Perplexity và OpenAI không phản hồi các câu hỏi cụ thể về lý do họ tham gia các quan hệ đối tác toàn cầu hoặc cung cấp công cụ AI miễn phí cho một số người dùng. Theo chính sách bảo mật của họ, cả ba công ty đều thu thập dữ liệu người dùng vì các lý do như cải thiện trải nghiệm, tạo và quản lý tài khoản, cũng như huấn luyện mô hình. Người dùng có thể chọn không chia sẻ dữ liệu để huấn luyện mô hình.
Trung Quốc đã chứng minh cách tiếp cận dữ liệu ngành cụ thể có thể mang lại lợi thế cạnh tranh.
Đầu tháng này, các công ty ứng dụng AI để phát triển thuốc của Trung Quốc đã ký kết các thỏa thuận trị giá hàng tỷ đô la với các hãng dược phẩm như AstraZeneca, Pfizer và Sanofi.
Thành công này một phần nhờ vào việc các công ty Trung Quốc tiếp cận được bộ dữ liệu ngữ cảnh khổng lồ từ hệ thống bảo hiểm y tế quốc gia, bao phủ hơn 600 triệu người. Scott Moore, giám đốc chương trình Trung Quốc tại Đại học Pennsylvania, chia sẻ đây là "lợi thế cấu trúc", vì lượng bệnh nhân lớn có thể được sử dụng như một bộ huấn luyện khổng lồ cho các mô hình AI.
GOOGLE VÀ PERPLEXITY ĐẠT THÀNH CÔNG BAN ĐẦU VỚI CÁC ĐỢT RA MẮT MIỄN PHÍ
Vào tháng 7, khi Perplexity công bố thỏa thuận với Bharti Airtel, công ty này ghi nhận lượng tải về hàng tháng lên đến 6,69 triệu lượt, so với chỉ 790.000 lượt vào tháng 6, theo dữ liệu từ công ty tình báo thị trường Sensor Tower.
"Tôi tải Perplexity về tháng trước vì giờ nó miễn phí với Airtel. Tôi vẫn dùng ChatGPT thường xuyên hơn", P. Sahay, một nhà khoa học dữ liệu làm việc tại một công ty tư vấn ở Bengaluru, cho biết.
"Tôi không quá lo lắng về dữ liệu của mình vì những thứ tôi dùng AI đều không nhạy cảm lắm. Tôi dùng nó để soạn email hoặc tin nhắn, debug code, lấy code sẵn, nghiên cứu thị trường…, không có thông tin bảo mật nào cả". Sahay cho biết anh không biết rằng các chatbot AI cung cấp tùy chọn tắt thu thập dữ liệu để huấn luyện.
Dù người dùng đang tận hưởng lợi ích từ các gã khổng lồ AI, các chuyên gia vẫn lo ngại về các vấn đề như chủ quyền dữ liệu và xu hướng các thị trường mới nổi trở thành nguồn cung cấp cho hệ thống AI toàn cầu mà không nhận được lợi ích công bằng.
Một số quốc gia đang phát triển ở châu Phi và châu Á đang phản đối sự kiểm soát dữ liệu toàn cầu của Big Tech. Nhiều quốc gia yêu cầu các công ty như Google, Microsoft và Amazon lưu trữ thông tin công dân địa phương tại chỗ.
"Điều này đòi hỏi các biện pháp bảo vệ vững chắc để bảo vệ quyền riêng tư và đảm bảo công bằng”, chuyên gia Patil nói. "Các công ty tham gia phải đảm bảo rằng bộ dữ liệu được phi cá nhân hóa và ẩn danh, đồng thời thiết lập các khung giám sát chặt chẽ để tránh thiên kiến trong việc thu thập dữ liệu”.
Theo The Wall Street Journal, dù vẫn còn tranh cãi về việc các ưu đãi miễn phí và quan hệ đối tác này có thể đưa các công ty AI đi xa đến đâu, cuộc chiến thống trị đã có bước ngoặt mới vào ngày 12/8, khi Perplexity đề nghị mua trình duyệt Chrome của Google với giá 34,5 tỷ USD. Giá đề nghị này gần gấp đôi giá trị của Perplexity là 18 tỷ USD.
Từ khóa:
Dòng sự kiện:
Trí tuệ nhân tạo -AILĩnh vực tài chính phi tập trung – hiện có quy mô khoảng 130 tỷ USD – đang trở thành mục tiêu đặc biệt hấp dẫn đối với các nhóm tội phạm mạng...
Không chỉ hàng hóa công nghệ tăng mạnh, các dịch vụ viễn thông, máy tính và công nghệ thông tin cũng tăng, nhờ nhu cầu ngày càng lớn đối với các mô hình AI của Trung Quốc trên thị trường quốc tế...
Trung Quốc đang đẩy mạnh yêu cầu sử dụng năng lượng xanh đối với các trung tâm dữ liệu trí tuệ nhân tạo (AI). Nhu cầu điện phục vụ làn sóng AI ngày càng tạo sức ép lớn lên hệ thống điện quốc gia và mục tiêu giảm phát thải carbon của Bắc Kinh...
TikTok vừa công bố kế hoạch đầu tư 25 tỷ USD vào các dự án hạ tầng dữ liệu tại Thái Lan, đánh dấu khoản đầu tư lớn nhất từ trước đến nay của nền tảng video ngắn này tại Đông Nam Á...
Thứ từng là lợi thế lớn nhất của ngành phần mềm Ấn Độ – nguồn nhân lực đông đảo và giá rẻ – có nguy cơ trở thành điểm yếu trong kỷ nguyên AI...
Điểm đáng chú ý là mức định giá của DeepSeek đã tăng mạnh chỉ trong thời gian ngắn. Khi bắt đầu quá trình gọi vốn cách đây vài tuần, startup này được định giá khoảng 20 tỷ USD…
Đây là lần đầu tiên trong lịch sử hãng điện tử lớn nhất Hàn Quốc đạt được cột mốc này, đồng thời trở thành công ty châu Á thứ hai làm được điều đó, sau Taiwan Semiconductor Manufacturing Co...
Theo thống kê, trong số 64 nhà máy mới dự kiến đi vào hoạt động tại châu Á đến năm 2029, chỉ có 6 cơ sở đặt tại Đông Nam Á, phần lớn còn lại tập trung ở Trung Quốc và Đài Loan (Trung Quốc)…
Động lực tăng trưởng của Huawei không chỉ đến từ nhu cầu thị trường, mà còn từ việc Nvidia gặp nhiều rào cản pháp lý với cả Washington và Bắc Kinh...
Thị trường robot hình người đã bắt đầu tạo ra các đơn hàng thực tế cho chuỗi cung ứng điện tử Trung Quốc…