image Chủ Nhật, 21/09/2025

"Khát" dữ liệu thực tế để huấn luyện AI, các công ty ra mắt ưu đãi miễn phí

Trần Thị Huyền Thương

22/08/2025

Chia sẻ

Các công ty như OpenAI, Google và Perplexity đang thiết lập quan hệ đối tác và cung cấp ưu đãi miễn phí để có dữ liệu tiêu dùng – loại dữ liệu không thể thu thập từ internet...

Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI
Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI

Trong bối cảnh cuộc cạnh tranh khốc liệt nhằm thống trị lĩnh vực trí tuệ nhân tạo (AI), các công ty AI đang xây dựng liên minh xuyên ngành và khu vực để thu thập dữ liệu thực tế – những thông tin không thể lấy từ các nguồn công khai trên mạng.

THIẾT LẬP QUAN HỆ ĐỐI TÁC ĐỂ THU THẬP DỮ LIỆU

Trong hai tháng qua, OpenAI đã ký kết hợp tác với các ông lớn thương mại điện tử như Shopee và Shopify. Trong khi đó, Google và Perplexity đã cung cấp quyền truy cập miễn phí vào các công cụ AI tiên tiến cho một số người dùng tại Ấn Độ. Các chuyên gia cho rằng những động thái này sẽ giúp các công ty tiếp cận những truy vấn tiêu dùng có cấu trúc, hành vi sản phẩm và dữ liệu giao dịch – những tín hiệu huấn luyện thường không có sẵn qua dữ liệu công khai.

"Những quan hệ đối tác này sẽ cung cấp cho họ các bộ dữ liệu đa dạng, giúp huấn luyện mô hình AI tốt hơn và tạo ra đầu ra chính xác hơn”, Sameer Patil, giám đốc Trung tâm An ninh, Chiến lược & Công nghệ tại tổ chức tư vấn toàn cầu Observer Research Foundation, chia sẻ.

"Điều này cũng sẽ giúp họ đổi mới các cách áp dụng mô hình AI trong một số lĩnh vực cụ thể. Đặc biệt là ở những ngành nhấn mạnh vào tùy chỉnh hóa siêu cá nhân hóa, chẳng hạn như fintech và chăm sóc sức khỏe”.

"Dân số trẻ, am hiểu công nghệ của châu Á cùng với tỷ lệ thâm nhập di động cao khiến khu vực này trở thành một trong những thị trường tăng trưởng nhanh nhất về áp dụng và đổi mới AI”, Oliver Jay, giám đốc điều hành OpenAI International, phát biểu trong thông cáo công bố quan hệ đối tác với Sea.

"Bằng cách áp dụng khả năng của OpenAI trong các lĩnh vực như thương mại, chúng tôi mong muốn hợp tác với Sea để trang bị cho nhiều doanh nghiệp hơn các công cụ thông minh nhằm quản lý hoạt động và tiếp cận khách hàng”.

Google, Perplexity và OpenAI không phản hồi các câu hỏi cụ thể về lý do họ tham gia các quan hệ đối tác toàn cầu hoặc cung cấp công cụ AI miễn phí cho một số người dùng. Theo chính sách bảo mật của họ, cả ba công ty đều thu thập dữ liệu người dùng vì các lý do như cải thiện trải nghiệm, tạo và quản lý tài khoản, cũng như huấn luyện mô hình. Người dùng có thể chọn không chia sẻ dữ liệu để huấn luyện mô hình.

Trung Quốc đã chứng minh cách tiếp cận dữ liệu ngành cụ thể có thể mang lại lợi thế cạnh tranh.

Đầu tháng này, các công ty ứng dụng AI để phát triển thuốc của Trung Quốc đã ký kết các thỏa thuận trị giá hàng tỷ đô la với các hãng dược phẩm như AstraZeneca, Pfizer và Sanofi.

Thành công này một phần nhờ vào việc các công ty Trung Quốc tiếp cận được bộ dữ liệu ngữ cảnh khổng lồ từ hệ thống bảo hiểm y tế quốc gia, bao phủ hơn 600 triệu người. Scott Moore, giám đốc chương trình Trung Quốc tại Đại học Pennsylvania, chia sẻ đây là "lợi thế cấu trúc", vì lượng bệnh nhân lớn có thể được sử dụng như một bộ huấn luyện khổng lồ cho các mô hình AI.

GOOGLE VÀ PERPLEXITY ĐẠT THÀNH CÔNG BAN ĐẦU VỚI CÁC ĐỢT RA MẮT MIỄN PHÍ 

Vào tháng 7, khi Perplexity công bố thỏa thuận với Bharti Airtel, công ty này ghi nhận lượng tải về hàng tháng lên đến 6,69 triệu lượt, so với chỉ 790.000 lượt vào tháng 6, theo dữ liệu từ công ty tình báo thị trường Sensor Tower.

"Tôi tải Perplexity về tháng trước vì giờ nó miễn phí với Airtel. Tôi vẫn dùng ChatGPT thường xuyên hơn", P. Sahay, một nhà khoa học dữ liệu làm việc tại một công ty tư vấn ở Bengaluru, cho biết.

"Tôi không quá lo lắng về dữ liệu của mình vì những thứ tôi dùng AI đều không nhạy cảm lắm. Tôi dùng nó để soạn email hoặc tin nhắn, debug code, lấy code sẵn, nghiên cứu thị trường…, không có thông tin bảo mật nào cả". Sahay cho biết anh không biết rằng các chatbot AI cung cấp tùy chọn tắt thu thập dữ liệu để huấn luyện.

Dù người dùng đang tận hưởng lợi ích từ các gã khổng lồ AI, các chuyên gia vẫn lo ngại về các vấn đề như chủ quyền dữ liệu và xu hướng các thị trường mới nổi trở thành nguồn cung cấp cho hệ thống AI toàn cầu mà không nhận được lợi ích công bằng.

Một số quốc gia đang phát triển ở châu Phi và châu Á đang phản đối sự kiểm soát dữ liệu toàn cầu của Big Tech. Nhiều quốc gia yêu cầu các công ty như Google, Microsoft và Amazon lưu trữ thông tin công dân địa phương tại chỗ.

"Điều này đòi hỏi các biện pháp bảo vệ vững chắc để bảo vệ quyền riêng tư và đảm bảo công bằng”, chuyên gia Patil nói. "Các công ty tham gia phải đảm bảo rằng bộ dữ liệu được phi cá nhân hóa và ẩn danh, đồng thời thiết lập các khung giám sát chặt chẽ để tránh thiên kiến trong việc thu thập dữ liệu”.

Theo The Wall Street Journal, dù vẫn còn tranh cãi về việc các ưu đãi miễn phí và quan hệ đối tác này có thể đưa các công ty AI đi xa đến đâu, cuộc chiến thống trị đã có bước ngoặt mới vào ngày 12/8, khi Perplexity đề nghị mua trình duyệt Chrome của Google với giá 34,5 tỷ USD. Giá đề nghị này gần gấp đôi giá trị của Perplexity là 18 tỷ USD.


73% người dùng ChatGPT cho mục đích không liên quan đến công việc

Khám phá nghiên cứu cho thấy 73% người dùng ChatGPT sử dụng cho mục đích cá nhân, không chỉ công việc. Tìm hiểu thêm!

19:47 18/09/2025
Các công ty Trung Quốc liên tiếp ra mắt chip AI

Khám phá nỗ lực của Huawei và Alibaba trong việc phát triển chip AI nội địa để cạnh tranh với Nvidia.

19:47 18/09/2025
Hàng trăm nhân sự AI hợp đồng của Google bị sa thải

Hơn 200 nhân viên hợp đồng của Google bị sa thải mà không báo trước, giữa cuộc chiến về lương và điều kiện làm việc.

14:59 18/09/2025
Doanh nghiệp chip Trung Quốc đồng loạt tăng trần sau động thái “điều tra chip Mỹ” của Bắc Kinh

Cổ phiếu chip Trung Quốc tăng mạnh sau điều tra chống bán phá giá chip Mỹ. Khám phá tiềm năng tăng trưởng thị trường chip nội địa.

10:34 17/09/2025
OpenAI công bố nghiên cứu toàn diện đầu tiên về người dùng ChatGPT

Khám phá nghiên cứu toàn diện về cách người dùng ChatGPT tương tác với AI. Đọc ngay để hiểu rõ xu hướng sử dụng mới nhất!

10:34 17/09/2025
AI sẽ là động lực chính đưa ngành công nghiệp chip đạt mốc 1 nghìn tỷ USD vào 2030

Khám phá cách AI thúc đẩy ngành công nghiệp chip đạt giá trị 1 nghìn tỷ USD vào năm 2030. Đọc ngay để hiểu rõ hơn!

17:47 12/09/2025
DeepSeek và các mô hình mã nguồn mở đang thay đổi AI như thế nào?

Khám phá cách DeepSeek và mô hình mã nguồn mở đang thay đổi cuộc chơi AI với chi phí thấp hơn và hiệu suất vượt trội.

14:17 11/09/2025
Hàng điện tử Trung Quốc "đổ bộ" châu Âu giữa thương chiến Mỹ - Trung

Khám phá cách thương chiến Mỹ - Trung thúc đẩy doanh nghiệp Trung Quốc mở rộng ra châu Âu và cơ hội mới cho ngành điện tử.

11:13 11/09/2025
Thuế nhập khẩu của Trung Quốc đang tác động ra sao tới thương mại điện tử

Khám phá cách thuế nhập khẩu mới của Trung Quốc ảnh hưởng đến giá hàng hóa và mô hình kinh doanh thương mại điện tử tại Mỹ.

11:12 11/09/2025
Mỹ cân nhắc xuất khẩu lượng chip cố định sang Trung Quốc

Mỹ đề xuất quy định mới về xuất khẩu chip cho Samsung và SK Hynix tại Trung Quốc. Tìm hiểu chi tiết ngay!

10:05 11/09/2025