image Thứ Sáu, 06/02/2026

"Khát" dữ liệu thực tế để huấn luyện AI, các công ty ra mắt ưu đãi miễn phí

Trần Thị Huyền Thương

22/08/2025

Chia sẻ

Các công ty như OpenAI, Google và Perplexity đang thiết lập quan hệ đối tác và cung cấp ưu đãi miễn phí để có dữ liệu tiêu dùng – loại dữ liệu không thể thu thập từ internet...

Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI
Các công ty đang cần nguồn dữ liệu thực tế từ người dùng để đào tạo mô hình AI

Trong bối cảnh cuộc cạnh tranh khốc liệt nhằm thống trị lĩnh vực trí tuệ nhân tạo (AI), các công ty AI đang xây dựng liên minh xuyên ngành và khu vực để thu thập dữ liệu thực tế – những thông tin không thể lấy từ các nguồn công khai trên mạng.

THIẾT LẬP QUAN HỆ ĐỐI TÁC ĐỂ THU THẬP DỮ LIỆU

Trong hai tháng qua, OpenAI đã ký kết hợp tác với các ông lớn thương mại điện tử như Shopee và Shopify. Trong khi đó, Google và Perplexity đã cung cấp quyền truy cập miễn phí vào các công cụ AI tiên tiến cho một số người dùng tại Ấn Độ. Các chuyên gia cho rằng những động thái này sẽ giúp các công ty tiếp cận những truy vấn tiêu dùng có cấu trúc, hành vi sản phẩm và dữ liệu giao dịch – những tín hiệu huấn luyện thường không có sẵn qua dữ liệu công khai.

"Những quan hệ đối tác này sẽ cung cấp cho họ các bộ dữ liệu đa dạng, giúp huấn luyện mô hình AI tốt hơn và tạo ra đầu ra chính xác hơn”, Sameer Patil, giám đốc Trung tâm An ninh, Chiến lược & Công nghệ tại tổ chức tư vấn toàn cầu Observer Research Foundation, chia sẻ.

"Điều này cũng sẽ giúp họ đổi mới các cách áp dụng mô hình AI trong một số lĩnh vực cụ thể. Đặc biệt là ở những ngành nhấn mạnh vào tùy chỉnh hóa siêu cá nhân hóa, chẳng hạn như fintech và chăm sóc sức khỏe”.

"Dân số trẻ, am hiểu công nghệ của châu Á cùng với tỷ lệ thâm nhập di động cao khiến khu vực này trở thành một trong những thị trường tăng trưởng nhanh nhất về áp dụng và đổi mới AI”, Oliver Jay, giám đốc điều hành OpenAI International, phát biểu trong thông cáo công bố quan hệ đối tác với Sea.

"Bằng cách áp dụng khả năng của OpenAI trong các lĩnh vực như thương mại, chúng tôi mong muốn hợp tác với Sea để trang bị cho nhiều doanh nghiệp hơn các công cụ thông minh nhằm quản lý hoạt động và tiếp cận khách hàng”.

Google, Perplexity và OpenAI không phản hồi các câu hỏi cụ thể về lý do họ tham gia các quan hệ đối tác toàn cầu hoặc cung cấp công cụ AI miễn phí cho một số người dùng. Theo chính sách bảo mật của họ, cả ba công ty đều thu thập dữ liệu người dùng vì các lý do như cải thiện trải nghiệm, tạo và quản lý tài khoản, cũng như huấn luyện mô hình. Người dùng có thể chọn không chia sẻ dữ liệu để huấn luyện mô hình.

Trung Quốc đã chứng minh cách tiếp cận dữ liệu ngành cụ thể có thể mang lại lợi thế cạnh tranh.

Đầu tháng này, các công ty ứng dụng AI để phát triển thuốc của Trung Quốc đã ký kết các thỏa thuận trị giá hàng tỷ đô la với các hãng dược phẩm như AstraZeneca, Pfizer và Sanofi.

Thành công này một phần nhờ vào việc các công ty Trung Quốc tiếp cận được bộ dữ liệu ngữ cảnh khổng lồ từ hệ thống bảo hiểm y tế quốc gia, bao phủ hơn 600 triệu người. Scott Moore, giám đốc chương trình Trung Quốc tại Đại học Pennsylvania, chia sẻ đây là "lợi thế cấu trúc", vì lượng bệnh nhân lớn có thể được sử dụng như một bộ huấn luyện khổng lồ cho các mô hình AI.

GOOGLE VÀ PERPLEXITY ĐẠT THÀNH CÔNG BAN ĐẦU VỚI CÁC ĐỢT RA MẮT MIỄN PHÍ 

Vào tháng 7, khi Perplexity công bố thỏa thuận với Bharti Airtel, công ty này ghi nhận lượng tải về hàng tháng lên đến 6,69 triệu lượt, so với chỉ 790.000 lượt vào tháng 6, theo dữ liệu từ công ty tình báo thị trường Sensor Tower.

"Tôi tải Perplexity về tháng trước vì giờ nó miễn phí với Airtel. Tôi vẫn dùng ChatGPT thường xuyên hơn", P. Sahay, một nhà khoa học dữ liệu làm việc tại một công ty tư vấn ở Bengaluru, cho biết.

"Tôi không quá lo lắng về dữ liệu của mình vì những thứ tôi dùng AI đều không nhạy cảm lắm. Tôi dùng nó để soạn email hoặc tin nhắn, debug code, lấy code sẵn, nghiên cứu thị trường…, không có thông tin bảo mật nào cả". Sahay cho biết anh không biết rằng các chatbot AI cung cấp tùy chọn tắt thu thập dữ liệu để huấn luyện.

Dù người dùng đang tận hưởng lợi ích từ các gã khổng lồ AI, các chuyên gia vẫn lo ngại về các vấn đề như chủ quyền dữ liệu và xu hướng các thị trường mới nổi trở thành nguồn cung cấp cho hệ thống AI toàn cầu mà không nhận được lợi ích công bằng.

Một số quốc gia đang phát triển ở châu Phi và châu Á đang phản đối sự kiểm soát dữ liệu toàn cầu của Big Tech. Nhiều quốc gia yêu cầu các công ty như Google, Microsoft và Amazon lưu trữ thông tin công dân địa phương tại chỗ.

"Điều này đòi hỏi các biện pháp bảo vệ vững chắc để bảo vệ quyền riêng tư và đảm bảo công bằng”, chuyên gia Patil nói. "Các công ty tham gia phải đảm bảo rằng bộ dữ liệu được phi cá nhân hóa và ẩn danh, đồng thời thiết lập các khung giám sát chặt chẽ để tránh thiên kiến trong việc thu thập dữ liệu”.

Theo The Wall Street Journal, dù vẫn còn tranh cãi về việc các ưu đãi miễn phí và quan hệ đối tác này có thể đưa các công ty AI đi xa đến đâu, cuộc chiến thống trị đã có bước ngoặt mới vào ngày 12/8, khi Perplexity đề nghị mua trình duyệt Chrome của Google với giá 34,5 tỷ USD. Giá đề nghị này gần gấp đôi giá trị của Perplexity là 18 tỷ USD.


Hàng không tăng tốc ứng dụng AI trong kỷ nguyên dịch vụ hàng không số

Trí tuệ nhân tạo (AI) đang trở thành đòn bẩy chiến lược giúp các hãng hàng không và doanh nghiệp bảo dưỡng, sửa chữa máy bay (MRO) tại châu Á – Thái Bình Dương giải bài toán tăng trưởng đội bay, thiếu hụt nhân lực và áp lực tối ưu chi phí.

08:32 06/02/2026
Esports World Cup 2026 công bố vòng loại toàn cầu với hơn 230 sự kiện

Hơn 230 sự kiện trên toàn thế giới kết nối nhiều hệ sinh thái thi đấu vào một mùa giải esports thống nhất, tạo lộ trình rõ ràng để tuyển thủ tranh tài và người hâm mộ theo dõi trên sân khấu esports lớn nhất thế giới...

11:00 05/02/2026
Đào tạo trí tuệ cảm xúc trong bối cảnh áp lực chuyển đổi số

Theo Báo cáo “Future of Jobs Report 2025” của Diễn đàn Kinh tế Thế giới (WEF), các năng lực như tự nhận thức, quản lý cảm xúc, khả năng thích ứng và thấu hiểu người khác nằm trong top kỹ năng quan trọng nhất...

15:00 04/02/2026
Vượt qua 2025 bất định, ngành công nghệ sinh học ngóng động lực từ 2026

Số lượng các thương vụ mua bán gia tăng cùng những tín hiệu hồi sinh trên thị trường IPO cho thấy tương lai tươi sáng hơn của ngành công nghệ sinh học…

09:10 04/02/2026
Amazon sa thải 16.000 nhân viên khi cuộc đua trí tuệ nhân tạo ngày càng gay cấn

Amazon tiếp tục cắt giảm 16.000 nhân viên chỉ trong vòng ba tháng, trong bối cảnh cuộc đua phát triển trí tuệ nhân tạo giữa các “ông lớn” công nghệ ngày càng khốc liệt…

10:18 03/02/2026
Các hãng bán dẫn Trung Quốc gặt hái lợi nhuận "khủng" trong năm 2025

Năm 2025 đánh dấu bước ngoặt đối với ngành bán dẫn Trung Quốc. Từ GPU, chip nhớ, thiết bị sản xuất chip đến phần mềm EDA, các doanh nghiệp nội địa đều ghi nhận kết quả kinh doanh tích cực...

10:17 03/02/2026
Con sóng AI đang bào mòn lợi nhuận Apple

Lần đầu tiên sau nhiều năm, Apple không còn là “khách hàng số một” mà mọi nhà cung ứng phải ưu tiên bằng mọi giá…

10:16 03/02/2026
Google đưa Gemini “thâm nhập sâu” vào Chrome: Trình duyệt trở thành trung tâm AI cá nhân

Từ góc nhìn chiến lược, việc “AI hóa” Chrome không chỉ giúp Google giữ chân người dùng, mà còn củng cố vai trò trung tâm của hãng trong kỷ nguyên AI tác nhân – nơi trình duyệt không còn chỉ để xem web, mà để điều hành cuộc sống số…

15:37 30/01/2026
Lợi nhuận Samsung lập kỷ lục nhờ “cơn khát” chip AI và bộ nhớ hiệu năng cao

Bức tranh kinh doanh của Samsung đang có sự phân hóa rõ rệt, bán dẫn – đặc biệt là bộ nhớ cho AI – trở thành “cỗ máy in tiền” mới…

15:36 30/01/2026
Công bố quỹ giải thưởng 45 triệu USD cho giải đấu Esports Nations Cup 2026 lần đầu tiên

Esports Nations Cup 2026 được bảo trợ bởi cam kết tài chính gồm gồm ba cấu phần, với tổng giá trị 45 triệu USD, nhằm hỗ trợ toàn diện hệ sinh thái esports thông qua quỹ giải thưởng dành cho tuyển thủ và ban huấn luyện, các chính sách khuyến khích khi Câu lạc bộ giải phóng tuyển thủ và quỹ phát triển đội tuyển quốc gia...

11:45 30/01/2026