image Thứ Bảy, 04/04/2026

Apple hứng chịu chỉ trích liên quan tới dữ liệu đào tạo Apple Intelligence

Bảo Ngọc

05/07/2024

Chia sẻ

Hành trình Apple “tham chiến” cuộc đua AI tạo ra nhiều phản ứng trái chiều, kể cả từ nhóm người dùng trung thành nhất…

Apple chính thức công bố bộ công cụ Apple Intelligence tại WWDC 2024 vừa qua.
Apple chính thức công bố bộ công cụ Apple Intelligence tại WWDC 2024 vừa qua.

Dự kiến vào cuối năm nay, hàng triệu thiết bị trong hệ sinh thái Apple sẽ bắt đầu tích hợp Apple Intelligence, bộ công cụ AI tổng quát vừa được nhà sản xuất iPhone công bố tại WWDC 2024. 

Theo Yahoo Tech, bên cạnh một số tính năng nổi trội khác, Apple Intelligence cho phép người dùng tạo hình ảnh từ câu lệnh văn bản. Một số thành viên thuộc cộng đồng sáng tạo không hài lòng về sự thiếu minh bạch của công ty xung quanh nguồn dữ liệu thô được cung cấp nhằm đào tạo mô hình AI.

“Tôi kỳ vọng Apple sẽ giải thích một cách minh bạch hơn về cách hãng thu thập dữ liệu đào tạo mô hình AI”, Jon Lam, nhà sáng tạo nội dung trong lĩnh vực trò chơi điện tử đang sinh sống và làm việc tại Vancouver, chia sẻ với Engadget. “Apple nên đưa ra thông báo càng sớm càng tốt, trước khi mọi chuyện diễn biến theo chiều hướng xấu”.

QUY TRÌNH THU THẬP DỮ LIỆU THIẾU MINH BẠCH

Những nhà sáng tạo từ lâu đã trở thành nhóm khách hàng trung thành của Apple khi các nhà sáng lập định vị công ty ở "giao điểm giữa công nghệ và nghệ thuật tự do". Nhưng ở thời điểm hiện tại, nhiều nhiếp ảnh gia, họa sĩ hay nhà điêu khắc không ngần ngại bày tỏ nỗi thất vọng xung quanh sự im lặng của Apple về cách công ty thu thập dữ liệu cho mô hình AI.

Để mô hình trí tuệ nhân tạo đạt được hiệu năng vượt trội nhất, hầu hết đại gia trong ngành đều cố gắng truy cập mọi dữ liệu có thể tìm thấy trên internet, bất chấp sự đồng ý của tác giả hay nguy cơ những vụ kiện đòi bồi thường có thể xảy ra. 

Gần 6 tỷ hình ảnh đang được sử dụng để đào tạo nhiều mô hình AI khác nhau đến từ LAION-5B, bộ dữ liệu hình ảnh khổng lồ được thu thập từ nhiều nguồn internet. Trong cuộc phỏng vấn với Forbes, ông David Holz, CEO phòng thí nghiệm trí tuệ nhân tạo Midjourney, cho biết đa số mô hình AI được đào tạo dựa trên "phần lớn dữ liệu internet" và "thực sự không có cách nào để biết chính xác nguồn gốc của hàng trăm triệu hình ảnh ban đầu".

Nhiều nghệ sĩ, tác giả và nhạc sĩ đã lên tiếng cáo buộc các công ty AI sử dụng tác phẩm không xin phép và kiếm lợi nhuận, dẫn đến hàng chục vụ kiện bản quyền chỉ tính riêng trong năm 2023. Tháng trước, một số hãng thu âm lớn bao gồm Universal và Sony đã kiện hai startup được định giá hàng trăm triệu USD chuyên về tạo nhạc AI, Suno và Udio, vì vi phạm bản quyền. 

Nhiều nhà sáng tạo đặt niềm tin rằng Apple có thể làm tốt hơn. Chàng trai trẻ Jon Lam bày tỏ: "Tôi nghĩ Apple nên tiếp cận vấn đề đạo đức theo cách khác".

Trước đó, Apple tiết lộ rất ít về nguồn dữ liệu đào tạo cho Apple Intelligence. Trong bài đăng trên blog, công ty thừa nhận lấy dữ liệu công khai từ web mở bằng AppleBot, trình thu thập dữ liệu web của công ty, đồng nhất với tuyên bố của các Giám đốc Điều hành trên sân khấu WWDC 2024 hồi tháng 6. Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, từng phát biểu rằng "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết. 

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Apple không trả lời bình luận từ Engadget.

NHÀ SÁNG TẠO LÊN TIẾNG

Vào tháng 5/2024, ông Andrew Leung, một nghệ sĩ từng tham gia sản xuất nhiều bộ phim đình đám như Black Panther, The Lion KingMulan, đã ví Generative AI như "vụ trộm lớn nhất lịch sử trí tuệ con người" trong bài phát biểu trước Đại hội đồng Tiểu bang California về tác động của AI đối với ngành công nghiệp giải trí. "Công ty sử dụng dữ liệu 'có sẵn công khai', tôi muốn nói rằng thuật ngữ này không được các nhà sáng tạo chấp nhận. Nhiều công ty ngang nhiên sử dụng dữ liệu đó".

Được biết, Apple cho phép trang web từ chối AppleBot thu thập dữ liệu đào tạo Apple Intelligence. Nhưng không rõ AppleBot bắt đầu thu thập dữ liệu web từ khi nào hay làm thế nào để bất kỳ ai cũng có thể từ chối tham gia đào tạo AI. Và vẫn còn câu hỏi chưa có lời giải về việc liệu yêu cầu xóa thông tin khỏi mô hình AI sẽ được thực hiện ra sao.

Ông Adam Beane, nhà điêu khắc sinh sống tại Los Angeles đồng thời là tác giả đứng sau tác phẩm mô phỏng CEO Steve Jobs trên tạp chí Esquire vào năm 2011, thừa nhận là fan trung thành của Apple trong suốt 25 năm. Ông Beane bày tỏ việc công ty không công khai nguồn dữ liệu đào tạo Apple Intelligence đã khiến nhiều người dùng như ông cảm thấy thất vọng. 

"Bạn phải đủ hiểu biết và đủ thông minh để biết cách từ chối đào tạo AI, và sau đó bạn phải tin tưởng công ty sẽ tôn trọng mong muốn của bạn", nhà điêu khắc nói thêm.

Apple hứng chịu nhiều chỉ trích xoay quanh quá trình thu thập dữ liệu đào tạo AI
Apple hứng chịu nhiều chỉ trích xoay quanh quá trình thu thập dữ liệu đào tạo AI

Bà Karla Ortiz, một họa sĩ đến từ San Francisco đồng thời là nguyên đơn trong vụ kiện bản quyền hình ảnh năm 2023 chống lại Stability AI và DeviantArt, chia sẻ: “Điểm mấu chốt là, để mô hình AI hoạt động hiệu quả, các công ty đều cố tình khai thác vượt quá quyền hạn, thậm chí vi phạm quyền riêng tư và quyền sở hữu trí tuệ. Apple cũng như bao công ty ngoài kia đang tiến hành theo phương thức như vậy”.

APPLE KHÔNG PHẢI NGOẠI LỆ

Vào tháng 4/2024, báo cáo từ Bloomberg tiết lộ Adobe, chủ sở hữu Photoshop và một số công cụ sáng tạo khác được nhiều nghệ sĩ, nhà thiết kế và nhiếp ảnh gia tin dùng, đã sử dụng hình ảnh có nguồn gốc không rõ ràng để đào tạo mô hình tạo ảnh bằng AI Firefly, dù Adobe tuyên bố chắc nịch về quy trình đào tạo "có đạo đức". Đầu tháng này, công ty buộc phải cập nhật điều khoản dịch vụ nhằm làm rõ việc không sử dụng nội dung từ khách hàng để đào tạo mô hình AI sau làn sóng phẫn nộ đỉnh điểm. 

"Toàn bộ cộng đồng sáng tạo đã bị phản bội bởi mọi công ty phần mềm mà trước đây chúng tôi từng rất tin tưởng", anh Jon Lam nhấn mạnh. Dù không thể xa rời hoàn toàn khỏi các sản phẩm của Apple, nhưng anh Lam đang cố gắng cắt giảm, trước mắt là với iPhone.

Nhà điêu khắc Beane cũng khẳng định: "Tôi có cảm giác ngày càng mãnh liệt rằng Apple đang trở nên giống với những đối thủ còn lại. Gã khổng lồ công nghệ ưu tiên lợi nhuận hơn mối quan tâm của những người sử dụng sản phẩm".


SpaceX bí mật nộp hồ sơ chào bán cổ phiếu, dự báo thương vụ IPO lớn nhất lịch sử

Thương vụ này được cho là có thể huy động từ 40 tỷ đến 80 tỷ USD – con số đủ để đưa SpaceX vào nhóm những đợt IPO lớn nhất từng được thực hiện trên toàn cầu…

16:44 03/04/2026
Chương trình Đối tác 20 triệu USD của Esports Foundation chính thức có đại diện Việt Nam

GAM Esports vừa gia nhập danh sách 40 câu lạc bộ thuộc Chương trình Đối tác 20 triệu USD của Esports Foundation, tiếp cận mạng lưới hơn 300 triệu người hâm mộ toàn cầu...

16:44 03/04/2026
Cuộc đua khốc liệt tạo video bằng AI sau quyết định “khai tử” Sora AI của OpenAI

Sora nhanh chóng phải dừng lại khi tài nguyên được công ty mẹ ưu tiên sử dụng vào mục đích khác trong bối cảnh đối thủ cạnh tranh ngày càng mạnh…

15:31 02/04/2026
Ngành chip châu Á đối mặt “cú siết” nguồn cung naphtha

Cuộc khủng hoảng nguồn cung naphtha – nguyên liệu đầu vào quan trọng của ngành hóa dầu và sản xuất bán dẫn – đang lan rộng khắp châu Á trong bối cảnh căng thẳng địa chính trị tại Trung Đông leo thang...

16:37 01/04/2026
Sony bắt tay hãng Trung Quốc TCL, “chia đôi quyền lực” mảng TV BRAVIA

Điểm gây tranh cãi lớn nhất chính là cơ cấu sở hữu: TCL nắm 51% cổ phần, trong khi Sony giữ 49%...

16:34 01/04/2026
Đầu tư vào viễn thông Trung Quốc năm 2026 dự báo giảm mạnh nhất trong vòng 15 năm

Chi tiêu vốn (capex) của các nhà mạng quốc doanh Trung Quốc được dự báo sẽ giảm xuống mức thấp nhất trong vòng 15 năm vào năm 2026, khi làn sóng đầu tư cho hạ tầng 5G đã đi qua giai đoạn cao trào...

16:33 01/04/2026
Trung Quốc: Nhiều tổ chức kêu gọi chính phủ thiết lập "giới hạn đỏ" với AI

Các cố vấn chính phủ Trung Quốc cảnh báo việc phát triển và ứng dụng AI nếu thiếu kiểm soát có thể gây ra những hệ lụy nghiêm trọng về việc làm và an ninh dữ liệu. Họ kêu gọi thiết lập các “lằn ranh đỏ” cho công nghệ này…

09:51 31/03/2026
Doanh nghiệp lượng tử thế giới “đua” lên sàn

Làn sóng niêm yết của các công ty lượng tử diễn ra trong bối cảnh thị trường toàn cầu đầy biến động, khi các xung đột địa chính trị làm suy giảm niềm tin của nhà đầu tư, đặc biệt với các tài sản rủi ro cao như công nghệ mới nổi…

09:50 31/03/2026
Cổ phiếu chip nhớ “bốc hơi” 100 tỷ USD sau một nghiên cứu của Google Research

Nguyên nhân đến từ một nghiên cứu mới của Google Research, cho thấy các trung tâm dữ liệu AI trong tương lai có thể cần ít bộ nhớ hơn đáng kể so với kỳ vọng trước đó...

14:27 30/03/2026
AI và bot chính thức “chiếm lĩnh” Internet: Lưu lượng máy vượt con người

Một báo cáo mới từ Human Security cho thấy lưu lượng truy cập do AI và bot tạo ra đã vượt qua con người, đánh dấu bước ngoặt lớn của Internet trong kỷ nguyên trí tuệ nhân tạo...

09:36 28/03/2026