16:55 05/07/2024

Apple hứng chịu chỉ trích liên quan tới dữ liệu đào tạo Apple Intelligence

Bảo Ngọc

Hành trình Apple “tham chiến” cuộc đua AI tạo ra nhiều phản ứng trái chiều, kể cả từ nhóm người dùng trung thành nhất…

Apple chính thức công bố bộ công cụ Apple Intelligence tại WWDC 2024 vừa qua.
Apple chính thức công bố bộ công cụ Apple Intelligence tại WWDC 2024 vừa qua.

Dự kiến vào cuối năm nay, hàng triệu thiết bị trong hệ sinh thái Apple sẽ bắt đầu tích hợp Apple Intelligence, bộ công cụ AI tổng quát vừa được nhà sản xuất iPhone công bố tại WWDC 2024. 

Theo Yahoo Tech, bên cạnh một số tính năng nổi trội khác, Apple Intelligence cho phép người dùng tạo hình ảnh từ câu lệnh văn bản. Một số thành viên thuộc cộng đồng sáng tạo không hài lòng về sự thiếu minh bạch của công ty xung quanh nguồn dữ liệu thô được cung cấp nhằm đào tạo mô hình AI.

“Tôi kỳ vọng Apple sẽ giải thích một cách minh bạch hơn về cách hãng thu thập dữ liệu đào tạo mô hình AI”, Jon Lam, nhà sáng tạo nội dung trong lĩnh vực trò chơi điện tử đang sinh sống và làm việc tại Vancouver, chia sẻ với Engadget. “Apple nên đưa ra thông báo càng sớm càng tốt, trước khi mọi chuyện diễn biến theo chiều hướng xấu”.

QUY TRÌNH THU THẬP DỮ LIỆU THIẾU MINH BẠCH

Những nhà sáng tạo từ lâu đã trở thành nhóm khách hàng trung thành của Apple khi các nhà sáng lập định vị công ty ở "giao điểm giữa công nghệ và nghệ thuật tự do". Nhưng ở thời điểm hiện tại, nhiều nhiếp ảnh gia, họa sĩ hay nhà điêu khắc không ngần ngại bày tỏ nỗi thất vọng xung quanh sự im lặng của Apple về cách công ty thu thập dữ liệu cho mô hình AI.

Để mô hình trí tuệ nhân tạo đạt được hiệu năng vượt trội nhất, hầu hết đại gia trong ngành đều cố gắng truy cập mọi dữ liệu có thể tìm thấy trên internet, bất chấp sự đồng ý của tác giả hay nguy cơ những vụ kiện đòi bồi thường có thể xảy ra. 

Gần 6 tỷ hình ảnh đang được sử dụng để đào tạo nhiều mô hình AI khác nhau đến từ LAION-5B, bộ dữ liệu hình ảnh khổng lồ được thu thập từ nhiều nguồn internet. Trong cuộc phỏng vấn với Forbes, ông David Holz, CEO phòng thí nghiệm trí tuệ nhân tạo Midjourney, cho biết đa số mô hình AI được đào tạo dựa trên "phần lớn dữ liệu internet" và "thực sự không có cách nào để biết chính xác nguồn gốc của hàng trăm triệu hình ảnh ban đầu".

Nhiều nghệ sĩ, tác giả và nhạc sĩ đã lên tiếng cáo buộc các công ty AI sử dụng tác phẩm không xin phép và kiếm lợi nhuận, dẫn đến hàng chục vụ kiện bản quyền chỉ tính riêng trong năm 2023. Tháng trước, một số hãng thu âm lớn bao gồm Universal và Sony đã kiện hai startup được định giá hàng trăm triệu USD chuyên về tạo nhạc AI, Suno và Udio, vì vi phạm bản quyền. 

Nhiều nhà sáng tạo đặt niềm tin rằng Apple có thể làm tốt hơn. Chàng trai trẻ Jon Lam bày tỏ: "Tôi nghĩ Apple nên tiếp cận vấn đề đạo đức theo cách khác".

Trước đó, Apple tiết lộ rất ít về nguồn dữ liệu đào tạo cho Apple Intelligence. Trong bài đăng trên blog, công ty thừa nhận lấy dữ liệu công khai từ web mở bằng AppleBot, trình thu thập dữ liệu web của công ty, đồng nhất với tuyên bố của các Giám đốc Điều hành trên sân khấu WWDC 2024 hồi tháng 6. Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, từng phát biểu rằng "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết. 

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Apple không trả lời bình luận từ Engadget.

NHÀ SÁNG TẠO LÊN TIẾNG

Vào tháng 5/2024, ông Andrew Leung, một nghệ sĩ từng tham gia sản xuất nhiều bộ phim đình đám như Black Panther, The Lion KingMulan, đã ví Generative AI như "vụ trộm lớn nhất lịch sử trí tuệ con người" trong bài phát biểu trước Đại hội đồng Tiểu bang California về tác động của AI đối với ngành công nghiệp giải trí. "Công ty sử dụng dữ liệu 'có sẵn công khai', tôi muốn nói rằng thuật ngữ này không được các nhà sáng tạo chấp nhận. Nhiều công ty ngang nhiên sử dụng dữ liệu đó".

Được biết, Apple cho phép trang web từ chối AppleBot thu thập dữ liệu đào tạo Apple Intelligence. Nhưng không rõ AppleBot bắt đầu thu thập dữ liệu web từ khi nào hay làm thế nào để bất kỳ ai cũng có thể từ chối tham gia đào tạo AI. Và vẫn còn câu hỏi chưa có lời giải về việc liệu yêu cầu xóa thông tin khỏi mô hình AI sẽ được thực hiện ra sao.

Ông Adam Beane, nhà điêu khắc sinh sống tại Los Angeles đồng thời là tác giả đứng sau tác phẩm mô phỏng CEO Steve Jobs trên tạp chí Esquire vào năm 2011, thừa nhận là fan trung thành của Apple trong suốt 25 năm. Ông Beane bày tỏ việc công ty không công khai nguồn dữ liệu đào tạo Apple Intelligence đã khiến nhiều người dùng như ông cảm thấy thất vọng. 

"Bạn phải đủ hiểu biết và đủ thông minh để biết cách từ chối đào tạo AI, và sau đó bạn phải tin tưởng công ty sẽ tôn trọng mong muốn của bạn", nhà điêu khắc nói thêm.

Apple hứng chịu nhiều chỉ trích xoay quanh quá trình thu thập dữ liệu đào tạo AI
Apple hứng chịu nhiều chỉ trích xoay quanh quá trình thu thập dữ liệu đào tạo AI

Bà Karla Ortiz, một họa sĩ đến từ San Francisco đồng thời là nguyên đơn trong vụ kiện bản quyền hình ảnh năm 2023 chống lại Stability AI và DeviantArt, chia sẻ: “Điểm mấu chốt là, để mô hình AI hoạt động hiệu quả, các công ty đều cố tình khai thác vượt quá quyền hạn, thậm chí vi phạm quyền riêng tư và quyền sở hữu trí tuệ. Apple cũng như bao công ty ngoài kia đang tiến hành theo phương thức như vậy”.

APPLE KHÔNG PHẢI NGOẠI LỆ

Vào tháng 4/2024, báo cáo từ Bloomberg tiết lộ Adobe, chủ sở hữu Photoshop và một số công cụ sáng tạo khác được nhiều nghệ sĩ, nhà thiết kế và nhiếp ảnh gia tin dùng, đã sử dụng hình ảnh có nguồn gốc không rõ ràng để đào tạo mô hình tạo ảnh bằng AI Firefly, dù Adobe tuyên bố chắc nịch về quy trình đào tạo "có đạo đức". Đầu tháng này, công ty buộc phải cập nhật điều khoản dịch vụ nhằm làm rõ việc không sử dụng nội dung từ khách hàng để đào tạo mô hình AI sau làn sóng phẫn nộ đỉnh điểm. 

"Toàn bộ cộng đồng sáng tạo đã bị phản bội bởi mọi công ty phần mềm mà trước đây chúng tôi từng rất tin tưởng", anh Jon Lam nhấn mạnh. Dù không thể xa rời hoàn toàn khỏi các sản phẩm của Apple, nhưng anh Lam đang cố gắng cắt giảm, trước mắt là với iPhone.

Nhà điêu khắc Beane cũng khẳng định: "Tôi có cảm giác ngày càng mãnh liệt rằng Apple đang trở nên giống với những đối thủ còn lại. Gã khổng lồ công nghệ ưu tiên lợi nhuận hơn mối quan tâm của những người sử dụng sản phẩm".