20:51 03/01/2024

New York Times kiện OpenAI và Microsoft vi phạm bản quyền

Nguyễn Hà

New York Times đã kiện OpenAI và Microsoft vì vi phạm bản quyền, cáo buộc rằng công nghệ trí tuệ nhân tạo của các công ty này đã sao chép trái phép hàng triệu bài báo của Times để đào tạo ChatGPT và các dịch vụ khác nhằm cung cấp cho mọi người quyền truy cập thông tin tức thì…

Khiếu nại này là vụ kiện mới nhất trong một loạt vụ kiện nhằm hạn chế việc thu thập nội dung từ khắp nơi trên internet để đào tạo các mô hình ngôn ngữ lớn. Các diễn viên, nhà văn, nhà báo đăng tác phẩm của họ lên internet lo sợ rằng AI sẽ học hỏi từ tài liệu của họ và cung cấp các chatbot cạnh tranh cũng như các nguồn thông tin khác mà họ không được trả phí bản quyền.

Trong đơn khiếu nại ngày 27/12, tờ Times nói rằng việc Microsoft và OpenAI “sử dụng trái phép tác phẩm của The Times để tạo ra các sản phẩm trí tuệ nhân tạo cạnh tranh đe dọa đến khả năng cung cấp dịch vụ đó của The Times”. Tờ báo lưu ý rằng OpenAI và Microsoft đã sử dụng các nguồn khác nhau để “sao chép trên diện rộng”, tìm cách tận dụng khoản đầu tư khổng lồ của The Times vào hoạt động báo chí để xây dựng các sản phẩm thay thế mà không được phép.

Người phát ngôn Lindsey Held của OpenAI cho biết: “Chúng tôi tôn trọng quyền của người sáng tạo và chủ sở hữu nội dung, đồng thời cam kết hợp tác với họ để đảm bảo họ được hưởng lợi từ công nghệ AI và các mô hình doanh thu mới. Các cuộc trò chuyện của chúng tôi với New York Times đã diễn ra hiệu quả và tiến triển theo hướng xây dựng, vì vậy chúng tôi rất ngạc nhiên và thất vọng với đơn khiếu nại này. Chúng tôi hy vọng rằng chúng tôi sẽ tìm ra cách hợp tác cùng có lợi như chúng tôi đang làm với nhiều nhà xuất bản khác”.

HAI BÊN KHÔNG ĐẠT ĐƯỢC THỎA THUẬN

The Times chia sẻ trong đơn khiếu nại rằng cách đây nhiều tháng họ phát hiện ra nội dung xuất bản của họ đã được sử dụng để đào tạo các mô hình ngôn ngữ lớn. Bắt đầu từ tháng 4, tờ Times cho biết họ đã đàm phán với OpenAI và Microsoft để nhận được khoản bồi thường công bằng và đặt ra các điều khoản của thỏa thuận.

Tuy nhiên, tờ Times cáo buộc họ không thể đạt được thỏa thuận hợp lý với các công ty. Microsoft và OpenAI tuyên bố rằng các tác phẩm của Times được coi là “sử dụng hợp pháp”, cho phép họ sử dụng tài liệu có bản quyền cho “mục đích biến đổi”. The Times phản đối mạnh mẽ tuyên bố đó, cho biết ChatGPT và chatbot Bing của Microsoft có thể cung cấp dịch vụ tương tự như New York Times.

Tờ Times cho biết trong đơn khiếu nại: “Thật không công bằng khi các công ty sử dụng nội dung của The Times mà không trả tiền để tạo ra các sản phẩm thay thế The Times và cướp đi khán giả của The Times”.

CÁC CÔNG TY BÁO CHÍ LỚN NỖ LỰC NGĂN CHẶN AI THU THẬP DỮ LIỆU

The Times là một trong số các phòng tin tức hàng đầu, bao gồm cả CNN, đã thêm mã vào trang web của họ để chặn trình thu thập dữ liệu web của OpenAI, GPTBot, quét nền tảng của họ để tìm nội dung.

Trong các vụ kiện riêng biệt nhưng có liên quan vào đầu năm nay, diễn viên hài Sarah Silverman và hai tác giả đã kiện Meta và OpenAI vào tháng 7, cáo buộc các mô hình ngôn ngữ AI của các công ty này thu thập tài liệu có bản quyền từ sách của họ mà họ không hề biết hoặc không đồng ý. Cả hai công ty đều không bình luận gì về vụ kiện. Một thẩm phán vào tháng 11 đã bác bỏ hầu hết các yêu cầu của vụ kiện.

Ngoài ra, một nhóm các nhà văn nổi tiếng đã cùng với Hiệp hội Tác giả nộp đơn kiện tập thể OpenAI vào tháng 9, cáo buộc công nghệ của công ty đang sử dụng trái phép tác phẩm có bản quyền của họ.

The Times cáo buộc rằng các bộ dữ liệu được sử dụng để đào tạo các mô hình ngôn ngữ lớn OpenAI “có thể đã sử dụng hàng triệu tác phẩm thuộc sở hữu của Times”.

Trong một trường hợp được trích dẫn trong đơn khiếu nại, ChatGPT đã cung cấp cho người dùng ba đoạn đầu tiên của bài báo đoạt giải Pulitzer năm 2012 “Snow Fall: The Avalanche at Tunnel Creek,” sau khi người dùng phàn nàn trong cuộc trò chuyện với ChatGPT rằng họ không thể đọc được bài báo vì phải trả phí cho Times.

Hãng tin này cũng cáo buộc rằng công cụ tìm kiếm Bing của Microsoft, được nâng cấp vào đầu năm nay với công nghệ của OpenAI, đã "sao chép và phân loại" nội dung của Times để tạo ra phản hồi dài hơn và chi tiết hơn so với các công cụ tìm kiếm truyền thống.

Đơn khiếu nại nêu rõ: “Bằng cách cung cấp nội dung của Times mà không có sự cho phép hoặc ủy quyền của The Times, các công cụ sẽ làm suy yếu và gây tổn hại đến mối quan hệ của The Times với độc giả và tước đi quyền đăng ký, cấp phép, quảng cáo và doanh thu liên kết của The Times”.

CHẤP NHẬN AI MỘT CÁCH CÓ GIỚI HẠN

Tờ New York Times cho biết, họ chỉ muốn đảm bảo rằng họ được đền bù xứng đáng. Phó chủ tịch điều hành và Tổng cố vấn của New York Times, Diane Brayton đã nói với các nhân viên rằng: “Chúng tôi nhận ra tiềm năng của GenAI đối với công chúng và đối với báo chí”.

Bà cho biết thêm “Nhưng đồng thời, chúng tôi tin rằng sự thành công của GenAI và các công ty phát triển nó không nhất thiết phải trả giá bằng các tổ chức báo chí. Việc sử dụng công việc của chúng tôi để tạo ra các công cụ GenAI phải có sự cho phép và thỏa thuận phản ánh giá trị hợp lý của công việc đó”.

Với vụ kiện của mình, Times đang yêu cầu bồi thường thiệt hại hàng tỷ đô la nhưng không nêu rõ khoản bồi thường mà tờ Times yêu cầu đối với cáo buộc vi phạm các tài liệu có bản quyền của mình. Công ty cũng tìm kiếm một lệnh cấm vĩnh viễn nhằm ngăn chặn Microsoft và OpenAI tiếp tục hành vi vi phạm bị cáo buộc.

Theo Dina Blikshteyn, đối tác trong nhóm thực hành trí tuệ nhân tạo và học sâu tại công ty luật Haynes Boone, vụ kiện của Times có thể tạo tiền lệ cho ngành công nghiệp báo chí, bởi vì câu hỏi liệu việc sử dụng tài liệu có bản quyền để đào tạo các mô hình AI có vi phạm luật hay không là một vấn đề pháp lý chưa được giải quyết.