Reddit kiện Anthropic sử dụng dữ liệu đào tạo AI không phép, yêu cầu bồi thường

Reddit vừa kiện công ty AI Anthropic tại tòa án California với cáo buộc sử dụng dữ liệu trang để đào tạo mô hình AI mà không có thỏa thuận cấp phép. Reddit yêu cầu bồi thường và chấm dứt khai thác dữ liệu.

Reddit kiện Anthropic vì sử dụng dữ liệu đào tạo AI không phép

Theo đơn kiện gửi tòa án tại Bắc California ngày thứ Tư, Reddit cáo buộc Anthropic đã thu thập và sử dụng dữ liệu từ trang Reddit để đào tạo các mô hình AI mà không có hợp đồng cấp phép chính thức. Reddit cho rằng việc Anthropic tận dụng dữ liệu này nhằm mục đích thương mại là hành vi bất hợp pháp, vi phạm thỏa thuận sử dụng của người dùng Reddit.

Anthropic bị tố vi phạm điều khoản và không tôn trọng robots.txt

Reddit khẳng định đã tiếp cận Anthropic và làm rõ rằng công ty này không được phép thu thập hoặc sử dụng nội dung trang.
Anthropic bị cáo buộc phớt lờ chỉ dẫn từ robots.txt, tiếp tục cho bot truy cập và thu thập dữ liệu.
Mô hình AI Claude của Anthropic còn thường xuyên trích dẫn, tham chiếu đến các cộng đồng và chủ đề trên Reddit - được Reddit xem là bằng chứng công ty này dùng dữ liệu Reddit huấn luyện AI.

Reddit đã hợp tác hợp pháp với các công ty AI khác

Reddit từng ký thỏa thuận với OpenAI và Google cho phép các hãng này truy cập dữ liệu Reddit để đào tạo AI và tích hợp nội dung vào các chatbot. Theo Reddit, các hợp đồng này đặt ra điều kiện bảo vệ quyền lợi, quyền riêng tư người dùng. Sam Altman, CEO OpenAI, là cổ đông lớn thứ ba ở Reddit và từng là thành viên hội đồng quản trị.

Ngành công nghệ đối mặt nhiều vụ kiện liên quan dữ liệu huấn luyện AI

Nhiều hãng công nghệ và xuất bản kiện các công ty AI tương tự

Reddit là nền tảng lớn đầu tiên trong nhóm Big Tech kiện nhà cung cấp AI về vấn đề sử dụng dữ liệu huấn luyện mô hình. Trước đó, The New York Times kiện OpenAI, Microsoft với cáo buộc tương tự đối với bài báo của mình. Các nghệ sĩ, nhà xuất bản sách như Sarah Silverman, cùng nhiều hãng âm nhạc cũng có động thái pháp lý với các startup AI chuyên tạo nội dung âm thanh, hình ảnh, video.

Yêu cầu kiến nghị và bồi thường từ Reddit

Reddit yêu cầu Anthropic bồi thường thiệt hại, hoàn trả khoản lợi bất chính từ việc sử dụng dữ liệu và đề nghị tòa án ban lệnh cấm Anthropic tiếp tục thu thập cũng như sử dụng nội dung của Reddit vì mục đích thương mại.

Reddit đã chính thức kiện Anthropic với cáo buộc sử dụng dữ liệu trái phép để đào tạo AI, nhấn mạnh tầm quan trọng của quyền lợi cộng đồng người dùng. Vụ việc nối dài loạt tranh chấp liên quan đến dữ liệu huấn luyện AI trong lĩnh vực công nghệ hiện nay.