Reddit kiện Anthropic vì dùng dữ liệu trái phép

Reddit vừa khởi kiện công ty AI Anthropic, cáo buộc đơn vị này đã sử dụng trái phép bài viết trên nền tảng để huấn luyện chatbot Claude mà không xin phép hay trả phí. Vụ kiện nhấn mạnh cuộc chiến bản quyền dữ liệu ngày càng nóng giữa các nền tảng mạng xã hội và công ty AI.

Reddit kiện Anthropic, dữ liệu Reddit, Claude chatbot, huấn luyện AI, vi phạm bản quyền, dữ liệu người dùng, bản quyền AI

Reddit chính thức đâm đơn kiện công ty trí tuệ nhân tạo Anthropic tại tòa án San Francisco vào ngày 4/6/2025. Theo đơn kiện, Anthropic bị cáo buộc đã thu thập hàng loạt bài viết từ nền tảng Reddit để huấn luyện mô hình AI Claude mà không có sự cho phép, vi phạm nghiêm trọng thỏa thuận người dùng cũng như các biện pháp kỹ thuật ngăn chặn truy cập tự động của Reddit.

Cụ thể, Reddit cho rằng hành vi của Anthropic là “khai thác thương mại không được phép” và “lợi dụng nội dung do người dùng tạo ra” để xây dựng sản phẩm trị giá hàng tỷ USD mà không hề chi trả bất kỳ khoản phí nào. Trong khi đó, Reddit đã ký hợp đồng cấp quyền sử dụng dữ liệu với những công ty lớn như Google và OpenAI – những thỏa thuận được cho là trị giá hàng chục triệu USD mỗi năm. Điều này càng khiến Reddit phản ứng mạnh mẽ trước việc Anthropic bị cho là “dùng chùa”.

Theo cáo buộc, từ tháng 12/2021, Anthropic đã bắt đầu âm thầm thu thập dữ liệu trên Reddit, bất chấp các biện pháp hạn chế như tệp robots.txt. Reddit cũng tuyên bố rằng vào tháng 7/2024, Anthropic từng cam kết đã ngừng truy cập, nhưng thực tế các bản ghi kiểm tra cho thấy các bot của Anthropic tiếp tục gửi hơn 100.000 lượt truy cập tới hệ thống Reddit trong những tháng tiếp theo. Đáng chú ý, trong đơn kiện còn có ảnh chụp đoạn hội thoại với chatbot Claude, trong đó Claude “thừa nhận” đã được huấn luyện bằng dữ liệu từ Reddit – dù điều này có thể không hoàn toàn chính xác do AI thường xuyên “ảo tưởng”.

Reddit chỉ trích Anthropic là một công ty "hai mặt": ngoài mặt nói về đạo đức AI và tôn trọng nguyên tắc, nhưng bên trong lại lặng lẽ vượt rào để thu lợi. Vì vậy, Reddit yêu cầu tòa buộc Anthropic phải bồi thường đáng kể, gồm toàn bộ lợi nhuận thu được từ việc sử dụng dữ liệu Reddit, hoàn trả những tổn thất tài chính mà Reddit phải gánh chịu, và thêm cả khoản bồi thường mang tính răn đe.

Không dừng lại ở đó, Reddit còn đề nghị tòa ban hành lệnh cấm vĩnh viễn, buộc Anthropic không được tiếp tục sử dụng bất kỳ dữ liệu nào từ Reddit, xóa toàn bộ nội dung Reddit trong hệ thống, và gỡ bỏ những sản phẩm AI (như Claude) khỏi thị trường nếu chúng được phát triển từ dữ liệu bị tranh chấp. Reddit cũng yêu cầu Anthropic chi trả toàn bộ chi phí pháp lý của vụ kiện.

Vụ việc cho thấy cuộc đụng độ giữa các nền tảng sở hữu dữ liệu và các công ty AI đang bước vào giai đoạn quyết liệt, trong bối cảnh dữ liệu người dùng ngày càng trở thành “vàng số” trong cuộc đua huấn luyện trí tuệ nhân tạo.