Tòa Mỹ: Anthropic dùng sách có bản quyền để huấn luyện AI là đúng luật

Một thẩm phán liên bang tại Mỹ vừa ra phán quyết rằng việc công ty Anthropic sử dụng sách có bản quyền để huấn luyện mô hình AI là hợp pháp theo luật "sử dụng hợp lý". Đây là quyết định đầu tiên có tính bước ngoặt, ảnh hưởng lớn tới toàn ngành AI.

Anthropic, bản quyền sách, huấn luyện AI, sử dụng hợp lý, tòa án Mỹ, sách có bản quyền, AI ngôn ngữ lớn

Tòa án Liên bang Mỹ vừa đưa ra phán quyết có thể tạo tiền lệ cho toàn ngành trí tuệ nhân tạo: Việc công ty Anthropic sử dụng sách có bản quyền để huấn luyện các mô hình AI là hợp pháp theo quy định về "sử dụng hợp lý" (fair use).

Thẩm phán William Alsup là người đưa ra quyết định này. Ông cho rằng, việc dùng sách để huấn luyện mô hình AI là một hình thức sử dụng mang tính biến đổi, khác xa với mục đích ban đầu của các tác phẩm gốc. Ông ví von rằng AI giống như một người học viết, học hỏi từ sách nhưng không sao chép hay cạnh tranh trực tiếp với tác giả.

Phán quyết này là tin vui với các ông lớn công nghệ như OpenAI, Google, Meta, những công ty cũng sử dụng hàng nghìn đến hàng triệu cuốn sách có bản quyền để huấn luyện các mô hình AI ngôn ngữ lớn (LLM).

Anthropic, bản quyền sách, huấn luyện AI, sử dụng hợp lý, tòa án Mỹ, sách có bản quyền, AI ngôn ngữ lớn

Tuy nhiên, không phải mọi phần của vụ việc đều được "bật đèn xanh". Thẩm phán Alsup cũng nói rằng, việc lưu trữ sách trong một “thư viện trung tâm” phục vụ huấn luyện là hành vi vi phạm bản quyền, tạo ra sự mập mờ: bởi rõ ràng cần lưu trữ sách để huấn luyện, nhưng cách lưu trữ nào là hợp pháp thì chưa rõ ràng.

Một vấn đề gây tranh cãi khác là nguồn gốc sách được dùng. Một số tác giả cho biết sách của họ bị lấy từ các trang web vi phạm bản quyền. Dù Alsup không đi sâu vào khía cạnh này, nhiều ý kiến cho rằng tòa đang ngầm nhấn mạnh rằng các công ty AI nên mua bản sao hợp pháp trước khi sử dụng vào huấn luyện, thay vì tải sách lậu.

Đây là phán quyết đầu tiên của tòa án Mỹ liên quan đến tranh chấp bản quyền trong lĩnh vực AI sinh ngữ (generative AI). Nó có khả năng tạo tiền lệ pháp lý ở Mỹ, dù vẫn khó áp dụng tại các nước như Anh – nơi sử dụng khái niệm "fair dealing" vốn chặt chẽ hơn "fair use".

Trong bối cảnh các nhà văn muốn bảo vệ công sức lao động, còn các công ty AI thì cần dữ liệu để phát triển công nghệ mới, cuộc chiến pháp lý giữa hai bên chắc chắn sẽ chưa dừng lại. Phán quyết này chỉ là bước khởi đầu trong hành trình xác định ranh giới giữa sáng tạo con người và máy học.