AI và cuộc chiến bản quyền

Trí tuệ nhân tạo (AI), đặc biệt là AI sáng tạo nội dung, có vi phạm bản quyền tác giả? Luật pháp sẽ công nhận quyền tác giả cho người làm ra AI hay người sử dụng nó? Đây là hai câu hỏi không dễ để trả lời rạch ròi. Và trong tương lai, vấn đề này có thể sẽ còn phức tạp hơn nữa.

Vấn đề bản quyền

Trước hết, cần biết rằng các chương trình máy tính được thiết kế cho AI học tập sở hữu thuật toán tích hợp cho phép tiếp thu thông tin đầu vào, sau đó phát triển chúng để tự đưa ra quyết định độc lập hoặc được xác định sẵn.

Khi được sử dụng trong sáng tác nghệ thuật, AI có thể tiếp thu dữ liệu từ người lập trình, từ đó tạo nên tác phẩm mới, cũng như đưa ra quyết định độc lập trong khi hoạt động. Một tính năng chủ chốt của loại AI này là các tham số của nó được thiết lập bởi người lập trình, trong khi công việc "suy nghĩ” và "sáng tác" được chính AI thực hiện. Đây cũng là yếu tố khiến việc sáng tác nghệ thuật bằng AI gây nên nhiều tranh cãi lẫn ảnh hưởng tới luật bản quyền.

Từ trước đến nay, quyền sở hữu bản quyền tác phẩm do máy tính làm nên không gây quá nhiều tranh cãi, vì chúng đóng vai trò "công cụ hỗ trợ", như cây bút hay tờ giấy của tác giả. Khi đó, tác phẩm đủ điều kiện được luật bản quyền tác giả bảo vệ nếu nó là bản gốc, với phần lớn định nghĩa đều yêu cầu tác giả là người. Ở một số quốc gia như Tây Ban Nha hay Đức, chỉ tác phẩm được con người làm ra mới được luật pháp bảo vệ.

Tuy nhiên, khó có thể khẳng định chắc chắn ở thời điểm hiện đại, AI chỉ đóng vai trò "hỗ trợ", khi những AI tiên tiến nhất tham gia nhiều vào sáng tác mà không cần đến con người. Năm ngoái, để phối lại album Revolver (1966) của The Beatles, Giles Martin - con trai của nhà sản xuất album này là George Martin, đã cho AI học âm thanh từ mỗi nhạc cụ của các thành viên The Beatles. Giles đã nạp dữ liệu từ một cuộn băng đơn âm (mono) để làm thành âm thanh stereo và sản phẩm sau cùng rất ấn tượng với người nghe.

Với việc các nghệ sĩ ngày càng sử dụng AI nhiều hơn trong sáng tác, lằn ranh giữa tác phẩm do "người làm" và "máy làm" sẽ thêm mong manh. Và khi lằn ranh này không còn, tức không còn có thể phân biệt được đâu là nội dung do người hay máy làm, những nhà làm luật bảo vệ bản quyền tác phẩm sẽ buộc phải có cách tiếp cận mới.

Ai chịu trách nhiệm cho dữ liệu bị lấy cắp?

Hơn nữa, bản quyền của tác phẩm chỉ là "chuyện nhỏ” nếu so với đại dương dữ liệu có bản quyền khổng lồ mà các AI đã "bòn rút" trong khi được đào tạo để làm ra nội dung giống con người suốt thời gian qua. Nguồn dữ liệu này đến từ mọi nơi: mạng xã hội, lượt tìm kiếm trên Internet, thư viện số, truyền hình, phát thanh, báo cáo phân tích...

Thông thường, AI bị cáo buộc "ăn cắp" cơ sở dữ liệu mà không được phép. Các tác giả của nguồn tư liệu phàn nàn rằng, thành quả của họ "tuồn lên" mạng Internet mà không hề có sự đồng ý, dẫn nguồn hay bồi thường thiệt hại và tại đó, nhiều vụ kiện AI vi phạm bản quyền đã xuất hiện.

Trong đó, một vụ kiện ngay lập tức thu hút sự chú ý gần đây là của Getty Images - nơi cáo buộc Stability AI "lấy cắp" hơn 12 triệu bức ảnh mà không có sự đồng ý hay bồi thường. Getty Images cáo buộc hành động của Stability AI là vi phạm bản quyền, thông tin quản lý bản quyền sai lệch, sửa đổi hoặc bác bỏ thông tin quản lý bản quyền, vi phạm nhãn hiệu, cạnh tranh không lành mạnh, pha loãng nhãn hiệu và lừa đảo thương mại theo dự luật Delaware.

Được biết, Stability AI là chủ sở hữu mô hình khuếch tán ổn định Stable Diffusion giúp chuyển văn bản thành hình ảnh. Từ nhiều hình ảnh khác nhau, AI sẽ tạo ra bản tổng hợp của hình ảnh mà người dùng yêu cầu. Sản phẩm không phải hình ảnh thực mà thay vào đó là hình ảnh do AI tổng hợp từ dữ liệu mà chủ sở hữu nền tảng tải lên để đào tạo nó.

Theo Getty, tài sản ảnh của họ thường xuyên được sử dụng với AI lẫn Machine Learning và họ đã cấp phép hàng triệu tài sản số cho vô số đối tượng. Tuy nhiên, họ nói chưa nhận được đề nghị nào từ phía Stability AI.

Cần khung pháp lý

Nếu vụ kiện trên được giải quyết ngoài tòa án, nó có thể tạo ra một tiền lệ về việc cấu thành hành vi "sử dụng hợp lý” theo pháp luật Mỹ. Học thuyết "Sử dụng hợp lý” dựa trên sự tự do ngôn luận, được Tu chính án số 1 của Hiến pháp Mỹ bảo vệ và chứa đựng nội dung còn nhiều tranh cãi về việc liệu hành động khai thác dữ liệu không có giấy phép có được phép hay không.

AI bị cáo buộc "ăn cắp" cơ sở dữ liệu mà không được phép. Các tác giả của nguồn tư liệu phàn nàn rằng, thành quả của họ "tuồn lên" mạng Internet mà không hề có sự đồng ý, dẫn nguồn hay bồi thường thiệt hại và tại đó, nhiều vụ kiện AI vi phạm bản quyền đã xuất hiện.

Hai trong số nhiều đề mục của học thuyết này thường được viện dẫn để xác định hành vi sử dụng hợp lý là mục đích hoặc bản chất của việc sử dụng và sự ảnh hưởng đến thị trường cốt lõi của tác phẩm được bảo vệ hay không. Cụ thể, việc sử dụng tác phẩm có bản quyền được xem là hợp lý khi nó phục vụ mục đích xã hội có giá trị, tài liệu được biến đổi từ bản gốc và không ảnh hưởng đến thị trường cốt lõi của chủ sở hữu. Theo nhiều công ty AI, sử dụng tài liệu có bản quyền để đào tạo AI là hành vi sử dụng hợp lý.

Ngược lại, các nhà phê bình nói AI không biến đổi mà khai thác toàn bộ cơ sở dữ liệu chúng cần. Họ cho rằng, các công ty đang lợi dụng "sử dụng hợp lý” để "ăn theo" sản phẩm của cá nhân và đe dọa sinh kế của người sáng tạo, bên cạnh mối đe dọa xã hội nói chung nếu AI thúc đẩy sự theo dõi hàng loạt và truyền bá thông tin sai lệch.

Hiện chưa rõ các nhà hoạch định chính sách sẽ xây dựng khung pháp lý ra sao, song có một thực tế là khi quyền truy cập dữ liệu ngày một nhiều, AI sẽ ngày càng tốt hơn và nếu không có quyền truy cập thì có thể sẽ chẳng có AI nào cả. Nói cách khác, ngành công nghiệp AI có thể chết ngay từ trong trứng. Rốt cục, câu hỏi pháp lý quan trọng nhất cần tìm lời đáp là "Liệu luật bản quyền có cho phép người máy học hỏi hay không?".