人工智能訓(xùn)練侵犯作品復(fù)制權(quán)嗎？

2025-09-02 14:27:20 來源：法治日報(bào)-法治網(wǎng) -標(biāo)準(zhǔn)+

□ 李春暉

有關(guān)人工智能（AI）訓(xùn)練用數(shù)據(jù)的著作權(quán)爭議尚未塵埃落定。當(dāng)下學(xué)術(shù)研究似以一面倒的思路占優(yōu)：將著作權(quán)保護(hù)無條件適用于AI訓(xùn)練用數(shù)據(jù)，在此基礎(chǔ)上尋求包括合理使用和法定許可在內(nèi)的權(quán)利限制。這可稱為“先進(jìn)后出”路徑。亦有少數(shù)觀點(diǎn)“釜底抽薪”，從根本上質(zhì)疑著作權(quán)法的可適用性。筆者擬強(qiáng)化“釜底抽薪”進(jìn)路的論述，以平衡視聽。筆者并不排除規(guī)制AI訓(xùn)練用數(shù)據(jù)的可能性，但須在現(xiàn)行著作權(quán)法之外重新進(jìn)行利益衡量和價(jià)值選擇。

復(fù)制權(quán)是人工智能訓(xùn)練用數(shù)據(jù)著作權(quán)問題的核心

著作權(quán)一般包括精神權(quán)利、復(fù)制權(quán)、傳播權(quán)和演繹權(quán)。AI訓(xùn)練的結(jié)果是AI模型，不傳播原作品，不可能侵犯傳播權(quán)。諸項(xiàng)精神權(quán)利的被侵害也以作品的傳播為前提。因此，AI訓(xùn)練著作權(quán)問題主要涉及準(zhǔn)備訓(xùn)練數(shù)據(jù)時(shí)不可避免的物理復(fù)制以及訓(xùn)練時(shí)讀取數(shù)據(jù)過程中的臨時(shí)復(fù)制。有激進(jìn)觀點(diǎn)將機(jī)器學(xué)習(xí)過程本身，也就是對(duì)數(shù)據(jù)的分析、挖掘、學(xué)習(xí)納入復(fù)制范疇。

另有觀點(diǎn)認(rèn)為，對(duì)訓(xùn)練數(shù)據(jù)的預(yù)處理還可能涉及演繹權(quán)中的翻譯權(quán)、改編權(quán)、匯編權(quán)等，如轉(zhuǎn)換數(shù)據(jù)的自然語言或?qū)⑵滢D(zhuǎn)換為機(jī)器語言、對(duì)訓(xùn)練素材的改寫、標(biāo)注、解釋、分類、整理、匯總等。不過，這些操作并非著作權(quán)法意義上面向讀者的演繹，而是為了機(jī)器學(xué)習(xí)，本質(zhì)上仍是復(fù)制的一種，或以復(fù)制為前提。筆者將其視為廣義復(fù)制。

因此，在著作權(quán)法意義上，AI訓(xùn)練使用數(shù)據(jù)的合法性之核心是復(fù)制權(quán)。當(dāng)然，著作權(quán)法還規(guī)定了應(yīng)由著作權(quán)人享有的其他權(quán)利，因此將“用于AI訓(xùn)練”或文本數(shù)據(jù)挖掘（TDM）作為著作權(quán)的新權(quán)能的道路是暢通的。不過，若在既有權(quán)能之外求助于新權(quán)能，這仍屬于“釜底抽薪”進(jìn)路。

人工智能訓(xùn)練之技術(shù)、倫理本質(zhì)與復(fù)制

AI模型之基本原理脫胎于早期的模式識(shí)別技術(shù)。神經(jīng)網(wǎng)絡(luò)技術(shù)的變化，是從發(fā)現(xiàn)和構(gòu)建特征維度的“小農(nóng)經(jīng)濟(jì)”方式，轉(zhuǎn)變?yōu)榇笠?guī)模計(jì)算反映數(shù)據(jù)之全方位聯(lián)系的參數(shù)。模型的構(gòu)建和訓(xùn)練不是對(duì)數(shù)據(jù)的復(fù)制，而是對(duì)數(shù)據(jù)作出統(tǒng)計(jì)學(xué)上的特征表達(dá)。生成式AI是決策式AI的特定形式的應(yīng)用，底層技術(shù)沒有本質(zhì)變化。

AI訓(xùn)練從另一角度來看就是機(jī)器學(xué)習(xí)。AI志在替代人的智力。但AI要進(jìn)行創(chuàng)造活動(dòng)，必須預(yù)先學(xué)習(xí)掌握創(chuàng)造的素材和規(guī)則，這可與自然人學(xué)習(xí)過程相類比。人類學(xué)習(xí)時(shí)的記憶過程不構(gòu)成對(duì)作品的著作權(quán)法意義上的復(fù)制，AI在學(xué)習(xí)過程中將學(xué)習(xí)素材存儲(chǔ)在可用位置類似于人類的記憶過程，同樣不構(gòu)成著作權(quán)法意義上的復(fù)制。但這一結(jié)論若轉(zhuǎn)化為權(quán)利語言——“自然人有學(xué)習(xí)的權(quán)利，因而AI也有學(xué)習(xí)的權(quán)利”，卻面臨顯而易見的主體資格問題。

不過，民法上未出生的胎兒（甚至某些法域下的胚胎、受精卵）具有其倫理權(quán)利，但它們尚非具有主體意識(shí)的真正自然人主體。與之類比，若AI的目標(biāo)是成長為“人”，其可否享受類似胎兒在其正式“出生”之前的包括學(xué)習(xí)權(quán)利在內(nèi)的倫理權(quán)利？一方面，若AI的目的是具有似人的能力，則必須提供讓其獲取如此能力的環(huán)境；另一方面，AI與自然人構(gòu)成人機(jī)聯(lián)合體，AI可視為自然人人格的延伸或其一部分，AI的學(xué)習(xí)就是人自身的學(xué)習(xí)。

訓(xùn)練數(shù)據(jù)準(zhǔn)備中的復(fù)制

AI線下訓(xùn)練需預(yù)先準(zhǔn)備訓(xùn)練數(shù)據(jù)的拷貝于存儲(chǔ)集群中，這是否構(gòu)成著作權(quán)法意義上的復(fù)制？復(fù)制權(quán)之表面文義覆蓋任何形式的物理復(fù)制。然而隨著技術(shù)的發(fā)展，越來越多傳播行為無需以復(fù)制為前提，同時(shí)越來越多的復(fù)制與傳播無關(guān)。在此過程中，著作權(quán)實(shí)踐的歷史發(fā)展已逐漸顯明，傳統(tǒng)著作權(quán)法中的復(fù)制權(quán)實(shí)非純粹針對(duì)復(fù)制的權(quán)利，而是針對(duì)構(gòu)成傳播之前提的復(fù)制的權(quán)利。因此，AI訓(xùn)練用數(shù)據(jù)的預(yù)處理即使涉及物理復(fù)制，由于并無傳播目的和效果而不被具有傳播含義的“復(fù)制權(quán)”所覆蓋。

另一視角是把訓(xùn)練數(shù)據(jù)準(zhǔn)備中的復(fù)制視為臨時(shí)復(fù)制。但AI訓(xùn)練數(shù)據(jù)的大規(guī)模性導(dǎo)致訓(xùn)練不可能短時(shí)間內(nèi)完成，同時(shí)數(shù)據(jù)還需要預(yù)處理，數(shù)據(jù)復(fù)制狀態(tài)的存留不一定“短暫”，因此有人認(rèn)為訓(xùn)練數(shù)據(jù)準(zhǔn)備中的復(fù)制為永久復(fù)制。但臨時(shí)復(fù)制的更準(zhǔn)確表達(dá)當(dāng)為“中間復(fù)制”，核心不是時(shí)間，而是復(fù)制的非最終性、非目的性。訓(xùn)練數(shù)據(jù)準(zhǔn)備中的復(fù)制正是如此。

數(shù)據(jù)中間商的存在令問題更復(fù)雜，有觀點(diǎn)認(rèn)為其營利性證明了訓(xùn)練數(shù)據(jù)準(zhǔn)備中的復(fù)制有其獨(dú)立的經(jīng)濟(jì)意義。但獨(dú)立的經(jīng)濟(jì)意義并非指中間復(fù)制過程是否涉及對(duì)價(jià)，而是指公眾能否接觸、欣賞原作品的表達(dá)。同時(shí)，對(duì)AI開發(fā)者是否有復(fù)制和侵權(quán)行為而言，數(shù)據(jù)中間商的存在并非關(guān)鍵。反之，AI開發(fā)者行為的合法性反而會(huì)影響數(shù)據(jù)中間商行為的合法性，后者實(shí)為AI開發(fā)者的數(shù)據(jù)處理代工者，其所獲對(duì)價(jià)不過是代工的勞動(dòng)報(bào)酬。若數(shù)據(jù)中間商取得數(shù)據(jù)還有其他用途，在一些情形下可能構(gòu)成不正當(dāng)競爭，但就提供給多家AI開發(fā)者使用的情形而言，與一對(duì)一供應(yīng)數(shù)據(jù)沒有本質(zhì)區(qū)別，只是AI訓(xùn)練過程更廣泛、更精細(xì)的分工。

更寬廣的視野：知識(shí)產(chǎn)權(quán)權(quán)能碎片化之合理性審視

版權(quán)法上相對(duì)于傳播權(quán)獨(dú)立存在的復(fù)制權(quán)并非孤例，在商標(biāo)法、專利法領(lǐng)域存在類似情形。如專利產(chǎn)品銷售、使用之前的制造行為。這是因?yàn)橹R(shí)產(chǎn)權(quán)及其客體的特點(diǎn)，導(dǎo)致從復(fù)制/制造涉嫌侵權(quán)產(chǎn)品到權(quán)利人真正受損存在漫長的鏈條，知識(shí)產(chǎn)權(quán)立法將階段性行為視為獨(dú)立侵權(quán)行為，實(shí)為民事侵權(quán)理論中對(duì)侵權(quán)危險(xiǎn)的提前排除，有其歷史合理性。

但在新的技術(shù)和市場環(huán)境下，知識(shí)產(chǎn)權(quán)實(shí)施/使用鏈條各環(huán)節(jié)獨(dú)立權(quán)能化已愈加表現(xiàn)出現(xiàn)實(shí)的不合理性。一是利益延伸原則不符合知識(shí)產(chǎn)權(quán)法定原則并導(dǎo)致利益失衡。知識(shí)產(chǎn)權(quán)保護(hù)范圍隨利益無限延伸會(huì)過度控制信息和技術(shù)的傳播，產(chǎn)生固化“技術(shù)階層”的效果。二是多環(huán)節(jié)獨(dú)立權(quán)能化與民事侵權(quán)理論相齟齬。例如，在復(fù)制不再等價(jià)于傳播時(shí)，繼續(xù)單獨(dú)規(guī)制復(fù)制行為不再符合民事侵權(quán)理論。三是多環(huán)節(jié)獨(dú)立權(quán)能化導(dǎo)致各種弊端，包括多重許可、選擇性訴訟等。因此，應(yīng)回歸民事侵權(quán)理論，行為規(guī)制、責(zé)任承擔(dān)均須滿足侵權(quán)責(zé)任構(gòu)成要件。受損害的市場利益必須直接來自法定知識(shí)產(chǎn)權(quán)本身，而非具有復(fù)合性的知識(shí)產(chǎn)權(quán)客體中的非法定知識(shí)產(chǎn)權(quán)層面。

結(jié)論與展望：置之死地而后生

AI訓(xùn)練引發(fā)的熱烈討論和司法爭議，凸顯了革命性的技術(shù)需要革命性的制度。直截了當(dāng)?shù)霓k法，是直接承認(rèn)舊制度（著作權(quán)法）已不適應(yīng)新生產(chǎn)力（AI）。但這并不意味著對(duì)AI訓(xùn)練用數(shù)據(jù)問題撒手不管——若立法者和利益攸關(guān)方認(rèn)為AI訓(xùn)練用數(shù)據(jù)問題需要規(guī)制，則可進(jìn)行充分的利益衡量，基于價(jià)值取舍而重新立法/修法。塵埃落定之前，不妨讓子彈多飛一會(huì)兒，給新技術(shù)、新業(yè)態(tài)足夠的空間和時(shí)間，才更有利于科技、經(jīng)濟(jì)、社會(huì)、國家和人類的進(jìn)步?；蛘呓忖忂€須系鈴人，將技術(shù)引發(fā)的問題留待持續(xù)發(fā)展的技術(shù)本身去解決，可能是更有效的治理方法。

（原文刊載于《華東政法大學(xué)學(xué)報(bào)》2025年第4期）

編輯：武卓立

91麻豆免费观看,国产精品色综合久久,久久中文字幕免费,成人国产精品免费视频不卡,九九久久久久午夜精选,国产中的精品一区的,日本亚洲国产

人工智能訓(xùn)練侵犯作品復(fù)制權(quán)嗎？