ChatGPT許可應用,知識產權和數據講解,IP賦能NFT,平臺與版權方介紹
專利代理 發布時間:2024-04-02 18:59:48 瀏覽: 次
今天,樂知網律師 給大家分享: ChatGPT許可應用,知識產權和數據講解,IP賦能NFT,平臺與版權方介紹。
ChatGPT許可應用,知識產權和數據怎么看?
2023年2月27日,《數字中國建設整體布局規劃》(“《規劃》”),《規劃》指出,要全面賦能經濟社會發展,推動數字技術和實體經濟深度融合,在農業、工業、金融、教育、醫療、交通、能源等重點領域,加快數字技術創新應用。
AI作為支撐數字經濟發展的重要基礎設施,正在與各行業典型應用場景相融合,將為我國數字經濟發展提供核心驅動力。
商業實踐中,AI軟件發揮作用的方式通常體現為AI企業將其研發的AI軟件許可給使用者,以收取許可費的形式盈利。
如何合理安排AI軟件許可協議中雙方的權利義務,特別是知識產權和數據相關條款如何設計,在該等業務模式下至關重要。
以下,我們將基于AI軟件與傳統軟件的區別,對AI軟件許可協議中知識產權和數據條款設計所應當包含的要素進行探討。
對于傳統軟件而言,軟件開發者更關注的是軟件的功能需求,即軟件必須實現的功能。
因此,軟件開發者需要通過使用各種模型對相關功能需求進行描述,數據處理等規則往往已經被事先設計確定。
而對于AI軟件而言,功能需求相對并不那么重要,模型訓練則十分關鍵,模型開發者通過使用大量的數據對待訓練模型進行持續訓練,使之歸納出處理新數據的規則。
待訓練模型通過學習知識成為具有推理和決策能力的訓練后模型,從而實現智能化。
因此,相比于傳統軟件,AI軟件開發者更關注的是模型、訓練模型的數據以及支撐模型訓練的算力。
在傳統軟件開發過程中,由于沒有模型訓練的環節,軟件開發者一般不需要收集并使用大量的數據。
而在AI軟件的開發過程中,軟件開發者則必須借助大量且高質量的數據對模型進行訓練,并在訓練過程中不斷優化參數以提高運行效率和準確性。
訓練數據通常根據具體的應用場景進行確定。
以計算機視覺應用場景為例,盡管利用一些現有的開源數據也可以對模型進行訓練,但是這些數據通常不能很好地滿足特定的視覺應用場景需求,解決上述問題的關鍵在于如何采集足夠多的來自于實際應用場景的真實圖像或視頻數據,并對這些數據進行一定的處理,例如數據清洗、數據標注等。
從軟件使用者角度出發,AI軟件的安裝部署方式與傳統軟件可能并無明顯差異,但是從運營方式和商業模式來看,二者還是存在一定區別。
對于傳統軟件而言,其對算力的要求相對較低,因此通常是由企業購買后安裝在其自有服務器上,相關數據也通常存儲在本地計算機或服務器中。
而對于AI軟件而言,新興應用場景產生的海量數據對AI算力的需求持續加大,例如云游戲、自動駕駛等對數據傳輸的速度和量級都提出了更高的要求,而通過云計算和云部署的方式便可以在很大程度上解決上述問題。
在該等情形下,相關數據則被傳輸并存儲在云端。
為了明確軟件許可協議中不同知識產權的權屬安排,我們有必要先對軟件許可中常見的許可標的進行梳理。
(1)軟件許可標的 在傳統軟件許可協議中,關于許可標的的安排一般會區分源代碼和目標代碼。
源代碼是由程序員用人類可讀的語言編寫的用于執行某些任務的代碼,然后將文件保存為規定的格式,但該等代碼未經編譯無法被機器直接執行;而目標代碼則是通過編譯器將源代碼轉換而成的機器可直接執行的代碼。
由于目標代碼通常難以被人類所理解,因此倘若需要對軟件進行修改,例如增加定制化的功能模塊,則往往需要對源代碼進行修改。
實踐中,如果被許可方對軟件的需求僅涉及運行和使用,一般不涉及源代碼的交付;但是如果被許可方對軟件的維護、調整、改進和升級有特定需求,許可方通常還需要向被許可方交付軟件的源代碼,并授予其源代碼層面的許可。
(2)知識產權權屬 在傳統軟件許可協議中,無論許可標的是目標代碼還是源代碼,雙方均應當對相關知識產權的權屬安排進行提前約定,以免后續產生糾紛。
一般而言,軟件許可協議的知識產權歸屬安排會根據時間順序采用“三段式”的敘述邏輯,即背景知識產權、前景知識產權和改進知識產權。
其中,背景知識產權是指協議一方在履行協議前擁有或取得的技術成果及相關知識產權,前景知識產權是指在雙方合作期間產生的知識產權,而改進知識產權則是指對前景知識產權進行的修改、改編或提升,包括但不限于對前景知識產權相關的功能、性能、部件或模塊的變更等。
在傳統軟件許可協議的談判過程中,以前景知識產權為例,若許可方向被許可方提供目標代碼或源代碼層面的許可,相關前景知識產權的安排一般需要考慮雙方的談判地位。
強勢的一方通常會要求前景知識產權全部歸其所有,在某些情形下可以考慮后續免費或附條件地許可另一方使用。
倘若雙方之間的談判地位相當,則一般會約定由做出實質性貢獻的一方享有相關前景知識產權。
而在AI軟件許可協議中,由于許可標的涉及AI模型,相關前景知識產權在形成與權屬約定方面則與傳統軟件許可協議存在諸多差異。
如上文所述,模型是由訓練程序從訓練數據中歸納出的某種“推理規則”,在此過程中,訓練數據的質量和標注精度對模型的準確性起到至關重要的作用,換言之,訓練程序輸入不同的訓練數據后所輸出的模型也不盡相同。
一般而言,模型的訓練分為靜態訓練(static training)和動態訓練(dynamic training)兩種,因此,模型也分為靜態模型與動態模型。
對于靜態模型,模型訓練好則長期投入使用,而對于動態模型而言,隨著新數據的不斷輸入,通過對這些數據的整合,模型也將不斷進行更新迭代。
(3)AIGC的保護 在傳統軟件許可中,許可方基于目標代碼進行研發或創作的成果一般歸屬于被許可方,例如被許可方利用Word軟件編寫的文檔在構成作品的前提下受到著作權法的保護。
但是,在AI軟件許可中,則面臨關于人工智能生成內容(Artificial Intelligence Generated Content,“AIGC”)可版權性的討論,對該問題的具體分析可以參見我們的上一篇文章《ChatGPT出品:誰是作者?》。
整體而言,在現行法律體系下,AIGC很可能難以通過著作權進行保護,以合適的方式向AI使用者明確告知其享有的相關權益至關重要,例如在AIGC構成作品情況下的著作權歸屬、通過AIGC進行二次創作情況下的相關權益分配等。
(1)“合理使用”的適用困境 根據一般的著作權法理論,“合理使用”是指在特定情況下使用作品,可以不經著作權人許可,不向其支付報酬,但應當指明作者姓名或者名稱、作品名稱,并且不得影響該作品的正常使用,也不得不合理地損害著作權人的合法權益。
這是因為著作權法的立法目的在于通過授予著作權人壟斷權利來鼓勵文學、藝術和科學領域的創作和傳播,但有一些事項在立法者眼中具有更高的價值位階,著作權人的壟斷權力需要讓位于這些事項(例如社會運行過程中對于知識和信息的最基本需求)。
以我國著作權法為例,“合理使用”的事由包括但不限于“個人使用”“適當引用”“在時事新聞報道中使用”“在課堂教學和科學研究中使用”等。
(2)“許可使用”的現實障礙 若AI軟件對作品的使用不構成“合理使用”,則必須取得相關作品著作權人的許可。
但是,對于AI模型的訓練數據而言,確保訓練數據中包含的作品全部獲得作品著作權人的許可在現實中并非易事。
一方面,AI軟件開發者需要花費大量的時間和成本將可能受保護的作品從訓練數據中識別出來;另一方面,針對識別出來的受保護的作品,AI軟件開發者還需逐一地與作品的著作權人進行協商取得其許可,并支付許可費用。
考慮到不同作品許可談判的難度以及AI軟件開發的時效性,在實踐中逐一取得相關作品著作權人許可的可行性可能并不高。
AI軟件許可標的的不同使得AI軟件許可協議知識產權條款的設計應當有特殊的考量,而AI模型本身對數據天然的依賴性則要求協議雙方在協商談判時還應當特別關注數據的使用和權屬、數據安全合規等在內的相關問題。
(1)數據使用 為了不斷提升模型的性能,ChatGPT等AI模型一般還需要使用用戶提供的數據作為模型訓練的新數據來源。
ChatGPT的使用條款規定:我們不會使用您提供給我們的API或從我們的API接收的內容(“API內容”)來開發和改進我們的服務。
API內容僅用于提供和維護我們的API服務。
我們可能會使用API以外的服務內容(“非API內容”)來幫助開發和改進我們的服務[2]。
在《如何使用您的數據來提高模型性能》文檔中,模型開發者進一步明確了使用相關數據的目的:AI模型最有用和最有前途的特性之一是它們可以隨著時間的推移而改進。
我們通過科學和工程突破以及接觸現實世界的問題和數據不斷改進我們的模型[3]。
(2)數據權屬 在AIGC的可版權性成為人們的討論焦點之余,AI相關數據的權屬安排也是AI軟件許可協議中雙方繞不開的話題之一。
正如我們在《數據交易協議:Checklist請收好》一文中所述,總體而言,數據可以分為原始數據和衍生數據。
原始數據是數據采集時提供的、反映客觀事物屬性的記錄,是不經過任何加工、創作或提取、編輯的數據。
衍生數據是指基于特定的商業目的、通過運用一系列技術手段對數據進行篩選、分析、處理從而形成的數據。
AI軟件的使用過程中可能涉及的數據主要有三類,包括模型訓練階段使用的訓練數據以及模型使用階段的輸入數據和輸出數據。
其中,訓練數據又包括原始訓練數據和訓練數據集。
原始訓練數據是指模型開發者直接收集的數據,理論上來說,AI模型接受的訓練數據越多,其自我進化也會更快,但是這種情況必須建立在訓練數據沒有任何錯誤的基礎上。
因此,模型開發者往往會在原始訓練數據的基礎上進行一定的處理,例如數據清洗、數據標注、數據分組等,從而形成高質量和高精準的訓練數據集用于模型訓練。
模型使用階段的輸入數據一般是具體應用場景下的原始數據,例如使用者的個人信息、受著作權保護的作品等;輸出數據即為上文提及的AIGC。
在動態模型訓練中,模型使用階段的輸入數據和輸出數據也有可能成為新的訓練數據以進一步改進模型。
模型開發者為了避免在AI模型實際應用過程中發生訓練階段無法預期的事件,可能會要求將使用階段采集的數據作為訓練數據來生成新的精度更高的模型。
AI模型訓練、應用中涉及大量的數據,從行業維度來看,這些數據可以分為金融數據、交通數據、自然資源數據、衛生健康數據、科技數據等;從數據載體維度來看,這些數據可以分為音頻數據、視頻數據、圖像數據、文字數據等;而從數據主體維度來分,上述數據又可以分為個人數據、企業數據和公共數據等。
在AI模型訓練和后續的許可中,無論是許可方還是被許可方,均應當特別注意數據的來源合規問題。
此外,在確保數據來源合規的前提下,雙方還應當就如何使用相關數據,使用相關數據所應當采取的安全保護措施等進行明確約定。
(1)數據來源合規 考慮到在AI軟件許可協議中,數據的使用場景主要包括模型訓練階段對訓練數據的使用以及模型使用階段對輸入數據的使用,且模型使用階段收集的數據后續也可能成為新的訓練數據,因此,無論是對于許可方還是被許可方,均應當確保自身使用的數據具有合法來源。
一般而言,對于AI模型而言,獲取數據的方式主要包括數據交易、自行采集和開放數據爬取。
數據交易是指通過合法的交易方式從數據提供方處獲取相關數據,自行采集是指通過APP、傳感器、相機等方式直接采集數據,開放數據爬取則是指通過數據爬蟲等方式獲取開放的數據。
對于數據交易和自行采集兩種獲取方式而言,最重要的是要確保如何取得相關數據權利主體的授權。
而對于開放數據爬取而言,則更應當關注數據爬蟲行為本身是否合法,例如爬蟲所采取的技術手段是否突破數據訪問控制、數據爬蟲的使用目的是否正當等。
對于許可方而言,例如,在收集和使用個人數據進行模型訓練時,可能存在的風險包括但不限于侵犯人格權和個人信息權。
《中華人民共和國民法典》第一百一十條規定:“自然人享有生命權、身體權、健康權、姓名權、肖像權、名譽權、榮譽權、隱私權、婚姻自主權等權利。
”第一百一十一條規定:“自然人的個人信息受法律保護。
任何組織或者個人需要獲取他人個人信息的,應當依法取得并確保信息安全,不得非法收集、使用、加工、傳輸他人個人信息,不得非法買賣、提供或者公開他人個人信息。
”《中華人民共和國個人信息保護法》第二條規定:“自然人的個人信息受法律保護,任何組織、個人不得侵害自然人的個人信息權益。
”以個人信息為例,除法律另有規定,許可方只有在取得個人信息主體同意的前提下才能處理相關個人信息。
在該等個人信息來源于其他第三方的情況下,許可方至少還應當要求相關個人信息的提供方保證其提供的個人信息獲得了個人信息主體的同意。
(2)數據安全保護 由于AI軟件的云計算和云部署等特點,在AI軟件許可協議中,許可方的數據安全保護能力往往是被許可方關注的重點。
如前文所述,在AI模型的使用階段,其會采集各行業領域的不同類型的數據,這些數據中可能包括敏感個人信息,國家重要數據等對安全保護有特殊要求的數據。
以自動駕駛為例,智能駕駛汽車上集成的攝像頭、激光雷達、導航儀等各類傳感器,每時每刻都在收集車主本人、乘車人、駕駛人等的個人信息、車輛的環境信息以及車輛行駛信息等。
根據《汽車數據安全管理若干規定(試行)》,車輛行蹤軌跡、音頻、視頻、圖像和生物識別特征等信息屬于敏感個人信息,而軍事管理區、國防科工單位以及縣級以上黨政機關等重要敏感區域的地理信息、人員流量、車輛流量等數據、汽車充電網的運行數據等則屬于重要數據[4]。
若汽車數據處理者對收集的上述數據進行不當使用,將可能導致個人信息主體的人身、財產安全以及國家安全受到損害。
對此,法律法規規定汽車數據處理者在處理敏感個人信息時,應當符合特定要求,例如應具有直接服務于個人的目的,包括增強行車安全、智能駕駛、導航等;在處理重要數據時,應當按照規定開展風險評估并形成風險評估報告、報送汽車數據的安全防護和管理措施,包括保存地點、期限等[5]。
因此,在AI軟件許可協議中,被許可方應當要求許可方對數據的采集、存儲、使用、傳輸等各方面均采取充分的數據安全保護措施,防止數據被竊取、濫用、篡改或毀損,并對可能因數據安全問題導致的責任承擔進行明確約定。
此外,在AI軟件許可領域,由于許可方很有可能是境外主體,在該等情形下,數據出境可能引發的數據安全相關問題應當引起被許可方的特別關注。
倘若在使用AI軟件過程中確實涉及數據出境,被許可方應當在協議中明確要求許可方遵守數據出境的合規要求和履行數據出境申報義務。
例如,被許可方可以在協議中要求許可方承諾其對相關數據的使用應當遵守中國關于數據出境的相關法律法規。
IP賦能NFT,平臺與版權方介紹
目前我國的數字文創作品,或稱為數字藏品,從創建到發售的主要環節包括設計、鑄造、上鏈、平臺展示及銷售。
結合實務中NFT平臺的聯名企劃方案、發行方協議、在售數字文創作品描述等,從經營、開發和盈利的角度而言,目前NFT平臺與版權方的合作流線大致如下:
NFT平臺與版權方的合作流程一覽 根據NFT平臺對于其上流通的數字文創產品的決定權,NFT平臺的經營模式可以分為“平臺準入”模式及“自由入駐”模式。
平臺準入模式下,NFT平臺上展示及銷售的數字文創作品都經由平臺方參與設計、鑄造等前期工作及最終確認后上架,對于版權方而言,其通常并不享有自由上傳內容、鑄造及發行和/或銷售數字文創作品的權限。
而該等模式下,數字文創作品發售方如何認定則具體取決于版權方和NFT平臺之間的約定,往往可以僅是版權方,也可以是NFT平臺或由版權方與NFT平臺聯合發售。
與平臺準入模式相比,自由入駐模式下,NFT平臺在其中的角色簡化為交易場所和相關網絡服務的提供者,版權方可以自行在NFT平臺上鑄造、展示及銷售數字文創作品。
國外的實踐中,部分平臺允許用戶上傳圖片、音樂、影像甚至游戲用交易卡等自行制作NFT作品并發售,例如OpenSea等,而從我們目前的觀測來看,在已經有原始作品的情況下,我國目前主流的NFT平臺還是采用平臺準入模式居多,版權方與NFT平臺達成合作意向也因此成為發售數字文創作品的基石。
根據NFT平臺的參與深度及權限,NFT平臺開發數字文創作品的模式可以分為簡單授權模式、全方位運營策劃模式與作品孵化模式。
(1) 簡單授權 簡單授權模式下,NFT平臺往往獲得的是基于原始作品鑄造及發售數字文創作品的權利,例如將現實畫作通過數字技術生成3D模型復制品并在平臺指定的區塊鏈上生成唯一對應的虛擬憑證進行標識,之后在平臺上展示、發售該等數字文創作品,或者針對版權方指定的、特定范圍內的內容直接生成相應的NFT作品。
同時,還存在版權方授權NFT平臺以原始作品的素材、標志、片段、元素等為基礎進行二次創作,再將新作品鑄造為數字文創作品并于平臺發售的合作模式。
簡單授權模式多見于NFT平臺與政府部門、博物館、私人收藏家就特定的旅游地標、文物、知名藝術品等打造數字文創作品,相較于強調加工創作、藝術設計,這一類的合作往往更加注重在虛擬空間還原、呈現原始作品。
(2) 全方位運營策劃 全方位運營策劃模式在簡單授權模式的基礎上賦予了NFT平臺針對數字文創作品更多的代理運營權限。
該模式下,NFT平臺除了負責前述數字文創作品的鑄造、發售及交易行為相關的日常運營外,還有權代理版權方就前述數字文創作品進行商業洽談、開展推廣宣傳活動等。
相較簡單授權模式下NFT平臺僅被授權鑄造、發售數字文創作品、無法就數字文創作品進行再開發,全方位運營策劃模式中,在獲得版權方充分授權的前提下,NFT平臺可以就原始作品的二次創作、數字文創作品的設計、線上玩法與線下場景等進行策劃和執行。
該模式更適配于對數字文創作品的推廣宣傳、商業合作有更高需求和接受度的版權方及具備相應商務資源的NFT平臺。
(3) 作品孵化 無論是簡單授權模式或是全方位運營策劃模式,數字文創作品通常依賴于版權方既有的、成熟的IP內容,例如影視劇或文學作品、音樂、游戲、動漫,或畫作、雕塑等藝術品。
與之相對,也有從“0”打造數字文創作品的模式,NFT平臺與掌握一定IP內容的版權方或是具有設計創作能力的創作者共同“孵化”數字文創作品。
與前兩種模式相比,該等作品孵化模式下,版權方很可能是僅能提供商標、品牌標識等元素的企業,或者是具有原創能力的作者個人,但對于如何將該等元素或原創能力生成數字文創作品以及后續的全鏈條運營,則需要NFT平臺提供從策劃方案到落地執行的“一攬子”服務。
相應地,NFT平臺需要獲取的權利范圍也會顯著擴大,一方面,NFT平臺自身由于加入了“創作孵化”,很可能兼任版權方及發售方的角色,同時對于數字文創作品享有更大的運營權限。
另一方面,不僅限于作品本身,NFT平臺還可能享有圍繞作者所展開的一系列經紀代理權限,例如安排、管理作者的線上、線下各類商務合作活動等。
NFT平臺與版權方就合作發售數字文創作品所涉及的費用(以下簡稱“合作費”)通常包括基礎費用以及基于發售數字文創作品所得收益的分配(以下簡稱“收益分配”)。
基礎費用方面,NFT平臺往往需要針對生成、運營數字文創作品獲得版權方的授權向版權方支付相應的授權費,授權費的金額一般與IP內容的價值、授權范圍等相關。
同時,版權方應就委托NFT平臺將原始作品鑄造上鏈生成數字文創作品并于平臺展示、發售向NFT平臺支付一定的服務費,服務費一般是按照技術服務的固定收費標準計算。
如果版權方提供給NFT平臺的原始作品涉嫌侵犯他人權益,包括但不限于因版權方未獲得授權或超越授權范圍導致的情況,復制、改編該等原始作品及發行、銷售因此形成的數字文創作品可能侵犯權利人的復制權、發行權和信息網絡傳播權等權益,NFT平臺不僅會面臨權利人的投訴和索賠,還可能需要召回已售出的侵權數字文創作品并向消費者承擔賠償責任。
更多關于 ChatGPT許可應用,知識產權和數據講解,IP賦能NFT,平臺與版權方介紹 的資訊,可咨詢 樂知網。
(樂知網- 領先的一站式知識產權服務平臺,聚焦 專利申請,商標注冊 業務)。
關鍵詞: 發明專利申請 專利代理 ?