專利信息學:任務與工具,專利分析及其應用
專利代理 發布時間:2024-02-23 10:11:27 瀏覽: 次
今天,樂知網律師 給大家分享: 專利信息學:任務與工具,專利分析及其應用。
專利信息學:任務與工具
專利信息學是一門應用科學,科學技術的日新月異已大大豐富了它的研究手段和應用范圍。
專利信息分析的過程,就是在準確把握分析目的的基礎上,利用各種方法完成所設定的一系列任務,并最終獲得所需情報的過程。
本文將就專利信息分析中通常需要解決的一些任務,以及可以幫助和支持完成這些任務的分析工具作一概述。
一、專利信息分析的任務 為了獲得最終的分析結果,專利分析員往往需要完成各種不同的任務。
總的來說,專利信息分析過程中常見的任務包括: 1。術語的清理與分組,即手工或自動對所分析的數據中的各種術語進行標準化。
例如更正拼寫錯誤,將表達類似概念的同義詞或近義詞歸類為一組等。
這樣做的目的是為了獲得準確的統計結果,以真實反映某個術語或某項信息在整個數據組中的重要程度。
2。繪制直方圖,即對各個數據組中與專利相關的各種量度(例如專利申請量、專利授權量等)進行記數。
這樣做可以對同一數據組中的兩個或多個量度的結果進行統計學對比。
3。繪制曲線圖,即將數據分置在X軸和Y軸上,既滿足X軸條件又滿足Y軸條件的交叉點的數據就是矩陣中的一個個數據。
完成這項任務可以使我們了解兩個或多個信息之間的相關性,以及相關性的強弱。
在比較不同的數據項,例如專利權人和申請年或技術主題(例如可以用專利分類號表示)之間的關系時,這種類型的分析是非常有用的。
如果將專利權人情況表現在Y軸上,將申請年表示在X軸上,就可以迅速地看出各個公司各年的專利申請趨勢。
4。對結構化(域化)數據進行聚類分析。
當數據被標引或被包含在某一個數據域中,稱之為被結構化。
數據的結構化并不能由作者寫作時自動完成。
按照某種規則設定的分類系統可以產生標準化的編碼,這些標準化編碼可以用作對具有類似編碼結構的文獻進行組織的工具。
聚類有時候也稱之為聚集,即以一種系統化的方式來歸置大量文獻。
例如將所有關于開關的文獻集合在一起,而將關于插座的文獻集合在另一個地方。
這種分析方法的原理是基于文獻的構思,彼此之間具有相同編碼的百分比越高,文獻的內容越可能相近。
5。對未結構化的(文本)數據進行聚類分析。
未結構化的文本是指沒有被標引到各個數據域中的文本,它們唯一的結構就是作者寫作時將不同的詞連成句子、再將句子組成段落……,如此而形成的結構。
這種類型的數據對于專利分析員來說極具挑戰性,因為專利文獻的作者可以自己造詞,只要他能在說明書中向專利審查員清楚地解釋出該詞的含義即可。
對未結構化的數據進行聚類分析,就要對原始文本進行加工,以識別出其中的概念和術語。
與結構化數據的分析一樣,用編碼代替其中的概念和術語,然后按照編碼相似的程度將文獻分組。
同樣,彼此之間編碼的相似度越高,文獻的內容越接近。
6。將文獻集合作圖,即將聚類分析獲得的一個個文獻集合排列在一個二維空間中,獲得一個二維圖像。
在圖形中,包含有共同元素的文獻集合被排列在更為接近的位置,而相似性不太高的集合則被放置在較遠的地方。
這種方法使得分析結果可視化,從圖中可以清楚地看出不同文獻集合之間的關系。
7。繪制三維圖像,既在上述二維圖像中再加入一個時間維度。
加入時間維度時通常利用不同的顏色來表示。
當用不同的顏色來表示不同的年份時,分析員可以通過不同顏色在圖中的走向或變化來追蹤某項分析主題的進展情況。
8。引證分析。
當我們閱讀專利文獻時,會在其檢索報告或是扉頁上看到相關的在先技術的信息,這些就被稱作專利引證。
可以對引證的次數進行計數,或者按照引證關系將相關文獻聚集在一起。
通過查看這些文獻是按照怎樣的引證歷史而聯系在一起的,就有可能獲知早期的技術是如何隨著時間而不斷進化發展成新的技術和專利的。
有時候會采用雙向引文樹來顯示彼此引用的專利之間的關系。
引證數可以用來揭示潛在的核心專利。
9。主題/功能/目的(SAO)分析。
SAO是專利文獻的作者用來描繪想要給出的教導時所采用的語言的一部分。
關鍵的SAO中包含了文獻中給出的技術知識。
SAO也可以稱為是問題/解決方案。
例如,“清潔雙手用的肥皂”這一陳述中包括了主題(肥皂)、功能(清潔)和目的(手)。
通過確定SAO,可以從文獻的其它部分分離和檢查出文獻給出的有用的教導。
二、專利信息分析工具 上文中提到的專利信息分析過程中的各種任務往往需要借助一定的分析工具才能夠完成。
這些工具可以大致分為三類:軟件,它們可以在公司內部服務器或者是客戶的個人電腦上運行;資源,即提供靜態統計分析結果的印刷品或參考資料;和網站,它是由外部服務器驅動的分析設備,用戶一般按月或年度購買使用權限。
下文將就常用的一些分析工具進行綜述。
(一)軟件: Aureka IPAM Aureka IPAM 系統是Aurigin公司 最成熟的專利分析系統。
IPAM是“知識產權資產管理”的縮寫,應用這套系統可以組織和管理知識財產(不僅僅是專利,還包括各種公司文件)。
該系統包含的專利分析工具是智能知識財產管理的一部分。
這套系統具有很強大的功能,很高的兼容性和安全性(因為它是安裝在公司的防火墻后面的),但是使用這套系統的花費相當高。
Aurigin 在它的平臺上預裝了專利數據,這些數據來自四個主要的專利授權機關(美國、歐洲、日本和WIPO),并且包含一個用于查找相關文獻的搜索引擎。
專利數據定期更新,檢索得到的文獻可以儲存,創建成若干組以備進一步分析之用,也能和其它同事共享。
Aureka平臺的另一個優點是能對專利文獻進行注釋。
由于Aurigin是從SmartPatents公司起家的,所以用戶能夠通過這套系統實現SmartPatents所有的注釋和瀏覽功能。
作為一個集成化的系統,Aureka平臺的兼容性很好,它能兼容很多其它的應用軟件。
Aurigin與一些優秀的分析軟件公司合作或合伙,并將這些公司的軟件集成到了Aurigin的管理系統之中。
Aureka 系統集成的分析軟件中有一個是ThemeScape主題文本挖掘工具。
它最早是由一家叫Cartia的公司進行市場開發的, Aurigin公司在2000年收購了它,并將其集成到Aureka平臺中。
ThemeScape 采用一種構思繪圖法來生成技術分布地形圖。
該程序能讀取文件全文,通過提及的頻率來確定主題,并通過對這些主題的同現情況進行分析,應用聚類運算將這些文獻重組。
在一張ThemeScape地形圖中,每篇文獻用一個黑點代表,高峰表示某一特定主題下集中了大量文獻的聚類;圖中兩篇文獻距離越近,表明它們的主題相關度越高。
ThemeScape是一種文本挖掘工具,同時也具備一些數據挖掘功能,這增強了系統進行聚類分析的能力。
根據用戶需要,你可以在一張專利地圖中確定一個具體的專利權人。
這用小白點的形式表示,可反映出該專利權人正從事的開發領域。
系統中的Aureka引文樹軟件(Aureka Citation Tree)是平臺中的另一項重要分析工具。
該工具獲得InXight的授權,這項技術引入了一個雙向樹狀圖瀏覽器。
引文樹工具能利用美國專利數據中的引證信息創建出一個雙向引文樹。
選擇某篇美國專利,把它看成樹根,向前的一級級引用可以形成若干樹枝。
向后引用同樣也可形成這種樹狀形式。
用戶可以按照申請人、公開日期、發明人等不同內容來構建引文樹,也能按照日期或者專利權人信息給樹干著色。
對某一篇美國專利來講,通過引文樹可以快速了解該專利的引用歷史。
不過該軟件有一個缺陷,即獲得的引文樹的樹干都是直線形式的,因此無法看出某一級和下一級引用文獻之間的交叉關系,因而無法觀察到整個引文鏈的全貌。
此外該軟件僅適用于美國專利數據。
Aureka 系統中還有一個生成報告的工具,它能對專利數據進行各種統計分析。
報告模式可以分成三大類:n 關鍵信息摘要報告(Key summary report)。
此類報告就某一特定領域的信息要素形成排名前十的統計分析,比如某技術領域專利申請量排名前十位的專利權人或發明人等。
詳細報告(Detailed report)。
這類報告中包括一系列對不同主題進行分析后得到的文本式的子報告,比如發明過程分析、引證分析、發明人和專利權人分析、矩陣分析(比如IPC分類與專利權人的組合)報告等。
要點圖表式報告(Pivot tables)。
這是功能最強大的報告模式,它是根據專利權人、發明人、美國專利分類、引證關系和其它一些信息要素做出來的。
收集到上述信息要素后,分析員可將其輸出到Microsoft Excel中,據此作出各種圖表,并進行深入的分析處理。
對分析人員來講,幾乎所有的專利著錄項目都能用來合并、組合、匹配到一張要點圖表里。
用這種方式,可以進行各種極為復雜和出色的分析。
關于該系統的更多信息可登陸網站:http://www。micropat。com/static/aureka。htm。
ClearForest ClearForest系列軟件是ClearForest公司的產品,它們是非常強大的文本挖掘工具。
大多數文本挖掘工具從進行主題詞提取開始,即利用該過程從文本中挑選出相關的主題詞,并將它們提取出來用于后續的分析。
主題詞提取類似于過去那種創建一個全文本的、反向索引的特定文件的過程。
主題詞一旦從文本中提取出來后,就可以各種方式進行分析。
信息提取比主題詞提取更加深入,它不僅要挑選出主題詞,而且隨后還要自動地將它們分到預定義的類別中。
它是基于未經加工的文獻工作的,這些文獻中沒有特別標記出發明人或專利權人信息。
信息提取技術能分析這些未經加工的文獻,并且自動提取和分類有關信息,比如人名、它們的職務、所在公司以及其它一些特征。
ClearForest 開發了兩個不同的軟件來處理信息提取工作,它們是ClearStudio 和 ClearLab。
ClearStudio界面友好,能夠讓用戶快速設定自動將信息分類的語言關聯規則。
ClearLab 也允許創建關聯規則,但它的界面使用的是C++語言,是針對熟悉這種程序語言的用戶而設計開發的。
ClearForest系列軟件的第三部分叫做ClearResearch。
這一軟件能對經過分類的信息進行分析,其中包括很多不同的分析功能。
最強大的一個功能是可應用圓圈圖來顯示一類信息與另一類信息之間的關系。
比如說,可以將一組文獻中提到的所有公司分成一類,假設左邊的圓圈顯示的是技術主題,右邊的圓圈代表公司名稱。
他們之間不同粗細的連線代表該家公司與該技術主題之間的關聯情況。
連線的粗細和顏色反映了基于所涉及的文獻總量計算出的關聯強度。
雙擊一條連線,用戶就能看到相應的專利文獻。
雙擊某個技術主題或公司名稱圓圈的邊緣,就會打開一個新的窗口,被點擊的項目列在窗口的中間,其余相關內容顯示在它的周圍。
例如,點擊一個公司名會產生一個新窗口,這個公司名出現在窗口中央,與該公司有關的技術主題則顯示在周圍。
右鍵單擊窗口中的某一項技術主題,就會出現一個顯示了上下文的菜單,分析人員可以針對能得到的任何一類信息作進一步的劃分。
以這種方式,人們可以利用與之關聯的相應技術主題將公司的發明人分類。
ClearForest系列工具包含許多強大的文本挖掘功能,目前該公司也對其軟件進行了整合,新的ClearForest文本分析平臺主要由兩部分組成:先進的文本標記和分類引擎(ClearForest Tags)和文本分析系統(ClearForest Analytics),更多信息可登陸網站:http://www。clearforest。com/。
VantagePoint Search Technology公司的產品VantagePoint是一種數據挖掘工具,主要是對數據域內的各種項目進行統計分析。
如果該數據域里含有書面文本的話,該軟件也能應用某些自然語言運算法則進行主題解析。
該軟件所使用的數據由用戶直接向數據供應商購買。
用戶利用數據供應商提供的搜索引擎進行檢索,并將檢索結果下載到用戶的計算機上,然后借助導入編輯器將這些數據導入VantagePoint并進行解析。
幾乎任何來源的域化數據都可被準確地解析并導入到系統中以備分析之用。
用域化的數據生成了一個數據庫后,該系統可使用軟件進行數據清理。
VantagePoint提供了一個數據清理工具(Data Cleaning Tools),它應用模糊邏輯法則幫助用戶合并某些相似項目。
在清理公司名和發明人名稱時,常常使用這一功能。
好的統計分析需要好的準確的數據,VantagePoint的數據清理功能能夠使得原本耗時費力的工作變得更加容易,例如它可以自動處理拼寫錯誤、大小寫、連字符、不同拼寫習慣等。
VantagePoint使用的主要統計方法是交叉矩陣。
Y軸顯示一類信息,X軸顯示另一類信息。
矩陣中的數字表示同時具有X和Y軸相應特征的專利的數目。
點擊該數字單元會出現一個相應專利文獻的標題列表。
含義相同的項目可以歸為一組,并將其與矩陣中的另一組項目作比較。
例如,機構可以按照它們的一般屬性分為企業、政府部門或教育科研單位等。
用戶可以據此比較分析某特定關鍵技術領域中不同類型機構擁有的專利數量。
使用交叉矩陣,該系統也能對任何項目的主要構成作進一步分解,從而生成要素地圖。
該系統還能根據預定指令自動選取并把矩陣表導入Microsoft Excel中,進一步生成三維圖、線形圖和其它各種各樣的圖表。
該軟件的更多相關信息參見網站http://thevantagepoint。com。
Invention Machine Invention Machine系列產品是由Invention Machine Corp。公司開發的一系列用于幫助進行計算機輔助發明設計的應用軟件,其中在專利分析方面最相關的兩個產品是Co-Brain 和 Knowledgist。
這兩個軟件都是用于實現從全文數據中提煉主題/功能/目的(SAO)函數的。
該公司將這一分析方法稱之為問題/解決方案法。
這一方法是基于以下觀念:專利是指導閱讀者如何解決一個實際問題的。
我們將主題和功能看作是解決方案,將目的看作是問題。
舉例說,如果目的是洗凈衣服,解決方案就可能是用肥皂洗——正如功能和主題揭示的。
一旦該軟件從文獻中提煉出了主題/功能/目的函數,它就可以將問題和解決方案聯系起來,將類似的問題歸到一起,以便用戶可以對比解決同一問題的不同方法。
這兩個軟件的區別在于應用范圍和處理能力。
Knowledgist針對個人臺式電腦設計,可以使用個人數據庫,而Co-Brain為公司服務器設計,可以充當公司信息入口。
這兩個系統都附帶有同義詞處理工具,可大大減少生成的問題/解決方案組的數目,并極大地提高系統識別解決同一問題的兩個不同解決方案的能力。
這兩個軟件經常會創建出通過上下滾動列表都難以瀏覽的很大的問題/解決方案函數。
為了幫助確定相關函數,用戶可以使用一個搜索按鍵快速地找到問題或解決方案。
有關細節可瀏覽具體網站:http://www。invention-machine。com/。
BizInt Smart Charts BizInt Smart Charts for Patents是BizInt公司開發的用于專利方面的產品,這是一種用于專利文獻圖表制作的軟件。
該軟件允許用戶使用來自STN、Derwent、IFI、Dialog上的化學文摘庫的專利數據,并生成由其得到的信息圖表(包括許多種內置圖像形式)。
系統可以簡便地定制各種圖形,并有多種存儲和輸出選擇。盡管該軟件本身并不是一個文本或數據挖掘工具,但它能很好地將用于終端用戶的專利數據標準化。
生成的圖表可以根據用戶需求變化,甚至可以在其中加入幾欄來記錄同一分析項目 起工作的同事所作的注釋。
有關詳細信息可瀏覽具體網站:http://www。bizcharts。com/patents/index。html。
OmniViz Battelle的SPIRE是最早提供文本挖掘和可視化軟件包的公司之一。
SPIRE研發隊伍中的一些成員后來離開建立了Cartia公司。
Cartia生產前文中介紹過的ThemeScape軟件。
Battelle的另一組科學家認識到SPIRE技術不僅可以用于直接進行文本挖掘,而且開始將該軟件應用于生物和化學數據。
這項工作再次剝離出來,創建了另一家新的公司:OmniViz。
就核心部分,OmniViz與ThemeScape有很多相似之處,但OmniViz的技術人員在Cartia/Aurigin所做工作的基礎上又作了大量改進。
在文本挖掘方面,OmniViz可以導入多種不同文本格式的文獻,還可以風格化和識別已著錄的文本。
當分析人員在選擇想要用于進行聚類分析的那部分文獻記錄時,該系統可以區分該文本的關鍵內容,例如發明人、專利權人、發明名稱、摘要,公開年份等。
OmniViz系統可以識別這些不同信息項,題目和摘要可用于進行聚類分析,其余信息項可以用于獲得令人感興趣的圖表,諸如基于類似的發明標題和文摘,哪些專利權人擁有類似文獻,或者在哪些年份公開了哪些主題。
以前人們也可進行一些這樣的分析,但都不如OmniViz做得深入和方便。
OmniViz可以對來自生物學、化學和文本原始資料的數據進行整合分析并從中發現趨勢的能力使其成為一種獨特的工具。
它能讓生物學家對大量的細胞檢測數據進行分析,例如,找出具有類似試驗結果的候選藥物,即使這些候選藥物在結構上有很大差異。
該系統還允許將兩種或多種具有共同要素的分析關聯起來。
這可以使分析人員利用一種類型的數據源和分析方法來發現趨勢,同時利用一種相關的數據源和方法來觀測是否有類似的趨勢出現。
例如,設想某一項分析顯示了對于某種目標酶均具有活性的幾類分子。
對基于其化學相似性進行了分類的候選藥物的關聯分析顯示,有兩種可能的抑制劑具有類似結構,而第三種結構很不同。
于是對含有所述候選藥物的各類專利和非專利文獻增加一個三項關聯聚類分析。
由于三種分析都聯系起來了,因此可以容易地發現這兩種相似化合物已實際上被數篇相關專利覆蓋,而第三種化合物在非專利文獻中提到了。
了解具體信息可登陸網站:http://www。omniviz。com/。
Thomson Data Analyzer Thomson Data Analyzer是湯姆森科技公司在Thomson Derwent公司之前成功開發的一款專利分析軟件Derwent Analystics的基礎上后續開發的。
它是一款適于在臺式電腦上使用的專利分析軟件,依托 VantagePoint作為技術支持,具有較為強大的數據挖掘和可視化功能。
Thomson Data Analyzer可以針對來自Dialog、STN、Questel。Orbit、Delphion、Aureka等的多種專利數據進行分析,例如業界最權威的世界專利索引數據庫(Derwent World Patent Index(DWPI))數據、Aureka和Delphion的全文專利數據。
此外,借助導入編輯器(Import Engine Editor),該軟件還可以導入任何結構化的數據進行分析。
Thomson Data Analyzer的使用界面友好直觀,它將VantagePoint最新功能和眾多高質量專利數據結合在一起,可以滿足專利分析的多種需要。
此外,它還具有多種輸出選擇,其分析結果甚至可以輸出到其他應用軟件,例如Aureka(包括ThemeScape)、Mircosoft Office和BizInt Smart Charts等中做進一步的分析,有關詳細信息可以瀏覽網站:http://scientific。thomson。com/products/tda/。
INAS INAS(Information Analysis System)是韓國WinsLAB株式會社開發的專利分析軟件,由專利信息分析系統(INAS)和專利信息下載系統(PatentGet)兩部分組成。
它具有多種數據入口,特別是利用其專利信息下載系統可以從包括美國、歐洲、日本等國家的免費專利數據庫和中國專利檢索數據庫免費自動下載專利數據,然后直接應用到其專利信息分析系統中。
INAS系統依據專利地圖理論研發而成,可以進行定性和定量兩種分析。
定量分析主要用于對專利文獻扉頁上的著錄項目進行不同的組合分析。
定性分析則首先需要對專利文獻的技術內容進行標引后,再進行矩陣分析、時間趨勢分析等。
分析結果可以用圖表顯示,方便、直觀。
專利分析及其應用
一、專利分析的概念 專利分析,是指從專利文獻中采集專利信息,通過科學的方法對專利信息進行加工、整理和分析,轉化為具有總攬性及預測性的競爭情報,從而為企業的技術、產品及市場開發中的決策提供參考。
專利分析通常按以下程序進行: 1、準備期 專利分析首先要確定分析目的。
根據分析目的(比如分析競爭對手、分析行業技術、分析特定技術等)的需求,收集背景資料,選定分析工具(分析軟件)、選擇專利信息源。
2、分析期 在準備的基礎上,進行數據采集和數據分析。
數據采集包括確定專業領域,擬定專利檢索策略,進行檢索和修正,以及分析樣本數據庫。
分析包括數據清洗,按專利指標聚集,生成工作圖表,生成深度分析目標群,分析與解讀以及撰寫分析報告。
分析方法包括定性分析、定量分析、擬定量分析、圖表分析等。
3、應用期 應用期包括對分析報告進行評估、制定相應的專利戰略和實施專利戰略。
二、專利分析的作用 1、把握相關領域的技術狀況 專利文獻是技術資料的寶庫。
據世界知識產權組織的統計,全世界發明成果的90%以上會出現在專利文獻中。
通過對相關產業和技術領域的專利技術進行檢索和分析,能夠把握相關產業和技術領域的整體狀況(包括重點技術現狀)和發展趨勢,明確行業技術創新熱點及專利保護特征。
2、了解相關企業的技術活動 專利制度是被廣泛認可的保護自主創新的有效方式。
大多數企業通常會將自己開發出的技術盡早申請專利以求得以保護,企業的技術路線,技術布局必然會體現在其專利信息中。
通過對企業的專利信息進行分析,便可以了解其技術活動及其戰略布局。
3、了解競爭對手動向 互為競爭對手的企業必然處在相同或相近的技術領域,通過對該技術領域的專利信息進行分析,不僅可以發現現實的競爭對手,挖掘潛在的競爭對手,還可以通過對競爭對手在不同國家的專利文獻進行分析,了解其在不同國家、不同地域的市場經營活動,競爭企業間的技術合作、技術許可動向等。
4、了解人才分布 通過對專利文獻中的發明人信息進行分析,可容易的找到該領域的技術專家,并可以了解到這些技術專家在技術上的側重點。
5、預測新產品新技術的市場情況 專利文獻記載著目前最先進的科學技術。
據世界知識產權組織統計,同一發明成果出現在專利文獻中的時間要比出現在其它媒體上的時間平均早1~2年。
通過對專利文獻信息進行分析,可以預測新產品、新技術的推出,以及相關國家的市場分布和規模等。
6、為企業的研發、投資、兼并決策等提供依據 通過對相關領域的專利文獻信息進行分析,可以了解相關領域的技術發展現狀和發展趨勢,可以為企業決策者把握特定技術的開發、投資方向、兼并收購等決策提供依據。
7、為建立企業專利數據庫指明方向 通過對相關領域的專利信息進行分析,并結合企業自身的發展現狀和發展目標,確定合適的技術領域,確定合適的目標跟蹤對象,為建立符合企業特色,又符合行業發展趨勢的專利數據庫指明方向。
8、為制定企業專利戰略提供依據 專利信息不僅包含著大量的技術信息,還含有大量法律和經濟的信息,仔細分析和科學利用這些信息,可以為企業制定專利戰略、企業發展戰略乃至市場戰略等競爭戰略提供依據。
三、專利分析案例 專利分析會根據不同的目的確定不同的分析方案。
下面通過日本東海公司打火機相關專利分析情況,說明如何利用專利數據了解該公司的技術發展特征和趨勢。
更多關于 專利信息學:任務與工具,專利分析及其應用 的資訊,可咨詢 樂知網。
(樂知網- 領先的一站式知識產權服務平臺,聚焦 專利申請,商標注冊 業務)。
關鍵詞: 發明專利申請 專利代理 ?