[閒聊] 一技術描述與 多專利請求項1的相似度

作者: ides13 (juso)   2020-07-05 15:14:16
分享一個“找出「一技術描述」與 「多個專利請求項1 」間的相似度”的程式。
https://reurl.cc/9EmGQn
1、要使用這支程式,建議安裝,anaconda python。並且,需要gensim 套件。
2、功能:找出「一個技術描述(sentance1)」,與 「patentlist 中各專利請求項1 」間
的相似度。
3、此程式的使用方式如下:
#sentance1 指的是一個技術的描述,最簡單的方法就是一個發明的請求項的記載方式。
#patentlist 提供想要比對的美國專利書號碼,例如['US7654301B2', 'US7654300B2',
'US7654329B2']。
4、改變上述要點3中的變數sentance1及patentlist並執行後,會得到
claim_similarity.txt的文件,打開該文件後,可以得到相似度的計算值,如最後所述。
5、結果:如果把一件專利的不同組的請求項,當作sentance1時,相似度會達0.9以上。
因此,此方法有實用上的「可能性」,但實際上效果可能沒有很好,需要再優化。目前,
我把它當作閱讀順序的排序,覺得滿好用的。
如果顯示0的值,表示沒有爬到該專利的內容。
目前只能從google專利資料庫中爬到美國專利的內容。
與US5419973A間的相似度 = 0
作者: kaikai1112 (骨髓捐贈match也是種緣份)   2020-07-06 10:21:00
感謝分享
作者: airrooco (批批踢三星級潛水伕)   2020-07-08 08:31:00
不明覺厲 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com