
語義檢索的出現,開辟了專利信息檢索逐步向更加智能化和人性化發展的方向,用戶只需簡單的輸入一個你想到的檢索主題,數據庫就會自動檢索出全部你所希望的數據。
語義檢索又稱概念檢索,是根據用戶的檢索需要輸入關鍵詞(也可以是一篇文章、一段話、一個句子、一個短語或者單詞),系統就自動完成檢索概念分析,檢索出與之切實相關或者內容相似的專利數據。在用戶得到的檢索結果中,不僅僅包括檢索式中限定的內容,而且還包括了語義系統所聯想到的相關知識。如:檢索“沙發”時,可以同時得到包含“舒適的椅子”、“海綿靠背”、“軟墊椅”等概念的檢索結果。
TRS“專利信息語義檢索”解決方案
TRS專利信息語義檢索解決方案是在TRS CKM文本挖掘軟件和TRS Database Server全文數據庫系統的基礎上構建,實現全文檢索和語義檢索的集成、方便實現語義檢索的結果統計分析的目標,為用戶提供更為智能、快捷的檢索服務。
TRS專利信息語義檢索解決方案可以根據輸入的關鍵詞、句子、文章、PN號等信息,采用語義算法實現對專利數據的檢索。檢索結果包括:符合檢索需求的檢索結果集、檢索記錄的相應相關度分值,結果數量可以根據需要選取,它是專利全文檢索和語義檢索的集成。
功能:
1、 相關度排序
根據申請文件的主題內容,從海量文獻中,找到與目標文獻相關的文獻集;根據用戶輸入的關鍵詞集合,從海量文獻中,找到最能反映關鍵詞集合主題的文獻集。
2、 自動聚類
將最相關的文獻,進行自動聚類處理,有利于檢索結果能夠被劃分為幾個技術領域和技術分支,便于用戶更快的確定目標文檔集合,提供瀏覽導航,減少閱讀的文摘數量。
? 基于專利內容的自動聚類, 性能指標:單用戶時每分鐘執行聚類5000篇,到達8個并發用戶時,每分鐘執行聚類20000篇。
? 基于專利IPC分類體系的自動聚類, 性能指標:單用戶時每秒執行聚類5000篇,到達8個并發用戶時,每秒執行聚類10000篇。
3、 主題詞標引
自動給出每篇文檔的主題詞,便于用戶在瀏覽中很快的確定文檔的技術要點,提高瀏覽速度。
4、自動摘要和自動關鍵詞技術
自動給出每篇文檔的摘要,便于用戶瀏覽全文內容,提高瀏覽速度;自動從專利文本中提取摘要和關鍵詞, 摘要能夠設定以下參數:摘要字數、摘要百分比、摘要中心詞(偏重摘要)。
5、 相關詞推薦
自動給出與本申請的技術主題詞相關的詞,便于用戶完善檢索要素。
6、 自動分類
根據分類體系(如IPC的三級類別)及準備的專利語料或者分類規則,訓練出分類模板;根據分類模板自動對分類的專利文獻進行分類,,輸出類別;分類模板可以增加語料重新訓練,提高分類精度。
7、相關概念聯想技術及相應知識庫
自動從專利文本中提取語義概念及該語義概念的相關概念,并將海量結果形成知識庫資源,實現專利檢索過程中對上述相關概念的調用,并應用于相關概念顯示和語義檢索擴展等技術中。提供對自動抽取相關概念的人工修訂和完善, 用戶自定義導入新的相關概念集合。
TRS語義檢索技術對專利文獻的概念識別和檢索能力,為在生產系統中引入語義檢索技術提供參考性的實證數據支撐。
文章作者:國脈電子政務網
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄