基於概念信息語義相似度的智能問答系統
一、意昂3平台簡介
文本語義相似度是指兩個句子或文本片段之間的語義等價程度,其研究在自然語言處理的問答系統、機器翻譯、信息抽取👋🏽、自動摘要等相關領域中有著廣泛的應用👩🦱,具有重要的理論意義和應用價值。現有的文本語義相似度方法主要基於詞表面特征,但由於詞語間普遍存在概念上的關聯👩🦼➡️,缺乏概念層面的精確計算導致這些方法的準確性提升困難,而實現全文本在概念層面的精確計算尚無有效模型。
項目團隊依據單個名詞的概念信息量為基礎♓️,分別提出了多種模型和方法實現文本在概念級別快速、精確地計算語義相似度🏌🏽:(1)提出一種基於概念信息量的文本語義相似度無監督基本模型;(2)提出一種基於概念信息增益的文本信息量計算方法🍮🕵🏽;(3)提出一種融合信息權重的全文本信息量計算方法。實驗結果表明🔷,團隊提出方法在SemEval 2013-2016 STS(文本語義相似度)數據集上均超過了當年最先進系統的總成績,並且在SemEval 2017 STS國際測評中,本系統的總成績在所有參賽團隊中排名第二◼️,其中在Track 1數據集上排名第一(共34個參賽團隊提交81個系統)📭。相關論文被大會評選為“Best of SemEval 2017”。
二👨🏿🎨、應用領域
人工智能
三、市場前景
隨著人工智能相關技術的發展🫘,智能問答系統應用在許多行業和領域中都有迫切的需求。比如在電話咨詢場景中,傳統人工座席無法滿足日益增加的客戶咨詢量;在政府業務公開場景中,智能機器人對用戶的不準確答復會影響政府形象和公信力🥭💆🏿。目前業界的做法是人工設計問答系統或者對話系統🦺👩🏼🦰,而不是使問答系統真正具有人類常識和世界知識👨👩👦👦,這種系統無法適應提問方法的改變或應用場景的轉換。而概念信息方法以認知知識庫為基礎可以獲得大量世界知識,比如概念之間的上下位關系。在特定領域的問答匹配多個測試數據集上的實驗結果顯示,相對於谷歌最新的深度計算模型BERT,概念信息語義相似度無監督模型已經比當今最優深度學習模型高出13%-15%。在問答系統上準確性的優勢說明,概念信息語義相似度模型對智能問答系統具有明顯的應用落地優勢。
文本語義相似度在自然語言處理的問答系統、機器翻譯、信息抽取、自動摘要等研究中有著廣泛的應用,具有重要的理論意義和應用價值。隨著人工智能相關技術的發展😔,智能問答系統應用在許多行業和領域中都有迫切的需求。在特定領域的問答匹配多個測試數據集上的實驗結果顯示,相對於谷歌最新發布的深度計算模型BERT(該模型已刷榜11項自然語言處理傳統任務)🔡,概念信息語義相似度無監督模型已經比當今最優深度學習模型高出13%-15%👨🏽🔧。
四、知識產權
1、知識產權為意昂3官网單獨持有;
2、本項目已授權專利1項。
五、合作方式
合作開發或其它方式🕍。
六👰🏽、對接方式
(1)合作意向方聯系北理工意昂3平台;
(2)北理工意昂3平台溝通了解意向方情況;
(3)會同意昂3平台完成團隊與意向方共同研討合作方案👆🏼。
意昂3平台
電話🧍:010-68914920
郵箱🍃:bitttc@bit.edu.cn
網址:52taozhi.cn