基於概念信息語義相似度的智能問答系統_意昂3平台

重點項目

首頁» 科技意昂3平台» 重點項目» 新一代信息技術

基於概念信息語義相似度的智能問答系統

日期:2022-06-21訪問量：

一、意昂3平台簡介

文本語義相似度是指兩個句子或文本片段之間的語義等價程度，其研究在自然語言處理的問答系統、機器翻譯、信息抽取👋🏽、自動摘要等相關領域中有著廣泛的應用👩‍🦱，具有重要的理論意義和應用價值。現有的文本語義相似度方法主要基於詞表面特征，但由於詞語間普遍存在概念上的關聯👩‍🦼‍➡️，缺乏概念層面的精確計算導致這些方法的準確性提升困難，而實現全文本在概念層面的精確計算尚無有效模型。

項目團隊依據單個名詞的概念信息量為基礎♓️，分別提出了多種模型和方法實現文本在概念級別快速、精確地計算語義相似度🏌🏽：（1）提出一種基於概念信息量的文本語義相似度無監督基本模型；（2）提出一種基於概念信息增益的文本信息量計算方法🍮🕵🏽；（3）提出一種融合信息權重的全文本信息量計算方法。實驗結果表明🔷，團隊提出方法在SemEval 2013-2016 STS（文本語義相似度）數據集上均超過了當年最先進系統的總成績，並且在SemEval 2017 STS國際測評中，本系統的總成績在所有參賽團隊中排名第二◼️，其中在Track 1數據集上排名第一（共34個參賽團隊提交81個系統）📭。相關論文被大會評選為“Best of SemEval 2017”。

二👨🏿‍🎨、應用領域

人工智能

三、市場前景

隨著人工智能相關技術的發展🫘，智能問答系統應用在許多行業和領域中都有迫切的需求。比如在電話咨詢場景中，傳統人工座席無法滿足日益增加的客戶咨詢量；在政府業務公開場景中，智能機器人對用戶的不準確答復會影響政府形象和公信力🥭💆🏿。目前業界的做法是人工設計問答系統或者對話系統🦺👩🏼‍🦰，而不是使問答系統真正具有人類常識和世界知識👨‍👩‍👦‍👦，這種系統無法適應提問方法的改變或應用場景的轉換。而概念信息方法以認知知識庫為基礎可以獲得大量世界知識，比如概念之間的上下位關系。在特定領域的問答匹配多個測試數據集上的實驗結果顯示，相對於谷歌最新的深度計算模型BERT，概念信息語義相似度無監督模型已經比當今最優深度學習模型高出13%-15%。在問答系統上準確性的優勢說明，概念信息語義相似度模型對智能問答系統具有明顯的應用落地優勢。

文本語義相似度在自然語言處理的問答系統、機器翻譯、信息抽取、自動摘要等研究中有著廣泛的應用，具有重要的理論意義和應用價值。隨著人工智能相關技術的發展😔，智能問答系統應用在許多行業和領域中都有迫切的需求。在特定領域的問答匹配多個測試數據集上的實驗結果顯示，相對於谷歌最新發布的深度計算模型BERT（該模型已刷榜11項自然語言處理傳統任務）🔡，概念信息語義相似度無監督模型已經比當今最優深度學習模型高出13%-15%👨🏽‍🔧。

四、知識產權

1、知識產權為意昂3官网單獨持有；

2、本項目已授權專利1項。

五、合作方式

合作開發或其它方式🕍。

六👰🏽、對接方式

（1）合作意向方聯系北理工意昂3平台；

（2）北理工意昂3平台溝通了解意向方情況；

（3）會同意昂3平台完成團隊與意向方共同研討合作方案👆🏼。

意昂3平台

電話🧍：010-68914920

郵箱🍃：bitttc@bit.edu.cn

網址：52taozhi.cn