实践篇（5）：基于REfO的简单知识问答-FreeNAS中文网

admin 管理员组

文章数量: 887006

实践篇（5）：基于REfO的简单知识问答

本文主要参考SimmerChan大神文章：
Pelhans 大神的博客：/

1 简介

基于浙江大学在openKG上提供的基于REfO的KBQA实现及示例。代码部分浙大方面已经完成绝大部分，这里主要将其应用到自己的知识图谱上。在运行KBQA代码前，应按照前面的教程将电影类知识图谱导入到Jena的TDB数据库中，并运行fuseki服务器，这样我们才能进行访问查询。

1.1代码结构

 jena_sparql_endpoint.pyquery_main.pyquestion2sparql.pyquestion_temp.pyword_tagging.pyexternal_dict/csv2txt.pymovie_title.csvmovie_title.txtperson_name.csvperson_name.txt__init__.py

"KB_query"文件夹包含的是完成整个问答demo流程所需要的脚本。
"external_dict"包含的是人名和电影名两个外部词典。csv文件是从mysql-workbench导出的，按照jieba外部词典的格式，我们将csv转为对应的txt。
“word_tagging”，定义Word类的结构（即我们在REfO中使用的对象）；定义"Tagger"类来初始化词典，并实现自然语言到Word对象的方法。
“jena_sparql_endpoint”，用于完成与Fuseki的交互。
“question2sparql”，将自然语言转为对应的SPARQL查询。
“question_temp”，定义SPARQL模板和匹配规则。
“query_main”，main函数。

在运行"query_main"之前，读者需要启动Fuseki服务，具体方法请参考上一篇文章。

1.2 展示：

2具体实现

基于REfO的简单知识问答的原理很简单，就是通过REfo提供的匹配能力，在输入的自然语言问题中进行匹配查找。如果找到我们预先设定的词或词性组合，那么就认为该问题与这个词或词性组合匹配。而一个词或词性的组合又对应着一个SPARQL查询模板，这样我们就借助REfO完成了自然语言到查询模板的转换。得到查询模板后，我们就利用Jena fuseki 服务器提供的端口进行查询得到返回的结果。

2.1 模块一 word_tagging部分

该部分利用jieba分词对中文句子进行分词和词性标注。将词的文本和词性进行打包，视为词对象，对应 :class:Word(token, pos)。

class Word(object):    def __init__(self, token, pos):self.token = tokenself.pos = pos class Tagger:          def __init__(self, dict_paths):# TODO 加载外部词典for p in dict_paths:jieba.load_userdict(p)def get_word_objects(self, sentence):""" Get :class:WOrd(token, pos) """            return [Word(word.encode('utf-8'), tag) for word, tag in pseg.cut(sentence)]

2.2 模块二 rules 部分

该部分为程序核心，负责将自然语言转换为SPARQL模板。

下面为rules的程序入口，customize_rules 函数：

def customize_rules():# some rules for matching# TODO: customize your own rules hereperson = (W(pos="nr") | W(pos="x") | W(pos="nrt"))movie = (W(pos="nz"))place = (W("出生地") | W("出生"))intro = (W("简介") | W(pos="介绍"))rules = [      Rule(condition=W(pos="r") + W("是") + person | \ person + W("是") + W(pos="r"),action=who_is_question),Rule(condition=person + Star(Any(), greedy=False) + place + Star(Any(), greedy=False),action=where_is_from_question),Rule(condition=movie + Star(Any(), greedy=False) + intro + Star(Any(), greedy=False) ,action=movie_intro_question)]         return rules

该函数中我们设置了一些简单的匹配规则，例如我们设置 ‘’’movie = (W(pos=”nz”))’’‘，即movie 的词性应该是nz。其中的W()是我们在继承REfO的Predicate方法的基础上扩展更新了match方法。您可以简单的把它理解为re中compile后的match，只不过多个W()间出现的顺序可以变化。这样通过多个定制的W()和Star(Any(), greedy=False)(相当于.*?)这种通配符的组合，我们就定义了一组匹配规则，当遇到符合该规则的句子时，就选取该规则后action对应的查询模板。

例如当输入为“周星驰是谁”这样的问题时，会匹配到rules 中的第一条规则。而后执行该规则后对应的action， who_is_question。而who_is_question对应的查询模板为：

def who_is_question(x):select = u"?x0"               sparql = Nonefor w in x:if w.pos == "nr" or w.pos == "x":e = u" ?a :actor_chName '{person}'. \n \ ?a :actor_bio ?x0".format(person=w.token.decode("utf-8"))sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE,select=select,expression=INDENT + e)breakreturn sparql

有了查询模板后，我们通过SPARQLWrapper 模块的SPARQLWrapper 执行该查询，并对返回的结果进行转换得到回答。对应的代码如下：

from SPARQLWrapper import SPARQLWrapper, JSON    
from utils.word_tagging import Tagger
from utils.rules import customize_rules                   if __name__ == "__main__":    print("init...........")    sparql_base = SPARQLWrapper("http://localhost:3030/kg_demo_movie/query")#加载外部词典，提升分词准确性和词性标注准确性tagger = Tagger(['data/actorName.txt', 'data/movieName.txt'])#初始化并获取规则列表rules = customize_rules()   print("done \n")    while True:    print("Please input your question: ")    default_question = raw_input()    # 获取wordclassseg_list = tagger.get_word_objects(default_question)for rule in rules:    # 将规则列表应用到问题上得到查询模板query = rule.apply(seg_list)    if query:    # 设置查询相关sparql_base.setQuery(query)    sparql_base.setReturnFormat(JSON)         # 得到返回结果并做转换results = sparql_base.query().convert()   if not results["results"]["bindings"]:    print("No answer found :(")    continue    for result in results["results"]["bindings"]:print "Result: ", result["x0"]["value"]

本文标签：实践篇（5）基于REfO的简单知识问答

版权声明：本文标题：实践篇（5）：基于REfO的简单知识问答内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1732360169h1534988.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

实践篇（5）：基于REfO的简单知识问答

实践篇（5）：基于REfO的简单知识问答

1 简介

1.1代码结构

1.2 展示：

2具体实现

2.1 模块一 word_tagging部分

2.2 模块二 rules 部分

更多相关文章

实践篇（5）：基于REfO的简单知识问答

发表评论

推荐文章

探索纯净之旅：史上最纯净的Win7专业版系统

为什么三星平板电脑无法关闭以及如何修复[教程]

Ubuntu与Windows系统之间进行远程访问和文件的传输

windows下gdal的java开发环境搭建

谷歌和微软浏览器不能用了——解决方法

热门文章

kafka入个门

Python新冠疫情可视化分析系统免费赠送项目完整源码,可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案等

《自私的皮球》

springboot 移动maven仓库后执行mvn clean报错Could not find artifact

Windows10忘记密码重置恢复

WINDOWS系统有几个版本

如何用ChatGPT进行论文润色？手把手一步一步保姆级教程

Windows彻底停止nginx服务

Navidrome音乐服务器 + 音流APP = 释放你的手机空间

Windows 终端 | Windows Terminal | 一款强大且高效的终端应用程序

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

[转]笔记本电脑处理器(CPU)性能排行榜

project安装包的下载和安装教程

测试模式 windows2008 内部版本7601

如何区分自己的windows系统是正版还是盗版？从零基础到精通，收藏这篇就够了！

windows下查看系统证书（一）

技术交流 – FreeNAS中文网

实践篇（5）：基于REfO的简单知识问答

实践篇（5）：基于REfO的简单知识问答

1 简介

1.1代码结构

1.2 展示：

2具体实现

2.1 模块一 word_tagging部分

2.2 模块二 rules 部分

更多相关文章

实践篇（5）：基于REfO的简单知识问答

发表评论

推荐文章

探索纯净之旅：史上最纯净的Win7专业版系统

为什么三星平板电脑无法关闭以及如何修复[教程]

Ubuntu与Windows系统之间进行远程访问和文件的传输

windows下gdal的java开发环境搭建

谷歌和微软浏览器不能用了——解决方法

热门文章

kafka入个门

Python新冠疫情可视化分析系统免费赠送项目完整源码,可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案等

《自私的皮球》

springboot 移动maven仓库后执行mvn clean报错Could not find artifact

Windows10忘记密码重置恢复

WINDOWS系统有几个版本

如何用ChatGPT进行论文润色？手把手一步一步保姆级教程

Windows彻底停止nginx服务

Navidrome音乐服务器 + 音流APP = 释放你的手机空间

Windows 终端 | Windows Terminal | 一款强大且高效的终端应用程序

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

[转]笔记本电脑处理器(CPU)性能排行榜

project安装包的下载和安装教程

测试模式 windows2008 内部版本7601

如何区分自己的windows系统是正版还是盗版 ？从零基础到精通，收藏这篇就够了！

windows下查看系统证书（一）

如何区分自己的windows系统是正版还是盗版？从零基础到精通，收藏这篇就够了！