- URL: https://www.cnblogs.com/NLPlunwenjiedu/p/15949973.html
- Added At: 2024-11-08 12:18:30
- Link To Text
本文概述了知识图谱的定义、发展历程、研究方向、数据集和开源库,展望了未来发展方向,包括复杂推理、统一框架、可解释性、可扩展性、知识聚合和自动构建。
-
知识图谱概述:
- 知识是人类认识世界的结晶,知识图谱是知识工程的重要分支,以符号形式结构化描述物理世界概念及其关系。
- 知识图谱由实体、关系和实体组成的三元组构成,形成复杂的网状结构。
- 知识图谱在认知和人工智能领域受到重视,并在众多实际工程项目中发挥重要作用。
-
知识图谱发展历程:
- 知识图谱研究已有六十年历史,经历了从图形化知识表征到语义网的发展。
- 1956年,Richens提出语义网概念,1959年通用问题求解器(GPS)出现。
- 20世纪70年代,专家系统成为研究热点,MYCIN系统是最著名的基于规则医学诊断专家系统。
- 20世纪80年代,知识表征经历了Frame-based Languages、KL-ONE Frame Language的混合发展时期。
- 1984年,Cyc项目出现,目标是编码上百万条知识。
- 20世纪末,RDF、OWL成为语义网重要标准,开放知识库如WordNet、DBpedia、YAGO和Freebase相继发布。
- 2012年,Google首次提出知识图谱概念,得到广泛接受。
-
知识图谱定义:
- Ehrlinger et al. 定义:知识图谱获取信息并将其集成到本体中,并应用推理器来获取新知识。
- Wang et al. 定义:知识图谱是由实体和关系组成的多关系图,实体和关系分别被视为节点和不同类型的边。
-
知识图谱研究方向:
- 知识表征学习(KRL):研究实体和关系的低维分布嵌入,包括表征空间、评分函数、编码模型和辅助信息。
- 知识获取:从非结构化文本和其他源中构建知识图谱,包括知识图谱补全、实体识别、实体对齐和关系抽取。
- 时序知识图谱(TKG):处理时序信息,包括时序信息嵌入、动态实体、时序关系依赖和时序逻辑推理。
- 应用(Knowledge-aware Applications):将知识图谱应用于实际场景,如语言表征学习、问答、推荐系统和对话系统。
-
数据集和开源库:
- 通用领域数据集:WordNet、Cyc、DBpedia、YAGO、Freebase、NELL和Wikidata。
- 特定领域数据集:医学、生命科学等。
- 特定任务数据集:实体对齐、关系提取等。
- 开源库:AmpliGraph、Grakn、Akutan等。
-
未来发展方向:
- 复杂推理:探索循环关系路径编码、基于GNN的知识图谱传递消息等。
- 统一框架:对不同模型进行统一理解研究。
- 可解释性:提高模型的可解释性,增强预测知识的可靠性。
- 可扩展性:提高计算效率和模型表达能力。
- 知识聚合:有效且可解释地聚合知识。
- 自动构建与动态生成:从非结构化内容中自动构建知识图谱,并考虑时间性质。