0%

简介

题目:《A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs

来源:VLDB-2020

链接:论文链接

代码:Code和Dataset

关键字:Benchmarking StudyEmbedding-basedEntity Alignment

Abstract

  这篇文章主要对实体对齐该领域进行了一次综合性的分析研究,调研了23Embedding-based的实体对齐方法,并根据其使用的技术和特性进行分类;作者提出了一种新的取样的方法,其可以保证其取样和现实数据集分布一致;同时构建了一个开源库-OpenEA,其包含了12种具有代表性的基于嵌入学习的实体对齐方法,以及对这些技术的评估方法;最后作者在一些还没被探索的方向进行了一些探索实验的分析研究。整体来说,本文章对基于嵌入学习的实体对齐的方法技术进行了一次综述分析。

阅读全文 »

简介

题目:《Neighborhood Matching Network for Entity Alignment

来源:ACL-2020

链接:论文链接

代码:Code和Dataset

关键字:Entity AlignmentS

研究背景

  从原先的大量依赖人工的参与实体对齐任务,到Embedding-Based的实体对齐方法的出现,大大缩减了人为的参与度,但是依旧需要一定量的训练种子对,然后提出了基于GCN的相关方法,这些方法有一个假设前提-相似实体对的周围邻近结构也会很相似。但是实际情况不是这样的。如下图:

  从上图中可以看到,对于有些对齐的实体,其周围的邻接点数目相差是很大的,而且就算不考虑数量的差别(图中第二组),其邻接点中相似的数量也很少,很多节点都是不相似,同时作者通过实验发现,随着邻接点的数目增加,其Embedding-Based方法的准确率会大大下降,同时邻接点的数目增多,同时其评价邻接点的相似度的难度也很大,其GCN方法的计算量的代价也会大大增加。作者由此分析提出了相应的改进的NMN模型。

阅读全文 »

简介

题目:《Bootstrapping Entity Alignment with Knowledge Graph Embedding

来源:IJCAI-2018

链接:论文链接

代码:Code和Dataset

关键字:Entity Alignment、Bootstrapping、Embedding

研究背景

  近些年(基于2018年的),一些基于Embedding的实体对齐方法被提出,虽然取得了不错的效果,但是仍存在一些问题:

1) KG Embedding部分主要复用面向KG补全的Embedding模型,面向实体对齐的Embedding模型有待探索。

2)在训练数据比较少的情况下,当前方法精度很低。

  为此我们提出了一个Bootstrapping的方法,将实体对齐转化为一个分类问题,期望学习的Embeddings具有最大的实体对齐似然。具体地,我们提出了一个面向实体对齐的KG Embedding模型(AlignE);然后动态标记新的实体对齐作为训练数据来增强匹配效果(BootEA)。

阅读全文 »

简介

题目:《Multi-view Knowledge Graph Embedding for Entity Alignment

来源:IJCAI-2019

链接:论文链接

代码:Code和Dataset

关键字:Entity Alignment、Embedding、Multi-view

摘要

  原先的实体对齐工作主要关注在实体的关系结构特征,这就导致一些其他类型的特征被忽视,例如其属性(Attributes)特征,由于没有对这类特征给予一样的重要性,这会影响基于嵌入式的实体对齐工作的鲁棒性和准确性

  作者基于上述的缺点,提出了一种新颖的框架,从实体名、关系、属性三个方面来学习实体的嵌入表示,并提出了相应的整合策略,其最终结果在数据集DBP-WD和DBP-YG上相对已有的方法有显著的提升。

阅读全文 »

简介

题目:《Knowledge Graph Alignment Network with Gated Multi-hop Neighborhood Aggregation》

来源:AAAI-2020

链接:论文链接

代码:Code和Dataset

研究背景

  由于GNN网络在识别同构子图上表现非常不错,因此应用于很多基于嵌入式的实体对齐方法。但是实际上不同KGs之间对应的实体对,其周围的邻域图结构一般不是相似的,这导致GNN不能准确进行识别。如图1:

  上图中指向Kobe Bryant的两个实体的邻域是不一致的,邻居实体集合也是不同的(有数据显示大部分对齐的实体对都具有不同的邻域)。要对齐的实体具有不同的邻域结构,使用GNN就容易导致为这些实体生成不同的表示。

阅读全文 »

《Entity Alignment between Knowledge Graphs Using Attribute Embeddings》

简介

题目:《Entity Alignment between Knowledge Graphs Using Attribute Embeddings》

来源:AAAI-2019

链接:原文地址

代码:Code和Dataset

研究背景

  早期的实体对齐研究基于属性之间的相似性,依赖于用户定义的规则来确定实体之间需要比较的属性。由于不同实体之间可能需要不同的属性来进行比较,所以这种方法容易出现误差。

  最近,针对实体对齐任务提出了基于嵌入的模型,它要求将两个KG嵌入到同一个向量空间中,以适应KG嵌入在两个KG之间的实体对齐。但该方法需要大量的种子实体,这在现实使用中难以获取。

本文针对上述的局限性,提出了一种新的嵌入模型,本文的主要贡献如下:

  • 提出两个KG之间的实体对齐框架,由谓词对齐模块(predicate alignment module)嵌入学习模块(embedding learning module)实体对齐模块(entity alignment module)组成
  • 提出一种新的嵌入模型,将实体嵌入和属性嵌入集成在一起,用来学习对于两个KGs的统一嵌入空间
  • 在三对KGs上对模型进行评估,就hits@1指数而言,模型优于现有模型50%以上
阅读全文 »

Neural Snowball for Few-Shot Relation Learning

Abstract

  知识图谱正处于新的关系不断增长的状况,基于大量充足信息预先定义好关系的关系抽取方法不能很好的处理这种状况。在利用少量的样本来处理新的关系的目标下,我们提出了一种新颖的自展方法-Neural Snowball,通过转换现有关系的语义知识来学习新的关系。更详细地说,我们使用了关系连体网络(RSN)来学习基于已有关系及其标记数据的实例之间的关系相似性度量,然后,在给定一个新关系及其少量实例的基础上,利用RSN从未标记的语料库中积累可靠的实例,并用这些实例训练一个关系分类器,进一步识别新关系的新事实。这个过程就像雪球一样反复进行。实验表明我们的模型对于小样本学习可以获取更高质量的实例,并且相比于baseline,性能有重大的提升。代码与数据集发布在https://github.com/thunlp/Neural-Snowball

阅读全文 »

背景与挖掘目标

随着互联网的快速发展,用户很难快速从海量信息中寻找到自己感兴趣的信息。因此诞生了:搜索引擎+推荐系统

本章节-推荐系统:

  1. 帮助用户发现其感兴趣和可能感兴趣的信息。
  2. 让网站价值信息脱颖而出,得到广大用户的认可。
  3. 提高用户对网站的忠诚度和关注度,建立稳固用户群体。
    阅读全文 »