摘要
本发明公开了一种跨领域的少样本命名实体抽取方法,属于自然语言处理技术领域。针对现有实体抽取方法缺乏对实体表示的专门优化、实体类型标签的语义信息利用不充分的问题,一方面,通过多粒度对比学习显式强化实体跨度表示中对命名实体抽取更有益的语义信息,增强其实体跨度检测性能;另一方面,通过双重感知对比学习有效的利用实体类型标签中蕴含的语义信息,构建更加稳定的实体类型原型表示,增强其实体分类性能。此外,基于原型网络的设计使其具备了充分的跨领域能力,能够较为容易的进行领域迁移,而无需依赖大量的标注数据,进而提升跨领域场景下的少样本命名实体抽取模型的准确率,同时降低了数据标注带来的人力成本。