学术动态

公共管理学院

您现在的位置: 学院首页 > 学术动态 > 正文

公共管理学院

期刊论文|张晓娟,马乐,基于上下文语义与全局信息的局部引文推荐研究,《情报学报》2025年第10期

发布时间:2025-11-27

 摘 要:局部引文推荐有助于研究人员更快速有效地获得参考文献。已有的局部引文推荐方法主要聚焦于如何根据有限的上下文来获得与之相关的候选引文,限制了模型推荐结果的准确度提升。本文尝试在融合上下文语义信息的基础上,进一步融合全局信息(如全局语义和全局关系信息)来提升局部引文推荐的准确度。首先,在经过预训练的SciBERT(scientific bidirectional encoder representations from transformers)模型基础上,通过自定义任务对其进行模型微调后,提取引文上下文语义信息。为了最大限度地利用论文标题和摘要所包含的高度概括的全局语义信息,分别利用Sentence-BERT模型和微调后的SciBERT模型对论文标题向量和论文摘要向量进行提取。其次,构建包括作者、论文和论文发表地(会议或期刊)三类节点的学术文献异构关系图,并通过关系图卷积网络(relational graph convolutional network,R-GCN)对三种不同关系类型(引用关系、写作关系以及发表关系)进行聚合来获得论文以及作者向量的嵌入表达。最后,将引文推荐转化为多分类问题,即将上下文语义信息、目标论文全局标题信息、目标论文全局摘要信息与嵌入了全局关系的目标论文向量和目标论文作者向量进行拼接作为推荐模型的输入,通过前馈神经网络(feedforward neural network,FFNN)+softmax进行训练,为给定上下文生成相应的候选引文列表。为进一步提高运算效率,本文尝试通过多设备分布式数据并行以及单设备模型压缩两种优化策略来降低模型运行的时间开销。实验结果表明,本文方法能有效提升局部引文推荐的准确度;在考虑引文上下文语义的基础上,在所有表征全局信息的向量(标题语义向量、摘要向量、作者向量和论文向量)中,论文向量对模型推荐性能的贡献最大;全局关系信息对模型推荐性能的贡献大于全局语义信息;在全局关系信息中,历史引用信息对局部引文推荐整体性能提升的贡献最大;两种模型优化方法均能提高模型的运行效率。

关键词:上下文语义;全局信息;局部引文推荐;R-GCN模型;

【本文第一作者为四川大学公共管理学院副教授,硕士生导师。本文系国家社会科学基金一般项目“时间感知的个性化学术文献引文推荐研究”(21BTQ072)阶段性成果之一。】


领导邮箱

书记信箱地址:wb@scu.edu.cn

院长信箱地址:xia6677@163.com

提示:请将您的宝贵意见或建议用常用邮箱发送。

四川大学公共管理学院“萃文智服”二维码

提示:请点击或者扫描二维码咨询。