来源:Frontiers of Computer Science 发布时间:2024/1/5 13:24:23
选择字号:
FCS|文章精要:基于单字生成的词语简化

论文标题:Lexical simplification via single-word generation(基于单字生成的词语简化)

期刊:Frontiers of Computer Science

作者:Jipeng QIANG, Yang LI, Yun LI, Yunhao YUAN, Yi ZHU

发表时间:15 Dec 2023

DOI:10.1007/s11704-023-2744-2

微信链接:点击此处阅读微信文章

导读

最近,基于预训练语言模型BERT的词语简化方法取得了显著的进展,该方法直接根据一个复杂的词的上下文生成候选词。然而,标注数据的匮乏迫使研究人员主要采用无监督的方法,这限制了大型预训练模型的适用性。在本文中,我们通过从复述模型生成替代候选词来缓解这一问题,因为复述语料库包含大规模的词语复述规则。我们将词语简化任务视为一个单字生成任务,在对复述句子上训练非自回归编码器-解码器模型后,我们将句子输入编码器,并让解码器根据复杂词的上下文生成候选词的概率。我们的方法生成的候选词不仅符合上下文,而且保留了句子的含义。在三个广泛使用的基准上的实验结果表明,与最先进的基于BERT的词语简化方法相比,该方法的性能提高了10%以上。

文章精要

相关内容推荐:

文章精要 | 胶囊图卷积网络的动态深度宽度优化 2023 17(6):176346

文章精要 | 基于PCA与CNN深度学习相结合的企业财务绩效评价与预测 2023 17(6):176345

文章精要 | 东南大学张宇团队:场景文本检测中的标签分布学习 2023 17(6):176339

文章精要 | 上海交通大学张伟楠团队:综述:顺序决策中的大规模序列模型 2023 17(6):176349

文章精要 | BGNN: 基于行为感知的图神经网络的异构会话序列推荐 2023 17(5):175336

文章精要 | 西北师范大学马慧芳教授:基于谱图小波的高效多尺度社区搜索方法 2023 17(5):175335

文章精要 | 南京航空航天大学陈松灿教授团队:通过辅助大任务学习标签不一致的多任务 2023 17(5):175342

文章精要 | 基于集成自编码器的无监督领域自适应表示学习方法 2023 17(5):175334

文章精要 | 基于属性增广的众包标记集成 2023 17(5):175331

文章精要 | 基于核最大均值差异的主动标记分布学习方法 2023 17(4):174327

文章精要 | 一种求解多约束机器人任务的稳定演员-评论家算法 2023 17(4):174328

文章精要 | 基于人体动作配准的视频对齐方法 2023 17(4):174324

文章精要 | 基于自监督表征学习的深度主动采样方法 2023 17(4):174323

文章精要 | 一种用于异构聚类的深度对抗贝叶斯生成模型 2023 17(3):173322

文章精要 | 北京航空航天大学牛虹婷团队:基于大规模移动数据的城市商圈潮汐效应探索 2023 17(3):173319

文章精要 | 中国科学技术大学陈恩红教授团队:通过方差约减加速在非独立同分布数据下的Local SGD 2023 17(2):172311

文章精要 | 吉林大学叶育鑫教授团队:基于复制驱动与自定义SAT求解策略的轻量级公理定位 2023 17(2):172315

文章精要 | 基于多尺度特征融合的光滑调制神经网络用于车辆颜色识别 2023 17(3):173321

文章精要 | 东南大学米思娅团队:基于代理度量模型的弱监督动作时序定位 2023 17(2):172309

文章精要 | 基于生理-物理特征融合的自动语音欺骗检测 2023 17(2):172318

文章精要 | 西北工业大学於志文教授团队:面向流式数据的人机交互在线自适应异常检测 2023 17(2):172317

文章精要 | 教师合作:针对多源跨域少样本学习的团队知识蒸馏 2023 17(2):172312

文章精要 | 北京航空航天大学庄福振教授团队:使用知识图谱缓解少样本学习中的数据偏移 2023 17(1):171305

文章精要 | 苏州大学张莉教授团队:最大差异最大化准则:一种针对文本分类的特征选择方法 2023 17(1):171337

文章精要 | 南京信息工程大学田青教授团队:用于无监督预适应的自适应标签过滤学习 2023 17(1):171308

文章精要 | 南昌大学闵卫东教授团队:基于元学习和双输入网络DMNet的场景自适应人群计数方法 2023 17(1):171304


Frontiers of Computer Science


Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。


《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
利用量子精密测量技术开展暗物质搜寻 天文学家找到最小恒星了吗
超大容量变速抽蓄工程进入机电安装阶段 问答之间 | 如何开展科研之路
>>FC碰碰胡老虎机法典-提高赢钱机率的下注技巧
 
一周新闻排行
 
编辑部推荐博文