9066.
在资源稀缺、语义结构复杂的藏文语境下,关键短语抽取是一项具有挑战性的自然语言处理任务。现有藏文关键短语抽取方法依赖于词频和位置等统计特征,忽略了词汇间的语义关系。该文提出了一种基于图结构特征和语义关联度的无监督藏文关键短语抽取方法。该方法使用藏文预训练语言模型和图结构特征来建模文档,使用自注意力机制融合全局和局部信息表示;通过计算原始文档与其掩码版本之间的语义关联度得分,采用综合加权策略,对自注意力机制、余弦相似度以及掩码版本所得到的关键短语得分进行三重加权计算。实验结果证明,该文提出的方法相较于基准在参数K为5、10、15的情况下,F
1值分别提升了5.16%、2.52%、0.66%,证明了其在藏文文本关键短语抽取任务中的显著有效性。… …
相似文献