基于频繁语义模式的主题标注——以肿瘤靶向治疗技术为例

[目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观10058-F4说明书性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。[方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与CGSK’872浓度anopy方法对比评估。[结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>