天津师范大学管理学院数据科学系宋培彦教授课题组所申请的《国际组织科技文本词汇链自动构建与主题发现方法》(授权公告日:2024.02.13)和《多机器翻译引擎驱动的国际组织科技术语主题句萃取方法》(授权公告日:2023.12.08)两项发明专利正式获得授权,形成具有完全自主知识产权的知识组织与知识发现系列研究成果,并取得积极反响。
《国际组织科技文本词汇链自动构建与主题发现方法》公开了一种基于国际组织术语库的科技文本词汇链构建与主题发现方法。该方法针对传统关键词标引缺乏语义关联、主题覆盖率不足等问题,提出了适应长文本、满足多维度知识服务需求的科技文本词汇链构建方法,进而利用大规模术语库和自然语言处理技术,通过语义相似度计算、自动聚类以及多维度词汇链生成等关键技术,有效提升了科技文献标引的语义关联性和主题覆盖率,为可信、可计算、可解释的知识组织与知识发现提供了新的理论指导,并为大语言模型幻觉消解、科技信息自动摘要等应用提供重要支撑。
《多机器翻译引擎驱动的国际组织科技术语主题句萃取方法》公开了一种基于多机器翻译引擎驱动的国际组织科技术语主题句萃取方法,为用户提供跨语言科技知识服务。该方法融合多种机器翻译引擎和术语计算技术,实现了跨语言科技报告术语知识点快速识别、主题自动探测和译文融合生成,不仅能够帮助用户快速掌握重点领域国际科技发展动向,而且可以与词汇链技术协同,实现跨语言科技报告摘要自动生成,形成用户需求驱动的个性化、智能化摘要服务模式。
在上述两项专利基础上,课题组发表了词汇链系列研究论文,研制了原型系统并获得了软件著作权,与企事业单位签订技术服务合同2项,已成功应用于公共卫生、灾害防治等领域专业文献自动标引与深度挖掘服务。