2019年4月11日下午4时,乐山师范学院金澎教授来我院开展学术交流,在明理楼B306为我院师生作了题为“基于“词嵌入袋”的文本分类”的学术讲座。
金澎教授现任教乐山师范学院计算机科学学院,是互联网自然语言智能处理省高校重点实验室主任,四川省学术技术带头人后备人选。主要研究领域为自然语言处理。发表论文50余篇,其中三大检索论文36篇;授权国家发明专利一项;主持国家自然科学基金二项;翻译学术专著一部。
一词多义在自然语言中是普遍现象,这给文本分类等任务带来巨大挑战。即便采用词嵌入(word embedding)方法,该问题仍未得到有效解决。金教授研究发现同一个词在不同文本类中表现出不同的分布特性,并基于上述假设,提出基于“词嵌入袋”的文本分类模型。金教授向大家详细讲述了该模型的特点,以及如何训练、如何预测,实验分析与评估等问题。