2021年4月26日晚,来自交通大学的管新潮副教授为我学部教师开设2021年第4次语料库与Python应用系列讲座(腾讯会议 ID:880 257 035),这是继2020年8月开始的第9次讲座。本次讲座的内容涉及词长分布及其语言学含义和计算方法,受到了师生的欢迎。
管教授的本次讲座以语料库为基础,以协同语言学理论为指导,从词汇长度与词汇频数关系的计量语言学研究出发,对词汇长度与词汇在语篇中的使用频数之间的关系进行计量语言学分析。从实验结果表明,词汇的使用频数和词汇长度之间存在明显的依存关系。词汇越长,在语篇中的使用频数越低,二者成反比关系。在讲座中,管教授提出了Köhler构建的协同语言学模型。在词汇控制循环模型中,词长和词频之间的关系是核心内容。该模型描述了词频、词长、多义词和多文度四种属性之间的协同关系的片段。管教授通过Python对词汇进行数据处理,进一步探讨描述这一协同规律的数学模型及其参数与语体类型之间的关系,为深入了解词汇动态机制提供依据。
管教授表示,词汇的动态机制是一个由多种词汇属性的交互影响、多种因素的协作过程构成的复杂系统,相互依存,协同作用。因此,要进一步了解词频的协同作用规律,全面揭示其内在动态机制有待于我们研究人员依据更多语种、更多文类的语言事实对词频与词汇的多文度、同义关系、反义关系、内涵信息量等词汇属性以及与语境经济性、语境精细度、形式-意义关系稳定性等因素之间的相互协作过程和交互影响进行深入研究。
管教授的系列讲座为我们教师和学生研究与医学学科相关的学术词汇打开了一扇管窥之窗,并为我学部在“新文科”视阈下的寻找学科融合点,提供了跨学科教学与研究的新思考和新路径。