学科专业

语言数据科学与应用

“语言数据科学与应用”学科简介

“语言数据科学与应用”学科属于一级学科“外国语言文学”下以文理交叉为特色的二级交叉学科,并于2021年获批教育首批新文科项目。本学科一方面对接教育部新文科发展战略,顺应当代学术研究交叉与融合的趋势,另一方面积极响应国家人工智能重大发展战略,培养语言智能领域的高端人才。

“语言数据科学与应用”学科是基于信息科学、统计学、语言学和翻译学的新兴交叉学科,旨在研究语言数据的各种类型、状态、属性及其变化规律,以揭示人类语言和语言行为背后的规律,并探讨语言数据在智慧教育和人工智能领域中的应用。本学科以语料库和数据库的应用为基础,开展语言数据驱动的语言研究、翻译研究、智慧教育以及人工智能相关领域的研究,从而实现数据科学与语言学、翻译学、智慧教育以及语言智能等领域研究的有机结合,最大程度地揭示和解释语言和翻译的本质,推进语言数据在智慧教育和语言智能等领域中的应用。

“语言数据科学与应用”学科下设四个研究方向:(1)语言数据与语言研究;(2)语言数据与翻译研究;(3)语言数据与智慧教育;(4)语言数据与人工智能。以下是这四个研究方向的简介:

(1)语言数据与语言研究:在对语言进行定量研究的基础之上,本方向结合多元统计和可视化方法,研究语义学、形态学、语音学、词汇学、句法学和话语分析等,对语言规律进行形式化描述,具体研究领域为语料库语言学、统计语言学、计量语言学和计算语言学等。主要导师有胡开宝、蒋勇、雷蕾、李晶洁、David Machin、Gwendonila Jeanne C. Bouvier、Göran Eriksson、张明倩、丁红卫、Muhammad Afzaal 、吕珊珊、李晓倩等。

(2)语言数据与翻译研究:主要关注语料库翻译学、数字人文与翻译研究、语言数据库或语料库的建设、基于语言数据的翻译语言特征研究、译者风格研究、翻译规范研究、翻译与意识形态研究、翻译教学研究和口译研究等。主要导师有胡开宝、韩子满、耿强、潘峰、金菊花、张丽莉等。

(3)语言数据与人工智能:专注语言智能、机器翻译、深度学习等领域研究。本方向基于海量语料数据,利用人工智能的信息加工机制,通过语言学与人工智能的有机结合,推动语言智能研究的产学研合作。主要导师有罗华、李路、凌爱凡、赵海、许洪志等。

(4)语言数据与智慧教育:语言数据是知识的主要载体,在知识的输入、消化、加工、输出、评价等各阶段至关重要。本方向结合教育大数据的挖掘分析技术,探索语言数据在AI赋能教育上的研究应用,支持科学决策和实施智慧教育。主要导师有洪化清、黄芳等。

本学科为硕博士研究生开设的课程主要包括:理论语言学、概率论与数理统计、数据科学、Python编程与语言数据开发、语言数据库建设与应用基础、句法学、语义及语用学、计算语言学、线性代数、机器翻译、当代译学研究、机器学习、多模态语料库建设与应用、学习科学与智慧教育、认知语言学、言语科学、语料库与话语研究、国际学术交流英语、自然语言处理与语言研究、符号学导论、语言和性别等。