施建军
博士,教授(博导)
研究领域:日语语言学、语料库语言学、计量文体学
办公室:松江校区5教楼165室
邮箱:jianjunshi_cn@126.com
  • 个人简历

    主要讲授研究生课程

         1、语料库语言学

    语料库语言学是基于经验主义的语言学研究领域,旨在从大量的语言事实出发揭示语言的规律和机制。语料库语言学涉及统计学、数据科学、计算机科学等众多学科。《语料库语言学》课程将系统介绍语料库语言学产生的方法论背景、语料库语言学和理性主义方法论的差别、相关计算机基础知识、语料库加工相关的自然语言处理技术、语料库检索分析的技术和工具、利用语料库开展语言研究的基本方法、语料库在词汇、语法等研究领域的应用案例等。通过这门课程的学习,学生能够了解语料库语言学的前沿研究和发展趋势,能够掌握开发语料库的基本技能,能够运用语料库和常用的语料库分析工具开展自己的研究。

    语料库语言学是语言本体研究和应用语言学研究方向的的核心基础课、入门必修课,也是其他相关方向的候选课。

         2、计量语言学

    计量语言学是用统计学的理论和方法研究语言学问题的新兴的语言学研究领域,旨在用统计规律阐释传统的定性研究方法无法解决的语言现象和问题。计量语言学的问题意识来自于传统语言学,计量语言学的理论基础是概率论和统计学,也涉及数据科学、计算机科学等众多学科。《计量语言学》课程将系统介绍计量语言学产生的背景、计量语言学的发展历史、计量语言学必备的概率论和统计学基础、常用计量模型的使用、利用计量方法开展语言研究的基本过程、利用计量方法开展语言研究的具体案例等。通过这门课程的学习,学生能够了解计量语言学的前沿研究和发展趋势,能够掌握概率论和统计学的基础知识,能够初步运用计量方法开展自己的研究。

    计量语言学是语言本体研究和应用语言学研究方向的的核心基础课、入门必修课,也是其他相关方向的候选课。

    3、 现代日语语言学理论

    现代日语语言学界建立了丰富的有关日语的语言学理论,产生了众多语言学流派和许多知名的语言学家。这门课重点介绍如下内容:自现代语言学引进日本以后,在日本语言学界掀起的陈述争论、主题和主语争论。包括参与这些争论的主要日本语言学家,以及这些语言学家的相关理论。如山田孝雄等学者的陈述论、时枝诚记的语言过程说、渡边实的日语构文论、三上章和尾上圭介等的主语主题论等;日本语言学家金田一春彦、工藤真由美等学者关于日语时、体、态等语法范畴的理论;寺村秀夫、仁田义雄、益冈隆志等学者关于日语情态表达的学说等等。


    研究生招生和培养

      在外国语言学及应用语言学一级学科、日语语言文学二级学科下招收博士研究生和硕士研究生。具体研究方向包括日语语言学、东亚国家语言文字比较、外语信息计算机处理。欢迎海内外相关领域的优秀学子报考。

  • 科学研究

    主持和承担的教学科研项目

    1. 主持人:基于大语言模型的语言学研究范式变革研究,上海市人工智能促进科研范式改革赋能学科跃升计划项目,2024年12月立项

    2. 主持人:基于词向量的中日通用汉字词汇语义计量研究,国家社科基金重点项目(22AYY024),2022年立项

    3. 主持人:东亚国家语言中汉字词汇使用现状研究,“十三五”国家重点出版物出版规划项目4. 首席专家:东亚国家语言中汉字词汇使用现状研究,教育部哲学社会科学重大课题攻关项目(12JZD014),2012年立项

    5. 主持人:中日两国现代语言生活中的同形词汇研究,国家社科基金项目(12BYY138),2015年结项

    6. 主持人:中日新闻平行语料库,中国科学院横向项目,2013结项

    7. 主持人:汉日平行类义词库的开发研究,日本住友财团资助项目,2007年结项

    8. 主持人:计量文体学导论,北京市社科理论著作出版资助项目,2016年结项

    9. 主持人:汉日语料库通用分析工具的开发研究,教育部人文社科一般项目(07JA740041),2009年结项

    10. 主持人:日本語文章の難易度と語彙の難易度の関係に関する調査日本国际交流基金横向项目,2010年结项

    11. 主持人:外文信息计算机处理课程建设,2019年上海高校大学计算机课程教学改革项目,2021年结项

    12. 子课题负责人:外宣视域下的汉日语政治隐喻的比较与翻译研究,国家社科基金一般项目,2021年结项

    13. 子课题负责人:两岸三地现代汉语对日语借词的吸收及创造性使用研究,国家社科一般项目(15BYY187),2021年结项

    14. 子课题负责人:日本汉文古写本与整理研究,国家社科重大项目,2014立项

    15.子课题负责人:中日对译语料库的研制及应用研究,国家社科项目项目(99BYY007),2002年结项


    获得专利和软件著作权

    1、国家发明专利,专利号:ZL 2013 1 0493954.6,授权公吿日:2019年11月05日,授权公告号:CN 103544274 B

    2、国家软件著作权:外语信息计算机处理平台,证书号:软著登字第7655148号,登记号2021SR0932522

    3、国家软件著作权:汉日通用语言研究与分析工具,证书号:软著登字第8289656号,登记号:2021SR1567030

    4、国家软件著作权:日语作文辅导服务软件V1.0,证书号:软著登字第11260725号,登记号:2023SR0673554

    5、国家软件著作权:基于语言模型的多语种分析平台1.0,证书号:软著登字第 16575354 号


    代表性论文

    1. 施建军:用计算机对日语进行研究的基础,解放军外国语学院学报,1991年6月

    2. 施建军:关于计算机辅助外语教学的几点思考,解放军外国语学院学报,1992年12月

    3. 施建军:机器单词词典和日语单词的自动切分,外语电化教学,1994年12月

    4. 施建军:语言学研究中的对立原则,解放军外国语学院学报,1997(2)

    5. 施建军:关于以句节为直接单位进行日语句子切分的构想,日本学研究,1998年11月

    6. 施建军等:中日两国关于句子“主题”问题的争论,解放军外国语学院学报,人民大学复印报刊资料《语言文字学》转载,2000(3)

    7. 施建军:汉语的主题及汉语句子的基本格局,解放军外国语学院学报,2001(3)

    8. 施建军等:外语教学专家系统的开发与传统教学模式的改革,外语与外语教学,2001(5)

    9. 施建军:日语词汇单一汉译词计算机自动抽取研究,解放军外语学院学报,2003

    10. 施建军等:语料库与日语研究,日语学习与研究,2003年12月,

    11. 施建军:日语专业词汇的统计特征及基本专业词汇的界定,日语学习与研究,2007(6)

    12. 施建军:关于汉日通用语料库分析工具的设计,日本学研究,2008(18)

    13. 施建军:基于语料库的中日同形同义动词意义用法的考察,日本学研究,2009(19)

    14. 施建军:抽取日语专业词汇的一种量化方法,日本学研究,2010(20)

    15. 施建军:关于以《红楼梦》120回为样本进行其作者聚类分析的可信度问题研究,红楼梦学刊,2010(5)

    16. 施建军:基于语料库的汉日语通用词汇获取方法研究,解放军外国语学院学报,2011(1)

    17. 施建军:汉语词汇难易度对文章难度的影响,日本学研究论丛第六辑,2011年5月

    18. 施建军:汉日通用语料库分析工具研制中的关键技术问题及其解决,日本学研究,2011(21)

    19. 施建军:基于支持向量机技术的红楼梦作者研究,红楼梦学刊,2011(5)

    20. 施建军等:中国人日语学习者日语结构歧义句的韵律特征,日语学习与研究,2012(2)

    21. 施建军:中日同形词共时比较研究的现状及存在的课题,东北亚外语研究,2013(1)

    22. 张晓东、施建军:汉日同形词“再三”的用法辨析,绍兴文理学院学报,2013(1)

    23. 施建军、谯燕:汉日语复合词中“手”的语义扩展考察,解放军外国语学院学报,2013(2)

    24. 施建军、洪洁:中日同形词意义用法比较方法研究,外语教学与研究,人民大学复印报刊资料《语言文字学》转载,2013(4)

    25. 施建军、许雪华:再论中日两国语言中的同形词汇问题,解放军外国语学院学报,2014(6)

    26. 施建军:コーパス言語学の立場から中日同形語の分類を考え直す,外语教育研究:2014年7月

    27. 施建军:中日韓三カ国言語の漢字源語——比較研究の現状と課題,日本:比較日本学教育研究センター研究年報,2015年3月,日本:論説資料58号全文转载

    28. 施建军:日语中汉字词汇的使用现状及其历史变迁,对外传播,人民大学复印报刊资料《语言文字学》全文转载,2016(10)

    29. 洪洁、施建军:日本今年热词解读,世界语言生活报告,商务印书馆,2016年10月

    30. 施建军、谯燕:中日同形词意义用法距离的计量研究——以对译比构建的F-measure为尺度,解放军外国语学院学报,2016(4)

    31. 施建军、洪洁:日本的语言文字问题及其相关语言政策,语言政策与规划研究,外语教学研究出版社,2017年6月

    32. 施建军、洪洁:基于语义组合关系的汉日同形词意义对比研究,汉日语言对比研究论丛第8辑,华东理工大学出版社,2017年8月.

    33. 邓佳雨;施建军:从礼貌理论再论日语句末「が」的语法定位,日语学习与研究,2018(1)

    34. 施建军:2017年度中国日语语言学研究状况及动向分析,日语学习与研究,2018(2)

    35. 许雪华;施建军:关于日语汉字词汇多样性的再认识,东北亚外语研究,2018(2)

    36. 施建军:关于日本汉文古写本数据库建设的一些思考和实践,国际中国文学研究丛刊第7集,2019年7月

    37. Shi-Jianjun:Calculating the Distance Between Near Synonyms Across Languages: A Case Study on Chinese and Japanese,International Journal of Language and Linguistics,2019:7(2)

    38. 施建军:从汉字词汇的使用看汉字在东亚国家的前途——基于大规模语料库的考察.外语学刊,2021(1)

    39. 施建军:基于logdice值的中日同形词意义用法差异的计量研究,中国语文法研究,2020年卷

    40. 施建军:现代人工智能视阈下语言学研究之管见,语料库研究前沿,外语教育出版社,2020(1)

    41. Shi-jianjun.Comparing the effectiveness of SVM and deep learning in stylometry:The case of a Dream of the Red Chamber.at the International Quantitative Linguistics Conference QUALICO 2021.

    42. 王淑一、施建军等:面向中国日语专业本科教学的文章难度测量研究,日语学习与研究,2022(5)

    43. 施建军等:基于词向量的汉日通用汉字词语义计量研究方法探索,外语教学理论与实践,2023(1)

    44. 施建军等:基于词向量的汉语“N的V”结构研究——兼与日语「NのV」结构对比,外语电化教学,2023(2)

    45. 施建军. (2021). 大语言模型词向量的语言学价值及其应用所面临的课题. 当代语言学, (4), 496-512.

    46. 施建军等. (2024). 基于汉文体计量特征的《日本书纪》各卷分类研究. 日语学习与研究, (4), 12-25.

    47. 施建軍. (2024). DICEによる中日漢字同形語の意味や用法の相違に関する計量的考察. 日中対照言語学研究論文集, 日本:和泉书院.

    48. 王淑一, 施建军, 沈纳川. (2025). 语篇衔接指标与外语学习者语篇能力习得研究. 外语教学理论与实践.

    49. 施建军, 赵凌梅. (2025). 日本平成时期媒体汉字使用动态及原因分析. 外语导刊, (3).

    50. Zhao, L., & Shi, J.* (2025). Authorship Detection on Classical Chinese Text Using Deep Learning. Applied Sciences, 15(4), 1677.

    51. Lei, L., Tongxi, G., Jianjun, S., & Yi, G. (2025). Calculating Semantic Frequency of GSL Words Using a BERT Model in Large Corpora. Sage Open, 15(2).

    52. Tongxi, G., Lei, L.*, Jianjun, S., & Yi, G. (2025). A meaning-based academic vocabulary list. Journal of English for Academic Purposes, 77.

    53. Tongxi, G., Lei, L.* (2025). A BERT-based method to develop discipline-specific academic vocabulary lists in large corpora. English for Specific Purposes, 82.


    出版著作目录

    1、施建军等:东亚国家语言中汉字词汇使用现状研究(专著),北京:经济科学出版社,2023年3月

    2、施建军:中日现代语言同形词汇研究(专著),北京:北京大学出版社,2019年10月

    3、施建军:计量文体学导论(专著),北京:北京大学出版社,2016年12月

    4、施建军:汉日主题句结构对比研究(专著),北京:世界知识出版社,2001年5月

    5、施建军等:汉日语同形副词研究,北京:学苑出版社,2012年12月

    6、施建军等:日语拟声拟态词研究,北京:学苑出版社,2010年3月

    7、施建军等:日源新词研究,北京:学苑出版社,2011年12月

    8、施建军等:日汉英语言学术语对照辞典,北京:学苑出版社,2009年6月

    9、施建军执行主编:21世纪东北亚日本研究论文集,北京:学苑出版社,2009年11月

    10、施建军执行主编:日本学研究21,北京:学苑出版社,2011年11月

    11、施建军参编:明镜日汉辞典,高等教育出版社,2012年3月

    12、施建军执行主编:日本学研究27,北京:学苑出版社,2017年12月

    13、施建军参编:日语知识百题,北京:北京大学出版社,2007年3月


  • 招生与培养

    主要讲授研究生课程

         1、语料库语言学

    语料库语言学是基于经验主义的语言学研究领域,旨在从大量的语言事实出发揭示语言的规律和机制。语料库语言学涉及统计学、数据科学、计算机科学等众多学科。《语料库语言学》课程将系统介绍语料库语言学产生的方法论背景、语料库语言学和理性主义方法论的差别、相关计算机基础知识、语料库加工相关的自然语言处理技术、语料库检索分析的技术和工具、利用语料库开展语言研究的基本方法、语料库在词汇、语法等研究领域的应用案例等。通过这门课程的学习,学生能够了解语料库语言学的前沿研究和发展趋势,能够掌握开发语料库的基本技能,能够运用语料库和常用的语料库分析工具开展自己的研究。

    语料库语言学是语言本体研究和应用语言学研究方向的的核心基础课、入门必修课,也是其他相关方向的候选课。

         2、计量语言学

    计量语言学是用统计学的理论和方法研究语言学问题的新兴的语言学研究领域,旨在用统计规律阐释传统的定性研究方法无法解决的语言现象和问题。计量语言学的问题意识来自于传统语言学,计量语言学的理论基础是概率论和统计学,也涉及数据科学、计算机科学等众多学科。《计量语言学》课程将系统介绍计量语言学产生的背景、计量语言学的发展历史、计量语言学必备的概率论和统计学基础、常用计量模型的使用、利用计量方法开展语言研究的基本过程、利用计量方法开展语言研究的具体案例等。通过这门课程的学习,学生能够了解计量语言学的前沿研究和发展趋势,能够掌握概率论和统计学的基础知识,能够初步运用计量方法开展自己的研究。

    计量语言学是语言本体研究和应用语言学研究方向的的核心基础课、入门必修课,也是其他相关方向的候选课。

    3、 现代日语语言学理论

    现代日语语言学界建立了丰富的有关日语的语言学理论,产生了众多语言学流派和许多知名的语言学家。这门课重点介绍如下内容:自现代语言学引进日本以后,在日本语言学界掀起的陈述争论、主题和主语争论。包括参与这些争论的主要日本语言学家,以及这些语言学家的相关理论。如山田孝雄等学者的陈述论、时枝诚记的语言过程说、渡边实的日语构文论、三上章和尾上圭介等的主语主题论等;日本语言学家金田一春彦、工藤真由美等学者关于日语时、体、态等语法范畴的理论;寺村秀夫、仁田义雄、益冈隆志等学者关于日语情态表达的学说等等。


    研究生招生和培养

      在外国语言学及应用语言学一级学科、日语语言文学二级学科下招收博士研究生和硕士研究生。具体研究方向包括日语语言学、东亚国家语言文字比较、外语信息计算机处理。欢迎海内外相关领域的优秀学子报考。