冯志伟：我与计算语言学的缘分一

　　这是冯志伟老师发表在《现代语文》07年第9期上的文章，写得不错，就转载在这里了！　

　　计算语言学是一个横跨语言学、数学和计算机科学的交叉学科。语言学和数学都是有着相当长历史的古老学科。语言学历来被看作是典型的人文科学，数学则被许多人看作是最重要的自然科学。在学校教育中，语文和数学被认为是两门最基础的学科，成为任何一个受教育者的必修课。它们似乎成了学校教育的两个极点：一个极点是作为文科代表者的语文，另一个极点是作为理科代表者的数学。很少有人想到，这两门表面上如此不同的学科之间竟然会存在着深刻的学术联系。计算机科学是研究计算机的新兴学科，带有相当强的工程性质和浓烈的技术色彩，属于高科技的范畴，表面上看来，作为典型的人文科学的语言学与属于高科技的计算机科学也不会存在什么瓜葛。因此，在一般人的心目中，这门横跨语言学、数学和计算机科学的计算语言学似乎是不可思议的，甚至是有悖于常识的，就是连“计算语言学”这个名称也几乎是荒谬绝伦的。
　　然而，一些具有远见卓识的学者却早就洞察了语言学、数学和计算机科学之间的紧密联系。1847 年，俄国数学家布里亚柯夫斯基(В.Я.Буляковский)提出了用概率方法来进行语法、词源及语言历史比较研究的思想。1894 年，瑞士语言学家索绪尔(DeSaussure)指出，“在基本性质方面，语言中的量和量之间的关系可以用数学公式有规律地表达出来”，后来，他在其名著《普通语言学教程》（1916 年）中又指出，语言学好比一个几何系统，“它可以归结为一些待证的定理”。1904 年，波兰语言学家博杜恩.德.库尔特内(Baudouin de Courtenay)认为，语言学家不仅应该掌握初等数学，而且还有必要掌握高等数学。他表示坚信，语言学将日益接近精密科学，语言学将根据数学的模式，一方面“更多地扩展量的概念”，一方面“将发展新的演绎思想的方法”。1933 年，美国语言学家布龙菲尔德(L. Bloomfield)提出了一个著名的论点：“数学只不过是语言所能到达的最高境界”。法国数学家阿达玛(J. Hadamard)说得更好：“语言学是数学和人文科学之间的桥梁”，他一语道破了语言学和数学之间的联系，并清楚地看出了语言学是人文科学中最容易与数学建立联系的学科。
　　著名俄国数学家马尔可夫(A. A. Марков)更是躬行实践，他在1913 年把普希金的叙事长诗《欧根·奥涅金》中的连续字母加以分类，研究俄语字母序列内部的关系，提出了马尔可夫随机过程论，后来成为了一个独立的数学分支，对现代数学的发展产生了深远的影响。语言结构中蕴藏着的数学规律，成为了马尔可夫创造性思想的取之不尽的源泉。
　　1946 年第一台电子计算机ENIAC 在美国研制成功。就在电子计算机问世的同一年，英国工程师布斯（A.D.Booth）和美国洛克菲勒基金会副总裁韦弗（W.Weaver）在讨论电子计算机的应用范围时，就提出了利用计算机进行语言自动翻译的想法。韦弗在1947年3月4日给控制论学者维纳(N. Wiener）的信中说：“我怀疑是否真的建造不出一部能够作翻译的计算机？即使只能翻译科学性的文章（在语义上问题较少），或是翻译出来的结果不怎么优雅（但能够理解），对我而言都值得一试。”可见，电子计算机一出现，计算机科学家的慧眼就投到了自然语言的自动处理方面。
　　这样看来，语言学、数学和计算机科学之间确实有着深刻的内在联系，那么，作为一门横跨语言学、数学和计算机科学的计算语言学的存在便应该是合情合理的了。

注：转载请注明出处“我爱自然语言处理”：www.52nlp.cn

本文链接地址：https://www.52nlp.cn/i-and-computational-linguistics-one

冯志伟：我与计算语言学的缘分一

作者52nlp

作者 52nlp

相关文章

概率语言模型及其变形系列-PLSA及EM算法

EMNLP-CoNLL 2012 List of accepted papers

NiuTrans: 一套开源的统计机器翻译平台

《冯志伟：我与计算语言学的缘分一》有2条评论

发表回复

You missed

新浪张俊林：大语言模型的涌现能力——现象与解释

中科院张家俊：ChatGPT中的提示与指令学习

“国产类 ChatGPT ”所存在的差距与挑战-专家圆桌

探索大语言模型垂直化训练技术和应用-陈运文