计算语言学研究简介

  晚上读了冯志伟老师的“《语料库语言学与计算语言学研究丛书》序”,觉得写得很好,这里特转载其第二部分“计算语言学研究简介”。

  1946 年美国宾夕法尼亚大学的J. P. Eckert 和J.W. Mauchly 设计并制造出了世界上第一台电子计算机ENIAC,电子计算机惊人的运算速度,启示着人们考虑传统翻译技术的革新问题。为了探索如何用计算机来改进翻译技术,1952 年在美国的MIT 召开了第一次机器翻译会议,1954 年美国乔治敦大学在国际商用机器公司(IBM 公司)的协同下,用IBM-701 计算机,进行了世界上第一次机器翻译试验,把几个简单的俄语句子翻译成英语,拉开了人类历史上使用计算机来处理自然语言的序幕。接着,苏联、英国、日本也进行了机器翻译试验,机器翻译出现热潮。
  为了推动机器翻译的研究,1954 年美国出版了第一本机器翻译的杂志,这个杂志的名称叫做Machine Translation(《机器翻译》)。1965 年Machine Translation杂志改名为Machine Translation and Computational Linguistics(《机器翻译和计算语言学》)杂志,在杂志的封面上,首次出现了“Computational Linguistics”这个新学科的名字,令人遗憾的是,“and Computational Linguistics”这三个单词是用特别小号的字母排印的,与大号字母排印的“Machine Translation”形成强烈的对照。这说明,当时学者们对于“计算语言学”是否能够算为一门真正的独立的学科还没有确实的把握。计算语言学刚刚登上学术这个庄严的殿堂的时候,还带有“千呼万唤始出来,犹抱琵琶半遮面”那样的羞涩,以至于这个刊物不敢用与Machine Translation 同样大小的字母来排印它。当时Machine Translation 杂志之所以改名,是因为在1962 年美国成立了“机器翻译和计算语言学学会”(Association for machine Translation and Computational Linguistics),通过改名可以使杂志的名称与学会的名称保持一致。根据这些史料,我们认为,远在1962年,就出现了“计算语言学”这个学科了,尽管它在刚出现的时候还是偷偷摸摸的,显示出少女般的羞涩,然而,它却悄悄地登上了庄严的学术殿堂。
  40 多年来,计算语言学发展迅速,逐渐建立了完整的理论和方法,成为了一门独立的学科,取得了很大的成绩,在当代语言学中引人注目。
  由于计算机的速度和存储量的增加,使得计算语言学在语音合成(speech synthesis)、语音识别(speech recognition)、文字识别(character recognition)、拼写检查(spelling check)、语法检查(grammar check)这些应用领域,进行了商品化的开发。除了早期就开始的机器翻译(machine translation)和信息检索(information retrieval)等应用研究进一步得到发展之外,计算语言学在信息抽取(information extraction)、问答系统(question answering system)、自动文摘(text summarization)、术语的自动抽取和标引(term extraction and automatic indexing)、文本数据挖掘(text data mining)、自然语言接口(natural language interaction),计算机辅助语言教学(computer-assisted language learning)等新兴的应用研究中,都有了长足的进展,计算语言学的技术在多媒体系统(multimedia system)和多模态系统(multimodal system)中也得到了应用。

注:转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:http://www.52nlp.cn/brief-introduction-for-the-research-in-computational-linguistics/

此条目发表在计算语言学, 转载分类目录,贴了, , 标签。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已用*标注