还是先从评论说起,计算所刘洋师兄昨天在《最有影响力的自然语言处理论文》下留言:
  “在这方面,一个比较好的资源是ACL Anthology Network。不仅能够查到论文的排名,而且能查到作者的排名。”
  虽然曾经写过关于ACL Anthology的文章:《ACL Anthology——计算语言学的数字档案》,但是对于ACL Anthology Network,却不曾知晓,于是仔细浏览了ACL Anthology Network。
  ACL Anthology Network由密歇根大学计算语言学和信息检索小组(Computational Linguistics And Information Retrieval (CLAIR) group)设计和维护,主要是对ACL Anthology里的论文信息进行收集、整理和加工,最终形成了几个“关系网”,包括论文引用网络,作者引用网络和作者合作网络等。ACL Anthology Network 目前使用了13706篇ACL论文,包括2008年11月份以前及当月出版的所有论文信息。以下是其简介:
  Here we have collected information regarding all of the papers included in the many ACL venues. From those papers, we have created several networks, including paper citation, author citation, and author collaboration.
  ACL Anthology Network除了可以单独搜索作者和文章外,不仅有一个总的排名情况,而其还有各个会议的排名情况,很有参考价值。让我们来看一看按引用数对文章和作者进行总的排名情况:
  文章前十名:
  Building A Large Annotated Corpus Of English: The Penn Treebank
  The Mathematics Of Statistical Machine Translation: Parameter Estimation
  Attention Intentions And The Structure Of Discourse
  A Maximum Entropy Approach To Natural Language Processing
  Bleu: A Method For Automatic Evaluation Of Machine Translation
  A Maximum-Entropy-Inspired Parser
  A Stochastic Parts Program And Noun Phrase Parser For Unrestricted Text
  A Systematic Comparison Of Various Statistical Alignment Models
  Statistical Phrase-Based Translation
  Minimum Error Rate Training In Statistical Machine Translation
  其中标题加粗的文章是和《最有影响力的自然语言处理论文》中重复的文章,不过这个更有说服力,毕竟ACL Anthology Network的统计数据大得多!
  作者前十名:
  Och, Franz Josef
  Ney, Hermann
  Della Pietra, Vincent J.
  Mercer, Robert L.
  Della Pietra, Stephen A.
  Marcus, Mitchell P.
  Collins, Michael John
  Brown, Peter F.
  Church, Kenneth Ward
  Marcu, Daniel
  统计机器翻译的传奇人物Franz Josef Och力拔头筹!另外,作者排名还有一项依据H-Index的排名,这个指标具体指啥我不太明白,不过排在第一位的是Kevin Knight,作为统计机器翻译领域公认的领袖人物,培养了一批统计机器翻译青年才俊的Kevin Knight位列第一也当属实至名归!
  关于ACL Anthology Network的更多信息,请读者参考其官方网站:
  http://clair.eecs.umich.edu/aan/index.php

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:https://www.52nlp.cn/about-acl-anthology-network

作者 52nlp

《ACL Anthology 姊妹篇:ACL Anthology Network》有7条评论
  1. 博主你好:
    请教个问题,有没有度量文档正确性的文献。Web2.0中出现了大量的用户生成文档,这些文档没有经过验证,因此如何对这些文档进行正确性度量。

    [回复]

    admin 回复:

    不好意思,这块儿我不熟,建议你去水木自然语言处理版问一下,那里的nlpers比较热心!

    [回复]

  2. 博主你好。我觉得这个blog还是很不错的。
    我想我有一个建议。我觉得有必要以整个自然语言处理发展的历史进程为主要线索去写一些文章。 当然不能是那种很泛泛的东西。
    比如在某一个时期,发展的主要热门方向,存在哪些问题,出现了哪些主要的牛人,做了一些什么样的贡献,怎么做出这些贡献的(方法,思想),最基本的原理(主要是指暗含的基本假设,为什么这个方法成立,最好不要通过数学公式解决),又进一步引入了哪些问题(方法的缺陷)。
    我觉得任何学科的发展方向都是存在必然性的,哪里是需要重点注意的,哪里能够进一步抽象和归纳的,都可以从它的发展历史当中学习到。
    呵呵,小小的建议。

    [回复]

    admin 回复:

    谢谢你的建议,不过以我个人目前的水平,还很难达到写这个系列的要求。你可以关注一下冯志伟老师的写得一些关于自然语言处理及计算语言学的文章,这些大多是他多年积累的经验之谈,写得通俗易懂,非常不错!另外,可以看一些自然语言处理的书籍,一般都会在开头讲一下nlp方面的历史。

    [回复]

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注