如果你刚接触自然语言处理并对她感兴趣,最好读几本这方面的书籍,除了能让你知道自然语言处理各个领域是干什么的外,还能培养一下NLP的感觉。以下四本书是我读研期间阅读和接触过的,如果您还有好书推荐,欢迎补充。

1、 自然语言处理综论(Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition)
  这本书的权威自不用说,译者是冯志伟老师和孙乐老师,当年读这本书的时候,还不知道冯老师是谁,但是读起来感觉非常好,想想如果没有在这个领域积攒多年的实力,是不可能翻译的这么顺畅的。这本书在国内外的评价都比较好,对自然语言处理的两个学派(语言学派和统计学派)所关注的内容都有所包含,但因此也失去一些侧重点。从我的角度来说更偏向于统计部分,所以需要了解统计自然语言处理的读者下面两本书更适合做基础阅读。不过这本书的N-gram语言模型部分写得非常不错,是SRILM的推荐阅读参考。

2、统计自然语言处理基础(Foundations of Statistical Natural Language Processing)
  我比较喜欢这本书,这两年的学习过程中也经常拿这本书作为参考,可能与我做统计机器翻译有关吧。看china pub上的评论说这本书的翻译比较差,自己的感觉是还行。当然,这是国内翻译图书的一个通病:除了很难有翻译的非常好的书外,另外一个原因就是滞后性。如果e文足够好的坏,就及时看英文版吧。这本书在统计基本部分的介绍很不错,另外n元语法部分讲得也比较好,也是SRILM的推荐阅读。

3、统计自然语言处理
  这是北京自动化所宗成庆老师今年5月出版的一本专著,我有幸较早的阅读了这本书的很多章节。一个很强的感觉是:如果你想了解相关领域的国内外最新进展,这本书非常值得一读。上面两本书在由于出版稍早的缘故,很多领域最新的方法都没有介绍。而这本书刚刚出版,宗老师对国内外现状把握的也比较好,因此书中充分体现了这方面的信息。另外统计机器翻译这一部分写得很详细很不错,这可能与宗老师亦是这个领域的研究者有关吧。

4、《计算机自然语言处理》
  这是我最早看的一部自然语言处理方面的书籍,和上面几部大部头的书籍相比,这本书很薄,可以很快的看完。书的内容我都有点忘了,但是印象中可以在每个章节看到国内这个领域的研究历史和相关单位。这时才发现母校HIT在这个领域的超强实力,只是可惜这时候已经离开冰城了。

  这些书籍怎么读都行,泛览也罢,精读也行,只要有时间,多读书是没坏处的。我自己的经验是,先泛泛的浏览或阅读一篇,对于比较晦涩的部分可以先跳过去,然后对自己感兴趣的领域或者将要从事的领域的相关章节进行精读,当然,书籍一般在开始的几个章节讲些基础性的知识,这部分最好也仔细揣摩一下。真正要对自己研究的领域深刻了解,还得好好读一下本领域的相关论文。

更多书籍请参考:书籍

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:
https://www.52nlp.cn/natural-language-processing-primer-books/

作者 52nlp

《几本自然语言处理入门书》有32条评论
  1. 补充一本,《Statistical Machine Translation》,是我们系的Philipp Koehn前不久刚写好的,应该算是我目前看到的讲统计机器翻译的最详尽的一本书了。我只有一个草本,正式本可能会在几个月后出版,这里是亚马逊的链接:

    http://www.amazon.co.uk/Statistical-Machine-Translation-Philipp-Koehn/dp/0521874157/ref=sr_1_1?ie=UTF8&s=books&qid=1247577671&sr=1-1

    估计不久后也会有中文版面世。

    [回复]

    admin 回复:

    呵呵,这本书我在“自然语言处理与计算语言学书籍汇总之五:机器翻译”里介绍了一下,不过你实在太幸福了!

    [回复]

  2. 太羡慕了,这本书可否小范围共享下啊,保证不外传。牛人大作,好想拜读啊

    [回复]

    admin 回复:

    呵呵,这个我不能随便表态的。

    [回复]

  3. Neil能不能传给我一下呢?等到国内出版,至少得两年,等不及啊,这种好书

    我的邮箱是fslptehc at gmail dot com

    [回复]

    admin 回复:

    Neil最近似乎不在,这个问题请等他和Philipp Koehn咨询之后给你个答复,毕竟涉及版权的问题,在国外尤其注重这个,不好意思。

    [回复]

  4. 手头上有一本Foundations of Statistical Natural Language Processing的pdf版本发到你邮箱了,是英文版,网上应该也可以下载的到。其他几本书我都是购买的纸质书籍,无法传阅;另外smt的书籍限于版权的问题,抱歉!

    [回复]

  5. Neil ,可否发给我一下呀,真的非常需要,
    保证不外传!
    非常谢谢!hhystar@163.com

    [回复]

  6. 非常不好意思,也理解你的心情,但是估计Neil比较为难,我也很为难!
    这本书的电子版如果得到允许可以提供,我会第一时间mail你的,也会通知给大家!
    不过还是希望这里以后不要有这种评论了,如果出现,我会删除的!再次抱歉!

    [回复]

    语言学小生 回复:

    您好,能否给我一份,非常感谢!!!zhiq.wang@163.com

    [回复]

    52nlp 回复:

    Sorry!

    [回复]

  7. 第一次看到博主的文章,隐隐的感觉像是HIT的。一直得不到确定。看到这文章,终于证实了。在这儿学习了不少知识,对学长表示一下敬意。

    [回复]

    52nlp 回复:

    谢谢,欢迎常来看看!

    [回复]

  8. 《Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition》
    这本书翻译的是在不敢恭维
    开篇,库布里克2001年的电影太空奥德赛....
    我就看不下去了,这译者的态度~

    [回复]

    52nlp 回复:

    建议再多看一些内容,至少我觉得这本书冯志伟老师翻译的很好的!当然有些地方会不尽人意,但是毕竟“瑕不掩瑜”。

    [回复]

    placebo 回复:

    n-gram那章也是翻的不知所云,应该就是找了几个研究生吧,唉,那个年代google翻译还不是很好,现在用google直接翻效果都还是可以的,我还是看英文版吧~英文版写的超级好,看的都放不下了。

    [回复]

    52nlp 回复:

    嗯,技术书籍,能直接看原版就原版吧!

  9. 最近开始学结构化学习,师兄这关于CRF的资源挺多的。师兄是计院哪级的啊?

    [回复]

    52nlp 回复:

    其实我是数学系的,呵呵。

    [回复]

  10. 博主写的很好,我是一个入门者,看到楼主提供的很多信息,收益匪浅,期待能够尽快入门。
    后续也希望有机会和博主多交流

    [回复]

  11. 博主您好,可以分享你提到的这几本书的pdf版么?O(∩_∩)O谢谢

    [回复]

    52nlp 回复:

    抱歉,没有,建议直接购买书籍吧

    [回复]

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注