推荐《用Python进行自然语言处理》中文翻译-NLTK配套书

  NLTK配套书《用Python进行自然语言处理》(Natural Language Processing with Python)已经出版好几年了,但是国内一直没有翻译的中文版,虽然读英文原版是最好的选择,但是对于多数读者,如果有中文版,一定是不错的。下午在微博上看到陈涛sean 同学提供了NLTK配套书的中译本下载,就追问了一下,之后译者和我私信联系,并交流了一下,才发现是作者无偿翻译的,并且没有出版计划的。翻译是个很苦的差事,向译者致敬,另外译者说里面有一些错误,希望能得到nlper们的指正,大家一起来修正这个珍贵的NLTK中文版吧。另外译者希望在“52nlp”上做个推荐,这事是造福nlper的好事,我已经在“资源”里更新了本书的链接,以下是书的下载地址:

PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版

  翻看了一下翻译版,且不说翻译质量,单看排版就让人觉得向一本正式的翻译书籍,说明译者是非常有心的。以下是从翻译版中摘录的“译者的话”:

  作为一个自然语言处理的初学者,看书看到“训练模型”,这模型那模型的,一直不知
道模型究竟是什么东西。看了这本书,从预处理数据到提取特征集,训练模型,测试修改等,一步一步实际操作了之后,才对模型一词有了直观的认识(算法的中间结果,存储在计算机中的一个个pkl 文件,测试的时候直接用,前面计算过的就省了)。以后听人谈“模型”的时候也有了底气。当然,模型还有很多其他含义。还有动词的“配价”、各种搭配、客观逻辑对根据文法生成的句子的约束如何实现?不上机动手做做,很难真正领悟。

  自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度
讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。

  本书是译者课余英文翻译练习,抛砖引玉。书中存在很多问题,尤其是第10 章命题逻
辑和一阶逻辑推理在自然语言处理中的应用。希望大家多多指教。可以在微博上找到我(w
eibo.com/chentao1999)。虽然读中文翻译速度更快,但直接读原文更能了解作者的本意。

  原书作者在书的最后列出了迫切需要帮助改进的条目,对翻译本书建议使用目标语言的
例子,目前本书还只能照搬英文的例子,希望有志愿者能加入本书的中文化进程中,为中文
自然语言处理做出贡献。

  将本书作学习和研究之用,欢迎传播、复制、修改。山寨产品请留下译者姓名和微博。
用于商业目的,请与原书版权所有者联系,译者不承担由此产生的责任。

翻译:陈涛(weibo.com/chentao1999)

2012 年4 月7 日

   最后希望大家在读这本书的过程中,记录一下需要勘误的地方,可以在“评论”中给出勘误建议,一起来修正这本书。谢谢!

此条目发表在中文信息处理, 自然语言处理分类目录,贴了, , , , , 标签。将固定链接加入收藏夹。

推荐《用Python进行自然语言处理》中文翻译-NLTK配套书》有 37 条评论

  1. uha说:

    非常感谢译者~~
    提个小小的校正建议..刚刚看到第17页:
    “它是一个 string 对象,包含用来把字 符串分割成词的 split()方法(或叫操作、函数)。我们在对象名称后面写句号(点)再写方 法名称就可以调用对象的一个方法,即 line.splie()。”
    最后的splie是不是应该是split呢?..

    [回复]

    52nlp 回复:

    谢谢,应该是split,最快的勘误者!

    [回复]

  2. qingshi说:

    感谢。泪奔~中
    能否把中英文的术语对照表公布,就更加完美了。
    我注意到第9.1节有“术语”的小节,不知道为何其他章节没有。

    [回复]

  3. goog说:

    看中文的好处是 ?不解?

    [回复]

    52nlp 回复:

    个人认为,能看英文尽量看英文,但是还是有很多读者有中文版需求的,要照顾多数。

    [回复]

    goog 回复:

    hi! 随便问下,我不是数学专业的,请问有什么crf资料可以让我看懂其原理啊 thx!

    [回复]

    52nlp 回复:

    建议看看”pgm”课程。

  4. goog说:

    是 概率图模型吗?

    [回复]

    52nlp 回复:

    是的。

    [回复]

  5. jianzhu说:

    这样的译者太伟大了~
    赞!

    [回复]

    52nlp 回复:

    师兄也来了啊!呵呵!

    [回复]

  6. jianzhu说:

    @goog
    可能这篇paper对你理解crf比较有帮助,我当初是参考的这篇paper
    http://www.scai.fraunhofer.de/fileadmin/images/bio/data_mining/paper/crf_klinger_tomanek.pdf

    [回复]

    Pasenture 回复:

    感动到哭。。一直在看crf。。对于一个基础入门的小博来说看了一些paper,表示能看懂大概理论,凡是涉及到数学公式或者类似的东西立马就跪了!求大神给点建议。。

    [回复]

  7. kingsten_88说:

    译者可敬!

    [回复]

  8. babam说:

    向译者致敬

    [回复]

  9. Callon说:

    感谢分享!

    [回复]

  10. 纸鸢说:

    谢谢译者!谢谢分享!
    刚刚开始读,遇到个问题不知道有什么相关的论坛可以提问,所以冒昧来这里留个言:
    我在试运行Babelizer的时候显示错误:
    BabelfishChangedError: Can’t recognize translated string.
    在nltk的网上也没有发现相应的排错说明,恳请各位帮忙~谢谢!

    [回复]

    52nlp 回复:

    建议直接问 @陈涛sean 同学。

    [回复]

  11. Aquastar说:

    280 页
    这只是Piglet 句子长度的一般
    > 这只是Piglet 句子长度的一半

    [回复]

    52nlp 回复:

    谢谢

    [回复]

  12. 说:

    楼主,有个问题,我安装nltk_data时,总有两个包安装不成功,我甚至自己下载了,也同样不行,这两个包是:propbank.zip和nombank.1.0.zip。同时,还有一个问题,在输入text3.generate(),出现Building ngram index…AssertionError:的错误信息,这是怎么回事呀

    [回复]

    52nlp 回复:

    抱歉,我大概三年前玩过NLTK,已经很久没碰了,你的问题,不太清楚,建议你直接在微博上问 @陈涛sean 同学吧。

    [回复]

  13. Pingback引用通告: 如何计算两个文档的相似度(三) | 我爱自然语言处理

  14. Halcyon说:

    致敬,我是一开始想找一个Linux下语音处理软件,查到了HTK;不知HTK为何,查到了HMM;不知什么是隐式马尔科夫模型,查到了wiki,百度空间;百度空间介绍的内容据说链接自这里,最终才来到这个神秘的博客群!很酷的博客,内容真的不错,很多惊喜,想学习人工智能,偏于应用的,不知有什么推荐的方向或指导?

    [回复]

    52nlp 回复:

    这个博客不神秘,呵呵。自然语言处理就是一个很偏应用的方向,当然机器人也是激动人心的方向。

    [回复]

  15. 小波说:

    想学习下语音识别,并能够自己做个简单的应用,给自己用下。陈涛真牛,下载了这个文档,感谢译者的无私奉献。

    [回复]

  16. sharp说:

    博主~~~ 问个问题,输入一个句子:
    I like swim。
    输出 其中可能的语法错误如 swim -> swimming

    能否给点思路
    谢谢

    [回复]

    52nlp 回复:

    抱歉,这个不是很清楚,你可以搜一下国外的grammar checker看看

    [回复]

  17. 李博渊说:

    楼主你好,该书链接已经失效,请问能否重新提供一下下载链接?

    [回复]

    52nlp 回复:

    这个链接是译者陈涛同学留的,可以微博上联系他问一下: http://weibo.com/chentao1999

    [回复]

  18. Anita说:

    我看连接取消了。谁能发一份‘《用Python进行自然语言处理》中文翻译-NLTK配套书’到我的邮箱wenhong1984@126.com。先谢过了。

    [回复]

  19. vvfock3r说:

    网盘分享被取消了,帮忙发一份到我邮箱,谢谢大家了

    [回复]

  20. 陈帅说:

    链接失效了,可以发给我一份吗?十分感谢。邮箱:2451260711@qq.com

    [回复]

    52nlp 回复:

    链接: http://pan.baidu.com/s/1i3DvwFV 密码: oxne

    [回复]

  21. wzm说:

    谢谢分享,正好要学nltk,非常感谢!

    [回复]

    咸鱼 回复:

    免费领了 译者的资源,谢谢了

    [回复]

  22. lightzhixing说:

    请问这本书有没有课后练习的答案或者源代码

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用*标注