资源

这里提供一些52nlp博客的一些系列文章以及收集的自然语言处理相关书籍及其他资源的下载,陆续整理中!如有不妥,我会做删除处理!

特别推荐系列:
1、HMM学习最佳范例全文文档,百度网盘链接: http://pan.baidu.com/s/1pJoMA2B 密码: f7az

2、无约束最优化全文文档 -by @朱鉴 ,百度网盘链接:链接: http://pan.baidu.com/s/1hqEJtT6 密码: qng0

3、PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版陈涛sean 无偿翻译。链接: http://pan.baidu.com/s/1i3DvwFV 密码: oxne
4、正态分布的前世今生(pdf 版) – by @rickjin
5、LDA-math-汇总 LDA数学八卦 – by @rickjin
6、如何计算两个文档的相似度全文文档
7、中文分词入门之字标注法全文文档

一、书籍:
1、《自然语言处理综论》英文版第二版
2、《统计自然语言处理基础》英文版
3、《用Python进行自然语言处理》,NLTK配套书
4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦
5、《自然语言处理中的模式识别》
6、《EM算法及其扩展》
7、《统计学习基础》
8、《自然语言理解》英文版(似乎只有前9章)
9、《Fundamentals of Speech Recognition》,质量不太好,不过第6章关于HMM的部分比较详细,作者之一便是Lawrence Rabiner;
10、概率统计经典入门书:《概率论及其应用》(英文版,威廉*费勒著)
第一卷  第二卷  DjVuLibre阅读器(阅读前两卷书需要)
11、一本利用Perl和Prolog进行自然语言处理的介绍书籍:《An Introduction to Language Processing with Perl and Prolog
12、国外机器学习书籍之:
1) “Programming Collective Intelligence“,中文译名《集体智慧编程》,机器学习&数据挖掘领域”近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的”
2) “Machine Learning“,机器学习领域无可争议的经典书籍,下载完毕将后缀改为pdf即可。豆瓣评论 by 王宁):老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能”新”到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。
3) “Introduction to Machine Learning
13、国外数据挖掘书籍之:
1) “Data.Mining.Concepts.and.Techniques.2nd“,数据挖掘经典书籍 作者 : Jiawei Han/Micheline Kamber 出版社 : Morgan Kaufmann 评语 : 华裔科学家写的书,相当深入浅出。
2) Data Mining:Practical Machine Learning Tools and Techniques
3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher)
14、国外模式识别书籍之:
1)“Pattern Recognition
2)“Pattern Recongnition Technologies and Applications
3)“An Introduction to Pattern Recognition
4)“Introduction to Statistical Pattern Recognition
5)“Statistical Pattern Recognition 2nd Edition
6)“Supervised and Unsupervised Pattern Recognition
7)“Support Vector Machines for Pattern Classification
15、国外人工智能书籍之:
1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智能领域无争议的经典。
2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP
16、其他相关书籍:
1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor
2)Learning.Python第四版,英文

二、课件:
1、哈工大刘挺老师的“统计自然语言处理”课件;
2、哈工大刘秉权老师的“自然语言处理”课件;
3、中科院计算所刘群老师的“计算语言学讲义“课件;
4、中科院自动化所宗成庆老师的“自然语言理解”课件;
5、北大常宝宝老师的“计算语言学”课件;
6、北大詹卫东老师的“中文信息处理基础”的课件及相关代码;
7、MIT Regina Barzilay教授的“自然语言处理”课件,52nlp上翻译了前5章;
8、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然语言处理的机器学习方法)”课件;
9、Michael Collins的“Machine Learning (机器学习)”课件;
10、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高级自然语言处理)”课件;
11、Philipp Koehn “Empirical Methods in Natural Language Processing”课件;
12、Philipp Koehn“Machine Translation(机器翻译)”课件;

三、语言资源和开源工具:
1、Brown语料库:
a) XML格式的brown语料库,带词性标注;
b) 普通文本格式的brown语料库,带词性标注;
c) 合并并去除空行、行首空格,用于词性标注训练:browntest.zip
2、NLTK官方提供的语料库资源列表
3、OpenNLP上的开源自然语言处理工具列表
4、斯坦福大学自然语言处理组维护的“统计自然语言处理及基于语料库的计算语言学资源列表
5、LDC上免费的中文信息处理资源
6、中文分词相关工具:
1)Java版本的MMSEG:mmseg-v0.3.zip,作者为solol,详情可参见:《中文分词入门之篇外
2)张华平老师的ICTCLAS2010,该版本非商用免费一年,下载地址:
http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/.Public/ICTCLAS2010-packet-release.rar
7、热心读者“finallyliuyu”提供的一批新闻语料库,包括腾讯,新浪,网易,凤凰等,目前放在CSDN上:http://finallyliuyu.download.csdn.net/
另外finalllyliuyu在2010年9月又提供了一批文本文类语料,详情见:献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二

四、文献:
1、ACL-IJCNLP 2009论文全集:
a) 大会论文Full Paper第一卷
b) 大会论文Full Paper第二卷
c) 大会论文Short Paper合集
d) ACL09之EMNLP-2009合集
e) ACL09 所有workshop论文合集

资源》有 69 条评论

  1. Pingback引用通告: 自然语言处理相关书籍及其他资源 | 合创斋

  2. hongqh说:

    您好,机器学习相关书籍都不能下载了

    [回复]

    52nlp 回复:

    那个网盘失效了,这些书爱问上基本上都有,在那里找找吧,抱歉。

    [回复]

  3. blacksoil说:

    博主您好!
    我想问下您知道有没有一些公开的英文新闻数据(带时间标签的),比如yahoo!news dataset, 但是我不知道怎么下载或申请。谢谢博主啦!

    [回复]

    52nlp 回复:

    抱歉,这个不清楚。

    [回复]

  4. oscar说:

    你好 你知网的资源找到了吗 我做实验需要 能不能共享一份 oscarzhangke@qq.com

    [回复]

  5. abu说:

    真希望有人能从基础总结一套学习方案阿,
    数学方面要看哪些,计算机方面要看哪些,语言学要看哪些,自然语言处理方面的等等。作为新手只能是有点迷茫,感觉学海浩瀚,不知道从哪入手比较好。

    [回复]

    52nlp 回复:

    可以看看课程图谱博客上的一些系列文章,包括数学,计算机,机器学习等学科的课程系列,相信会有很多帮助 http://blog.coursegraph.com/

    [回复]

  6. zoky说:

    博主您好,我是再保险公司的精算师,请问怎样可以联系到您?

    [回复]

  7. asiagood说:

    我觉得博主的网站非常好,对于刚开始研究nlp的初学者来说,真的是太好的入门网站了。为什么不弄个donate,让大家尽点心意么。。。

    [回复]

    52nlp 回复:

    谢谢建议,不过暂时不考虑了

    [回复]

  8. 朱臻说:

    51nlp太棒的,有很多我要的资料,我做实体关系提取的 有志同道合的 可以聊聊阿
    qq: 1951352997 注明身份

    [回复]

  9. 逸兴遄飞说:

    博主,您好,首先非常感谢您的总结,对我们新手具有非常好的指引作用。关于课件分享,新浪爱问的不可以访问,不知可否从其他途径分享下?比如百度网盘之类的,谢谢!

    [回复]

    52nlp 回复:

    抱歉,很多资料由于在老电脑里不太好找了,建议google一下,我自己当时也是从公开途径获得后整理的

    [回复]

  10. Robin说:

    非常感谢你的资源,不过《自然语言处理综论》英文版第二版的链接好像失效了,我最近正在找这本书,您有资源的话不知道是否方便更新一下。谢谢!

    [回复]

    52nlp 回复:

    抱歉,我电脑换了之后有些资源找不到了,回头要是有的话我再更新一下吧

    [回复]

  11. dhqcl说:

    Pattern Recongnition 这本书我倒是有高清的电子版本,一直没有看。

    [回复]

  12. wangfeng说:

    老师您好,我看了您的关于斯坦福大学深度学习与自然语言处理的文章,里面评论说您把视频搬到了百度云了,请问能否给我一个链接呢谢谢老师。

    [回复]

  13. 说:

    博主你好,感谢你提供的资源,我是一个初学者,不知道该如何获得资源,不知道您愿不愿意帮助我,希望能得到您的回复
    qq:1952461154

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用*标注