关于

这是一个自然语言处理爱好者的群体博客,欢迎nlper们注册,见博客右下角,点击“注册”按钮即可。进入wordpress注册页面后,输入想用用户名和邮件即可,确定后会有一封邮件发送到你邮箱,里面包含用户名,系统自动生成的密码以及登录页面;利用这个密码登录后会有提示修改密码,修改即可。注册的用户默认为“作者”组,可以在这里”随便“发与NLP相关的文章,一般不做限制,特别需要注意的是:
1、如果仅仅是“提问”最好到水木自然语言处理版,那里高手众多,问的问题一般能解决;如果不得不在这里提问,请写出你的思考,最好是深思熟虑过的。
2、编辑文章时段落前的空格需要用圆角符号空格,文章发表前最好按”预览“按钮观摩一下,文章最后选择一个分类,如果没有自己要用的分类可自建,已经几个tag(主题词)。
3、这里已经安装了latex插件,对于latex高手来说,在\$\$...\$\$之间插入latex公式即可在博文中显示相关的公式,如:
\(\iiiint_{F}^{U} \, dx\,dy\,dz\,dt \) ==> \iiiint_{F}^{U} \, dx\,dy\,dz\,dt

特别感谢以下已经为52nlp成为群体博客做出直接贡献的作者:
1、boycat:为52nlp转型为群体博客提出了最宝贵的建议和最直接的贡献-第一砖,混在NLP
2、finallyliuyu:在52nlp转型为群体博客后,贡献了第一篇博文-公布一批中文文本分类的新闻语料库
3、王增才基于哈希表和二叉树的词典研究

2010年12月8日之前,她是暂时属于52nlp的个人博客:
一个自然语言处理爱好者的个人博客,愿与您分享!且行且学习!且行且珍惜!如有任何问题,请联系52nlpcn#gmail.com (防止垃圾邮件,请将#换成@)。

推荐阅读:
如何学习自然语言处理
中文分词入门之资源

关于自然语言处理与机器翻译的一篇不错的介绍文章:
自然语言处理与机器翻译FAQ

机器翻译的一个有趣应用:
机器翻译与微软对联

一篇推荐文献阅读:
统计机器翻译中的几篇经典文献

两个文献存档网站介绍:
机器翻译档案计划
ACL Anthology——计算语言学的数字档案

自然语言处理书籍系列:
几本自然语言处理入门书
自然语言处理与计算语言学书籍汇总之一:国外书籍
自然语言处理与计算语言学书籍汇总之二:国内书籍
自然语言处理与计算语言学书籍汇总之三:国内书籍
自然语言处理与计算语言学书籍汇总之四:国内书籍
自然语言处理与计算语言学书籍汇总之五:机器翻译
自然语言处理与计算语言学书籍汇总之六:国外书籍
自然语言处理与计算语言学书籍汇总之七:其他书籍

Moses系列介绍:
Moses相关介绍
Moses基本框架
Ubuntu8.10下moses测试平台搭建全记录
Moses训练脚本的一个问题
Moses中模型训练的并行化问题

自然语言处理公司巡礼系列:
自然语言处理公司巡礼一:Teragram
自然语言处理公司巡礼二:Powerset
自然语言处理公司巡礼三:Inxight
自然语言处理公司巡礼四:Systran
自然语言处理公司巡礼五:Autonomy
自然语言处理公司巡礼六:Metaweb
自然语言处理公司巡礼七:Language Weaver

MIT自然语言处理系列:
MIT开放式课程“自然语言处理”介绍
MIT自然语言处理第一讲:简介和概述
MIT自然语言处理第二讲:单词计数
MIT自然语言处理第三讲:概率语言模型
MIT自然语言处理第四讲:标注
MIT自然语言处理第五讲:最大熵和对数线性模型

HMM相关:
wiki上一个比较好的HMM例子
HMM学习最佳范例与崔晓源的博客
几种不同程序语言的HMM版本
HMM学习最佳范例一:介绍
HMM学习最佳范例二:生成模式
HMM学习最佳范例三:隐藏模式
HMM学习最佳范例四:隐马尔科夫模型
HMM学习最佳范例五:前向算法1
HMM学习最佳范例六:维特比算法1
HMM学习最佳范例七:前向-后向算法1

52nlp历程:
2008年12月19日:博客新家,开始新的旅程!
2009年3月1日:“我爱自然语言处理”阶段性总结
2009年5月6日:“我爱自然语言处理”日访问量过百
2009年5月28日:“我爱自然语言处理”PageRank首次更新
2009年6月19日:“我爱自然语言处理”半岁
2009年6月24日:“我爱自然语言处理”PageRank再次更新
2009年10月30日:“我爱自然语言处理”PageRank更新为3
2009年12月19日:“我爱自然语言处理”一周岁
2010年12月8日:52nlp开放注册权限
2010年12月19日:“我爱自然语言处理”两周岁

关于》有 10 条评论

  1. miracle 说:

    请教一下博主,中文分词的词库是怎么制作的呢?我想好好系统学习一下您的分词系列文章,但是不知道词库我怎么搞定。谢谢!!!

    [回复]

    52nlp 回复:

    制作专业的词库是由专业机构做的,对于如何搞定词库,可以看看这篇文章:http://www.52nlp.cn/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%85%A5%E9%97%A8%E4%B9%8B%E8%B5%84%E6%BA%90

    [回复]

    miracle 回复:

    谢谢

    [回复]

  2. ricky 说:

    同问一下楼上的问题!
    我还有个问题,看了博主关于beautiful data 分词的文章,一般词库很大,都要事先装载到内存里吗?有没有什么特别的处理方式。或是有没有关于存储这些词库的方法,以及在内存中处理的方法。
    多谢!
    我是个刚入门,如果问题太初级还请包含!

    [回复]

    52nlp 回复:

    事实上,词库一般不会很大,因为仅仅是一些词而已,内存是装得下的。至于内存中的处理方法,主要是利用了一些比较好的数据结构,譬如trie树,或者double array trie等等。

    [回复]

    ricky 回复:

    多谢!^_^

    [回复]

  3. samurai 说:

    版主你好!!因为刚刚学习自然语言处理,虽然看了很多文摘,
    但是还是有很多不懂的地方!所以想找个引路人,希望版主能
    帮忙找几个在文本自动文摘方面有过研究的人,不胜感激!!

    [回复]

  4. 美蜂 说:

    我是在看了data beauty 的分词文章之后,搜索Viterbi算法来到这里的 ,很不错,go on

    [回复]

  5. 老栋 说:

    你好,我是一名在读本科生,打算往自然语言处理这个方向发展,希望博主可以推荐几个好的学校参考,谢谢

    [回复]

    52nlp 回复:

    国内大家比较推崇的大概是哈工大,清华,中科院,南大,苏大等几家,具体各个学校的研究方向你可以再仔细查查,我也不是很清楚。

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>