第一砖,混在NLP!

这第一板砖,就谈谈大家可能感兴趣的讨论题目吧。

我接触NLP的时间很短,在最初的几年里,兴趣也不浓厚,只是被动的去听课,听听报告(现在想起来错过了很多牛人的报告)。应该是我的导师不厌其烦的鼓励,还有当时的新室友(samcd)让我有了一些兴趣去尝试深入了解一些NLP问题。

随后就在水木nlp版和52nlp出没,到现在已经有挺长一段时间了,从开始看大家讨论,到跟着掺和,学到了不少东西,也纠正了很多错误的概念,受益匪浅!总体上感觉有一些问题是比较引人注意的,经常引发讨论。 希望我们能像52nlp建议的那样, 充分发挥自己的特长,在自己关注的,或者工作的领域上引导一些专题讨论,由浅入深,进而汇总成一组对更多nlpers(从入门到进阶)都有帮助的资源。

希望大家积极揭发身边的领域内“知名人士” 来主持感兴趣的专题:-)

0,宏观介绍NLP研究趋势(符号规则,统计学习,等等)—-这个需要大牛来做。。。

1, 有关自然语言处理的一些基本问题, 同时也是经典问题,尤其以不同语言的预处理(哪怕是英语,细问起来,你会发现不同人对不同任务的预处理习惯差别还挺大, tokenization? lemmatizatioin? ), 中文分词,POS标注,computing word similarity, WordNet 和语言模型(LM). (谈这些问题就不可避免地会谈及一些经典模型,从规则到统计,我想可以穿插进行,现在流行的ML paper不是经常拿pos-tagger等小任务来展示自己嘛)

2, 一些NLP的综合应用,从经典的自动语音识别(ASR),语音合成(TTS),到语义分析(semantics,例如,语义消歧(WSD),语义表示 (semantic space),semantic role labelling),句法分析(各种语法:PCFG, HPSG,甚至CCG, TAG, QG)。我们不可能找个人出来精通所有这些,但大家都贡献自己专长的某一部分的经验,综合起来就会非常漂亮了(欢迎大家互相揭发)。

3,面向实际的深层次综合应用。这个就不用列举了吧,大家都是各方面的行家。从Natural Language Generation, 机器翻译(MT),自动文本摘要(summarization, text2text compression),情感分类(sentiment analysis),对话系统(dialogue),问答系统(QA),推荐系统,基于信息抽取(IE),信息检索(IR)的一大类需求(Keyword Extraction , Relation Extraction, Text Representation, Text Classification)

4,一些经典的模型(各种机器学习模型等等),方法(bayesian方法--这个我来揭发PCA),这个52nlp已经做了大量的工作了:)

5,一些资源,工具的介绍,使用心得。WordNet, Penn TreeBank,(常用语言资源),机器翻译资源(europar?), FrameNet,probank, 各种 POS-taggers, 中文分词包,parsers,一些常用的工具,Lingpipe,SRILM, 等等

完全覆盖所有这些话题是不太现实,不过至少我们可以挑选一些有广泛代表性的问题开始,然后再开展一些更深入的专题。

欢迎大家拍砖,希望我们能尽快确定一个大致的列表。下周ACL的deadline一过,就可以找各位牛人“志愿”了:)

此条目发表在自然语言处理分类目录。将固定链接加入收藏夹。

第一砖,混在NLP!》有 16 条评论

  1. 52nlp说:

    一觉醒来,真是好消息不断啊!
    非常支持加非常感谢Cat老兄的鼎立支持!

    [回复]

    finallyliuyu 回复:

    赞boycat

    [回复]

  2. 白大王说:

    好多觉之后醒来,发现52nlp好像比当初做链接时热闹了很多?

    [回复]

    52nlp 回复:

    嗯,的确要热闹很多!

    [回复]

  3. 王 增才说:

    我在写一篇汇编语言的基于哈希表和二叉树的中文词典的文章,写完了,放上来,希望能抛砖引玉。

    [回复]

    52nlp 回复:

    非常感谢!非常期待!

    [回复]

  4. wildboar说:

    这是改版了啊!哈
    52nlp快成社区了,哇咔咔!

    [回复]

    52nlp 回复:

    应该是介于社区和介于博客之间的“群体博客”!

    [回复]

    shimo 回复:

    前段时间还在水木上说改版,这么快就好了~送赞~顺赞boycat牛~

    [回复]

    52nlp 回复:

    欢迎注册!欢迎分享!

  5. Jcai说:

    关注你的博客有段时间了,来冒个泡泡。 顺祝新年好,期待讨论版块!

    [回复]

    52nlp 回复:

    新年快乐!常来看看!

    [回复]

  6. necrostone说:

    google里搜到,自然语言处理 博客,第一个就是这里。

    最近心情特别郁闷,一直处在焦虑中,不知道各位是不是都是学生,是不是有就业的压力。

    用了很久,CL接收了我的文章,好容易能毕业了,可是就业路漫漫,投简历都是无回音。

    [回复]

    52nlp 回复:

    这里应该有学生也有工作者~

    CL指的是权威的《Computational Linguistics》杂志吗?如果是这个,只能说非常非常佩服。

    关于工作的问题,慢慢来吧,其实NLP的工作机会还是蛮多的,可以看看水木自然语言处理版,最近有很多的招聘信息。

    [回复]

    necrostone 回复:

    感谢博主回我。
    是那个CL。
    刚读博的时候方向是随意的,确实也对NLP不了解也不是很感兴趣,不过既然是进了就应该做出点什么。
    想找个地方踏实的做研究特别难。体制内的似乎是个选择,不过已经没有地方了…;体制外的根本就不是搞研究的,他们可容不得你思考的时间。

    [回复]

    52nlp 回复:

    谢谢你今天回了这么多,我可能不能一一答复了!
    我觉得你既然能在CL上发文章,确实很适合做研究,不过感觉你对体制内和体质外的认识也仅仅停留在认识上,因为你还不曾经历,所以下这样的结论未免有点早。
    祝早日找到适合自己的工作!

发表评论

电子邮件地址不会被公开。 必填项已用*标注