标签归档:计算语言学

AINLP公众号"自动作诗机"上线

最近对自然语言生成或者文本自动生成技术比较感兴趣,做了一些调研,作为自然语言处理领域的难题之一,个人一直觉得自然语言生成(NLG)是最难的,虽然这一两年动辄会看机器模仿莎士比亚写剧本,模仿金庸写小说,这些不过是媒体用来吸引眼球的,总之这些字凑到一起看起来像模像样,但是读了之后不知所云。不过对于特定格式的文本,类似诗歌这种,如果不细究,从直观的角度来看确实还有点像那么回事,例如清华大学自然语言处理与社会人文计算实验室开发的九歌计算机诗词创作系统,还是很强大的:

所以我首先将目光瞄准了诗歌自动生成相关的资料上,在google了一圈后,锁定了ioiogoo同学的这篇文章和两个开源版本实现:

1)介绍文章:用Keras实现RNN+LSTM的模型自动编写古诗
2)ioiogoo同学原始版本代码:https://github.com/ioiogoo/poetry_generator_Keras
3)youyuge34同学的更新版本:https://github.com/youyuge34/Poems_generator_Keras

特别是最后这个版本,作者直接提供了训练好的模型数据:poetry_model.h5,如果不想训练,直接下载这个模型把玩即可。我尝试了一下训练流程,训练几百步的时候会报错,具体原因还没有细究。不过在继续训练自己的模型之前,可以基于作者提供的模型将这个自动作诗模块包装到AINLP公众号对话接口中去,所以花了一点时间,在AINLP公众号上上线了这个自动作诗机模块,算是玩具级别的自动作诗机吧,目前支持两个功能:藏头诗(提供四个字)和首字诗(提供一个字):

请注意这两个功能目前只提供'五言绝句'的生成,因为上述代码在训练模型的时候已经过滤了其他诗词,另外这套代码也用了一些trick,生成的结果也是随机的,每次都不一样。最后,感兴趣的同学欢迎关注AINLP公众号,直接在公众号对话里测试即可:

关于文本自动生成或者自然语言生成,如果有好的idea或者素材或者想法,欢迎留言讨论,这里也会继续关注这个话题。

注:原创文章,转载请注明出处及保留链接“我爱自然语言处理”:http://www.52nlp.cn

本文链接地址:AINLP公众号"自动作诗机"上线 http://www.52nlp.cn/?p=11995

EMNLP-CoNLL 2012 List of accepted papers

EMNLP-CoNLL 2012(Conference on Empirical Methods in Natural Language Processing and Natural Language Learning)会议将于2012年7月12-14日在韩国济州岛举行,以下是会议录用文章的情况,原文请参考官方网站:http://emnlp-conll2012.unige.ch/papers.html

继续阅读

From Google Research Blog: Google at ACL 2011

  自然语言处理与计算语言学的盛会ACL 2011即将在美国俄勒冈州波特兰市举行,而Google Research Blog在昨天发表了一篇“Google at ACL 2011”,给大家及时通报了今年Google在ACL 2011上的参与情况。粗略的看了一下,Google今年在ACL上发表的Paper涉及Part-of-Speech Tagging, Named Entity Recognition, Context-Free Parsing, Translation等自然语言处理的基础领域,值得NLPer们一阅。我是在Google Reader上看到的,直接看原文的话在国内可能需要“翻墙”,为了给大家节省一点“翻墙”的时间以及活跃这里的气氛,以下就全文转载了!
继续阅读

ACL-HLT 2011: List of Accepted Papers

  第49届国际计算语言学学术会议(Annual Meeting of the Association for Computational Linguistics,ACL)和人类语言技术会议(Human Language Technology,HLT)的联合会议(ACL-HLT 2011: Joint Conference of the 49th Annual Meeting of the Association for Computational Linguistics and the Human Language Technologies Conference) 将于2011年6月19号至24号在美国俄勒冈州波特兰市召开,目前ACL-HLT 2011官方网站上已经给出了今年的long paper录用情况,以下转载自ACL-HLT 2011的官方网站上的“List of Accepted Papers”。
继续阅读

Coling 2010 文章已可下载

  自然语言处理与计算语言学的盛会COLING 2010——第23届国际计算语言学大会(International Conference on Computational Linguistics)——正在北京举行,目前会议论文已经可以在ACL Anthology上下载,以下来自于ACL Anthology负责人Min-Yen Kan的邮件。 继续阅读

ACL 2010 Best Paper Awards

  ACL 2010官方主页似乎在前几天已经确定好了本次大会的Best Paper Awards,在其Awards页面里,不仅给出了本次大会的Best long paper, Best short paper, IBM Best student paper,而且包括其在会议期间Presented time. 继续阅读

ACL 2010文章已可下载

  晚上收到ACL Anthology负责人Min-Yen Kan发给ACL Anthology Google Group的邮件,通知说目前ACL 2010的文章已经可以下载,包括full papers, short papers, student research workshop papers, demonstrations, tutorial abstracts以及所有的workshops的Paper,才想起今天(7月11号)ACL 2010会议召开。以下是具体的下载地址,有兴趣的读者可以关注一下。 继续阅读

COLING 2010: List of Accepted Papers (Oral)

  这是Coling 2010的List of Accepted Papers(Oral),先是从水木自然语言处理社区看到,才在Coling的官方主页上找到。关于Coling本次的录用情况,水木自然语言处理版已经有过一波大讨论了,有兴趣的读者可以关注一下。 Coling是ACL之外另一个自然语言处理与计算语言学界的顶级会议,全称国际计算语言学大会(International Conference on Computational Linguistics),每两年举办一次,第23届COLING会议将于2010年8月23日~27日在中国北京举行,由中文信息学会承办。 继续阅读

冯志伟:自然语言处理的形式模型

  《自然语言处理的形式模型》是冯志伟老师2010年出的一本新书,也是近期国内自然语言处理及计算语言学领域的一部新著,属于”中国科大校友文库”系列,我没有看过全书,以下摘自于卓越网的介绍。 继续阅读