月归档:十二月 2008

机器翻译档案计划

  大多数人都知道“互联网档案计划”(Internet Archive),这个计划的目的就是为互联网保存一份档案。现在机器翻译领域也有了自己的档案计划,这里我介绍一下。

发表在 机器翻译 | 标签为 , , | 留下评论

wiki上一个比较好的HMM例子

  HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、词性标注及语音识别等,在NLP中占有很重要的地位。

发表在 隐马尔科夫模型 | 标签为 , , , | 2 条评论

Visuwords安装及问题

  无意间从一个NLP tools推荐网站上发现了Visuwords,它的描述“online graphical dictionary”(在线图结构词典)比较吸引我

发表在 词典 | 标签为 , , , | 留下评论

几本自然语言处理入门书

  如果你刚接触自然语言处理并对她感兴趣,最好读几本这方面的书籍,除了能让你知道自然语言处理各个领域是干什么的外,还能培养一下NLP的感觉。

发表在 自然语言处理 | 标签为 , , , | 27 条评论

自然语言处理与机器翻译FAQ

  博客搬家以来,一直想为“我爱自然语言处理”写个自然语言与机器翻译的通俗介绍。

发表在 机器翻译, 自然语言处理, 转载 | 标签为 , , | 一条评论

BITS架构分析

  晚上读了LDC的语料库自动采集系统(BITS)的论文,感觉其可操作性更大,可以考虑结合Strand的框架设计一个语料库收集工具的新的架构。

发表在 语料库 | 标签为 , , , , , , | 留下评论

统计机器翻译中的几篇经典文献

  MIT人工智能实验室的《如何做研究》建议阅读本领域中最本质的几篇论文:“如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么”。

发表在 机器翻译 | 标签为 , , , , , | 2 条评论

统计机器翻译与资源建设思考

  统计机器翻译发展到目前为止,我觉得最主要的两个里程碑式的工作应该是:一是Brown等在90、93提出的统计机器翻译框架及其数学基础;二是Och等在2002年提出的基于最大熵模型的统计机器翻译框架。

发表在 机器翻译, 语料库 | 标签为 , , | 6 条评论

机器翻译研究单位调研

  前段时间调研了一下与汉语有关的机器翻译研究单位,不是很全面,如有遗漏,欢迎补充!

发表在 机器翻译 | 标签为 , , | 留下评论

Google、网易、百度在线翻译调查及分析

  机器翻译市场是一块大饼,目前很多大公司都已经进入或准备进入机器翻译市场。从已推出的在线翻译情况看,除了国外的Google、雅虎、微软外,08年下半年国内的百度、网易也推出了在线翻译产品,

发表在 机器翻译 | 标签为 , , , , | 2 条评论