月归档:二月 2009

自然语言处理公司巡礼六:Metaweb

  在自然语言处理公司Powerset的介绍中,Powerset使用的知识来源除了维基百科外,另一个主要来源就是Freebase,而Freebase的幕后则是“野心勃勃”的Metaweb.

发表在 自然语言处理, 语义网, 随笔 | 标签为 , , , , , | 2 条评论

自然语言处理公司巡礼五:Autonomy

  两年前我关注Autonomy创始人麦克•林奇这个名字的时候,主要是因为他说了一句“Google不是我的对手”以及“英国的比尔•盖茨”这个名号!

发表在 自然语言处理, 随笔 | 标签为 , , , , | 留下评论

自然语言处理公司巡礼四:Systran

  每一个行业都有一个或屈指可数的几个巨头在引领潮流,比如操作系统领域是微软,搜索引擎领域是谷歌,视频领域是Youtube,而机器翻译领域的老大无疑是Systran!

发表在 机器翻译, 自然语言处理, 随笔 | 标签为 , , | 留下评论

语言模型训练工具SRILM详解

  SRILM是著名的约翰霍普金斯夏季研讨会(Johns Hopkins Summer Workshop)的产物,诞生于1995年,由SRI实验室的Andreas Stolcke负责开发维护。

发表在 机器翻译, 语言模型 | 标签为 , , , , , , , , | 29 条评论

MIT自然语言处理第四讲:标注(第一部分)

自然语言处理:标注 Natural Language Processing: Tagging

发表在 MIT自然语言处理, 标注, 自然语言处理 | 标签为 , , , , | 一条评论

“大教堂与市集”摘要

  比较喜欢阅读“大教堂与市集”,这里做个摘要,希望自己有一天也能去实践文中的思想。

发表在 随笔 | 标签为 | 2 条评论

自然语言处理公司巡礼三:Inxight

  搜索Inxight,中文信息量较之Powerset非常之小,主要是关于它被BO收购的消息,比较“可怜”的是,Inxight的官方网站已不存在,被指向到了SAP的子站点了。

发表在 自然语言处理, 随笔 | 标签为 , , , , | 4 条评论

自然语言处理公司巡礼二:Powerset

  在数学中,Powerset的意思是幂集的意思,一个集合S的幂集指的是S的所有子集。这是Powerset主页中给出的这个名字的数学解释,但是这又预示着什么呢?

发表在 自然语言处理, 随笔 | 标签为 , , , | 留下评论

自然语言处理公司巡礼一:Teragram

  写这个题目的时候,自然语言处理(NLP)和高级语言技术上处于领先地位的私人公司Teragram 被商业智能和分析软件供应商SAS收购(08年3月17日),宣称使用自然语言处理搜索技术的Powerset被微软收购(08年7月1日),在文本分析方面领先的Inxight被法国商业智能软件公司Business Objects(BO)收购(07年5月31日),而BO随后又被德国软件大鳄SAP收购(07年10月7日)。

发表在 自然语言处理, 随笔 | 标签为 , , , , , , , , , | 留下评论

不做什么,做什么,为什么——董振东与知网

  看了董振东老师在中文信息学会成立二十七周年学术会议上的关于知网的发言“不做什么,做什么,为什么”,虽然短短两页,却写得言简意赅!董老坚守知网20年,是国内自然语言处理领域的泰山北斗!非常值得尊重和学习!

发表在 自然语言处理, 计算语言学, 随笔 | 标签为 , , , | 留下评论