自然语言处理公司巡礼二:Powerset

  在数学中,Powerset的意思是幂集的意思,一个集合S的幂集指的是S的所有子集。这是Powerset主页中给出的这个名字的数学解释,但是这又预示着什么呢?

Powerset:自然语言搜索不是新的“概念股”
  无论在Google还是百度,搜索“Powerset”所得到的反馈远比Teragram多得多,但这些信息无非可总结为几条吸引人眼球的内容:
  1、 Powerset独家获得自然语言处理搜索技术使用权将挑战Google——对于搜索引擎老大Google发起挑战无论如何都是爆炸性的新闻,无怪乎那么多网站转载,也不管里面的内容是真是假!而这条新闻发布的时候Powerset还是一个“概念股”!
  2、 基于自然语言搜索技术的新型搜索引擎Powerset正式启动——这条信息的发布是在08年5月12号,这说明Powerset还不是“概念股”,还是实实在在做了些东西,无论是骡子是马,终于拉出来溜了!
  3、 微软1亿美元收购Powerset——在Powerset推出不到两个月,微软来了,“狼子野心,路人皆知”,用Powerset的技术来与Google对抗,不过这也从另一个方面说明自然语言处理搜索引擎的是被看重的!
  我比较关注Powerset到底真正使用了哪些自然语言处理技术,抛去网络上真真假假的消息,在Powerset的官方网站上,可以看到关于Powerset的目标介绍:
  
  Powerset’s goal is to change the way people interact with technology by enabling computers to understand our language. While this is a difficult challenge, we believe that now is the right time to begin the journey. Powerset is first applying its natural language processing to search, aiming to improve the way we find information by unlocking the meaning encoded in ordinary human language.
  Powerset的目标是通过使计算机理解人类语言的技术(自然语言理解?)改变人机交互的方式。虽然这是一个困难的挑战,但是是开启这个旅程的时候了!Powerset首先将自然语言处理应用到搜索之中,目标是在我们寻找信息的过程中将人类语言中隐藏的意义展现出来!
 
  “Powerset is first applying its natural language processing to search”,这里是Powerset在宣称自己是第一个自然语言处理搜索引擎的公司吗?我对这句话的翻译把握不准,但是如果从“Powerset独家获得自然语言处理搜索技术使用权将挑战Google”这条新闻来看,这里翻译为第一应该可以接受。
  但果真如此吗?因为在众多的搜索结果中,我也看到了把Powerset称为语义搜索引擎的消息,而语义搜索似乎已经作为下一代搜索技术的代名词炒作了一段时间了。而关于语义搜索引擎,在Powerset之前,已经有Hakia,Cognition等的存在了,最近也有一个来自印度的语义搜索引擎Sagoon刚刚发布!另外Hakia在很多文章也被称为自然语言搜索引擎。更有甚者,写了一段这样的文字:
  “上个世纪 90 年代初,在很多用户为繁杂的不相关信息而头痛时,AskJeeves 诞生了。然而度过了惨淡的网络泡沫,该公司转而使用关键词搜索并且放弃了名为 Jeeves 的卡通吉祥物,来区别它曾经依赖自然语言算法的时代,这就是现在的Ask网站。”
  可见,“自然语言搜索”并不是什么新的概念股,关键问题是如何做出与这个概念股相匹配的搜索引擎。而目前无论是Powerset,亦或Hakia,还仅仅处于起步阶段,但是他们所推出的概念股,却恰恰是我们所期待的智能搜索引擎,因此无法轻视!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:
http://www.52nlp.cn/natural-language-processing-company-powerset/

此条目发表在自然语言处理, 随笔分类目录,贴了, , , 标签。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已用*标注