分类目录归档:随笔

Airbnb(爱彼迎)的几次体验

Airbnb 最近有了中文名字:爱彼迎,貌似有些争议,不过之前我有三次良好的Airbnb住宿体验,刚好在这里记录一下,供大家参考。关于Airbnb的历史,大家可以参考维基百科上的注解:

Airbnb(中国大陆地区品牌名为爱彼迎,取“让爱彼此相迎”之义),是一个让大众出租住宿民宿的网站,提供短期出租房屋或房间的服务。让旅行者可以通过网站或手机、发掘和预订世界各地的各种独特房源,为近年来共享经济发展的代表之一。该网站成立于2008年8月,公司总部位于美国加利福尼亚州旧金山,为一家私有公司,由“Airbnb, Inc.”负责管理营运。目前,Airbnb在192个国家、33,000个城市中共有超过500,000笔出租数据。

第一次注册 Airbnb(爱彼迎)是在2015年8月,忘记了通过什么途径知道它的,但是记得第一次通过邀请链接注册可以获得200多元的旅行基金,所以就注册了。这里你也可以通过我的邀请链接注册,注册后你也可以获得200+的旅行基金,点击右边这链接即可:Airbnb旅行基金

第一次使用Airbnb的行程是2016年7月,去上海的参加本科同学聚会,带着不到2岁的宝宝,预定的是上海陆家嘴的一个江景公寓:

豪华装修,超大景观阳台,厨房配备全套餐具及微波炉,冰箱,洗衣机,熨斗,晾衣架,干净床上用品及毛巾,浴巾,一次性洗漱用品,每天客房清洁,每天更换床上用品,陆家嘴核心区域,地铁4号线浦东大道站1号出口,免费班车至国金中心,东方明珠,上海海洋水族馆,非常便捷.

预定付款后房东很快发来消息,意思是到公寓门口接待处直接报名字核实身份证那房卡即可。去了之后发现是酒店式公寓,不过感觉不错,面朝黄浦江,私密性也很好,入住手续很简单。

第二次使用Airbnb爱彼迎是在2016年9月,全家5口人去杭州,选择了西湖边的一个公寓:

本房源位于全杭州最靠近西湖的高端公寓,本公寓与西湖的距离只隔了一条马路的宽度,也是西湖景观最好热闹的片区和乘船的主要渡口。公寓位于西湖商圈中心,房源面积168平方,南北通透户型。三个卧室均配备1米8真皮软靠大床,上了楼顶后可观西湖全景。

到了杭州后对接的是一个负责房间保洁的阿姨,额外押了200块钱,房间基本如实所述,距离西湖很近,楼顶能看到大部门西湖景色,几个房间也很大,特别是带着老人和小朋友,有住家的感觉,比较方便。

第三次使用爱彼迎是在今年3月份,全家厦门鼓浪屿之行,选择了鼓浪屿码头边的一个民宿:

面朝大海手捧下午茶、家人围坐用餐的写意您将拥有;2个房间1.8大床和1.5大床;自助厨房一展厨艺;舒适客厅转角沙发看看大海看看电视随您意,向往的海景房就等您和家人共享;海湾公园饭后散步悠闲自在;咖啡一条街品尝世界各地的风味美食;酒吧一条街去放松去high吧!

接待我们的是房东,很客气,给我们钥匙之后就走了,住了2晚,去鼓浪屿和厦门大学很方便,第三天退房时房东还没赶过来,让我们把钥匙留在屋里就OK了。

总之,关于Airbnb,这三次体验都很不错,特别是全家出游带着老人和小朋友的时候,住在一起很有家的感觉。

注:原创文章,转载请注明出处及保留链接“我爱自然语言处理”:http://www.52nlp.cn

本文链接地址:Airbnb(爱彼迎)的几次体验 http://www.52nlp.cn/?p=9475

在微信公众号里使用LaTeX数学公式

因为有同学在微信后台咨询这个问题,所以这里简单记录一下,其实自己之前也摸索了一些方法,不是太完美,目前所使用的这个方法算是折中后比较好的。

这段时间在鼓捣“NLPJob”这个公众号,特别是微信公众号支持“原创声明”后,就很乐意将52nlp上积攒的一些文章搬上去,但是逐渐会遇到一些数学公式的问题。目前在52nlp上用的是mathjax完美支持LaTeX数学公式展现,但是微信公众号的编辑器没有这个支持,另外mathjax支持的公式形式不是图片形式,所以不能直接将文章拷贝上去,但是如果是数学公式图片,微信编辑器可以直接拷贝,所以最直接的想法就是将mathjax支持的LaTeX公式转换为公式图片保存在文章中,然后再全文拷贝到微信公众号编辑器中。

其实在mathjax之前,网页上的很多数学公式都是用这种折中的方式,包括很多wordpress数学公式插件,当年我也因为52nlp上的公式问题还自己动手写了一个小的wordpress插件,但是当mathjax出现之后,之前的方案就显得很一般了。所以就开始尝试找一下支持img缓存的LaTeX公式插件,不过多数都不满意或者有瑕疵,甚至自己又开始动手修改代码,然后blablabla....,最终发现 quicklatex这个神器和它的wordpress插件QuickLaTeX,几乎完美支持和兼容Mathjax所支持的LaTeX数学公式。方法很简单,只要在wordpress中安装quicklatex,然后在文章的开头添加一个:[latexpage] ,然后文章中所有的latext公式都会转换为图片形式,类似昨天发出的rickjin的这篇文章:LDA数学八卦:神奇的Gamma函数(1)。当然需要先在wordpress中完成编辑转换,再全文拷贝到微信公众号中,微信会自动的将这些图片上传到它自己的图片服务器上。不过依然希望微信公众号编辑器能早日支持LaTeX公式编辑甚至Mathjax。

树莓派(Raspberry Pi)使用小记

最近开始玩树莓派,在淘宝上采购了两套树莓派(Raspberry Pi, Model B+)及相关配件,虽然网上有很多资料可以参考,不过经过自己实践和踩了一些坑之后,觉得有必要记录一下,也提供给对树莓派感兴趣的同学做个参考,可以少走一些弯路,尽快把树莓派点亮。

关于树莓派的资料很多,这里就不多介绍了,树莓派吸引我的原因其实很简单:卡片式大小,烧录SD卡之后就可以变身一个Linux主机,对于我这个硬件门外汉来说就可以用喜欢的语言来操控一些硬件接口,然后就可以动手实现一些年少时的idea了。
继续阅读

CIKM Competition数据挖掘竞赛夺冠算法陈运文

背景

CIKM Cup(或者称为CIKM Competition)是ACM CIKM举办的国际数据挖掘竞赛的名称。CIKM全称是International Conference on Information and Knowledge Management,属于信息检索和数据挖掘领域的国际著名学术会议,由ACM SIGIR分会(ACM Special Interest Group on Information Retrieval)主办。

随着数据挖掘技术越来越重要,CIKM会议的影响力也水涨船高,逐渐逼近KDD、WWW、ICDE。2014年是CIKM第一次在中国大陆举办,邀请了Google大神Jeff Dean,微软EVP陆奇博士和德国Max Planck Institute的Gerhard Weikum教授担任Keynote Speaker,盛况空前。CIKM很重视工业界的运用,既有面向工业届的Tutorial/Workshop,也有CIKM Cup这样面向实战的国际数据挖掘竞赛(类似另一个著名的数据挖掘竞赛KDD Cup),比赛使用真实的工业界数据和应用课题,让全世界的数据挖掘选手们一较高下。

cikm

今年的CIKM Cup竞赛的题目是自动识别用户的查询意图(Query Intent Detection,QID),主办方提供了来自百度线上的真实的用户查询和点击的数据(总行数为6141万行),竞赛目标是根据已标注的用户行为数据,来判断其中用户查询时的真实意图,要求识别的准确率和召回率越高越好。比赛历时2个半月,共吸引了520支队伍参赛,最终我们的队伍Topdata脱颖而出,所提出的算法以F1值0.9296排名Final Leaderboard第一获得冠军!

topdata

应很多朋友的邀请,发表这篇文章详细介绍我们使用的方法,给对大数据挖掘算法感兴趣的朋友们作个参考。另外在领奖现场我们和其他参赛队伍作了愉快的交流,因此本文也吸收了其他队伍的一些优秀思路,可以看作是这次竞赛整体方法和对策的总结。文章最后还附上了一些我个人的参赛感言(陈运文)。
继续阅读

NLPJob 主站上线

NLPJob之前主要以博客的模式在运作,虽然这个圈子的招聘很热闹,每次的招聘信息大家也响应的很热烈,但是毕竟博客这种人工模式比较低效,加之自己之前忙于其他的事情,这个博客慢慢的也淡了。前段时间,打开nlpjob的联系邮箱(nlpjob01 at gmail.com) 看了一下,赫然发现躺了很多邮件,包括招聘方的,也包括求职者的,由于自己的疏于搭理,冷落了这批同学,自己深感自责。所以,这段时间我在考虑把 NLPJob 的主站上线,考虑找个开源的或者自己动手写一个心中比理想的小众招聘网站来服务这个圈子。恰好清明的时候遇到了Jobberbase,试用后的立马觉得就是它了,所以这两天和同事一起着手定制和汉化,现在终于可以和大家打招呼了,欢迎大家试用,也欢迎大家多提建议。

www.nlpjob.com

这是一个完全自助式的互联网公司招聘平台,不需要任何注册信息。只需要在招聘和求职的时候留下相关的邮箱即可,我们的平台讲通过邮件服务为招聘者和求职者建立相关的联系

使用的时候招聘的同学可以直接发布职位,请注意,为了防止Spam,第一次发布职位的时候需要我们后台进行验证,如果验证通过,以后发布讲一路绿灯,畅通无阻,主要参照物将是邮箱。求职的同学可以在这个平台上直接申请相关的职位,求职信息及简历讲通过我们的平台邮件发送到招聘者的信箱之中。

另外特别需要注意的是,请猎头同学在发布职位的时候务必开头注明是猎头职位,否则讲无法通过验证或者将做删除处理。

如果您需要讲招聘信息置顶或者推荐到首页,请通过邮箱或者微博私信和我们取得联系,商讨相关事宜:

邮箱: nlpjob01@gmail.com
微博:@NLPJob

顺丰海淘SFBuy首次体验-美国亚马逊海淘Kindle DX转运全攻略

虽然家里早已有一个6寸多的Kindle,但是发现阅读一些英文pdf书籍和paper还是很不方便,所以一直想搞一个大一点的Kindle。虽然知道海淘已经有一段时间,但是一直没有尝试,即使前段时间决定要买一个9.7寸的Kindle DX (Kindle DX, Free 3G, 9.7" E Ink Display, 3G Works Globally) ,也跑到淘宝上了解了一下海外代购的价钱。不过促使我第一次开启海淘之旅的还是由于顺丰海淘SFBuy的走起:

SFBuy开淘走起!

SFBuy 自4月10日正式开放客户体验,请点击 "SFBuy邀请码获取" 或 "顺丰分享" 获取邀请码进行SFBuy注册,为了感谢您对SFBuy的支持,在4月30日前成功注册的客户我们将赠送一个月贵宾会员服务,欢迎您来注册!
我们将为您献上更贴心、更安全、更实惠、更快速的海淘转寄服务,通过SFBuy,海淘商品从美国转寄至中国内地只须7-10个工作日,运费低至三折,还可享受30天的免费仓储服务等。凭借顺丰速运超过20年的物流服务经验及稳定的技术保障,确保您海淘的宝贝安全到家。

所以在4月11号发现顺丰海陶SFBuy开放注册后,立即注册了一个账号,并且很快的在美国亚马逊(Amazon)上下单了Kindle DX (Kindle DX, Free 3G, 9.7" E Ink Display, 3G Works Globally) ,也就在那天,发了这样一条微博:

今天无意间发现顺丰的海淘开放注册了, 就通过邀请码的方式注册了一个帐号,然后在美国亚马逊上下单了一个9.7寸的Kindle DX, 第一次正式体验海淘,这里将继续记录这次顺丰海淘之旅。

昨天拿到 Kindle DX , 相当开心,整个过程历经了12天,期间还由于 Amazon 周末在美国投递没有成功耽误了两天,所以补充了如下的微博:

52nlp:10美元的手续费//@52nlp: 刚刚拿到kindle,开始的时候由于周末UPS在美国没有投递成功耽误了两天外,其他都比较顺利,回头写个小总结。

这几条微博得到了很多同学的回应,今天还有同学评论也下单了 Kindle DX , 所以觉得很有必要在这里把这次顺丰海淘及转运的整个过程记录一下。这次海淘也Google了很多资料,发现网上有很多海淘攻略,也有很多美国亚马逊 Amazon 海淘攻略,但是关于顺丰海淘SFBuy的资料不是太多,主要也就是官网上提供了一些海淘攻略,所以也就有了本文的题目:顺丰海淘SFBuy首次体验-美国亚马逊海淘Kindle DX转运全攻略 。好了,以下将尽可能的详细说明整个顺丰海淘亚马逊 Kindle DX 的过程,希望对以后有相似需求的同学有些帮助,其实海淘也很简单
继续阅读

DigitalOcean使用小记

晚上看到微博上的@developerWorks同学推荐DigitalOcean, 赫然发现自己使用DigitalOcean大概也一年了(2013年2月28日开始),自从前段时间把52nlp搬牵过来之后,我在国外的vps就只有DigitalOcean了。所以在微博上简短回复了一下:

上半年就开始用DO了,52nlp前段时间也搬到DO了,用的是10美元每月的Plan, 彻底告别了linode。

自从08年底52nlp开张以来,依次用过便宜好用的虚拟主机host2ez, 朋友免费赞助的小空间,Godaddy上免费附赠的空间(但是带广告),国外的老鹰主机(Hawkhost),以及用信用卡注册免费使用一年的AWS(但是一直没用上),直到遇见口碑极高的Linode,花上20多美元/每月搞一个完全自主拥有root权限的VPS(Virtual Private Server)后,发现自己已经离不开VPS了,虽然没有了Cpanel之类的控制面板可用(貌似也可以自己安装),但是更享受这种完全自主的命令行控制和Root权限。之后接触并玩过的VPS还有目前使用的阿里云和DigitalOcean

Linode大概使用了有两年,期间几乎没有出过什么问题,感觉非常棒,不过印象去年也是微博上某个朋友推荐我用DigitalOcean,号称配置SSD VPS( SSD cloud server, SSD云主机),了解了一下它的配置,发现最低配5美元/每月的Plan(512MB内存,1核,20G SSD硬盘, 1TB流量)和我每月20多美元的Linode Plan的配置基本旗鼓相当(不过目前linode最低配已经升级为1G内存...,印象也是这一年期间逐步加量不加价的,有竞争就是好啊),不过国外便宜的VPS有很多,不能因为便宜就放弃Linode,所以在没有放弃Linode的前提下选了一个Digital Ocean中最便宜的5美元/月的Plan玩一下,在这个上面诞生了“我爱公开课”,“挖课”等网站,也跑了一个python flask网站,课程图谱的前身:CourseraReview,从2013年2月28号到目前为止,基本上还没有出现过什么问题,感觉还不错,也欢迎大家体验这几个网站。

2013年年底,终于决定告别用了2年多的Linode,不是因为Linode不好,而是性价比没有DigitalOcean好,刚好这篇对比DO和Linode的英文文章“Digital Ocean vs. Linode”也道出了我的心声,这哥们也使用了2年的Linode,但是最终决定告别Linode,投向DigitalOcean的怀抱。所以除了之前5美元的vps外,我又为52nlp选了一个DigitalOcean中最流行的10美元/月的Plan或者官方说法是"Droplets",下面是我的后台截图,2个DigitalOcean Droplets:
继续阅读

52NLP微博-当真李逵遇到假李逵

  晚上无意间发现了新浪微博上有个52nlp的帐号:

  52nlp微博

  有点吃惊,虽然52nlp不是我的注册商标,任何人都有权利在新浪微博上注册,但是说成是我的,就有问题了。我没有在新浪微博上以52nlp的名义注册任何微博帐号,虽然前段时间在Twitter和腾讯微博上注册了52nlp的帐号,计划尝试玩一下微博,但是到目前为止还没有公开过,主要原因大概是自己认为做好52nlp这个博客就够了,其他都是浮云!同样,到目前为止,我没有加入任何自然语言处理的群,甚至也没有因为喜爱水木NLP版而去注册一个水木的帐号。
  但是,当我看到这个微博的时候,有点坐不住了,第一感觉就是“真李逵遇到假李逵”,没办法,别人已经注册了52nlp,我也没话说,但是请不要借用这个“52nlp”的旗号就行了。同样,为了遏制谣言,我刚刚注册了一个新浪微博帐号:http://weibo.com/2104931705,并且写下了我的第一条微博:

  52nlpcn:52NLP微博-当真李逵遇到假李逵!http://t.cn/hdjv3u

  如果你喜欢这里的52nlp,并且拥有新浪微博帐号,欢迎转发这条微博,非常感谢!

自然语言处理对于IBM超级计算机沃森(Watson)意味着什么?

  这几天估计很多人都在关注IBM超级计算机沃森(Watson)在美国最受欢迎的智力竞猜电视节目《危险边缘》中的表现,而在经历了三天的比赛后,沃森终于击败了该节目历史上两位最成功的选手肯-詹宁斯和布拉德-鲁特,成为《危险边缘》节目新的王者:IBM超级计算机在智力问答比赛中击败人类。与这场“人机大战”相关的信息中,几乎都会提及“自然语言处理”,毕竟沃森首先需要突破的就是能“理解人类的语言”,这当然是“自然语言处理”的份内之事。而在我看来,IBM沃森看起来更像一个超级的“自动问答”系统,当然,沃森背后凝聚的岂止是“自动问答”,它是一个包含了海量数据处理,机器学习,信息提取,文本分析,知识推理,自动问答等众多技术的的超级“人工智能”结合体。
  下午在看到这个消息时,我有一个很强烈的念头,要写一篇“IBM超级计算机沃森(Watson)背后的自然语言处理技术”,当然,即使写出来,也只能是一个旁观者的角度,需要一定的素材去挖掘。不过刚好有一篇相关的新闻给了我一些启示“IBM宣布八所大学参与沃森计算机系统的开发”:

“我们很高兴与这些在其各自领域表现优异的大学和专家们进行合作,他们可帮助推动作为 IBM沃森系统的支柱的问答技术的进步”,IBM沃森项目组负责人 David Ferrucci 博士表示,“《危险边缘》Jeopardy! 挑战的成功将突破与计算技术的处理和理解人类语言的能力有关的障碍,并将对科学、技术和商业带来深远的影响。”

  这篇文章下面对于每所大学的贡献都给与了简要的描述,通读下来,会发现“自然语言处理”技术在其中扮演着重要的角色。特别是麻省理工学院:

来自麻省理工学院,由计算机科学及人工智能实验室首席研究科学家 Boris Katz 带领的一个研究团队开创了一个名为 START 的在线自然语言问题回答系统,该系统能够使用来自半结构化和结构化信息存储库的信息来非常准确地回答问题。对沃森系统的根本贡献是将问题细分成简单的子问题,以便迅速收集相关回答,然后将这些回答汇合起来形成最终答案的能力。沃森系统的架构还利用了由麻省理工学院开创的对象-属性-值数据模型,该模型支持对半结构化数据源中的信息进行有效的检索,以回答自然语言问题。

  这里面提到的自然语言问答系统START很有意思,有兴趣的读者可以试着问两个问题看看:”What is start" and "How old are you"! 继续阅读