“我爱自然语言处理”阶段性总结

  从去年12月19日建立这个博客,20日从新浪搬家,22日正式在这个博客上写作,期间除去春节放假那段时间(1月21日-2月6日),一直坚持着每天写一篇文章(绝大多数文章都是定时在每天早上八点正式发布),目前博客已累积文章62篇,对我来说这是一笔极大的精神财富。可以说这个博客占去了我大部分业余时间,但是她给了我极大的精神安慰,就像我的孩子一样,慢慢的在我眼中长大。通过写博客,我发现她早已超越了自己最初的想法,除了在专业上让我对自然语言处理这个领域无论从宽度和深度上都有了全新的认识外,更让我学到了许多这个领域之外的东西,受益匪浅!
  关于52nlp的访问统计,我使用了两个工具:开源的Piwik和Google Analytics。前者是12月23号开始使用的,后者是12月26号开始使用的,开始还感受不到二者的区别到底有多大,但是自1月份开始有了来自百度搜索的访问后,发现Piwik显示的通过百度搜索而来的关键字是乱码,就慢慢的习惯用Google Analytics了,目前Piwik还在使用,其统计数据也能给我提供很多参考!以下所列出的统计数据主要是来自Google Analytics,时间从2008年12月26日至2月28日。
 博客目前的访问情况如下:
  总的访问情况:1,171访问数,5,269综合浏览量,4.50每次访问页数,46.37%跳出率,00:07:20平均网站停留时间,51.84%新访问次数百分比
  2月份的访问情况如下:718 访问数,3,231综合浏览量,4.50每次访问页数,47.21%跳出率 ,00:06:01平均网站停留时间 ,54.18%新访问次数百分比
  博客目前的发展比较良性,12月、1月、2月的访问数分别为73,380,718,希望其上升的势头还能继续保持下去。
 访问来源情况如下:
  搜索引擎667.00 (56.96%):其中通过Google为550,通过百度访问为117,而来自有道的1次访问被Google Analytics算作是推介网站了!这里大致可以看出来这里的访问者多习惯使用Google。
  直接访问量332.00 (28.35%):直接访问量的统计没有具体的数据,除了自己的访问外,还有一些访问者也是直接访问52nlp的,这多数应该算是“回头客”了,非常感谢!
  推介网站172.00 (14.69%):52nlp还没有和任何网站交换过链接,主要是我认为如果不关注nlp的访客来到这个网站,也不会有什么兴趣,因此也没有特意去交换外链。事实上Google Analytics也给了我这个印证:如果访问者“不小心”来到这个网站,基本上访问的时间以“秒”记。博客发展之初来自推介网站非常之少,几乎只是从我原来新浪博客找过来的,目前大概有十几个推介访问来源,其中有几个是通过RSS订阅的阅读器来的。特别需要说明的是来自豆瓣的推介,不知道是哪位好心的读者将52nlp推荐给了豆瓣的“现代语言学”小组,因此来自于这个推介的访问无论从访问数,每次访问页数和平均网站停留时间都高于其他的访问来源(访问数:55,每次访问页数:9.40,平均网站停留时间00:14:56)。这也说明了52nlp对于相关领域的访问者来说还是有一定吸引力的!
 关键字方面情况如下:
  搜索通过339关键字发出了667次合计访问。
  博客发展之初,我最希望的是“自然语言处理”和“机器翻译”这两个关键字可以让52nlp在Google和百度上有个好的排名。不过通过这段时间的观察,发现每隔一段时间这两家都会对排名变动一下。非常有趣的是1月10号左右百度开始收录52nlp后,这两个关键词竟然都排进了前十名,也就是在百度的第一页搜索结果上,而同期Google的排名大概在十几页之后。过完年我再检查,这两个关键词都不知道跑哪里去了,所以看来搜索引擎也喜欢一个有活力的博客!目前这两个关键字在Google和百度上的排名都在稳步上升,希望能得到二者一致的评价!不过真正来自于这两个关键字的访问其实很少,除了我自己比较喜欢校验这两个关键字外,一般大家都是因为一些问题而来的,关键字也五花八门,所以博客提供实实在在的内容,对于大家有一定帮助才是最主要的。
  目前访问量前十的文章大家都可以看到,最让我吃惊的是1月7号写的《赞一下host2ez》,这几乎属于一篇无关文章了,但是host2ez这个关键字却给我带来了53次的最多访问数,分析其原因,主要是这个关键字在Google和百度上的排名都在前面:前段时间在Google上一直是第二页,在百度一直是第一页;今天再次检查发现在Google上位于第一页第四位,而在百度上已经是第八页第71位了,且不是这篇文章,难怪最近来自于百度这个关键字的访问这么少。这里大概可以说明两个问题:热门关键字排名对于博客或网站很重要;另外就是Google和百度排名方法很不同!不过对于我来说,更希望52nlp能有更多的“回头客”,更多业内的推荐和分享,对搜索引擎的依赖比重能少一点!
 其他几个需要说明的情况:
  1月14号《Ubuntu8.10下moses测试平台搭建全记录》发布后,收到了52nlp的第一个评论,这让我看到了52nlp的文章对于用户还是有实实在在的帮助,这也让我有了继续写下去的理由和动力!
  春节后尝试申请了一下Google AdSense, 没想到成功了,因为似乎有人说过Google AdSense对于新网站的审核比较严厉。老实说,博客开办之初的目的并不是纯粹的想做好一个NLP方面的独立博客,有业余创收的想法,但是当52nlp慢慢发展后,我发现做好52nlp是我最大的愿望。Google AdSense申请后,对于将Google广告投放在哪里自己做了些挣扎,Google所建议的几个黄金位置对于52nlp的访问者来说是影响阅读的,最终决定将Google AdSense放在每篇文章的最下面,我想在最大程度不影响读者的情况下观察一下Google AdSense的盈利模式,而事实上,目前Google AdSense1500多次展示后,还没有带来一分钱的收益,远低于平均水平!不过这对我来说应该是可以预知的,因为我并不希望无所不在的广告马上把52nlp的用户吓走!
  春节后的另一个动作是启动52nlp的wiki:自然语言处理百科。当时的想法是网上存在着大量的NLP方面的好文章和资源,但对于个人博客来说,转载文章是大忌。所以想启动一个wiki来聚合自然语言处理方面的内容,给NLP的爱好者提供一个自然语言处理方面的百科全书。原来的计划是自己先悄悄的编辑一百篇文章后再推出这个wiki,没想到wiki的编辑并不是我所想像的复制加粘贴,在编辑第一篇关于自然语言处理的介绍时,发现必须按自己的理解来取舍、编辑和整合各方面的内容,其耗时耗力,不亚于我写一篇分量足的博客内容。于是,这个wiki就被我暂时搁置了,但是当时心中的一个口号却一直让我念念不忘:博客是个人的,wiki是大家的。可能的话,希望大家对这个wiki的发展提些建议!
 最后再说一下写这篇博客的另一个主要目的:
  除了总结一下前段时间的情况之外,希望关心52nlp的读者能谅解!我准备从今天之后做个调整:不再每天更新一篇文章,而是定在每周二、四、六早8点发布,如有特殊情况,我会提前声明。这里不是逃避,只是限于业余时间的有限和自己还有一些事情要做。关于我个人,我认为坚持做一件对我来说感兴趣的事从来都不是什么累赘和负担,从96年9月2日初一第一天开学起,我坚持或者说习惯性的每天写一篇日记至今,从来都是自觉自愿的,但是日记毕竟是日记,想法多的时候可以天马行空,没什么事的时候可以写一句话,因为只有自己一个人看,所以我可以随心所欲!但对于52nlp,毕竟我不能像国外一些博客名人一样全职写作并以此为生,她是我业余最大的乐趣但不是全部!在我坚持每日一篇的更新中,出现的问题是有些时候不得不为第二天早8点的准时发布熬夜加班,另外有些时候博客文章是仓促的!所以在二月结束的时候,我为52nlp做个总结:08年12月19日至09年2月28日可以称为第一阶段草创期,这一阶段集中写作是必须的,并因此带来了一批忠实的用户;现在开始应该是第二阶段良性发展期,我认为每周三篇的写作对52nlp是合适的,只要能坚持下去,52nlp应该能得到大家的认可!目前还没有第三阶段的想法,我还是且行且看吧!
  前两天看到台湾数位之墙07年的一个10周年的系列文章:《数位之墙十周年》,作者写了自己10年个人网络行业的从业经历,让我很有感触!其实有一些人可以十年如一日的坚持做一件事,但多数人很难十年如一日的做好一件事!其根源再于绝大多数人的选择都是被动的,不是难,而是根本就不喜欢!选择自然语言处理,机器翻译还有52nlp,我认为他们触发了我生命中最重要的兴趣源泉,因此我可以开开心心的去做这些事!希望回首十年的时候,我可以为自然语言处理,机器翻译以及52nlp做个总结!相信我可以做到!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:http://www.52nlp.cn/i-love-natural-language-processing-stage-summary/

此条目发表在自然语言处理, 随笔分类目录,贴了, , , , , , , , , , 标签。将固定链接加入收藏夹。

“我爱自然语言处理”阶段性总结》有 14 条评论

  1. 一个自然语言处理爱好者说:

    楼主继续加油,期待能够常常看到你的好文章

    [回复]

    admin 回复:

    谢谢支持!

    [回复]

  2. Zhiyuan Liu说:

    已经转载你很多的文章到水木社区的NLP版,反响很强烈。
    也欢迎你来该版布道阿。:)

    [回复]

    admin 回复:

    我也只是在学习中,怎敢称布道呢!很高兴能和你们一起交流!欢迎多多光临!

    [回复]

  3. iamzcyhit说:

    我也是HIT毕业的,现在在读研一,也在做机器翻译。要好好像admin学习啊

    [回复]

    admin 回复:

    学习不敢当,我也在不断的学习中,共同努力吧!

    [回复]

  4. hans说:

    你这里给我很大很大的帮助,谢谢。

    [回复]

    admin 回复:

    不用客气。srilm问题解决没有?

    [回复]

  5. 风影子说:

    我也是nlp爱好者,一直从事着自然语言处理相关研究,其中最主要研究方向是机器翻译,通过6年的探索过程,终于有所成果,包括形成了自然语言知识表示的主要框架,以及应用于自然语言解析的核心算法。热切期盼有兴趣的朋友参与进来,一同完成这个旷世壮举,我的联系方式:kingsten_88@hotmail.com
    另外,我的测试程序预计8月份上线,请大家上来测试。

    [回复]

  6. admin说:

    期待你的测试程序早日上线,欢迎常来交流!

    [回复]

  7. justmewei说:

    楼主,你好!还晓得我吧?呵呵!非常钦佩你对技术的执着和认真!好多东西需要向你学习。

    [回复]

    admin 回复:

    呵呵,还有一个给你的承诺没有办完,不好意思啊!

    [回复]

  8. Brishen Lee说:

    学习了,我可是几乎每天都会上的哦

    [回复]

    admin 回复:

    非常感谢!

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用*标注