中文分词入门之篇外

  这篇不是计划内的“中文分词入门系列”,所以称之为篇外。上一篇《中文分词入门之最大匹配法扩展1》提到了MMSEG国内的一些情况:

  不过国内也有该文的简介文章:《MMSeg分词算法简述》,原文似乎出自“www.solol.org”,但是我一直没打开这个网站,因为Java版的mmesg也是其提供的,不知道是已经关闭了还是被“墙”了。另外,leeing也翻译了全文《MMSEG 中文分词算法》,我粗略的读了一下,感觉翻译的不错。


  没想到《MMSeg分词算法简述》的原作者solol和我取得了联系,而leeing也留了言。难能可贵的是,由于solol.org目前已经关闭,而Google Group被墙,Java版的MMSEG代码目前已无法下载,solol希望通过52nlp这个途径提供给大家,这里非常感谢solol的分享!目前我已将Java版的代码上传到网络硬盘,同时会在”资源“页面里做个备注,有需要的读者可以在这里下载:mmseg-v0.3.zip
  同时,我发现python版的mmseg目前也无法下载,这个基于python的中文分词项目放在Google code上:pychseg,但是在”Downloads“页面里却没有可下载的版本,不知是何原因?如果哪位读者知情或者手头上有这个版本,欢迎和我联系,或者在这里留个言,希望python版本的MMSEG也能像Java版本一样,能共享给大家。此处先谢过了!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:http://www.52nlp.cn/中文分词入门之篇外

此条目发表在中文信息处理, 中文分词分类目录,贴了, , , , , , 标签。将固定链接加入收藏夹。

中文分词入门之篇外》有 10 条评论

  1. Chris Song说:

    你好,我是pychseg的作者,一直没时间加上download,大家check out源代码就可以用了。。。

    另外coreseek里带的c版本的mmseg很快而且也有python接口,推荐大家用那个了

    [回复]

    52nlp 回复:

    非常感谢!我也计划写coreseek的LibMMSeg的。

    [回复]

  2. 过来踩下,下了些资料,谢谢你啦

    [回复]

    52nlp 回复:

    不用客气,欢迎常来!

    [回复]

  3. 涂建军说:

    谢谢啊,学习了很多,感谢

    [回复]

    52nlp 回复:

    不客气

    [回复]

  4. selfdem说:

    有没有哪位大神对比过ansj和mmseg呢?

    [回复]

  5. 李霖说:

    这个java版本下载不了啊 楼主

    [回复]

    52nlp 回复:

    链接失效了,由于换了电脑,我自己的备份可能不太好找了

    [回复]

    李霖 回复:

    好的

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用*标注