中文分词入门之篇外

  这篇不是计划内的“中文分词入门系列”,所以称之为篇外。上一篇《中文分词入门之最大匹配法扩展1》提到了MMSEG国内的一些情况:

  不过国内也有该文的简介文章:《MMSeg分词算法简述》,原文似乎出自“www.solol.org”,但是我一直没打开这个网站,因为Java版的mmesg也是其提供的,不知道是已经关闭了还是被“墙”了。另外,leeing也翻译了全文《MMSEG 中文分词算法》,我粗略的读了一下,感觉翻译的不错。


  没想到《MMSeg分词算法简述》的原作者solol和我取得了联系,而leeing也留了言。难能可贵的是,由于solol.org目前已经关闭,而Google Group被墙,Java版的MMSEG代码目前已无法下载,solol希望通过52nlp这个途径提供给大家,这里非常感谢solol的分享!目前我已将Java版的代码上传到网络硬盘,同时会在”资源“页面里做个备注,有需要的读者可以在这里下载:mmseg-v0.3.zip
  同时,我发现python版的mmseg目前也无法下载,这个基于python的中文分词项目放在Google code上:pychseg,但是在”Downloads“页面里却没有可下载的版本,不知是何原因?如果哪位读者知情或者手头上有这个版本,欢迎和我联系,或者在这里留个言,希望python版本的MMSEG也能像Java版本一样,能共享给大家。此处先谢过了!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:http://www.52nlp.cn/中文分词入门之篇外

相关文章:

  1. 中文分词入门之最大匹配法扩展2
  2. 中文分词入门之最大匹配法扩展1
  3. 中文分词入门之资源
  4. Matrix67:漫话中文分词算法
  5. 中文分词入门之字标注法2
  6. 中文分词入门之字标注法1
  7. 中文分词入门之文献
  8. 推荐张华平老师的中文分词工具ICTCLAS2010
  9. 中文分词入门之最大匹配法
  10. 如何学习自然语言处理

此条目发表在 中文信息处理, 中文分词 分类目录,贴了 , , , , , , 标签。将固定链接加入收藏夹。

中文分词入门之篇外》有 4 条评论

  1. Chris Song 说:

    你好,我是pychseg的作者,一直没时间加上download,大家check out源代码就可以用了。。。

    另外coreseek里带的c版本的mmseg很快而且也有python接口,推荐大家用那个了

    [回复]

    52nlp 回复:

    非常感谢!我也计划写coreseek的LibMMSeg的。

    [回复]

  2. 过来踩下,下了些资料,谢谢你啦

    [回复]

    52nlp 回复:

    不用客气,欢迎常来!

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>