<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>评论：中文分词入门之字标注法2</title>
	<atom:link href="http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e5%ad%97%e6%a0%87%e6%b3%a8%e6%b3%952/feed" rel="self" type="application/rss+xml" />
	<link>http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e5%ad%97%e6%a0%87%e6%b3%a8%e6%b3%952</link>
	<description>I Love Natural Language Processing</description>
	<lastBuildDate>Fri, 30 Jul 2010 00:28:39 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>来自：52nlp</title>
		<link>http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e5%ad%97%e6%a0%87%e6%b3%a8%e6%b3%952/comment-page-1#comment-953</link>
		<dc:creator>52nlp</dc:creator>
		<pubDate>Tue, 13 Apr 2010 11:40:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=2952#comment-953</guid>
		<description>粗心了，没有发现wordpress的屏蔽，谢谢提醒，已在文中修改，这下应该清楚些。
严格意义上还包括citar给它自动添加的start及end标记，另外citar是3-gram的标注器，因此要分别提取1元、2元和3元的组合形式，这个和语料库有点关系，排列组合要多一些，而实际提取还要兼顾语料库及citar自身的实现。</description>
		<content:encoded><![CDATA[<p>粗心了，没有发现wordpress的屏蔽，谢谢提醒，已在文中修改，这下应该清楚些。<br />
严格意义上还包括citar给它自动添加的start及end标记，另外citar是3-gram的标注器，因此要分别提取1元、2元和3元的组合形式，这个和语料库有点关系，排列组合要多一些，而实际提取还要兼顾语料库及citar自身的实现。</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：bflout</title>
		<link>http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e5%ad%97%e6%a0%87%e6%b3%a8%e6%b3%952/comment-page-1#comment-950</link>
		<dc:creator>bflout</dc:creator>
		<pubDate>Tue, 13 Apr 2010 04:56:21 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=2952#comment-950</guid>
		<description>可以解释下msr_ngram吗？如果是标记本身及其之间的共现频率，是不是只有B,I以及四种组合可能？谢谢！</description>
		<content:encoded><![CDATA[<p>可以解释下msr_ngram吗？如果是标记本身及其之间的共现频率，是不是只有B,I以及四种组合可能？谢谢！</p>
]]></content:encoded>
	</item>
</channel>
</rss>
