<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>评论：HMM在自然语言处理中的应用一：词性标注5</title>
	<atom:link href="http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-5/feed" rel="self" type="application/rss+xml" />
	<link>http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-5</link>
	<description>I Love Natural Language Processing</description>
	<lastBuildDate>Fri, 30 Jul 2010 00:28:39 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>来自：52nlp</title>
		<link>http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-5/comment-page-1#comment-755</link>
		<dc:creator>52nlp</dc:creator>
		<pubDate>Mon, 01 Feb 2010 14:14:21 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=2630#comment-755</guid>
		<description>我觉得你的理解没任何问题，应该比我的还准确，我当时算的时候只是考虑了随机落到某个词性的概率，没有考虑第一个位置。不过我觉得对于HMM词性标注来说，由于它考虑的是整个句子的标记序列好坏，估计初始概率对于整个标记的影响甚微，尤其对于训练语料库充足的情况，甚至我觉得随机生成初始概率都没有多大影响，不过这只是我的猜测！
另外，不用客气，欢迎常来看看!</description>
		<content:encoded><![CDATA[<p>我觉得你的理解没任何问题，应该比我的还准确，我当时算的时候只是考虑了随机落到某个词性的概率，没有考虑第一个位置。不过我觉得对于HMM词性标注来说，由于它考虑的是整个句子的标记序列好坏，估计初始概率对于整个标记的影响甚微，尤其对于训练语料库充足的情况，甚至我觉得随机生成初始概率都没有多大影响，不过这只是我的猜测！<br />
另外，不用客气，欢迎常来看看!</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：WuGuangcai</title>
		<link>http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-5/comment-page-1#comment-754</link>
		<dc:creator>WuGuangcai</dc:creator>
		<pubDate>Mon, 01 Feb 2010 13:35:29 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=2630#comment-754</guid>
		<description>师兄，你好！我最近花了2个星期的时间几乎看完了这个博客中的文章，感谢你的无私奉献！
这篇文章中hmmtrain.pl在计算hmm的初始概率Pi时，用的是“$p = $n / $sum”，n是某个状态（词性）在训练集中出现的次数，sum是全部状态（词性）在训练集中出现的次数总和。
我之前也了解过hmm，但我的理解是，初始概率只与每一个训练样本（一句话）的第一个状态（第一个词性）相关，也就是说，n是某个状态（词性）出现在初始状态（句首）的次数，sum是训练样本的个数（句子数）。
不知道我的理解对不对，请赐教，谢谢！</description>
		<content:encoded><![CDATA[<p>师兄，你好！我最近花了2个星期的时间几乎看完了这个博客中的文章，感谢你的无私奉献！<br />
这篇文章中hmmtrain.pl在计算hmm的初始概率Pi时，用的是“$p = $n / $sum”，n是某个状态（词性）在训练集中出现的次数，sum是全部状态（词性）在训练集中出现的次数总和。<br />
我之前也了解过hmm，但我的理解是，初始概率只与每一个训练样本（一句话）的第一个状态（第一个词性）相关，也就是说，n是某个状态（词性）出现在初始状态（句首）的次数，sum是训练样本的个数（句子数）。<br />
不知道我的理解对不对，请赐教，谢谢！</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：WuGuangcai</title>
		<link>http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-5/comment-page-1#comment-753</link>
		<dc:creator>WuGuangcai</dc:creator>
		<pubDate>Mon, 01 Feb 2010 13:19:41 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=2630#comment-753</guid>
		<description>师兄，你好！我最近花了2个星期的时间几乎看完了这个博客中的全部文章，感谢你的无私奉献！
我之前对hmm有些了解，也做过些实验，在这片文章的hmmtrain.pl中计算初始概率pi时，用是“$p = $n / $sum;”，n是训练集中某个状态（词性）出现的次数，sum是训练集中全部状态（词性）的出现次数。
但我之前的理解是，初始概率只与每一个观察值序列（一个训练样本，即一句话）的第一个观察值（第一个词）相关，n是某个状态（词性）作为初始状态（句首）的次数，sum是训练样本（句子）的个数。
不知道我这样理解对不对，请赐教，谢谢。</description>
		<content:encoded><![CDATA[<p>师兄，你好！我最近花了2个星期的时间几乎看完了这个博客中的全部文章，感谢你的无私奉献！<br />
我之前对hmm有些了解，也做过些实验，在这片文章的hmmtrain.pl中计算初始概率pi时，用是“$p = $n / $sum;”，n是训练集中某个状态（词性）出现的次数，sum是训练集中全部状态（词性）的出现次数。<br />
但我之前的理解是，初始概率只与每一个观察值序列（一个训练样本，即一句话）的第一个观察值（第一个词）相关，n是某个状态（词性）作为初始状态（句首）的次数，sum是训练样本（句子）的个数。<br />
不知道我这样理解对不对，请赐教，谢谢。</p>
]]></content:encoded>
	</item>
</channel>
</rss>
