<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>《Beautiful Data-统计语言模型的应用二：背景》的评论</title>
	<atom:link href="http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%ba%8c%e8%83%8c%e6%99%af/feed" rel="self" type="application/rss+xml" />
	<link>http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%ba%8c%e8%83%8c%e6%99%af</link>
	<description>I Love Natural Language Processing</description>
	<lastBuildDate>Sun, 05 Feb 2012 11:54:59 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<item>
		<title>作者：JiangFeng &#187; 使用Google Web 1T 5-gram</title>
		<link>http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%ba%8c%e8%83%8c%e6%99%af/comment-page-1#comment-2490</link>
		<dc:creator>JiangFeng &#187; 使用Google Web 1T 5-gram</dc:creator>
		<pubDate>Tue, 12 Jul 2011 13:52:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.52nlp.cn/?p=3045#comment-2490</guid>
		<description>[...] Google语言模型的一些基本情况和背景可以参考52nlp上的这篇介绍，以及LDC上的介绍Web 1T 5-gram Version 1。 压缩的语言模型（1-5 gram）大小为24G，完全解压之后应该就是1T了。这么大的语言模型，无论是模型的训练（Google提供的是n-gram的计数文件）还是加载过程，几乎都不现实，我一想就头疼。对于一般用户而言，这么大的语言资源的确是收藏意义大于使用。 [...]</description>
		<content:encoded><![CDATA[<p>[...] Google语言模型的一些基本情况和背景可以参考52nlp上的这篇介绍，以及LDC上的介绍Web 1T 5-gram Version 1。 压缩的语言模型（1-5 gram）大小为24G，完全解压之后应该就是1T了。这么大的语言模型，无论是模型的训练（Google提供的是n-gram的计数文件）还是加载过程，几乎都不现实，我一想就头疼。对于一般用户而言，这么大的语言资源的确是收藏意义大于使用。 [...]</p>
]]></content:encoded>
	</item>
</channel>
</rss>

