<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>我爱自然语言处理 &#187; 词典</title>
	<atom:link href="http://www.52nlp.cn/category/dictionary/feed" rel="self" type="application/rss+xml" />
	<link>http://www.52nlp.cn</link>
	<description>I Love Natural Language Processing</description>
	<lastBuildDate>Wed, 21 Jul 2010 15:33:24 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>一个不错的自然语言处理词典</title>
		<link>http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8</link>
		<comments>http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8#comments</comments>
		<pubDate>Thu, 28 Jan 2010 11:51:09 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[自然语言处理]]></category>
		<category><![CDATA[词典]]></category>
		<category><![CDATA[Bill Wilson]]></category>
		<category><![CDATA[Prolog]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[机器学习]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=3019</guid>
		<description><![CDATA[　　前不久发现了一个“自然语言处理词典(The Natural Language Processing Dictionary)”，觉得很有意思。作者Bill Wilson是澳大利亚新南威尔士大学的一名教授，因为开了一门“人工智能”课程，就为这门课程分别编制了Prolog，人工智能（Artificial Intelligence），机器学习（Machine Learning）以及自然语言处理（Natural Language Processing）的相关术语词典。这几个词典建于1998年，Bill Wilson教授似乎还在进行维护和更新，所以目前仍很有参考价值。
　　以下是“自然语言处理词典”页面上的相关介绍：

You should use The NLP Dictionary to clarify or revise concepts that you have already met. The NLP Dictionary is not a suitable way to begin to learn about NLP. Further information on NLP can be found in the class web page lecture notes section.
Other [...]


相关文章:<ol><li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-common-abbreviations-acronyms' rel='bookmark' title='Permanent Link: 自然语言处理及计算语言学常见缩略语'>自然语言处理及计算语言学常见缩略语</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%80%e7%bc%98%e8%b5%b7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用一：缘起'>Beautiful Data-统计语言模型的应用一：缘起</a></li>
<li><a href='http://www.52nlp.cn/job-prospects-for-natural-language-processing' rel='bookmark' title='Permanent Link: 自然语言处理相关工作的前景'>自然语言处理相关工作的前景</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-seven-other-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之七：其他书籍'>自然语言处理与计算语言学书籍汇总之七：其他书籍</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-one-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之一：国外书籍'>自然语言处理与计算语言学书籍汇总之一：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/some-natural-language-processing-and-computational-linguistics-courses-material' rel='bookmark' title='Permanent Link: 一些自然语言处理及计算语言学相关的课件'>一些自然语言处理及计算语言学相关的课件</a></li>
<li><a href='http://www.52nlp.cn/%e7%ab%8b%e5%a7%94%e9%9a%8f%e7%ac%94-%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0%e5%92%8c%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86' rel='bookmark' title='Permanent Link: 立委随笔：机器学习和自然语言处理'>立委随笔：机器学习和自然语言处理</a></li>
<li><a href='http://www.52nlp.cn/%e6%9d%a1%e4%bb%b6%e9%9a%8f%e6%9c%ba%e5%9c%ba%e6%96%87%e7%8c%ae%e9%98%85%e8%af%bb%e6%8c%87%e5%8d%97' rel='bookmark' title='Permanent Link: 条件随机场文献阅读指南'>条件随机场文献阅读指南</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-systran' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼四：Systran'>自然语言处理公司巡礼四：Systran</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-five-machine-translation' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之五：机器翻译'>自然语言处理与计算语言学书籍汇总之五：机器翻译</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　前不久发现了一个“自然语言处理词典(The Natural Language Processing Dictionary)”，觉得很有意思。作者Bill Wilson是澳大利亚新南威尔士大学的一名教授，因为开了一门“人工智能”课程，就为这门课程分别编制了Prolog，人工智能（Artificial Intelligence），机器学习（Machine Learning）以及自然语言处理（Natural Language Processing）的相关术语词典。这几个词典建于1998年，Bill Wilson教授似乎还在进行维护和更新，所以目前仍很有参考价值。<span id="more-3019"></span></p>
<p>　　以下是“自然语言处理词典”页面上的相关介绍：</p>
<blockquote><p>
You should use The NLP Dictionary to clarify or revise concepts that you have already met. The NLP Dictionary is not a suitable way to begin to learn about NLP. Further information on NLP can be found in the class web page lecture notes section.</p>
<p>Other places to find out about artificial intelligence include the AAAI (American Association for Artificial Intelligence) AI Overview page or AI Reference Shelf</p>
<p>If you wish to suggest an item or items that should be included, or if you found an item that you felt was unclear, please let me know (E-mail: billw at cse.unsw.edu.au). </p></blockquote>
<p>　　如果读者对这几个词典感兴趣，可以通过如下链接访问它们：<br />
　　1) 自然语言处理词典(The Natural Language Processing Dictionary) – URL: <a href="http://www.cse.unsw.edu.au/~billw/nlpdict.html"target=_blank>http://www.cse.unsw.edu.au/~billw/nlpdict.html</a><br />
　　2) Prolog词典(The Prolog Dictionary) – URL: <a href="http://www.cse.unsw.edu.au/~billw/prologdict.html"target=_blank>http://www.cse.unsw.edu.au/~billw/prologdict.html</a><br />
　　3) 人工智能词典(The Artificial Intelligence Dictionary) – URL: <a href="http://www.cse.unsw.edu.au/~billw/aidict.html"target=_blank>http://www.cse.unsw.edu.au/~billw/aidict.html</a><br />
　　4) 机器学习词典(The Machine Learning Dictionary) – URL: <a href="http://www.cse.unsw.edu.au/~billw/mldict.html"target=_blank>http://www.cse.unsw.edu.au/~billw/mldict.html</a></p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<a href="http://www.52nlp.cn/一个不错的自然语言处理词典">http://www.52nlp.cn/一个不错的自然语言处理词典</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-common-abbreviations-acronyms' rel='bookmark' title='Permanent Link: 自然语言处理及计算语言学常见缩略语'>自然语言处理及计算语言学常见缩略语</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%80%e7%bc%98%e8%b5%b7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用一：缘起'>Beautiful Data-统计语言模型的应用一：缘起</a></li>
<li><a href='http://www.52nlp.cn/job-prospects-for-natural-language-processing' rel='bookmark' title='Permanent Link: 自然语言处理相关工作的前景'>自然语言处理相关工作的前景</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-seven-other-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之七：其他书籍'>自然语言处理与计算语言学书籍汇总之七：其他书籍</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-one-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之一：国外书籍'>自然语言处理与计算语言学书籍汇总之一：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/some-natural-language-processing-and-computational-linguistics-courses-material' rel='bookmark' title='Permanent Link: 一些自然语言处理及计算语言学相关的课件'>一些自然语言处理及计算语言学相关的课件</a></li>
<li><a href='http://www.52nlp.cn/%e7%ab%8b%e5%a7%94%e9%9a%8f%e7%ac%94-%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0%e5%92%8c%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86' rel='bookmark' title='Permanent Link: 立委随笔：机器学习和自然语言处理'>立委随笔：机器学习和自然语言处理</a></li>
<li><a href='http://www.52nlp.cn/%e6%9d%a1%e4%bb%b6%e9%9a%8f%e6%9c%ba%e5%9c%ba%e6%96%87%e7%8c%ae%e9%98%85%e8%af%bb%e6%8c%87%e5%8d%97' rel='bookmark' title='Permanent Link: 条件随机场文献阅读指南'>条件随机场文献阅读指南</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-systran' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼四：Systran'>自然语言处理公司巡礼四：Systran</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-five-machine-translation' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之五：机器翻译'>自然语言处理与计算语言学书籍汇总之五：机器翻译</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>CWB中文词库试用及其他</title>
		<link>http://www.52nlp.cn/cwb-trial-and-others</link>
		<comments>http://www.52nlp.cn/cwb-trial-and-others#comments</comments>
		<pubDate>Thu, 21 May 2009 16:00:45 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[自然语言处理]]></category>
		<category><![CDATA[词典]]></category>
		<category><![CDATA[语义学]]></category>
		<category><![CDATA[CWB中文词库]]></category>
		<category><![CDATA[Metaweb]]></category>
		<category><![CDATA[wordnet]]></category>
		<category><![CDATA[中文语义词库]]></category>
		<category><![CDATA[汉语语义词典]]></category>
		<category><![CDATA[知识库]]></category>
		<category><![CDATA[语义网]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=1604</guid>
		<description><![CDATA[　　52nlp有一段时间没有收到任何评论或留言了，晚上发现《自然语言处理公司巡礼六：Metaweb》有一条新留言，挺高兴的：
　　“http://www.cwbbase.com 是一个含 115,000 词的、有点类似 WordNet 的中文语义词库。欢迎访问，欢迎惠赐宝贵意见。”
　　毕竟WordNet大名鼎鼎，搞自然语言处理的同行大概都知道一些，如果真的做得是中文语义词库，还是很有意义的事。于是我访问了这个网站，本以为这是个中文语义词库的在线网站，但这个网站上提供的是桌面版的演示软件。以下是其简介：
　　“这是一个略具规模的中文语义词库, 也是稍有特色的汉语语义词典。它含有 10 万以上的词条, 每个词条通过关系比较密切的相关词 (例如同义词、反义词、上位词、下位词等) 与其它词条相连结。整个词库呈现为比较复杂的网络结构, 并带有多种检索手段和显示方式。”
　　虽然自己对这一块儿不熟，但是还是下载了“CWB中文词库演示版”试用了一下，以下是搜索“自然语言处理”的效果图：
 　　　　
 　　CWB中文词库做得很专业，帮助文档非常详细，而我也很想了解CWB的背景，毕竟研制这样的语义词库比一般的词典难度大的多，没有一定知识积累以及资金的支持，很难做得下去。但是，当我读到帮助文档中《为什么要研制 CWB 词库》的最后一段看到“本系统没有科研经费的支持”时，非常非常震惊：毕竟在中国，甭说没有科研经费的支持，就是有了科研经费的支持，真正用在刀刃上，真正踏踏实实做事的又有几人？我从心底里敬佩CWB中文词库的作者！
　　而事实上当看到作者隐去自己姓名的简介时，直觉就告诉我，这个作者很不一般：
　　“作者是语言学、现代哲学、人工智能、软件设计的爱好者。长期从事语义学研究和自然语言处理系统的开发。设计过机器翻译实验系统、中文自动分词系统、中文全文检索系统, 其中有的曾进入市场或在某些机构长期使用。曾在中文信息处理、语言学、哲学等领域的刊物上发表过若干篇语义学论文, 并撰写了较多语义学笔记, 主要探讨了语义关系、命名理论、知识本体等方面的一些问题。1993-1996 年间担任过少数全国性和国际性中文信息处理学术会议的程序委员会委员。原电子部在京机构高级工程师。20 世纪 90 年代中期辞职成为自由人员, 并主要从事 CWB 中文词库的研制工作。”
　　这里至少告诉我几个事实：作者曾涉足过机器翻译、中文分词及信息检索等领域，尤其在语义学方面的研究卓有成就，并且在90年代初中期的时候在中文信息处理领域具有一定的声望！另外，从帮助文档中还能看到作者在90年代中期以后逐渐将精力完全集中到语义词典“CWB中文词库”的研制上来，这也让我想起了“一生只做一件事”这句至理名言！
　　那么“CWB中文词库”的作者究竟是谁？帮助文档里的一些文章给了我提示，通过Google搜索还是找到了答案，不过这涉及个人隐私，这里就隐去不说了，但是可以肯定的是：“CWB中文词库”的作者是国内早期研究自然语言处理相关领域的老一辈拓荒者，对中文信息处理相关领域的发展做出了很大的贡献！
　　最后摘录《为什么要研制 CWB 词库》的一段话：
　　“由于理论问题的困扰, 尚未渐入佳境。作者还在不断修改该词库, 深感才疏学浅, 勉为其难, 决不敢掉以轻心或自鸣得意。岂能尽如人意, 但求无愧我心。在这个理论空白点尚多、数据庞杂多变、且还要做出比较精密的软件的领域, 努力追求、逼近完善是长期的任务, 无法一蹴而就。这一点是这种事情的性质所决定的, 不是一般谦虚的话。夸大的宣传只会误导用户和读者。语义学和知识库的一些问题也许还需要若干代人或更长时间的努力才可能解决。计算机获取和表示人类知识还任重而道远。语义词库所涵盖的知识还相当有限。对这些应有清醒的认识。目前自然语言处理中的各种方法和资源都有其局限性, 本系统当然也是如此。”
　　这段话让我深切感受到了前辈老师的谦虚和务实！而这段话似乎又可以拿来与所有搞自然语言处理的研究者分享和共勉！这里由衷的向前辈老师致上深深的敬意！
注：原创文章，转载请注明出处“我爱自然语言处理”：www.52nlp.cn
本文链接地址：http://www.52nlp.cn/cwb-trial-and-others











相关文章:语义网新闻一则：Google收购语义网公司Metaweb
自然语言处理公司巡礼六：Metaweb
一个不错的自然语言处理词典
COLING 2010: List of Accepted Papers (Oral)
HMM在自然语言处理中的应用一：词性标注1
ACL09 Full Paper各研究领域的录用情况
推荐刘群老师的《计算所与北大往事回顾》
自然语言处理中理性主义与经验主义的优缺点
自然语言处理公司巡礼一：Teragram
MIT自然语言处理第一讲：简介和概述（第一部分）



相关文章:<ol><li><a href='http://www.52nlp.cn/%e8%af%ad%e4%b9%89%e7%bd%91%e6%96%b0%e9%97%bb%e4%b8%80%e5%88%99-google%e6%94%b6%e8%b4%ad%e8%af%ad%e4%b9%89%e7%bd%91%e5%85%ac%e5%8f%b8metaweb' rel='bookmark' title='Permanent Link: 语义网新闻一则：Google收购语义网公司Metaweb'>语义网新闻一则：Google收购语义网公司Metaweb</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-metaweb' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼六：Metaweb'>自然语言处理公司巡礼六：Metaweb</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/coling-2010-list-of-accepted-papers-oral' rel='bookmark' title='Permanent Link: COLING 2010: List of Accepted Papers (Oral)'>COLING 2010: List of Accepted Papers (Oral)</a></li>
<li><a href='http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-1' rel='bookmark' title='Permanent Link: HMM在自然语言处理中的应用一：词性标注1'>HMM在自然语言处理中的应用一：词性标注1</a></li>
<li><a href='http://www.52nlp.cn/acl09-acceptance-rates-by-areas' rel='bookmark' title='Permanent Link: ACL09 Full Paper各研究领域的录用情况'>ACL09 Full Paper各研究领域的录用情况</a></li>
<li><a href='http://www.52nlp.cn/liu-qun-article-recommended' rel='bookmark' title='Permanent Link: 推荐刘群老师的《计算所与北大往事回顾》'>推荐刘群老师的《计算所与北大往事回顾》</a></li>
<li><a href='http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp' rel='bookmark' title='Permanent Link: 自然语言处理中理性主义与经验主义的优缺点'>自然语言处理中理性主义与经验主义的优缺点</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-teragram' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼一：Teragram'>自然语言处理公司巡礼一：Teragram</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第一部分）'>MIT自然语言处理第一讲：简介和概述（第一部分）</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　52nlp有一段时间没有收到任何评论或留言了，晚上发现《自然语言处理公司巡礼六：Metaweb》有一条新留言，挺高兴的<span id="more-1604"></span>：<br />
　　“<a href="http://www.cwbbase.com"target=_blank>http://www.cwbbase.com</a> 是一个含 115,000 词的、有点类似 WordNet 的中文语义词库。欢迎访问，欢迎惠赐宝贵意见。”<br />
　　毕竟WordNet大名鼎鼎，搞自然语言处理的同行大概都知道一些，如果真的做得是中文语义词库，还是很有意义的事。于是我访问了这个网站，本以为这是个中文语义词库的在线网站，但这个网站上提供的是桌面版的演示软件。以下是其简介：<br />
　　“这是一个略具规模的中文语义词库, 也是稍有特色的汉语语义词典。它含有 10 万以上的词条, 每个词条通过关系比较密切的相关词 (例如同义词、反义词、上位词、下位词等) 与其它词条相连结。整个词库呈现为比较复杂的网络结构, 并带有多种检索手段和显示方式。”<br />
　　虽然自己对这一块儿不熟，但是还是下载了“CWB中文词库演示版”试用了一下，以下是搜索“自然语言处理”的效果图：<br />
 　　　　<img src="http://www.52nlp.cn/images/cwb-nlp.jpg" alt="cwb中文词库"自然语言处理"效果图" /><br />
 　　CWB中文词库做得很专业，帮助文档非常详细，而我也很想了解CWB的背景，毕竟研制这样的语义词库比一般的词典难度大的多，没有一定知识积累以及资金的支持，很难做得下去。但是，当我读到帮助文档中《为什么要研制 CWB 词库》的最后一段看到“本系统没有科研经费的支持”时，非常非常震惊：毕竟在中国，甭说没有科研经费的支持，就是有了科研经费的支持，真正用在刀刃上，真正踏踏实实做事的又有几人？我从心底里敬佩CWB中文词库的作者！<br />
　　而事实上当看到作者隐去自己姓名的简介时，直觉就告诉我，这个作者很不一般：<br />
　　“作者是语言学、现代哲学、人工智能、软件设计的爱好者。长期从事语义学研究和自然语言处理系统的开发。设计过机器翻译实验系统、中文自动分词系统、中文全文检索系统, 其中有的曾进入市场或在某些机构长期使用。曾在中文信息处理、语言学、哲学等领域的刊物上发表过若干篇语义学论文, 并撰写了较多语义学笔记, 主要探讨了语义关系、命名理论、知识本体等方面的一些问题。1993-1996 年间担任过少数全国性和国际性中文信息处理学术会议的程序委员会委员。原电子部在京机构高级工程师。20 世纪 90 年代中期辞职成为自由人员, 并主要从事 CWB 中文词库的研制工作。”<br />
　　这里至少告诉我几个事实：作者曾涉足过机器翻译、中文分词及信息检索等领域，尤其在语义学方面的研究卓有成就，并且在90年代初中期的时候在中文信息处理领域具有一定的声望！另外，从帮助文档中还能看到作者在90年代中期以后逐渐将精力完全集中到语义词典“CWB中文词库”的研制上来，这也让我想起了“一生只做一件事”这句至理名言！<br />
　　那么“CWB中文词库”的作者究竟是谁？帮助文档里的一些文章给了我提示，通过Google搜索还是找到了答案，不过这涉及个人隐私，这里就隐去不说了，但是可以肯定的是：“CWB中文词库”的作者是国内早期研究自然语言处理相关领域的老一辈拓荒者，对中文信息处理相关领域的发展做出了很大的贡献！<br />
　　最后摘录《为什么要研制 CWB 词库》的一段话：<br />
　　“由于理论问题的困扰, 尚未渐入佳境。作者还在不断修改该词库, 深感才疏学浅, 勉为其难, 决不敢掉以轻心或自鸣得意。岂能尽如人意, 但求无愧我心。在这个理论空白点尚多、数据庞杂多变、且还要做出比较精密的软件的领域, 努力追求、逼近完善是长期的任务, 无法一蹴而就。这一点是这种事情的性质所决定的, 不是一般谦虚的话。夸大的宣传只会误导用户和读者。语义学和知识库的一些问题也许还需要若干代人或更长时间的努力才可能解决。计算机获取和表示人类知识还任重而道远。语义词库所涵盖的知识还相当有限。对这些应有清醒的认识。目前自然语言处理中的各种方法和资源都有其局限性, 本系统当然也是如此。”<br />
　　这段话让我深切感受到了前辈老师的谦虚和务实！而这段话似乎又可以拿来与所有搞自然语言处理的研究者分享和共勉！这里由衷的向前辈老师致上深深的敬意！</p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<a href="http://www.52nlp.cn/cwb-trial-and-others">http://www.52nlp.cn/cwb-trial-and-others<br />
</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/%e8%af%ad%e4%b9%89%e7%bd%91%e6%96%b0%e9%97%bb%e4%b8%80%e5%88%99-google%e6%94%b6%e8%b4%ad%e8%af%ad%e4%b9%89%e7%bd%91%e5%85%ac%e5%8f%b8metaweb' rel='bookmark' title='Permanent Link: 语义网新闻一则：Google收购语义网公司Metaweb'>语义网新闻一则：Google收购语义网公司Metaweb</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-metaweb' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼六：Metaweb'>自然语言处理公司巡礼六：Metaweb</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/coling-2010-list-of-accepted-papers-oral' rel='bookmark' title='Permanent Link: COLING 2010: List of Accepted Papers (Oral)'>COLING 2010: List of Accepted Papers (Oral)</a></li>
<li><a href='http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-1' rel='bookmark' title='Permanent Link: HMM在自然语言处理中的应用一：词性标注1'>HMM在自然语言处理中的应用一：词性标注1</a></li>
<li><a href='http://www.52nlp.cn/acl09-acceptance-rates-by-areas' rel='bookmark' title='Permanent Link: ACL09 Full Paper各研究领域的录用情况'>ACL09 Full Paper各研究领域的录用情况</a></li>
<li><a href='http://www.52nlp.cn/liu-qun-article-recommended' rel='bookmark' title='Permanent Link: 推荐刘群老师的《计算所与北大往事回顾》'>推荐刘群老师的《计算所与北大往事回顾》</a></li>
<li><a href='http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp' rel='bookmark' title='Permanent Link: 自然语言处理中理性主义与经验主义的优缺点'>自然语言处理中理性主义与经验主义的优缺点</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-teragram' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼一：Teragram'>自然语言处理公司巡礼一：Teragram</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第一部分）'>MIT自然语言处理第一讲：简介和概述（第一部分）</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/cwb-trial-and-others/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>胡正，StarDict，TheSourceCodeOfMyWorld</title>
		<link>http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld</link>
		<comments>http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld#comments</comments>
		<pubDate>Tue, 06 Jan 2009 00:00:09 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[词典]]></category>
		<category><![CDATA[随笔]]></category>
		<category><![CDATA[StarDict]]></category>
		<category><![CDATA[TheSourceCodeOfMyWorld]]></category>
		<category><![CDATA[胡正]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=290</guid>
		<description><![CDATA[　　花了一晚上，将StarDict作者胡正的TheSourceCodeOfMyWorld读完。以下是一些记录和感受：
===================================================
Linux is for people who want to know why it works.
Mac is for people who don”t want to know why it works.
DOS is for people who want to know why it does not work.
Windows is for people who don”t want to know why it does not work
感受：这也许是对Linux最好的说明了，要了解本质，请用Linux吧！
===================================================
When thinking changes your mind, that’’s philosophy.
When God changes [...]


相关文章:<ol><li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
<li><a href='http://www.52nlp.cn/googles-python-class' rel='bookmark' title='Permanent Link: Google&#8217;s Python Class'>Google&#8217;s Python Class</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/%e6%9c%ba%e5%99%a8%e7%bf%bb%e8%af%91%e5%a4%9a%e4%b8%80%e7%82%b9%e5%ae%bd%e5%ae%b9' rel='bookmark' title='Permanent Link: 机器翻译：多一点宽容'>机器翻译：多一点宽容</a></li>
<li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/one-problem-on-moses-training-scripts' rel='bookmark' title='Permanent Link: Moses训练脚本的一个问题'>Moses训练脚本的一个问题</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-powerset' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼二：Powerset'>自然语言处理公司巡礼二：Powerset</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-second-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第二部分）'>MIT自然语言处理第一讲：简介和概述（第二部分）</a></li>
<li><a href='http://www.52nlp.cn/maximum-entropy-model-tutorial-reading' rel='bookmark' title='Permanent Link: 最大熵模型文献阅读指南'>最大熵模型文献阅读指南</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　花了一晚上，将StarDict作者胡正的TheSourceCodeOfMyWorld读完。<span id="more-290"></span>以下是一些记录和感受：<br />
===================================================<br />
Linux is for people who want to know why it works.<br />
Mac is for people who don”t want to know why it works.<br />
DOS is for people who want to know why it does not work.<br />
Windows is for people who don”t want to know why it does not work<br />
<em>感受：这也许是对Linux最好的说明了，要了解本质，请用Linux吧！</em><br />
===================================================<br />
When thinking changes your mind, that’’s philosophy.<br />
When God changes your mind, that’’s faith.<br />
When facts change your mind, that’’s science.<br />
===================================================<br />
- Advice for Clever Children -<br />
Do one thing each day which you would rather not do &#8211; but feel that you ought to do. This will help your character grow, and will stand you in good stead for when you grow up and find that you have to do many things in adult life which you would prefer not to do.<br />
<em>感受：想起了“一生只做一件事”！</em><br />
===================================================<br />
SQLite是由 D. Richard Hipp 用C语言写的一个开源嵌入式数据库。支持 SQL92 标准。OS X自从10.4后把SQLite这套相当出名的数据库软件，放进了操作系统工具集里。软件属于公共领域（public domain），SQLite可说是某种「美德软件」（virtueware），作者本人放弃著作权，而给使用SQLite的人以下的「祝福」 （blessing）：<br />
* May you do good and not evil. 愿你行善莫行恶。<br />
* May you find forgiveness for yourself and forgive others. 愿你原谅自己宽恕他人。<br />
* May you share freely, never taking more than you give. 愿你宽心与人分享，所取不多于你所施予。<br />
===================================================<br />
自由，开放，金钱，当三者不能同时兼顾时，就有一个排列顺序的问题，而前两者是Linux目前所坚持的原则，最终第三个也会得到照顾。最后胜利的总是真理。<br />
===================================================<br />
有一只驴子，听说森林里很自由，就也跑到森林里，结果发现自己要被饿死了，食物要自己找，还有野兽恐吓，于是逃回了棚子里，再也不敢到森林里去了。哈哈，你就是那只尝试Linux的驴子！<br />
<em>感受：自己曾经就是这头驴子，直到在《大教堂与市集》的召唤和《鸟哥私房菜》的指引下学会不被饿死！</em><br />
===================================================<br />
对贡献有激情，对回报有信心。<br />
善待每个陌生人，回报每个帮助过你的人，断绝不回报你的人(骗子)的关系。<br />
《DOOM 启示录》<br />
《人生篆书&#8211;中国传统人生哲学精髓》<br />
===================================================<br />
因为我知道你不会是那个在我生病的时候守在我床边的人，不会是那个在我生气的时候逗我开心的人，不会是那个上街的时候会给我提包的人，不会是那个在我累了的时候会背着我的人，不会是那个在我难过的时候会揽我入怀的人，不会是那个会纵容我有点小脾气的人，不会是那个总是关心可以照顾我的人，不会是那个会听取 我意见也会给我提出意见但是不干涉我的人，不会是那个能给我充分安全感的人。最重要的是，你不是那个爱我的人。你不懂得尊重我，你不懂得珍惜我，你不懂得爱护我。<br />
<em>感受：把“不”字去掉，又是一番天地！</em><br />
===================================================<br />
从前有一个砍柴的人每天都到森林里去，有时候他必须挨饿，因为下雨，有时候则是因为天气太热或太冷。有一个神秘家住在森林里，他看到那个柴夫变得越来越老、生病、挨饿，而且整天工作非<br />
常辛苦。他说：“听着，你为什么不再前进一些？”那个柴夫说：“你所说的再前进一些是什么意思？砍更多的柴吗？不必要地背着那些柴走好几哩路吗？”<br />
那个神秘家说：“不，如果你再前进一些，你就会发现一个铜矿，你可以将那些铜带到城里去卖，这样可以够你维持七天，你就不需要每天来砍柴。”<br />
那个人想：“为什么不试试看？”<br />
他进入到森林里更深的地方，结果真的发现了铜矿，他觉得很高兴，他回来向那个神秘家顶礼。<br />
那个神秘家说：“现在还不要太高兴，你必须再更深入森林里。”<br />
“但是，”他说：“有什么意义呢？现在我已经有了十天的食物。”<br />
那个神秘家说：你还要更深入……<br />
但是那个人说：“如果我再前进，我将会失去铜矿。”<br />
他说：“你尽管去，当然，你将会失去铜矿，但是那里有一个银矿，你一天所能够带回来的银将够你维持三个月。”<br />
“关于铜矿的事，那个神秘家的确说对了。”那个柴夫想：“或许他所说的关于银矿的事也是对的。”结果他再更深入之后真的发现了银矿。<br />
他手舞足蹈地来，他说：“我要怎样报答你？我对你有无限的感谢。”<br />
那个神秘家说：“但是再稍微深入一点的地方有一个金矿。”<br />
那个柴夫觉得有些迟疑，事实上，他本来是一个很穷的人，如今有了一个银矿……那是他连作梦都从来没有想到过的。<br />
但是既然那个神秘家说了，谁晓得?或许他仍然是对的。结果他真的又发现了金矿。现在只要一年来一次就可以了。<br />
但是那个神秘家说：“你一年才来这里一次，那个时间真的是太长了，我已经渐渐变老，我或许不会再待在这里，我或许会过世。所以找必须告诉你，不要挖到金矿就停止，还要再往前一步……”<br />
但是那个人说：“为什么呢?这又是什么意义?你告诉我一件事，然后我一到手，你就立刻叫我停止，然后继续前进!现在我已经找到金矿了耶?”<br />
那个神秘家说：“但是在稍微深入一点的地方就有一个钻石矿。”<br />
那个柴夫当天就跑进去，结果真的又发现了，他带回来一大把的钻石，他说：“这些已经够我一生享用了。”<br />
那个神秘家说：“从此以后我们或许就不再见面了，所以，最后我要给你的讯息是：现在既然你已经有了足够的财富可以过一生，那么就向内走!忘掉那个森林、那 个铜矿、银矿、金矿、和钻石矿。现在我给你一个最终的奥秘，最终的宝物。你外在的需要已经被满足了，象我一样坐在这里。”<br />
那个可怜的人说：“是的，我也是在怀疑……所有这些事你都知道，为什么你还坐在这里？在我的脑海里，这个问题一再一再地浮现，我本来也想问：你为什么不去采集那些钻石?那些钻石就只有你知道，为什么你还一直坐在这棵树下?”<br />
那个神秘家说：“在找到了钻石之后，我师父告诉我说：现在坐在这棵树下，向内走！”<br />
===================================================</p>
<p>注：转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<br />
<a href="http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld/">http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld/</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
<li><a href='http://www.52nlp.cn/googles-python-class' rel='bookmark' title='Permanent Link: Google&#8217;s Python Class'>Google&#8217;s Python Class</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/%e6%9c%ba%e5%99%a8%e7%bf%bb%e8%af%91%e5%a4%9a%e4%b8%80%e7%82%b9%e5%ae%bd%e5%ae%b9' rel='bookmark' title='Permanent Link: 机器翻译：多一点宽容'>机器翻译：多一点宽容</a></li>
<li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/one-problem-on-moses-training-scripts' rel='bookmark' title='Permanent Link: Moses训练脚本的一个问题'>Moses训练脚本的一个问题</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-powerset' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼二：Powerset'>自然语言处理公司巡礼二：Powerset</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-second-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第二部分）'>MIT自然语言处理第一讲：简介和概述（第二部分）</a></li>
<li><a href='http://www.52nlp.cn/maximum-entropy-model-tutorial-reading' rel='bookmark' title='Permanent Link: 最大熵模型文献阅读指南'>最大熵模型文献阅读指南</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Visuwords安装及问题</title>
		<link>http://www.52nlp.cn/visuwords-installation-and-problem</link>
		<comments>http://www.52nlp.cn/visuwords-installation-and-problem#comments</comments>
		<pubDate>Mon, 29 Dec 2008 00:00:23 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[词典]]></category>
		<category><![CDATA[online graphical dictionary]]></category>
		<category><![CDATA[visuwords]]></category>
		<category><![CDATA[wordnet3.0]]></category>
		<category><![CDATA[自然语言处理]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=159</guid>
		<description><![CDATA[　　无意间从一个NLP tools推荐网站上发现了Visuwords，它的描述“online graphical dictionary”（在线图结构词典）比较吸引我，于是进入其官方网站试用了一下，感觉很有意思，就将其源码download下来，准备安装一下。我想之所以将它归类到NLP，与它使用wordnet3.0作为基本词典资源有密切关系。
　　在本机localhost下安装比较顺利，按官方网站介绍的方法，没敢擅自做主更改：
　　1.	Verify that PHP 4 or better is installed and running correctly on your web server.（注：基本要求是PHP4及以上版本）
　　2.	Make a folder in your web folder&#8217;s document directory (usually htdocs) and name it &#8216;visuwords&#8217; (this should be set for at least read access and all other folders likewise unless stated otherwise).（注：在htdocs下建立一个visuwords目录，不要使用其他文件夹名，我后来发现它的as脚本里已固定死了这些目录名，下面也是）
　　3.	Make a folder inside the &#8216;visuwords&#8217; folder [...]


相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%80%e7%bc%98%e8%b5%b7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用一：缘起'>Beautiful Data-统计语言模型的应用一：缘起</a></li>
<li><a href='http://www.52nlp.cn/provides-several-natural-language-processing-book' rel='bookmark' title='Permanent Link: 提供几本自然语言处理书'>提供几本自然语言处理书</a></li>
<li><a href='http://www.52nlp.cn/some-natural-language-processing-and-computational-linguistics-courses-material' rel='bookmark' title='Permanent Link: 一些自然语言处理及计算语言学相关的课件'>一些自然语言处理及计算语言学相关的课件</a></li>
<li><a href='http://www.52nlp.cn/cwb-trial-and-others' rel='bookmark' title='Permanent Link: CWB中文词库试用及其他'>CWB中文词库试用及其他</a></li>
<li><a href='http://www.52nlp.cn/googles-python-class-sos-%e7%bb%ad-%e4%b8%8b%e8%bd%bd' rel='bookmark' title='Permanent Link: Google’s Python Class SOS 续 &#8211;下载'>Google’s Python Class SOS 续 &#8211;下载</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词7'>Beautiful Data-统计语言模型的应用三：分词7</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%ba%8c%e8%83%8c%e6%99%af' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用二：背景'>Beautiful Data-统计语言模型的应用二：背景</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d6' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词6'>Beautiful Data-统计语言模型的应用三：分词6</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e8%b5%84%e6%ba%90' rel='bookmark' title='Permanent Link: 中文分词入门之资源'>中文分词入门之资源</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　无意间从一个NLP tools推荐网站上发现了Visuwords，它的描述“online graphical dictionary”（在线图结构词典）比较吸引我<span id="more-159"></span>，于是进入其<a href="http://www.visuwords.com"target="_blank">官方网站</a>试用了一下，感觉很有意思，就将其源码download下来，准备安装一下。我想之所以将它归类到NLP，与它使用wordnet3.0作为基本词典资源有密切关系。<br />
　　在本机localhost下安装比较顺利，按官方网站介绍的方法，没敢擅自做主更改：<br />
　　1.	Verify that PHP 4 or better is installed and running correctly on your web server.（注：基本要求是PHP4及以上版本）</p>
<p>　　2.	Make a folder in your web folder&#8217;s document directory (usually htdocs) and name it &#8216;visuwords&#8217; (this should be set for at least read access and all other folders likewise unless stated otherwise).（注：在htdocs下建立一个visuwords目录，不要使用其他文件夹名，我后来发现它的as脚本里已固定死了这些目录名，下面也是）</p>
<p>　　3.	Make a folder inside the &#8216;visuwords&#8217; folder you just made and name it &#8216;v2.0&#8242;.（注：在visuwords下建立一个v2.0目录）</p>
<p>　　4.	Unzip the contents of Visuwords20a.zip into the &#8216;v2.0&#8242; folder you just made. The file structure should resemble this: （注：将下载的安装文件visuwords20a.zip解压到v2.0里）：<br />
　　　{doc_root}/v2.0/class/dictionary.php<br />
　　　{doc_root}/v2.0/class/xml.php<br />
　　　{doc_root}/v2.0/lex.php<br />
　　　{doc_root}/v2.0/license.txt<br />
　　　{doc_root}/v2.0/Manager.as<br />
　　　{doc_root}/v2.0/Node.as<br />
　　　{doc_root}/v2.0/Nodegroup.as<br />
　　　{doc_root}/v2.0/readme.txt<br />
　　　{doc_root}/v2.0/visuwords.fla<br />
　　　{doc_root}/v2.0/visuwords.swf<br />
　　　{doc_root}/v2.0/wordnet_dependencies.txt</p>
<p>　　５.Create another folder inside &#8216;v2.0&#8242;and name it &#8216;dict&#8217; (this folder should be set for read/write access).（注：在v2.0里新建一个目录dict，用户要有读/写权）</p>
<p>　　6.	Into the &#8216;dict&#8217; folder you just made, copy the following files from the &#8220;WordNet 3.0 for UNIX-like systems&#8221; package. All of these files come from within the &#8216;dict&#8217; folder from WordNet. It is important to obtain &#8220;WordNet 3.0 for UNIX-like systems&#8221;, EVEN IF YOU ARE RUNNING IN A WINDOWS ENVIRONMENT! WordNet does not currently provide a Windows version of WordNet v3.0, but all we need are some of the data files from it. Please make sure that you understand and abide by the WordNet license agreement. （注：将wordnet3.0 linux版本里以下6个文件放到dict目录下）<br />
　　　data.adj<br />
　　　data.adv<br />
　　　data.noun<br />
　　　data.verb<br />
　　　index.sense<br />
　　　lexnames</p>
<p>　　7.	Test that lex.php works correctly. Call up http://localhost/visuwords/v2.0/lex.php in your browser. You should see an XML dump similar to this. If you don&#8217;t see a similar XML dump (it will be filled with data for a random word) then ensure that you have followed all of the instructions so far and that your web server is performing properly. The unmodified front-end Flash applet makes calls directly to &#8216;http://localhost/visuwords/v2.0/lex.php&#8217; for its data feeds. If you have installed it in any other URL path then you will need to modify the Manager.as file (lines 19 and 20) and rebuild the visuwords.swf file from the included visuwords.fla file. (Adobe/Macromedia Flash v8.0 or later is required). It is strongly recommended that you at least get it working in the default path first, before trying to customize it.（注：执行http://localhost/visuwords/v2.0/lex.php，如果生成xml文件，则说明安装成功，可以执行同目录下的visuwords.swf文件了）</p>
<p>　　8.	If lex.php works correctly, then you should be able to run the front side of the application which is a Flash applet. Make sure you have installed the latest Flash player that is compatible with your browser and call up http://localhost/visuwords/v2.0/visuwords.swf in your browser. You can confirm that you have a compatible player if the online version of Visuwords works from the website ( http://www.visuwords.com ), operates correctly.(注：顺利的话，这一步就可以看到漂亮的wordnet图形词典了，很漂亮)</p>
<p>9.	Jump for joy, you are done.<br />
　　<br />
　　但是，当我按同样的方法放在虚拟主机www.52nlp.cn上时，却在最后一步运行visuwords.swf时显示XML Load Failed!查了一下原因，发现下载的安装包默认的路径就在http://localhost/visuwords&#8230;下，如果要安装在其他主机上，必须修改v2.0下的manager.as文件的第19行，将localhost替换成相应的主机名（事实上在上面的第7条上已经做了提示，我安装的时候没注意），并且重新编译一个visuwords.swf. 对flash不熟，试着利用flash 8重新导出了一个swf，却发现生成的文件有15m，而下载下来的文件里的swf只有几百k。虽然感觉有问题，但还是将这个swf上传到了主机上，试用了一下，失败。猜测原作者在编译swf做了很多设置，但是没能在网上找到这样的说明。如果您对flash这方面的内容比较熟，可以研究一下这个问题，并把结果通知我，不甚感激！</p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<br />
<a href="http://www.52nlp.cn/visuwords-installation-and-problem/">http://www.52nlp.cn/visuwords-installation-and-problem/</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%80%e7%bc%98%e8%b5%b7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用一：缘起'>Beautiful Data-统计语言模型的应用一：缘起</a></li>
<li><a href='http://www.52nlp.cn/provides-several-natural-language-processing-book' rel='bookmark' title='Permanent Link: 提供几本自然语言处理书'>提供几本自然语言处理书</a></li>
<li><a href='http://www.52nlp.cn/some-natural-language-processing-and-computational-linguistics-courses-material' rel='bookmark' title='Permanent Link: 一些自然语言处理及计算语言学相关的课件'>一些自然语言处理及计算语言学相关的课件</a></li>
<li><a href='http://www.52nlp.cn/cwb-trial-and-others' rel='bookmark' title='Permanent Link: CWB中文词库试用及其他'>CWB中文词库试用及其他</a></li>
<li><a href='http://www.52nlp.cn/googles-python-class-sos-%e7%bb%ad-%e4%b8%8b%e8%bd%bd' rel='bookmark' title='Permanent Link: Google’s Python Class SOS 续 &#8211;下载'>Google’s Python Class SOS 续 &#8211;下载</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d7' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词7'>Beautiful Data-统计语言模型的应用三：分词7</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%ba%8c%e8%83%8c%e6%99%af' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用二：背景'>Beautiful Data-统计语言模型的应用二：背景</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d6' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词6'>Beautiful Data-统计语言模型的应用三：分词6</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e5%85%a5%e9%97%a8%e4%b9%8b%e8%b5%84%e6%ba%90' rel='bookmark' title='Permanent Link: 中文分词入门之资源'>中文分词入门之资源</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/visuwords-installation-and-problem/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>stardict2.4.8的main函数简要说明与注释</title>
		<link>http://www.52nlp.cn/stardict-main-function-brief-description</link>
		<comments>http://www.52nlp.cn/stardict-main-function-brief-description#comments</comments>
		<pubDate>Sat, 20 Dec 2008 14:11:40 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[词典]]></category>
		<category><![CDATA[mani函数]]></category>
		<category><![CDATA[StarDict]]></category>
		<category><![CDATA[stardict2.4.8]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=75</guid>
		<description><![CDATA[　　Stardict的入口函数main函数在stardict.cpp的1654行，这个函数涉及到跨平台、软件国际化及CORBA的C/S模式，以下是其简要说明和注释：
// 这里的条件编译用于跨平台
1654 #ifdef _WIN32 // _WIN32 是在windows系统下特有的宏, windows平台
1660 //set gStarDictDataDir; // 设置stardict主目录
1664 if ((hmod = GetModuleHandle(NULL))==0) // 返回指向模块的句柄
1667 if (GetModuleFileName(hmod, tmp_buf, sizeof(tmp_buf))==0) // 获取程序当前执行文件名
1674 gStarDictDataDir=STARDICT_DATA_DIR; //STARDICT_DATA_DIR=&#8221;"$(datadir)/stardict&#8221;"
1676 // 以下使用GNU GetText进行软件国际化
1677 #ifdef _WIN32
// bindtextdomain设置本地化文件的根路径(即(LANG)LC_MESSAGES的所在目录）
1678 bindtextdomain (GETTEXT_PACKAGE, (gStarDictDataDir + G_DIR_SEPARATOR_S &#8220;locale&#8221;).c_str());
1682 bind_textdomain_codeset (GETTEXT_PACKAGE, &#8220;UTF-8&#8243;); // 使用utf8编码
1684 // 获取用户指定的配置目录
1685 std::string userdir(get_user_config_dir());
// 将utf8字符串转换为系统环境的编码方式
1691 gchar *title=g_locale_from_utf8(_(&#8220;StarDict&#8221;), -1, NULL, NULL, NULL);
1692 HWND [...]


相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/maximum-matching-method-of-chinese-word-segmentation' rel='bookmark' title='Permanent Link: 中文分词入门之最大匹配法'>中文分词入门之最大匹配法</a></li>
<li><a href='http://www.52nlp.cn/cwmt2009-follow-up' rel='bookmark' title='Permanent Link: 第五届全国机器翻译研讨会后续'>第五届全国机器翻译研讨会后续</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/acl-wiki-encyclopedia-of-computational-linguistics' rel='bookmark' title='Permanent Link: ACL Wiki——计算语言学的百科全书'>ACL Wiki——计算语言学的百科全书</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-six-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之六：国外书籍'>自然语言处理与计算语言学书籍汇总之六：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e7%9a%84%e5%bd%a2%e5%bc%8f%e6%a8%a1%e5%9e%8b-%e5%af%bc%e8%af%bb' rel='bookmark' title='Permanent Link: 《自然语言处理的形式模型》导读'>《自然语言处理的形式模型》导读</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-second-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第二部分）'>MIT自然语言处理第一讲：简介和概述（第二部分）</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　Stardict的入口函数main函数在stardict.cpp的1654行，这个函数涉及到跨平台、软件国际化及CORBA的C/S模式，以下是其简要说明和注释：<span id="more-75"></span></p>
<p>// 这里的条件编译用于跨平台</p>
<p>1654 #ifdef _WIN32 // _WIN32 是在windows系统下特有的宏, windows平台</p>
<p>1660 //set gStarDictDataDir; // 设置stardict主目录</p>
<p>1664 if ((hmod = GetModuleHandle(NULL))==0) // 返回指向模块的句柄</p>
<p>1667 if (GetModuleFileName(hmod, tmp_buf, sizeof(tmp_buf))==0) // 获取程序当前执行文件名</p>
<p>1674 gStarDictDataDir=STARDICT_DATA_DIR; //STARDICT_DATA_DIR=&#8221;"$(datadir)/stardict&#8221;"</p>
<p>1676 // 以下使用GNU GetText进行软件国际化</p>
<p>1677 #ifdef _WIN32</p>
<p>// bindtextdomain设置本地化文件的根路径(即(LANG)LC_MESSAGES的所在目录）</p>
<p>1678 bindtextdomain (GETTEXT_PACKAGE, (gStarDictDataDir + G_DIR_SEPARATOR_S &#8220;locale&#8221;).c_str());</p>
<p>1682 bind_textdomain_codeset (GETTEXT_PACKAGE, &#8220;UTF-8&#8243;); // 使用utf8编码</p>
<p>1684 // 获取用户指定的配置目录</p>
<p>1685 std::string userdir(get_user_config_dir());</p>
<p>// 将utf8字符串转换为系统环境的编码方式</p>
<p>1691 gchar *title=g_locale_from_utf8(_(&#8220;StarDict&#8221;), -1, NULL, NULL, NULL);</p>
<p>1692 HWND ll_winhandle = FindWindowA(0, title); // 查找StarDict程序是否已运行</p>
<p>1695 if (IsIconic(ll_winhandle)) // 判断窗口是否最小化</p>
<p>1696 ShowWindow(ll_winhandle,SW_RESTORE); //从任务里恢复窗口显示</p>
<p>1698 SetForegroundWindow(ll_winhandle); // 激活该窗口</p>
<p>1703 gtk_set_locale(); // 调用setlocale(LC_ALL,&#8221;"),为本地环境读入本地化数据库, 如果应用程序需要调用gtk_set_locale(),则必须在gtk_init()前调用</p>
<p>1704 gtk_init(&#038;argc, &#038;argv); // 为应用程序初始化GDK和GTK+库, 在argv中搜索它能识别的运行库参数, 处理并从argv矢量中删除已识别的参数</p>
<p>1706 #ifdef CONFIG_GPE //GPE掌上电脑环境，GPE Palmtop Environment</p>
<p>1727 #ifndef CONFIG_GNOME // 如果是命令行模式<br />
1737if (g_utf8_validate (argv[i], -1, NULL)) / 验证字符串是否是utf8编码</p>
<p>1738 queryword= g_strdup(argv[i]); // 复制字符串作为查询词</p>
<p>1740 queryword = g_locale_to_utf8(argv[i],-1,NULL,NULL,NULL); // 将字符串转换为utf8编码</p>
<p>1745 #else // 如果在Gnome图形界面下</p>
<p>1746 GnomeProgram *program;</p>
<p>// Initialises the current GNOME libraries for use by the application</p>
<p>1747 program = gnome_program_init (&#8220;stardict&#8221;, VERSION,</p>
<p>1756 // An opaque structure used to hold different types of values</p>
<p>1757 GValue value = { 0 };</p>
<p>1758 poptContext pctx; // popt 库是一个用来分析 GNU 风格命令行参数的函数库.</p>
<p>1759 // Gets a property of an object.</p>
<p>1760 g_object_get_property (G_OBJECT (program),</p>
<p>1767 args = (char**) poptGetArgs(pctx); // 把所有非选项的参数提取出来放到args里</p>
<p>1777 poptFreeContext (pctx);</p>
<p>1778</p>
<p>1779 CORBA_Object factory; // 定义服务器端</p>
<p>1793 // GnomeClient — Interactions with the session manager</p>
<p>1794 GnomeClient *client; // 客户端</p>
<p>1795 if ((client = gnome_master_client()) != NULL) { //Get the master session management client</p>
<p>1796 g_signal_connect (client, &#8220;save_yourself&#8221;, G_CALLBACK (save_yourself_cb), (gpointer) argv[0]);</p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<br />
<a href="http://www.52nlp.cn/stardict-main-function-brief-description/">http://www.52nlp.cn/stardict-main-function-brief-description/</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/maximum-matching-method-of-chinese-word-segmentation' rel='bookmark' title='Permanent Link: 中文分词入门之最大匹配法'>中文分词入门之最大匹配法</a></li>
<li><a href='http://www.52nlp.cn/cwmt2009-follow-up' rel='bookmark' title='Permanent Link: 第五届全国机器翻译研讨会后续'>第五届全国机器翻译研讨会后续</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/acl-wiki-encyclopedia-of-computational-linguistics' rel='bookmark' title='Permanent Link: ACL Wiki——计算语言学的百科全书'>ACL Wiki——计算语言学的百科全书</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-six-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之六：国外书籍'>自然语言处理与计算语言学书籍汇总之六：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e7%9a%84%e5%bd%a2%e5%bc%8f%e6%a8%a1%e5%9e%8b-%e5%af%bc%e8%af%bb' rel='bookmark' title='Permanent Link: 《自然语言处理的形式模型》导读'>《自然语言处理的形式模型》导读</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-second-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第二部分）'>MIT自然语言处理第一讲：简介和概述（第二部分）</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/stardict-main-function-brief-description/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>编译stardict-tools-3.0.1及使用stardict2txt</title>
		<link>http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt</link>
		<comments>http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt#comments</comments>
		<pubDate>Sat, 20 Dec 2008 14:05:14 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[词典]]></category>
		<category><![CDATA[StarDict]]></category>
		<category><![CDATA[Stardict2txt]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=72</guid>
		<description><![CDATA[　　因为要用stardict2txt转化stardict下的词典，所以编译了一下stardict-tools-3.0.1，里面还有很多有用的工具，可慢慢参考。记录编译过程如下：
　　　1.下载stardict-tools-3.0.1.tar.bz2 到自定义的目录下;
　　　2.解压：tar xvf stardict-tools-3.0.1.tar.bz2 ;
　　　3.进入解压后的目录：cd stardict-tools-3.0.1;
　　　4.安装过程可参考INSTALL, 工具简介可参考README；
　　　5.编译安装：
　　　　　a) ./configure
　　　　　b) make
　　　　　c) make check
　　　　　d) make install
　　　　　e) make clean
　　　6.如果在上述过程中遇到问题，可能遇系统配置的编译环境不完全有关，我就遇到了mysql.h：No such file or directory的问题，是libmysqlclient-dev没安装的问题。
　　以上工作完成后，在src目录下就有编译好的stardict2txt工具了，这样就可以将stardict下的词典转    换为txt的格式，使用方法如下：
　　　./stardict2txt /usr/share/stardict/dic/somedicts/somedicts.ifo
　　使用前需将somdicdt目录下的somedict.dict.dz转换为somedict.dict.gz, 再用gunzip解压:
　　　cp somedict.dict.dz somedict.dict.gz;
　　　gunzip somedict.dict.gz
　　运行结果产生的txt文件在当前目录下，然后可以就可以观察这些词典文件的结果，按实际需要进行修改了。
注：原创文章，转载请注明出处“我爱自然语言处理”：www.52nlp.cn
本文链接地址：
http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt/










相关文章:stardict2.4.8的main函数简要说明与注释
StarDict背后的牛人
胡正，StarDict，TheSourceCodeOfMyWorld
Visuwords安装及问题
Google、网易、百度在线翻译调查及分析
安装Srilm的一点新变化
一个不错的自然语言处理词典
EuroMatrix与开放精神
Beautiful Data-统计语言模型的应用三：分词4
单词也疯狂——漂亮的“单词云”



相关文章:<ol><li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
<li><a href='http://www.52nlp.cn/online-translation-survey-and-analysis' rel='bookmark' title='Permanent Link: Google、网易、百度在线翻译调查及分析'>Google、网易、百度在线翻译调查及分析</a></li>
<li><a href='http://www.52nlp.cn/%e5%ae%89%e8%a3%85srilm%e7%9a%84%e4%b8%80%e7%82%b9%e6%96%b0%e5%8f%98%e5%8c%96' rel='bookmark' title='Permanent Link: 安装Srilm的一点新变化'>安装Srilm的一点新变化</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/euromatrix-and-spirit-of-openness' rel='bookmark' title='Permanent Link: EuroMatrix与开放精神'>EuroMatrix与开放精神</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d4' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词4'>Beautiful Data-统计语言模型的应用三：分词4</a></li>
<li><a href='http://www.52nlp.cn/crazy-word-beautiful-word-clouds' rel='bookmark' title='Permanent Link: 单词也疯狂——漂亮的“单词云”'>单词也疯狂——漂亮的“单词云”</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　因为要用stardict2txt转化stardict下的词典，所以编译了一下stardict-tools-3.0.1，里面还有很多有用的工具，可慢慢参考。记录编译过程如下：<span id="more-72"></span><br />
　　　1.下载stardict-tools-3.0.1.tar.bz2 到自定义的目录下;<br />
　　　2.解压：tar xvf stardict-tools-3.0.1.tar.bz2 ;<br />
　　　3.进入解压后的目录：cd stardict-tools-3.0.1;<br />
　　　4.安装过程可参考INSTALL, 工具简介可参考README；<br />
　　　5.编译安装：<br />
　　　　　a) ./configure<br />
　　　　　b) make<br />
　　　　　c) make check<br />
　　　　　d) make install<br />
　　　　　e) make clean<br />
　　　6.如果在上述过程中遇到问题，可能遇系统配置的编译环境不完全有关，我就遇到了mysql.h：No such file or directory的问题，是libmysqlclient-dev没安装的问题。<br />
　　以上工作完成后，在src目录下就有编译好的stardict2txt工具了，这样就可以将stardict下的词典转    换为txt的格式，使用方法如下：<br />
　　　./stardict2txt /usr/share/stardict/dic/somedicts/somedicts.ifo<br />
　　使用前需将somdicdt目录下的somedict.dict.dz转换为somedict.dict.gz, 再用gunzip解压:<br />
　　　cp somedict.dict.dz somedict.dict.gz;<br />
　　　gunzip somedict.dict.gz<br />
　　运行结果产生的txt文件在当前目录下，然后可以就可以观察这些词典文件的结果，按实际需要进行修改了。</p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<br />
<a href="http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt/">http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt/</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/stardict-heroe' rel='bookmark' title='Permanent Link: StarDict背后的牛人'>StarDict背后的牛人</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
<li><a href='http://www.52nlp.cn/online-translation-survey-and-analysis' rel='bookmark' title='Permanent Link: Google、网易、百度在线翻译调查及分析'>Google、网易、百度在线翻译调查及分析</a></li>
<li><a href='http://www.52nlp.cn/%e5%ae%89%e8%a3%85srilm%e7%9a%84%e4%b8%80%e7%82%b9%e6%96%b0%e5%8f%98%e5%8c%96' rel='bookmark' title='Permanent Link: 安装Srilm的一点新变化'>安装Srilm的一点新变化</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/euromatrix-and-spirit-of-openness' rel='bookmark' title='Permanent Link: EuroMatrix与开放精神'>EuroMatrix与开放精神</a></li>
<li><a href='http://www.52nlp.cn/beautiful-data-%e7%bb%9f%e8%ae%a1%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%ba%94%e7%94%a8%e4%b8%89%e5%88%86%e8%af%8d4' rel='bookmark' title='Permanent Link: Beautiful Data-统计语言模型的应用三：分词4'>Beautiful Data-统计语言模型的应用三：分词4</a></li>
<li><a href='http://www.52nlp.cn/crazy-word-beautiful-word-clouds' rel='bookmark' title='Permanent Link: 单词也疯狂——漂亮的“单词云”'>单词也疯狂——漂亮的“单词云”</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>StarDict背后的牛人</title>
		<link>http://www.52nlp.cn/stardict-heroe</link>
		<comments>http://www.52nlp.cn/stardict-heroe#comments</comments>
		<pubDate>Sat, 20 Dec 2008 13:50:02 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[词典]]></category>
		<category><![CDATA[StarDict]]></category>
		<category><![CDATA[胡正]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=66</guid>
		<description><![CDATA[　　虽然用了很长时间的StarDict,但晚上准备hack一些StarDict的词典文件时，才发现它的作者竟是一位中国人（http://www.huzheng.org/），看了他的resume,只能说自己是井底之蛙了！
　　而对于我来说，不仅仅要做一个研究者，也要做一个设计者&#8230;路还很长，坚持！加油！享受！
附：
StarDict的作者胡正的简历：
　　胡正,农历1982.12.5,湖南岳阳人,刚毕业，目前在北京工作。
　　1998年10月25日,我买了台电脑.
　　1999年4月,学vb.在网吧上网.
　　5月,用linux.
　　6月,xiazi1.0编了出来.
　　暑假,连续10天每天晚上2点,早上6点,学会并编出了xiazi1.2,之后又编了1.5,消去了许多BUG.
　　10月,用熟了linux.
　　11月,认识了开游戏厅兼广告设计的缪俊勇,帮我设计了程序界面,lf2.0出来了.
寒假,电脑被封,接触了汇编,linux下gtk+编程.用c++builder编的lf2.2和能订制界面的lf2.3都未完成.
　　2000年4月,电脑开封,lf2.009编了出来,不想再升级lf了.开始在linux下用gtk+编友情强档.
　　5月,1号到4号放假4天,与汤浩开始编网站IT蝎队.
　　之后就是高三了.一年没玩电脑.
　　高考完后终于自由了,暑假里就学PHP编了这个网站。然后考到了四川大学信息管理与信息系统系2001级。
　　大一上学期主要是继续编yqpim这个软件,下学期编reciteword,翻译了gtk2 tutorial.
　　大二上学期完善reciteword,开发了myicq的gaim插件,下学期开发了StarDict,编了LinQ-gtkmm版.
　　大三上学期完善了StarDict,推出2.4.2版，星际译王成为了一个完整的词典软件，另外写了本《胡正天才哲学》，下学期写了本《终极真理》 
　　大四上学期主要在休养，再就是课程最后积累得很多了，都忙着上课，这样下学期也过了，这一年半里没有做多少开发，不过推出了StarDict2.4.5版。
　　因为学分不够，延期一年毕业，因此有了大五，上学期在上课之余继续完善StarDict，加了Windows下的屏幕取词等功能，下学期课程少了，就主要开发StarDict，最后毕业时推出2.4.8版，星际译王作为一个本地的词典软件已经很成熟了。
　　2006.7月终于顺利从四川大学本科毕业，然后到了北京飞漫公司工作。
　　2007年一月转到了红帽子公司，全球最好的Linux企业 ：）
　　2001.10.14: 我是一名linuxer,但现在水平还太低,如果有一天能读懂linux内核的源代码,那将是很快乐的事.我的qq: 1706932,不过我很少进windows,就几乎没用了.
　　2003.12.1: 我的理想是以后成为Linux黑客兼哲学家兼物理学家兼文学家兼&#8230;.  
　　交友请mailto:huzheng_001@163.com
　　　　　MSN: huzheng_001@hotmail.com
　　　　　Gtalk聊天：huzheng001@gmail.com
　　　　　手机：13520747434
　　胡正的个人网站：
　　　http://www.huzheng.org/
　　StarDict官方网站：
　　　http://stardict.sourceforge.net/cn/index.php
注：转载请注明出处“我爱自然语言处理”：www.52nlp.cn
本文链接地址：
http://www.52nlp.cn/stardict-heroe/










相关文章:编译stardict-tools-3.0.1及使用stardict2txt
胡正，StarDict，TheSourceCodeOfMyWorld
stardict2.4.8的main函数简要说明与注释
欧洲议会平行语料库介绍
自然语言处理与计算语言学书籍汇总之六：国外书籍
贝叶斯模型文献阅读指南
基于字标注的中文分词方法
统计机器翻译与资源建设思考
SMT经典再回首之Brown90:远见卓识
Visuwords安装及问题



相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/european-parliament-proceedings-parallel-corpus-introduce' rel='bookmark' title='Permanent Link: 欧洲议会平行语料库介绍'>欧洲议会平行语料库介绍</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-six-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之六：国外书籍'>自然语言处理与计算语言学书籍汇总之六：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/bayesian-modeling-for-language-tutorial-reading' rel='bookmark' title='Permanent Link: 贝叶斯模型文献阅读指南'>贝叶斯模型文献阅读指南</a></li>
<li><a href='http://www.52nlp.cn/the-character-based-tagging-method-of-chinese-word-segmentation' rel='bookmark' title='Permanent Link: 基于字标注的中文分词方法'>基于字标注的中文分词方法</a></li>
<li><a href='http://www.52nlp.cn/statistical-machine-translation-and-resources-building-thinking' rel='bookmark' title='Permanent Link: 统计机器翻译与资源建设思考'>统计机器翻译与资源建设思考</a></li>
<li><a href='http://www.52nlp.cn/the-foresight-of-smt-classic-brown90' rel='bookmark' title='Permanent Link: SMT经典再回首之Brown90:远见卓识'>SMT经典再回首之Brown90:远见卓识</a></li>
<li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　虽然用了很长时间的StarDict,但晚上准备hack一些StarDict的词典文件时，才发现它的作者竟是一位中国人（http://www.huzheng.org/），看了他的resume,只能说自己是井底之蛙了！<span id="more-66"></span><br />
　　而对于我来说，不仅仅要做一个研究者，也要做一个设计者&#8230;路还很长，坚持！加油！享受！</p>
<p>附：<br />
<strong>StarDict的作者胡正的简历：</strong><br />
　　胡正,农历1982.12.5,湖南岳阳人,刚毕业，目前在北京工作。<br />
　　1998年10月25日,我买了台电脑.<br />
　　1999年4月,学vb.在网吧上网.<br />
　　5月,用linux.<br />
　　6月,xiazi1.0编了出来.<br />
　　暑假,连续10天每天晚上2点,早上6点,学会并编出了xiazi1.2,之后又编了1.5,消去了许多BUG.<br />
　　10月,用熟了linux.<br />
　　11月,认识了开游戏厅兼广告设计的缪俊勇,帮我设计了程序界面,lf2.0出来了.<br />
寒假,电脑被封,接触了汇编,linux下gtk+编程.用c++builder编的lf2.2和能订制界面的lf2.3都未完成.<br />
　　2000年4月,电脑开封,lf2.009编了出来,不想再升级lf了.开始在linux下用gtk+编友情强档.<br />
　　5月,1号到4号放假4天,与汤浩开始编网站IT蝎队.<br />
　　之后就是高三了.一年没玩电脑.<br />
　　高考完后终于自由了,暑假里就学PHP编了这个网站。然后考到了四川大学信息管理与信息系统系2001级。<br />
　　大一上学期主要是继续编yqpim这个软件,下学期编reciteword,翻译了gtk2 tutorial.<br />
　　大二上学期完善reciteword,开发了myicq的gaim插件,下学期开发了StarDict,编了LinQ-gtkmm版.<br />
　　大三上学期完善了StarDict,推出2.4.2版，星际译王成为了一个完整的词典软件，另外写了本《胡正天才哲学》，下学期写了本《终极真理》 <img src='http://www.52nlp.cn/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /><br />
　　大四上学期主要在休养，再就是课程最后积累得很多了，都忙着上课，这样下学期也过了，这一年半里没有做多少开发，不过推出了StarDict2.4.5版。<br />
　　因为学分不够，延期一年毕业，因此有了大五，上学期在上课之余继续完善StarDict，加了Windows下的屏幕取词等功能，下学期课程少了，就主要开发StarDict，最后毕业时推出2.4.8版，星际译王作为一个本地的词典软件已经很成熟了。<br />
　　2006.7月终于顺利从四川大学本科毕业，然后到了北京飞漫公司工作。<br />
　　2007年一月转到了红帽子公司，全球最好的Linux企业 ：）</p>
<p>　　2001.10.14: 我是一名linuxer,但现在水平还太低,如果有一天能读懂linux内核的源代码,那将是很快乐的事.我的qq: 1706932,不过我很少进windows,就几乎没用了.<br />
　　2003.12.1: 我的理想是以后成为Linux黑客兼哲学家兼物理学家兼文学家兼&#8230;. <img src='http://www.52nlp.cn/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>　　交友请mailto:huzheng_001@163.com<br />
　　　　　MSN: huzheng_001@hotmail.com<br />
　　　　　Gtalk聊天：huzheng001@gmail.com<br />
　　　　　手机：13520747434<br />
　　胡正的个人网站：<br />
　　　http://www.huzheng.org/<br />
　　StarDict官方网站：<br />
　　　http://stardict.sourceforge.net/cn/index.php</p>
<p>注：转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<br />
<a href="http://www.52nlp.cn/stardict-heroe/">http://www.52nlp.cn/stardict-heroe/</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/compile-stardict-tools-and-use-stardict2txt' rel='bookmark' title='Permanent Link: 编译stardict-tools-3.0.1及使用stardict2txt'>编译stardict-tools-3.0.1及使用stardict2txt</a></li>
<li><a href='http://www.52nlp.cn/huzheng-stardict-thesourcecodeofmyworld' rel='bookmark' title='Permanent Link: 胡正，StarDict，TheSourceCodeOfMyWorld'>胡正，StarDict，TheSourceCodeOfMyWorld</a></li>
<li><a href='http://www.52nlp.cn/stardict-main-function-brief-description' rel='bookmark' title='Permanent Link: stardict2.4.8的main函数简要说明与注释'>stardict2.4.8的main函数简要说明与注释</a></li>
<li><a href='http://www.52nlp.cn/european-parliament-proceedings-parallel-corpus-introduce' rel='bookmark' title='Permanent Link: 欧洲议会平行语料库介绍'>欧洲议会平行语料库介绍</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-and-computational-linguistics-books-summary-six-foreign-book' rel='bookmark' title='Permanent Link: 自然语言处理与计算语言学书籍汇总之六：国外书籍'>自然语言处理与计算语言学书籍汇总之六：国外书籍</a></li>
<li><a href='http://www.52nlp.cn/bayesian-modeling-for-language-tutorial-reading' rel='bookmark' title='Permanent Link: 贝叶斯模型文献阅读指南'>贝叶斯模型文献阅读指南</a></li>
<li><a href='http://www.52nlp.cn/the-character-based-tagging-method-of-chinese-word-segmentation' rel='bookmark' title='Permanent Link: 基于字标注的中文分词方法'>基于字标注的中文分词方法</a></li>
<li><a href='http://www.52nlp.cn/statistical-machine-translation-and-resources-building-thinking' rel='bookmark' title='Permanent Link: 统计机器翻译与资源建设思考'>统计机器翻译与资源建设思考</a></li>
<li><a href='http://www.52nlp.cn/the-foresight-of-smt-classic-brown90' rel='bookmark' title='Permanent Link: SMT经典再回首之Brown90:远见卓识'>SMT经典再回首之Brown90:远见卓识</a></li>
<li><a href='http://www.52nlp.cn/visuwords-installation-and-problem' rel='bookmark' title='Permanent Link: Visuwords安装及问题'>Visuwords安装及问题</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/stardict-heroe/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
	</channel>
</rss>
