<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>我爱自然语言处理 &#187; 语义学</title>
	<atom:link href="http://www.52nlp.cn/category/semantics/feed" rel="self" type="application/rss+xml" />
	<link>http://www.52nlp.cn</link>
	<description>I Love Natural Language Processing</description>
	<lastBuildDate>Wed, 21 Jul 2010 15:33:24 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>CWB中文词库试用及其他</title>
		<link>http://www.52nlp.cn/cwb-trial-and-others</link>
		<comments>http://www.52nlp.cn/cwb-trial-and-others#comments</comments>
		<pubDate>Thu, 21 May 2009 16:00:45 +0000</pubDate>
		<dc:creator>52nlp</dc:creator>
				<category><![CDATA[自然语言处理]]></category>
		<category><![CDATA[词典]]></category>
		<category><![CDATA[语义学]]></category>
		<category><![CDATA[CWB中文词库]]></category>
		<category><![CDATA[Metaweb]]></category>
		<category><![CDATA[wordnet]]></category>
		<category><![CDATA[中文语义词库]]></category>
		<category><![CDATA[汉语语义词典]]></category>
		<category><![CDATA[知识库]]></category>
		<category><![CDATA[语义网]]></category>

		<guid isPermaLink="false">http://www.52nlp.cn/?p=1604</guid>
		<description><![CDATA[　　52nlp有一段时间没有收到任何评论或留言了，晚上发现《自然语言处理公司巡礼六：Metaweb》有一条新留言，挺高兴的：
　　“http://www.cwbbase.com 是一个含 115,000 词的、有点类似 WordNet 的中文语义词库。欢迎访问，欢迎惠赐宝贵意见。”
　　毕竟WordNet大名鼎鼎，搞自然语言处理的同行大概都知道一些，如果真的做得是中文语义词库，还是很有意义的事。于是我访问了这个网站，本以为这是个中文语义词库的在线网站，但这个网站上提供的是桌面版的演示软件。以下是其简介：
　　“这是一个略具规模的中文语义词库, 也是稍有特色的汉语语义词典。它含有 10 万以上的词条, 每个词条通过关系比较密切的相关词 (例如同义词、反义词、上位词、下位词等) 与其它词条相连结。整个词库呈现为比较复杂的网络结构, 并带有多种检索手段和显示方式。”
　　虽然自己对这一块儿不熟，但是还是下载了“CWB中文词库演示版”试用了一下，以下是搜索“自然语言处理”的效果图：
 　　　　
 　　CWB中文词库做得很专业，帮助文档非常详细，而我也很想了解CWB的背景，毕竟研制这样的语义词库比一般的词典难度大的多，没有一定知识积累以及资金的支持，很难做得下去。但是，当我读到帮助文档中《为什么要研制 CWB 词库》的最后一段看到“本系统没有科研经费的支持”时，非常非常震惊：毕竟在中国，甭说没有科研经费的支持，就是有了科研经费的支持，真正用在刀刃上，真正踏踏实实做事的又有几人？我从心底里敬佩CWB中文词库的作者！
　　而事实上当看到作者隐去自己姓名的简介时，直觉就告诉我，这个作者很不一般：
　　“作者是语言学、现代哲学、人工智能、软件设计的爱好者。长期从事语义学研究和自然语言处理系统的开发。设计过机器翻译实验系统、中文自动分词系统、中文全文检索系统, 其中有的曾进入市场或在某些机构长期使用。曾在中文信息处理、语言学、哲学等领域的刊物上发表过若干篇语义学论文, 并撰写了较多语义学笔记, 主要探讨了语义关系、命名理论、知识本体等方面的一些问题。1993-1996 年间担任过少数全国性和国际性中文信息处理学术会议的程序委员会委员。原电子部在京机构高级工程师。20 世纪 90 年代中期辞职成为自由人员, 并主要从事 CWB 中文词库的研制工作。”
　　这里至少告诉我几个事实：作者曾涉足过机器翻译、中文分词及信息检索等领域，尤其在语义学方面的研究卓有成就，并且在90年代初中期的时候在中文信息处理领域具有一定的声望！另外，从帮助文档中还能看到作者在90年代中期以后逐渐将精力完全集中到语义词典“CWB中文词库”的研制上来，这也让我想起了“一生只做一件事”这句至理名言！
　　那么“CWB中文词库”的作者究竟是谁？帮助文档里的一些文章给了我提示，通过Google搜索还是找到了答案，不过这涉及个人隐私，这里就隐去不说了，但是可以肯定的是：“CWB中文词库”的作者是国内早期研究自然语言处理相关领域的老一辈拓荒者，对中文信息处理相关领域的发展做出了很大的贡献！
　　最后摘录《为什么要研制 CWB 词库》的一段话：
　　“由于理论问题的困扰, 尚未渐入佳境。作者还在不断修改该词库, 深感才疏学浅, 勉为其难, 决不敢掉以轻心或自鸣得意。岂能尽如人意, 但求无愧我心。在这个理论空白点尚多、数据庞杂多变、且还要做出比较精密的软件的领域, 努力追求、逼近完善是长期的任务, 无法一蹴而就。这一点是这种事情的性质所决定的, 不是一般谦虚的话。夸大的宣传只会误导用户和读者。语义学和知识库的一些问题也许还需要若干代人或更长时间的努力才可能解决。计算机获取和表示人类知识还任重而道远。语义词库所涵盖的知识还相当有限。对这些应有清醒的认识。目前自然语言处理中的各种方法和资源都有其局限性, 本系统当然也是如此。”
　　这段话让我深切感受到了前辈老师的谦虚和务实！而这段话似乎又可以拿来与所有搞自然语言处理的研究者分享和共勉！这里由衷的向前辈老师致上深深的敬意！
注：原创文章，转载请注明出处“我爱自然语言处理”：www.52nlp.cn
本文链接地址：http://www.52nlp.cn/cwb-trial-and-others











相关文章:语义网新闻一则：Google收购语义网公司Metaweb
自然语言处理公司巡礼六：Metaweb
一个不错的自然语言处理词典
COLING 2010: List of Accepted Papers (Oral)
HMM在自然语言处理中的应用一：词性标注1
ACL09 Full Paper各研究领域的录用情况
推荐刘群老师的《计算所与北大往事回顾》
自然语言处理中理性主义与经验主义的优缺点
自然语言处理公司巡礼一：Teragram
MIT自然语言处理第一讲：简介和概述（第一部分）



相关文章:<ol><li><a href='http://www.52nlp.cn/%e8%af%ad%e4%b9%89%e7%bd%91%e6%96%b0%e9%97%bb%e4%b8%80%e5%88%99-google%e6%94%b6%e8%b4%ad%e8%af%ad%e4%b9%89%e7%bd%91%e5%85%ac%e5%8f%b8metaweb' rel='bookmark' title='Permanent Link: 语义网新闻一则：Google收购语义网公司Metaweb'>语义网新闻一则：Google收购语义网公司Metaweb</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-metaweb' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼六：Metaweb'>自然语言处理公司巡礼六：Metaweb</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/coling-2010-list-of-accepted-papers-oral' rel='bookmark' title='Permanent Link: COLING 2010: List of Accepted Papers (Oral)'>COLING 2010: List of Accepted Papers (Oral)</a></li>
<li><a href='http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-1' rel='bookmark' title='Permanent Link: HMM在自然语言处理中的应用一：词性标注1'>HMM在自然语言处理中的应用一：词性标注1</a></li>
<li><a href='http://www.52nlp.cn/acl09-acceptance-rates-by-areas' rel='bookmark' title='Permanent Link: ACL09 Full Paper各研究领域的录用情况'>ACL09 Full Paper各研究领域的录用情况</a></li>
<li><a href='http://www.52nlp.cn/liu-qun-article-recommended' rel='bookmark' title='Permanent Link: 推荐刘群老师的《计算所与北大往事回顾》'>推荐刘群老师的《计算所与北大往事回顾》</a></li>
<li><a href='http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp' rel='bookmark' title='Permanent Link: 自然语言处理中理性主义与经验主义的优缺点'>自然语言处理中理性主义与经验主义的优缺点</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-teragram' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼一：Teragram'>自然语言处理公司巡礼一：Teragram</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第一部分）'>MIT自然语言处理第一讲：简介和概述（第一部分）</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>　　52nlp有一段时间没有收到任何评论或留言了，晚上发现《自然语言处理公司巡礼六：Metaweb》有一条新留言，挺高兴的<span id="more-1604"></span>：<br />
　　“<a href="http://www.cwbbase.com"target=_blank>http://www.cwbbase.com</a> 是一个含 115,000 词的、有点类似 WordNet 的中文语义词库。欢迎访问，欢迎惠赐宝贵意见。”<br />
　　毕竟WordNet大名鼎鼎，搞自然语言处理的同行大概都知道一些，如果真的做得是中文语义词库，还是很有意义的事。于是我访问了这个网站，本以为这是个中文语义词库的在线网站，但这个网站上提供的是桌面版的演示软件。以下是其简介：<br />
　　“这是一个略具规模的中文语义词库, 也是稍有特色的汉语语义词典。它含有 10 万以上的词条, 每个词条通过关系比较密切的相关词 (例如同义词、反义词、上位词、下位词等) 与其它词条相连结。整个词库呈现为比较复杂的网络结构, 并带有多种检索手段和显示方式。”<br />
　　虽然自己对这一块儿不熟，但是还是下载了“CWB中文词库演示版”试用了一下，以下是搜索“自然语言处理”的效果图：<br />
 　　　　<img src="http://www.52nlp.cn/images/cwb-nlp.jpg" alt="cwb中文词库"自然语言处理"效果图" /><br />
 　　CWB中文词库做得很专业，帮助文档非常详细，而我也很想了解CWB的背景，毕竟研制这样的语义词库比一般的词典难度大的多，没有一定知识积累以及资金的支持，很难做得下去。但是，当我读到帮助文档中《为什么要研制 CWB 词库》的最后一段看到“本系统没有科研经费的支持”时，非常非常震惊：毕竟在中国，甭说没有科研经费的支持，就是有了科研经费的支持，真正用在刀刃上，真正踏踏实实做事的又有几人？我从心底里敬佩CWB中文词库的作者！<br />
　　而事实上当看到作者隐去自己姓名的简介时，直觉就告诉我，这个作者很不一般：<br />
　　“作者是语言学、现代哲学、人工智能、软件设计的爱好者。长期从事语义学研究和自然语言处理系统的开发。设计过机器翻译实验系统、中文自动分词系统、中文全文检索系统, 其中有的曾进入市场或在某些机构长期使用。曾在中文信息处理、语言学、哲学等领域的刊物上发表过若干篇语义学论文, 并撰写了较多语义学笔记, 主要探讨了语义关系、命名理论、知识本体等方面的一些问题。1993-1996 年间担任过少数全国性和国际性中文信息处理学术会议的程序委员会委员。原电子部在京机构高级工程师。20 世纪 90 年代中期辞职成为自由人员, 并主要从事 CWB 中文词库的研制工作。”<br />
　　这里至少告诉我几个事实：作者曾涉足过机器翻译、中文分词及信息检索等领域，尤其在语义学方面的研究卓有成就，并且在90年代初中期的时候在中文信息处理领域具有一定的声望！另外，从帮助文档中还能看到作者在90年代中期以后逐渐将精力完全集中到语义词典“CWB中文词库”的研制上来，这也让我想起了“一生只做一件事”这句至理名言！<br />
　　那么“CWB中文词库”的作者究竟是谁？帮助文档里的一些文章给了我提示，通过Google搜索还是找到了答案，不过这涉及个人隐私，这里就隐去不说了，但是可以肯定的是：“CWB中文词库”的作者是国内早期研究自然语言处理相关领域的老一辈拓荒者，对中文信息处理相关领域的发展做出了很大的贡献！<br />
　　最后摘录《为什么要研制 CWB 词库》的一段话：<br />
　　“由于理论问题的困扰, 尚未渐入佳境。作者还在不断修改该词库, 深感才疏学浅, 勉为其难, 决不敢掉以轻心或自鸣得意。岂能尽如人意, 但求无愧我心。在这个理论空白点尚多、数据庞杂多变、且还要做出比较精密的软件的领域, 努力追求、逼近完善是长期的任务, 无法一蹴而就。这一点是这种事情的性质所决定的, 不是一般谦虚的话。夸大的宣传只会误导用户和读者。语义学和知识库的一些问题也许还需要若干代人或更长时间的努力才可能解决。计算机获取和表示人类知识还任重而道远。语义词库所涵盖的知识还相当有限。对这些应有清醒的认识。目前自然语言处理中的各种方法和资源都有其局限性, 本系统当然也是如此。”<br />
　　这段话让我深切感受到了前辈老师的谦虚和务实！而这段话似乎又可以拿来与所有搞自然语言处理的研究者分享和共勉！这里由衷的向前辈老师致上深深的敬意！</p>
<p>注：原创文章，转载请注明出处“<a href="http://www.52nlp.cn">我爱自然语言处理</a>”：<a href="http://www.52nlp.cn">www.52nlp.cn</a></p>
<p>本文链接地址：<a href="http://www.52nlp.cn/cwb-trial-and-others">http://www.52nlp.cn/cwb-trial-and-others<br />
</a></p>
<p>
<!-- Begin Google Adsense code -->
<script type="text/javascript"><!--
google_ad_client = "pub-4332174469367599";
/* 336x280, 创建于 09-2-7 */
google_ad_slot = "5707022987";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
<!-- End Google Adsense code -->
</p>


<p>相关文章:<ol><li><a href='http://www.52nlp.cn/%e8%af%ad%e4%b9%89%e7%bd%91%e6%96%b0%e9%97%bb%e4%b8%80%e5%88%99-google%e6%94%b6%e8%b4%ad%e8%af%ad%e4%b9%89%e7%bd%91%e5%85%ac%e5%8f%b8metaweb' rel='bookmark' title='Permanent Link: 语义网新闻一则：Google收购语义网公司Metaweb'>语义网新闻一则：Google收购语义网公司Metaweb</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-metaweb' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼六：Metaweb'>自然语言处理公司巡礼六：Metaweb</a></li>
<li><a href='http://www.52nlp.cn/%e4%b8%80%e4%b8%aa%e4%b8%8d%e9%94%99%e7%9a%84%e8%87%aa%e7%84%b6%e8%af%ad%e8%a8%80%e5%a4%84%e7%90%86%e8%af%8d%e5%85%b8' rel='bookmark' title='Permanent Link: 一个不错的自然语言处理词典'>一个不错的自然语言处理词典</a></li>
<li><a href='http://www.52nlp.cn/coling-2010-list-of-accepted-papers-oral' rel='bookmark' title='Permanent Link: COLING 2010: List of Accepted Papers (Oral)'>COLING 2010: List of Accepted Papers (Oral)</a></li>
<li><a href='http://www.52nlp.cn/hmm-application-in-natural-language-processing-one-part-of-speech-tagging-1' rel='bookmark' title='Permanent Link: HMM在自然语言处理中的应用一：词性标注1'>HMM在自然语言处理中的应用一：词性标注1</a></li>
<li><a href='http://www.52nlp.cn/acl09-acceptance-rates-by-areas' rel='bookmark' title='Permanent Link: ACL09 Full Paper各研究领域的录用情况'>ACL09 Full Paper各研究领域的录用情况</a></li>
<li><a href='http://www.52nlp.cn/liu-qun-article-recommended' rel='bookmark' title='Permanent Link: 推荐刘群老师的《计算所与北大往事回顾》'>推荐刘群老师的《计算所与北大往事回顾》</a></li>
<li><a href='http://www.52nlp.cn/the-advantages-and-disadvantages-of-the-rationalism-and-empiricism-in-nlp' rel='bookmark' title='Permanent Link: 自然语言处理中理性主义与经验主义的优缺点'>自然语言处理中理性主义与经验主义的优缺点</a></li>
<li><a href='http://www.52nlp.cn/natural-language-processing-company-teragram' rel='bookmark' title='Permanent Link: 自然语言处理公司巡礼一：Teragram'>自然语言处理公司巡礼一：Teragram</a></li>
<li><a href='http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part' rel='bookmark' title='Permanent Link: MIT自然语言处理第一讲：简介和概述（第一部分）'>MIT自然语言处理第一讲：简介和概述（第一部分）</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.52nlp.cn/cwb-trial-and-others/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
	</channel>
</rss>
