作者归档:cmtsalon

第十二次沙龙活动(特邀董振东老师做讲座)报名

题目: 知网及其应用
主讲人:董振东老师
时间:2011年12月11日(周日)下午14:00-17:00
地点:海淀区五道口清华科技园

报名截止日期:12月8日(周四)

报名者请使用以下格式,回复到邮箱cmt.salon@gmail.com

姓名:
手机:
基本情况介绍:

中文翻译技术沙龙的豆瓣小组是 http://www.douban.com/group/304684/。

中文翻译技术沙龙的QQ群:
NLP:172478666
CAT:172478453

中文翻译技术沙龙第十一次活动(特邀董振东老师做讲座)报名

题目: 人本机器翻译
主讲人:董振东老师
时间:2011年11月6日(周日)下午14:00-17:00
地点:海淀区五道口清华科技园

大致会包括如下内容:

1. 动机
2. 人本机器翻译的特点--
a. 人机协同 -- 以人为本
b. 知识管理与利用
c. 领域、题材、体裁的专业化
d. 基于内网与外网结合
3. 它与全自动机译,以及机助人译的区别
4. 人本机译系统的构成
5. 人本机译的用户群(内部用户与一般用户)、市场的培育、拓展
6. 机译系统开发与机译研究的关系

报名截止日期:11月4日(周五)

报名者请使用以下格式,回复到邮箱cmt.salon@gmail.com

姓名:
手机:
基本情况介绍:

中文翻译技术沙龙的豆瓣小组是 http://www.douban.com/group/304684/。

中文翻译技术沙龙的QQ群:
NLP:172478666
CAT:172478453

中文翻译技术沙龙第十次活动报名

时间:2011年10月15日(周六)下午14:00-17:00
地点:五道口清华科技园
费用:无

题目1: 开源输入法SunPinyin解读
主讲人:NUANCE公司何楠

题目2: 第13届国际机器翻译峰会(13th MT Summit)和第7届全国机器翻译研讨会(CWMT2011)的分享会
主讲人:部分参会人员,具体名单待定

报名截止日期:10月13日(周四)

报名者请使用以下格式,回复到邮箱cmt.salon@gmail.com

姓名:
手机:
基本情况介绍:

中文翻译技术沙龙的豆瓣小组是 http://www.douban.com/group/304684/。

中文翻译技术沙龙的QQ群:
NLP:172478666
CAT:172478453

中文翻译技术沙龙第九次活动

一、沙龙主题:统计语言模型的方法和应用
二、沙龙时间:2011年9月4日(周日)下午2-5点
三、沙龙地点:清华科技园
四、沙龙主持人:胡日勒博士

本次沙龙拟尝试读书会的形式。报名的同时,请告知您打算在沙龙上介绍的与本次活动主题相关的论文。该论文可以是您自己的,也可以是科研中接触到的高水平论文,或者是附件中的论文。如果选择附件的论文,请尽量选择其他人未选择的论文。关于已选择的论文情况,我们会每日在www.52nlp.cn更新。

报名截止日期:9月1日(周四)
报名请回复邮箱cmt.salon@gmail.com
中文翻译技术沙龙的豆瓣小组是http://www.douban.com/group/304684/。
中文翻译技术沙龙的QQ群:80266425(满);172478666(NLP);172478453(CAT)

附件:
1) S. F. Chen and J. Goodman, “An empirical study of smoothing techniques for language modeling”, Technical Report TR-10-98, Computer Science Group, Harvard University, Aug. 1998.
2)A. Stolcke, “Entropy-based pruning of backoff language models”, in Proceedings DARPA Broadcast News Transcription and Understanding Workshop, pp. 270–274, Lansdowne, VA, Feb. 1998. Morgan Kaufmann.
3)P. F. Brown, V. J. Della Pietra, P. V. deSouza, J. C. Lai, and R. L. Mercer, “Class-based n-gram models of natural language”, Computational Linguistics, vol. 18, pp. 467–479, 1992.
4)Kuhn R, De Mori R. A cache-based natural language model for speech reproduction. IEEE PAMI,1990 12(6), page:570-583
5)Kuhn R, De Mori R. Corrections to A cache-based natural language model for speech reproduction. IEEE PAMI,1992 14, page:691-692
6)Goodman J. A bit of progress in language modeling. In Computer Speech and Language, 2001, 15(4), pages: 403-434
7)R. Rosenfeld, “Two decades of statistical language modeling: Where do we go from here?”, Proceedings of the IEEE, vol. 88, 2000.
8)R. Rosenfeld, A Maximum Entropy Approach to adaptive statistical language modeling, Computer Speech and Language 1996, 10, pages: 187-228
9)Bengio Y, Ducharme R, Vincent P, Jauvin C. A Neural Probabilistic Language Model, In Journal of Machine Learing Research, 2003(3), pages: 1137-1155.
10)Xu P, Chelba C, Jelinek F. A Study on Richer Syntactic Dependencies for Structured Language Modeling, ACL2002.
11)Chelba C, Jelinek F. Structured Language Modeling, Computer Speech and Language 2000, 14(4),pages: 283-332.
12)Gao J F, Lin C Y. Introduction to the Special Issue on Statistical Language Modeling. ACM transactions on Asian language information processing, 2004, Vol 3, No.2 pages: 87-93
13)Berger A L, Della Pietra S A, Della Pietra V J. A Maximum Entropy Approach to Natural Language Processing. Computational Linguistics. 1996, 22(1), pages : 1-36
14)Clarkson P R, Robinson A J. Language model adaptation using mixtures and Exponentially. Decaying cache. ICASSP, 1997, vol 2 pages: 799-802
15)Kneser R, Steinbiss V. On the Dynamic Adaptation for Stochastic Language Models. ICASSP 1993.
16)Kneser R, Ney H. Improved Backing-off for ngram language modeling. ICASSP 1995, Vol 1,pages:181-184
17)Khudanpur S, Wu J. A Maximum Entropy Language Model Integrating N-Gram and Topic Dependency of Conversational Speech Recognition, In ICASSP 1999, Pages: 553-556
18)Gildea D, Hofmann T. Topic-Based Language Model Using EM. In Eurospeech 1999, pages 2167-2170.
19)Brants Thorsten, Popat Ashok. 2007. Large Language Models in Machine
Translation. In Proceedings of the 2007 Joint Conference on Empirical Methods in
Natural Language Processing and Computational Natural Language Learning:
858-867.
20)Deyi Xiong, Min Zhang, & Haizhou Li: Enhancing language models in statistical machine translation with backward n-grams and mutual information triggers. ACL-HLT 2011: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, Portland, Oregon, June 19-24, 2011; pp.1288-1297. [PDF, 620KB]

21)(已选)Adam Pauls & Dan Klein: Faster and smaller n-gram language models. ACL-HLT 2011: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, Portland, Oregon, June 19-24, 2011; pp.258-267. [PDF, 246KB]

22)(已选)Robert C.Moore & William Lewis: Intelligent selection of language model training data. ACL 2010: the 48th Annual Meeting of the Association for Computational Linguistics, Uppsala, Sweden, July 11-16, 2010: Proceedings of the Conference Short Papers; pp.220-224. [PDF, 176KB]

中文翻译技术沙龙第八次活动

一、沙龙主题:语料库的建设和应用
二、沙龙时间:2011年7月31日(周日)下午2-5点
三、沙龙地点:清华科技园
四、沙龙嘉宾:北京大学常宝宝老师

报名截止日期:7月29日(周五)

报名请回复邮箱cmt.salon@gmail.com

中文翻译技术沙龙的豆瓣小组是http://www.douban.com/group/304684/。

中文翻译技术沙龙的QQ群:80266425

中文翻译技术沙龙第七次活动

一、沙龙主题:在线词典和电子词典的现状及发展
二、沙龙时间:2011年6月19日(周日)下午2-5点
三、沙龙地点:有道会议室(五道口清华科技园)
四、沙龙拟邀嘉宾:有道词典:http://dict.youdao.com/ Nciku:http://www.nciku.com/句酷:http://www.jukuu.com/金山词霸:http://www.iciba.com/

欢迎外语爱好者,翻译,电子词典开发者,机器翻译爱好者,及其他感兴趣的朋友参加。

报名截止日期:6月17日(周五)

报名请回复邮箱cmt.salon@gmail.com

中文翻译技术沙龙的豆瓣小组是http://www.douban.com/group/304684/

中文翻译技术沙龙的QQ群:80266425

 

 

中文机器翻译沙龙第六次活动报名

本次活动由北大翻译协会与中文机器翻译沙龙联合举办。地址在北京大学理科楼,活动主题为计算机辅助翻译工具的评测, 欢迎对机器翻译、计算机辅助翻译感兴趣的人员报名,也欢迎专家、资深人士预约发言。

时间:2011年4月23日(周六)下午14:00-17:00

报名截止日期:4月21日(周四)

地点:北京大学理科楼

费用:无

主讲人:北京大学外国语学院翻译硕士教育中心 王华树

题目: 计算机辅助翻译工具的评测

报名请回复邮箱cmt.salon@gmail.com

北京大学语言信息工程系:www.pkucat.com

北大译坛:http://bbs.pkucat.com/

中文机器翻译的豆瓣小组是http://www.douban.com/group/304684/

中文机器翻译沙龙第五次活动小结

本次沙龙活动于3月27在清华科技园的泰为公司会议室举行。共有二十四人参加,包括来自泰为、百度、金山、高德、老虎宝典、索爱、Novell、ifeng等公司的人士,以及来自清华、中科院计算所、自动化所、北师大等高校的研究生。另外还有来自东北师大的研究生参加,这是首次有外地的沙龙参与者。

首先由国家知识产权局的王进先生介绍了他在机器翻译领域的研究成果----原型系统和句法分析。王进先生首先介绍了范畴语法,然后基于范畴语法的扩展建立了原型系统。他提出“突破句法范畴,定义语义范畴体系”以及“突破语言结构,定义范畴跳转规则”。然后给出了句法分析的例子,并演示了其构建的翻译系统。王进先生随后就大家感兴趣的问题与大家进行了交流。非常遗憾的是,限于时间关系,未能与王先生展开深入讨论。

然后来自中国科技技术信息研究所的宋培彦博士介绍了HNC(概念层次网络)的理论。我国中文信息处理的三大流派之一的HNC理论,是由中科院声学所的黄曾阳先生所提出的。“虽然世界上有6000多种语言,但概念空间基本稳定,而且互通,这是翻译的基础。” “HNC是对大脑的语言功能进行模拟。”HNC又具体到概念基元空间(HNC1):词汇及语义网络;句类空间(HNC2):句子;语境单元空间(HNC3):句群;语境空间(HNC4):篇章。HNC正在进行的天翼计划——机器翻译,“先理解,后翻译”,不要统计意义上的“硬译”,不要语法形式上的符号转换,直面理解。这些无疑对目前机器翻译的研究具有参考意义。宋博士的介绍深入浅出,使得大多数未接触过HNC的沙龙成员对其有了大概的认知。随后宋博士介绍了其在回指模糊消解方面所做的研究。随后大家就HNC目前的研究和发展状况进行了讨论,宋博士提出了HNC应该走向“通俗化”、“实例化”、“国际化”。