AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总

作者52nlp

11 月 30, 2018 AI Challenger, AI Challenger 2018, AI Challenger Baseline, AI Challenger Code, AI Challenger 代码, AI Challenger 竞赛, AI Challenger 解决方案, NMT, 人工智能竞赛, 情感分析, 情感分析代码, 文本挖掘, 文本挖掘竞赛, 机器翻译, 机器翻译代码, 深度学习, 深度学习情感分析, 深度学习机器翻译, 深度学习阅读理解, 神经网络机器翻译, 神经网络翻译, 细粒度情感分析, 观点型阅读理解, 阅读理解, 阅读理解代码

AI Challenger 2018 已近尾声，各赛道top选手已经结束了代码核验，正在准备12月18、19日 AI Challenger 决赛答辩材料的路上。在本年度 AI Challenger 即将尘埃落定之时，这里整理一批目前网上可见的文本挖掘相关赛道的解决方案和代码，欢迎补充，同时感谢github，感谢各位开源的同学。

细粒度用户评论情感分析

在线评论的细粒度情感分析对于深刻理解商家和用户、挖掘用户情感等方面有至关重要的价值，并且在互联网行业有极其广泛的应用，主要用于个性化推荐、智能搜索、产品反馈、业务安全等。本次比赛我们提供了一个高质量的海量数据集，共包含6大类20个细粒度要素的情感倾向。参赛人员需根据标注的细粒度要素的情感倾向建立算法，对用户评论进行情感挖掘，组委将通过计算参赛者提交预测值和场景真实值之间的误差确定预测正确率，评估所提交的预测算法。

貌似是最火爆的一个赛道，Testa 提交队伍有468支，详细介绍请参考该赛道主页：https://challenger.ai/competition/fsauor2018

相关代码或解决方案：

TOP1. 冠军解决方案：
1） AI Challenger 2018 冠军 PPT 分享---细粒度情感分析赛道
2）代码：https://github.com/chenghuige/wenzheng/tree/master/projects/ai2018/sentiment
阁子大神补充：开源了所有代码但是我最近没有时间整理流程估计复现会有困难仅供参考；我这个比较乱如果看的话参考一下 algos tf模型 torch-algos pyt模型就可以了 fast elmo参考 torch-lm-train.py 我这边都是先生成tfrecord 那部分代码在prepare 需要先转简体再分好词整体复现比较麻烦；python path需要设置下载路径utils 这样能找到下面的melt等路径

TOP2. 亚军解决方案：
AI Challenger2018情感分析赛道亚军PPT分享

TOP4. 决赛第4名解决方案：
AI Challenger 2018 第4名PPT分享---细粒度情感分析赛道

1. 官方baseline，基于SVM: sentiment_analysis2018_baseline
https://github.com/AIChallenger/AI_Challenger_2018/tree/master/Baselines/sentiment_analysis2018_baseline

2. 基于fastText的baseline: AI Challenger 2018 Sentiment Analysis Baseline with fastText
2.1 https://github.com/panyang/fastText-for-AI-Challenger-Sentiment-Analysis
2.2 文章：AI Challenger 2018 细粒度用户评论情感分析 fastText Baseline

3. 基于 SVM 的细粒度情感分析: https://github.com/scruel/sentiment_analysis

4. 第16名解决方案: https://github.com/xueyouluo/fsauor2018

5. 第17名解决方案：https://github.com/BigHeartC/Al_challenger_2018_sentiment_analysis

6. 基于Bert的尝试：https://github.com/brightmart/sentiment_analysis_fine_grain

7. ai challenger Competitions 1: Fine-grained Sentiment Analysis of User Reviews：
https://github.com/ShawnXiha/Fine-grained-Sentiment-Analysis-of-User-Reviews

8. 细粒度用户评论情感分析 (0.70201)：https://github.com/pengshuang/AI-Comp
8.1 相关文章1：https://zhuanlan.zhihu.com/p/47207009
8.2 相关文章2：https://zhuanlan.zhihu.com/p/47278559

9. AI Challenger 细粒度用户评论情感分析线上0.62: https://zhuanlan.zhihu.com/p/44857751

观点型问题阅读理解

机器阅读理解涉及信息检索、文本匹配、语言理解、语义推理等不同层次的技术，对于复杂问题的处理甚至需要结合世界知识与常识知识，极具挑战。为了进一步推动机器阅读理解领域的技术发展，为研究者提供学术交流和模型评测的基准，本次竞赛将重点针对阅读理解中较为复杂的，需要利用整篇文章中多个句子的信息进行综合才能得到正确答案的观点型问题开展评测。本次竞赛将利用准确率进行评分，作为主要评价指标。组委会将通过客观指标，并结合答辩表现，综合评估参赛者的算法模型。

更多信息请参考官方主页：https://challenger.ai/competition/oqmrc2018

相关代码或解决方案：

1. 官方baseline: 基于pytorch实现论文《Multiway Attention Networks for Modeling Sentence Pairs》
opinion_questions_machine_reading_comprehension2018_baseline
https://github.com/AIChallenger/AI_Challenger_2018/tree/master/Baselines/opinion_questions_machine_reading_comprehension2018_baseline

2. 将baseline迁移到了python 3.6.6，修正了错误，改变参数最高accuracy为 0.70370：
https://github.com/dreamnotover/oqmrc2018

3. 第18名解决方案：https://github.com/PanXiebit/aic_rc

4. Testa 得分 73.2: https://github.com/antdlx/aic18_rc

5. ai challenger 2018 's final code: https://github.com/NoneWait/ai_challenge_2018_mrc

6. 基于capsule的观点型阅读理解模型: https://github.com/freefuiiismyname/capsule-mrc

7. AI Challenger 2018 阅读理解赛道代码分享：https://github.com/renjunxiang/oqmrc_2018

8. 奇点机智分享的可以在Testa上超越第一的BERT方案：BERT fine-tune 终极实践教程

9. RCZoo: 从Testa棒的第22名到Testb棒的第2名，作者用“RCZoo@https://github.com/lixinsu/RCZoo” 作为战队名打榜，不过RCZoo更像是一个通用的深度学习阅读理解、问答系统解决方案和工具箱，至于在该项赛事中的细节需要作者来揭晓：
Question answering, reading comprehension toolkit：https://github.com/lixinsu/RCZoo

10. AI Challenger 2018 观点型问题阅读理解复赛第8名解决方案 (8th place of AI Challenger 2018 MRC)
https://github.com/yuhaitao1994/AIchallenger2018_MachineReadingComprehension

11. 阁子大神的A棒21名解决方案：
https://github.com/chenghuige/wenzheng/tree/master/projects/ai2018/reader

英中文本机器翻译

英中机器文本翻译作为此次比赛的任务之一，目标是评测各个团队机器翻译的能力。本次机器翻译语言方向为英文到中文。测试文本为口语领域数据。参赛队伍需要根据评测方提供的数据训练机器翻译系统，可以自由的选择机器翻译技术。例如，基于规则的翻译技术、统计机器翻译及神经网络机器翻译等。本次竞赛将利用机器翻译的客观考核指标（BLEU、NIST score、TER）进行评分，BLEU得分会作为主要的机器评价指标。组委会将通过客观指标，并结合答辩表现，综合评估参赛者的算法模型。

更多请参考该赛道主页：https://challenger.ai/competition/ect2018

作者 52nlp

自然语言处理

《AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总》有9条评论

点儿点儿说道：

2018年12月17号 09:59

请问博主知道细粒度情感分析最终的前几名使用的模型和方法吗？

[回复]
52nlp 回复:
17 12 月, 2018 at 15:41
明天决赛答辩，我大概会在现场看一下

[回复]
52nlp 回复:
20 12 月, 2018 at 22:43
可以关注我们的公众号: AINLP，分享了第一名同学的PPT： https://mp.weixin.qq.com/s/W0PhbE8149nD3Venmy33tw

[回复]
杨阳说道：

2019年04月19号 17:43

有do something团队的源码嘛，想学习一下。网上一直找不到。可以的话邮箱共享一份，谢谢博主大大了

[回复]
52nlp 回复:
19 4 月, 2019 at 18:34
抱歉，没有

[回复]
薛颖斌说道：

2019年04月24号 09:43

您好我想问下大神做的基于 SVM 的细粒度情感分析处理后的数据有吗？能发给我一份吗?

[回复]
52nlp 回复:
24 4 月, 2019 at 10:27
印象SVM是官方给得baseline，我跑了之后效果不好就删了

[回复]
Afterain说道：

2019年09月17号 10:58

请问哪里还可以下AI Challenger 18细粒度情感分析的数据集吗？官网不能下了。

[回复]
52nlp 回复:
17 9 月, 2019 at 15:26
https://github.com/tinySean/Fine-grained-user-commenting-emotions

[回复]

AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总

作者52nlp

作者 52nlp

相关文章

新浪张俊林：大语言模型的涌现能力——现象与解释

中科院张家俊：ChatGPT中的提示与指令学习

“国产类 ChatGPT ”所存在的差距与挑战-专家圆桌

《AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总》有9条评论

发表回复

You missed

新浪张俊林：大语言模型的涌现能力——现象与解释

中科院张家俊：ChatGPT中的提示与指令学习

“国产类 ChatGPT ”所存在的差距与挑战-专家圆桌

探索大语言模型垂直化训练技术和应用-陈运文

作者52nlp

相关文章：

作者 52nlp

相关文章

《AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总》有9条评论

发表回复

You missed