NLP人军火库,主要收录NLP竞赛策略实现、各任务教程、经验贴、学习资料以及会议时间等,如果对你有帮助,请给我们一个star。
本项目主要包含以下内容:
- NLPer-Arsenal-Code (2021.12)
- NLPer-Arsenal-Post(2021.03)
- 其它
项目正在不断完善,如果您有什么建议,欢迎到issue 留言,或通过问卷 ,邮箱([email protected])联系我们,同时我们也欢迎大家加入我们的项目。
所有内容均由我们从网络公开资料中收集整理得到,版权归原作者所有,如有侵权请立即与我们联系,我们将及时处理。
整理不易,转载时请务必备注本项目github链接,感谢您为维护良好的开源环境出一份力。
- 2021.3:开始更新本项目
- 2021.6:开放notion界面,NLPer-Arsenal-Notion (已暂停更新该页面)
- 2021.12:NLPer-Arsenal-Code 发布
记录当前正在进行的竞赛,奖金丰厚,适合有一定基础的NLPer;结束时间为官网标准时间或会议召开时间。
领域/会议 | 竞赛 | 报名时间 | 结束时间 |
---|---|---|---|
CAIL2022 | 1. 司法考试 2. 事件检测 3. 文书校对 4. 类案检索 5. 涉法舆情摘要 6. 辩论理解 7. 信息抽取 8. 可解释类案匹配 |
2022.8.1-11.15(具体时间请参考各赛事详细要求) | 2022.12 |
文本纠错 | 中文语义病句识别挑战赛 | 2022.7.25-9.10 | 2022.10.24 |
阅读理解 | 基于文心NLP大模型的阅读理解可解释评测 | 2022.8.29-11.4 | 2022.12中 |
NLP2SQL | 基于openGauss的自然语言查询器 | 2022.8.29-12.5 | 2022.12.20 |
知识图谱 | 高端装备制造知识图谱自动化构建技术评测任务 | 2022.8.29-11.4 | 2022.12中 |
信息抽取 | 汽车领域多语种迁移学习挑战赛 对话场景的用户标签提取挑战赛 疫情新闻中的地理位置识别挑战赛 表格解析挑战赛 给定模板识别填写内容挑战赛 |
2022.6.24-7.24 2022.7.8-8.10 2022.7.25-8.25 2022.7.8-8.10 2022.8.4-9.12 |
2022.10.24 2022.10.24 2022.10.24 2022.10.24 2022.10.24 |
中国健康信息处理大会(CHIP2022) | 1. 面向“基因-疾病”的关联语义挖掘任务 2. 医疗因果实体关系抽取任务 3. 从医疗文本中抽取诊疗决策树 4. 医疗纸质文档电子档(ePaper)OCR识别 5. 临床诊断编码任务 |
2022.6-10(具体时间参考对应评测任务) | 2022.10.23 |
问答 | 遗址文化领域知识抽取与问答挑战赛 |
2022.6.9-7.8 | 2022.10.24 |
文本匹配 | “兴智杯”全国人工智能创新应用大赛:深度学习模型可解释性赛 人岗匹配挑战赛 中文对话文本匹配挑战赛 |
2022.8.4-9.26 2022.8.16-9.19 2022.9.15-10.24 |
2022.12中 2022.10.24 2022.10.24 |
CCL2022 | 任务1:第二届中文抽象语义表示解析评测(CAMRP 2022) 任务2:第二届中文空间语义理解评测(SpaCE 2022) 任务3:汉语学习者文本纠错评测(CLTC 2022) 任务4:中文高效自然语言理解模型评测(CELUE) 任务5:跨语言知识迁移——汉语到少数民族语言(CMXT 2022) 任务6:以事件为中心的观点挖掘(ECOM 2022) 任务7:新闻脉络关系检测 任务8:“达观杯”汽车工业故障模式关系抽取评测 任务9:高考语文阅读理解可解释评测 任务10:第五届“讯飞杯”中文机器阅读理解评测(CMRC 2022) 任务11:航旅纵横杯-面向领域问答的知识抽取评测 任务12:第四届“小牛杯”幽默计算——聊天机器人幽默感挑战赛 任务13:基于前提的跨模态推理评测(PMR 2022) 任务14:视频看点抽取 |
2022.6.1-9.25(各任务的具体截止时间请参考对应的链接) | 2022.9.31 |
文本分类 | 非标准化疾病诉求的简单分诊挑战赛2.0 机器翻译质量评估挑战赛 基于论文摘要的文本分类与查询性问答 疫情微博情绪识别挑战赛 应用类型识别挑战赛 医疗搜索意图识别挑战赛 小样本数据分类任务 基于人工智能的漏洞数据分类 Feedback Prize - English Language Learning |
2022.6.9-7.9 2022.6.24-7.24 2022.7.1-8.1 2022.6.24-7.23 2022.7.25-9.10 2022.8.26-9.26 2022.8.29-11.4 2022.8.20-10.10 2022.8.30-11.22 |
2022.10.24 2022.10.24 2022.10.24 2022.10.24 2022.10.24 2022.10.24 2022.12中 2022.11 2022.11.29 |
NLPCC2022 | 官网:http://tcci.ccf.org.cn/conference/2022/cfpt.php 任务1:基于知识模型的智能问答 任务2:语音实体链接 任务3:多模态产品摘要 任务4:基于视频的对话生成 任务5:科技文献分类与信息抽取 任务6:对话文本分析 任务7:对话偏见测量 |
2022.3.15~5.5 | 2022.9.22~9.23 |
机器翻译 | 低资源多语种文本翻译挑战赛 领域迁移机器翻译挑战赛2.0 “一带一路”重点语种-法俄泰阿与中文互译 |
2022.6.17-7.17 2022.6.9-7.9 2022.8.10-9.30 |
2022.10.24 2022.10.24 2022.11 |
中文医疗信息处理挑战榜CBLUE | 目前任务包括医学文本信息抽取(实体识别、关系抽取)、医学术语归一化、医学文本分类、医学句子关系判定和医学QA共5大类任务8个子任务,-> 官网 | 现在 | 暂无 |
记录长期进行的训练赛,有排行榜,方便刚入门的NLPer练手
这里记录整理好的竞赛,包含数据下载以及竞赛方案
学界、业界、理论、实践以及时事动态,NLPer都应该有所了解
平台 | 主要领域 | 自媒体 |
---|---|---|
微信公众号 | 技术 | Coggle数据科学、DataFunTalk |
行业信息 | 机器之心、机器之能、AI报道、AI前线、AI科技评论、机器学习研究组订阅 | |
理论 | 科学空间、PaperWeekly、智源社区、人工智能前沿讲习、专知、AINLP、AI TIME 论道、夕小瑶的卖萌屋、机器学习算法与自然语言处理 | |
BiliBili | 前沿论坛 | 智源社区、AITIME论道 |
网站 | 竞赛 | Coggle数据科学 |
学术 | Paper With Code 、AMiner学术头条 、科学空间 |
warning: 请仔细评估第三方平台信誉,警惕代码、数据等重要信息泄露
平台 | 算力 | 价格 | 说明 |
---|---|---|---|
BitaHub | 1080Ti、titan xp、3090、V100 | 1080Ti(¥0.7/h)、titan xp(¥1/h)、3090(¥2.5/h)、V100(¥4.5/h) | 中科大先研院的平台,价格实惠,但一块GPU只搭配2核CPU,通过提交任务,按运行时间收取费用 |
featurize | 2080Ti、3090 | 2080Ti(¥2/h)、3090(¥3.6/h) | 镜像环境,使用灵活,可以通过jupyter_lab、vscode、pycharm远程连接 |
AutoDL | rtx a5000、3090、A100 | ¥0.6/h~¥8.5/h | 单机ssh连接,存储空间不大,不过很便宜 |
智星云 | 1080Ti、3080、3090、V/A100等 | ¥2.1/h~¥11/h | 整机,可远程连接(pycharm/vs code) |
沣云平台 | ML270 | ¥2.8/h | 一站式AI计算平台,CPU可以增量配置,按运行时间收取费用 |
恒源云 | 2080Ti、3060、3090、V100等 | ¥1.25/h~¥5.5/h | 可以搭配完整的CPU和硬盘,相比bithub有更高的自由度,目前处于推广期,有很多优惠 |
并行云 | V100、2080Ti、P100等 | 不明 | 计算节点来自超算,可个性化定制CPU核数、GPU、存储空间,有非常简便的操作界面,并且提供远程linux桌面,灵活度优于以上三个平台。目前处于推广期,有很多优惠 |
AI Studio | V100 | 基本免费 | 由百度开发, 偶尔申请不到V100,最高可免费8卡。主要使用飞桨PaddlePaddle框架,其它框架需自行折腾,也可用X2Paddle一键转为飞桨的代码和模型,大部分比赛参与即送算力卡。 |
天池DSW | p100 | 免费,单次限时8小时,不限次数 | 阿里的一个在线平台,运行时不能关闭 |
天池实验室 | V100 | 免费,60h/年 | 相比于AI Studio不限制深度学习框架,就是时间比较短 |
Kaggle | k80 | 免费,每周限时30小时 | 外网访问 |
Google Colab | k80、T4、P4、P100 | 免费,单次限时12小时 | 外网访问,无法指定具体GPU,未订阅Colab Pro用户多数时间下估计会被分配k80 |
- 阿里天池 :阿里,奖金丰厚
- AI Studio :百度AI Studio深度学习社区,成绩优异可获得飞桨开发者技术专家(PPDE) 认证申请绿色通道。
- 讯飞开发平台 :科大讯飞
- DataFountain : CCF指定专业大数据及人工智能竞赛平台,有很多训练赛
- 图灵联邦 :NLP竞赛不多
- biendata : 国内领先的人工智能竞赛平台,包含大量NLP学术评测
- FlyAI-AI竞赛服务平台 :难度分为新手、简单、中等、精英、困难,有大量GPU算力可供获取,奖金不多,但适合练手
- 和鲸社区 :一个综合的学习平台
- ACL、EMNLP、NLPCC、CCL、CCKS、SMP等会议每年都会举办相关学术评测
- Codalab :一个可重复计算平台,很多国外的竞赛都会在上面提交代码用于检验
- DCLab :和天池比较像
- AI研习社 :很多很多NLP竞赛
中国计算机学会推荐国际学术会议和期刊目录-2019
中国计算机学会推荐中文科技期刊目录
dblp:计算机科学文献库
AI会议deadline :会议倒计时
会议时间记录表 :Updated by Jackie Tseng, Tsinghua Computer Vision and Intelligent Learning Lab
note:以下时间为官网默认时间,暂未换算成北京时间
会议 | 级别 | 摘要截稿 | 原文截稿 | 审稿通知 | 开会时间 | 说明 |
---|---|---|---|---|---|---|
ICLR(官网、dblp) | * | 2022.9.21 | 2022.9.28 | 2022.11.4(review)、2023.1.20(final) | 2023.5.1-5.3 | Kigali Rwanda |
ACL(官网、dblp) | CCF-A | ? | ? | ? | ? | Toronto |
NeurIPS(官网、dblp) | CCF-A | 2022.11.28~12.9 | New Orleans(first week), online(second week) | |||
ICML(官网、dblp) | CCF-A | Baltimore, Maryland USA | ||||
SIGIR(官网、dblp) | CCF-A | 2022.1.21(long paper) |
2022.1.28(long paper) |
2022.3.31(long paper) |
Madrid, Spain | |
WWW(官网、dblp) | CCF-A | 2022.10.6 | 2022.10.13 | 2022.12.15-22(rebuttal) 2023.1.25(final) |
2023.4.30-5.4 | AUSTIN, TEXAS, USA |
AAAI(官网、dblp) | CCF-A | 2022.9.27-11.18 | 2023.2.7~2.14 | Washington | ||
IJCAI(官网、dblp) | CCF-A | ? | ? | ? | 2023.8 | Cape Town, South Africa |
EMNLP(官网、dblp) | CCF-B | 2022.8.23~8.29(rebuttal)、2022.10.6 | 2022.12.7~12.11 | Abu Dhabi | ||
NAACL(官网、dblp) | CCF-C | Seattle, Washington | ||||
COLING(官网、dblp) | CCF-B | * | 2022.10.12~10.17 | Gyeongju, Korea | ||
CoNLL(官网、dblp) | CCF-C | * | 2022.12.7~12.8 | same as emnlp、online | ||
NLPCC(官网、dblp) | CCF-C | * | 2022.9.22~9.25 | 桂林 | ||
ICONIP(官网) | CCF-C | * | 2022.11.22~11.26 | New Delhi, India | ||
ACML(官网) | CCF-C | * | 2022.5.26(期刊) |
2022.8.11-8.18(rebuttal)、9.8 (final); 2022.7.7(初审)、9.8(final) |
2022.12.14~12.16 | Hyderabad, India (with online) |
AACL(官网) | * | * | 2022.8.15~21(rebuttal) 2022.9.20 (final) |
2022.11.21~11.24 | 台北 | |
EACL(官网、dblp) | * | ? | ? | ? | ? | Kiev, Ukraine、online |
CCL(官网、dblp) | * | * | 2022.7.1(ARR投稿) |
2022.10.14~10.16 | 南昌 | |
CCKS(官网、dblp) | * | * | 秦皇岛 | |||
SMP(官网、dblp) | * | * | 北京 | |||
CCIR(官网) | * | * | 2022.9.16~9.18 | 重庆 | ||
CCMT(官网) | * | * | 西藏拉萨 |