Starred repositories
Pre-trained Chinese ELECTRA(中文ELECTRA预训练模型)
Facebook AI Research Sequence-to-Sequence Toolkit written in Python.
一键中文数据增强包 ; NLP数据增强、bert数据增强、EDA:pip install nlpcda
Google AI 2018 BERT pytorch implementation
今日头条中文新闻(文本)分类数据集
使用Bert,ERNIE,进行中文文本分类
State of the Art Natural Language Processing
🍟 a notebook sql client. what you get when have a lot of sequels.
中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
今日头条中文新闻文本(多层)分类数据集
中文命名实体识别(包括多种模型:HMM,CRF,BiLSTM,BiLSTM+CRF的具体实现)
中文命名实体识别,实体抽取,tensorflow,pytorch,BiLSTM+CRF
An Open-source Neural Hierarchical Multi-label Text Classification Toolkit
Algorithm Engineer Toolbox, for the purpose of quickly iterating new ideas
A curated list of awesome awesomeness
Interview = 简历指南 + 算法题 + 八股文 + 源码分析