Stars
An opinionated list of awesome Python frameworks, libraries, software and resources.
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Tensors and Dynamic neural networks in Python with strong GPU acceleration
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and…
A Gradio web UI for Large Language Models with support for multiple inference backends.
AiLearning:数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2
TensorFlow code and pre-trained models for BERT
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
Interactive deep learning book with multi-framework code, math, and discussions. Adopted at 500 universities from 70 countries including Stanford, MIT, Harvard, and Cambridge.
Graph Neural Network Library for PyTorch
ChatGLM2-6B: An Open Bilingual Chat LLM | 开源双语对话语言模型
Python package built to ease deep learning on graph, on top of existing DL frameworks.
100+ Chinese Word Vectors 上百种预训练中文词向量
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
bottle.py is a fast and simple micro-framework for python web-applications.
中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)
总结梳理自然语言处理工程师(NLP)需要积累的各方面知识,包括面试题,各种基础知识,工程能力等等,提升核心竞争力
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
keras implement of transformers for humans
CNN-RNN中文文本分类,基于TensorFlow
使用Bert,ERNIE,进行中文文本分类
Implementation and experiments of graph embedding algorithms.
Classic papers and resources on recommendation
Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。