Stars
All Algorithms implemented in Python
Unified Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
中文文本分类,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer,基于pytorch,开箱即用。
【PyTorch】Easy-to-use,Modular and Extendible package of deep-learning based CTR models.
torch-optimizer -- collection of optimizers for Pytorch
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embedding),文本分类(Text classification), 实体提取(ner,bert+bilstm+crf),数据增强(text augment, data enhance),同义句同义词生成,句子…
Several simple examples for popular neural network toolkits calling custom CUDA operators.
Panda项目是于2023年5月启动的开源海外中文大语言模型项目,致力于大模型时代探索整个技术栈,旨在推动中文自然语言处理领域的创新和合作。
Facilitating the design, comparison and sharing of deep text matching models.
文本匹配的相关模型DSSM,ESIM,ABCNN,BIMPM等,数据集为LCQMC官方数据
dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识问答,任务引导问答,闲聊问答,开箱即用。
NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE
bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示
MNBVC General Cleaning Script for the Q&A Dataset of Foreign Ministry Journalists