Skip to content

zl172463468/chatglm-6b-fine-tuning

 
 

Repository files navigation

作者也是小白,从零开始部署,微调,连python都不会的人,都是现学的,大佬别见笑。

查看此文档,你将学到什么?

  • 1 如何部署运行chatglm-6b
  • 2 如何使用LORA微调chatGLM-6B模型,单卡,多卡均可。

在此感谢

https://github.com/THUDM/ChatGLM-6B/issues/200
https://github.com/yuanzhoulvpi2017/zero_nlp/

更新说明


  • 2023-04-08 修改生成测试json逻辑,完成改名操作,如下图所示 rename.png rename2.png

如何部署运行chatglm-6b?

  • 1、git clone https://huggingface.co/THUDM/chatglm-6b.git
  • 2、安装依赖
    pip3 install protobuf==3.20.0 transformers==4.26.1 icetk cpm_kernels
    
  • 3、修改 chat_interact.py 中的 PRE_TRAINED_MODEL_PATH='上面克隆的chatglm-6b文件夹路径'
  • 4、运行代码 python3 chat_interact.py
  • 5、生成效果如下: 回答问题
    • 1.png 做数学题
    • 2.png 写标书提纲
    • 3.png 时政解答
    • 4.png 翻译
    • 5.png
    • 另外还有许多功能,比如:
      • 自我认知
      • 提纲写作
      • 文案写作
      • 邮件写作助手
      • 信息抽取
      • 角色扮演
      • 评论比较
      • 旅游向导

如何使用LORA微调chatglm-6b,单卡、多卡训练

  • 1 准备数据集,我改造了作者原来的csv数据集,换成了alpaca json格式
  • 2 运行start_train.sh 训练代码,这是单卡训练
  • train.png
  • 3 多卡训练,至少2张,测试使用2张、4张均可,理论上支持任意张卡。
  • multi_gpu_train.png

文件结构说明

  • chat_interact.py 交互式对话,命令行下运行,一般用于测试机器人对话。
  • chat_server.py 连接数据库,根据数据表对话内容,排队进行回答,并将生成内容回写到表,它依赖我写的数据库连接组件,另外还有一个http服务接收前端请求。
  • start_chat_server.sh 启动chat_server.py
  • data 训练数据集
  • fine-tuning 单GPU训练代码目录
    • model 预训练的模型文件存储目录,这里面不包含.bin文件,需要将bin复制进来,当然这个目录你也可以放到其它任意位置。
      训练需要安装如下依赖
      pip3 install datasets
      pip3 install peft
      
  • start_train.sh 单卡训练shell
  • parallel multi gpu fine tuning 目录
  • preprocess 生成测试数据代码
    请使用transformers==4.27.1 

环境说明

  • 系统版本:CentOS Linux release 7.9.2009 (Core)
  • 内核版本:3.10.0-1160.el7.x86_64
  • python 版本:3.7.16
  • NVIDIA驱动版本: 515.65.01
  • CUDA 版本:11.7
  • cuDNN 版本:v8.8.0
  • GPU:P40 24gb * 8

About

chatglm-6b-fine-tuning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.8%
  • Shell 0.2%