Skip to content

Commit

Permalink
Update README.md
Browse files Browse the repository at this point in the history
  • Loading branch information
tjadamlee authored Apr 19, 2023
1 parent a26df20 commit 5eb560d
Showing 1 changed file with 2 additions and 2 deletions.
4 changes: 2 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -28,12 +28,12 @@
</br>

## 🔄 最近更新
* [2023/04/19] 开放了其中一篇论文中的的相关模型:包括在LLaMA7B基础上增量预训练扩展中文词表的模(详见[BelleGroup/BELLE-LLaMA-EXT-7B](https://huggingface.co/BelleGroup/BELLE-LLaMA-EXT-7B)),以及基于多样化开源数据训练后的LLaMA-7B模型(详见[BelleGroup/BELLE-on-Open-Datasets](https://huggingface.co/BelleGroup/BELLE-on-Open-Datasets))。
* [2023/04/18] 更新了train代码,详见[BELLE/train](https://github.com/LianjiaTech/BELLE/tree/main/train),集成了Deepspeed-Chat,提供了相关的docker
* [2023/04/17] 更新了[两篇最新论文工作](#📑-研究报告),对比了不同方式产生的训练数据、不同训练方法(LoRA, finetune)对效果的影响
* [2023/04/18] 更新了[两篇最新论文工作](#📑-研究报告),对比了不同方式产生的训练数据、不同训练方法(LoRA, finetune)对效果的影响
* [2023/04/12] 发布了[ChatBELLE App](chat/README.md),基于[llama.cpp](https://github.com/ggerganov/llama.cpp)[Flutter](https://flutter.dev/),实现跨平台的BELLE-7B离线模型实时交互。
* [2023/04/11] 更新了一个人工精校的eval集合,大约一千多条
* [2023/04/08] [BELLE/10M](https://github.com/LianjiaTech/BELLE/tree/main/10M)中,新加40万条生成的给定角色的多轮对话[Generated Chat](https://huggingface.co/datasets/BelleGroup/generated_chat_0.4M),新加200万条生成多样化指令任务数据[train_2M_CN](https://huggingface.co/datasets/BelleGroup/train_2M_CN)
* [2023/04/05] 提供了colab上面可运行的推理代码(默认加载4Bit量化的BELLE模型,模型效果会有所损失)[Colab](https://colab.research.google.com/github/LianjiaTech/BELLE/blob/main/models/notebook/BELLE_INFER_COLAB.ipynb)

</br>

Expand Down

0 comments on commit 5eb560d

Please sign in to comment.