Skip to content

Commit

Permalink
Merge pull request LianjiaTech#220 from LianjiaTech/update-readme
Browse files Browse the repository at this point in the history
Update README.md
  • Loading branch information
tjadamlee authored Apr 19, 2023
2 parents c8cd22f + aab8958 commit b22e2ea
Showing 1 changed file with 3 additions and 1 deletion.
4 changes: 3 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -17,7 +17,9 @@

</div>

本项目目标是促进中文对话大模型开源社区的发展,愿景做能帮到每一个人的LLM Engine。本项目不会做大语言模型的预训练,会重点关注在开源预训练大语言模型的基础上,如何帮助每一个人都能够得到一个尽可能效果好的具有指令表现能力的语言模型,降低大家研究此方面工作的门槛,其中重点在中文大语言模型。为此,本项目会持续开放指令训练数据、相关模型、训练代码等,也会关注不同训练数据和训练算法对模型表现的影响。针对中文做了优化,模型调优仅使用由ChatGPT生产的数据(不包含任何其他数据)。
本项目的目标是促进中文对话大模型开源社区的发展,愿景是成为能够帮到每一个人的LLM Engine。

相比如何做好大语言模型的预训练,BELLE更关注如何在开源预训练大语言模型的基础上,帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力的语言模型,降低大语言模型、特别是中文大语言模型的研究和应用门槛。为此,BELLE项目会持续开放指令训练数据、相关模型、训练代码、应用场景等,也会持续评估不同训练数据、训练算法等对模型表现的影响。BELLE针对中文做了优化,模型调优仅使用由ChatGPT生产的数据(不包含任何其他数据)。

下图是一个可以使用App在设备端本地运行4bit量化的BELLE-7B模型,在M1 Max CPU上实时运行的效果(未加速)。App下载详见[App配套模型下载及使用说明](chat/README.md),App[下载链接](https://github.com/LianjiaTech/BELLE/releases/download/v0.95/chatbelle.dmg),目前仅提供了mac os版本。模型需要单独下载。**模型经过量化后,效果损失明显,我们将持续研究如何提升。**

Expand Down

0 comments on commit b22e2ea

Please sign in to comment.