fixed docs

Signed-off-by: ftgreat <[email protected]>
caowanxia123 · Jun 10, 2023 · b0d164a · b0d164a
1 parent d4bb7a0
commit b0d164a
Show file tree

Hide file tree

Showing 3 changed files with 9 additions and 7 deletions.
diff --git a/examples/Aquila/Aquila-pretrain/README.md b/examples/Aquila/Aquila-pretrain/README.md
@@ -15,11 +15,12 @@ We also support [Huggingface](https://huggingface.co/BAAI).
 
 |   模型/Model          |  状态/State    | 能否商用/Commercial use?  |  所用显卡/GPU   |                                    
 | :---------------- | :------- | :-- |:-- |   
-| <font color=red>Aquila-7B </font>         | 已发布  |   ✅   | Nvidia-A100  | 
-| <font color=red>Aquila-30B </font>         | 敬请期待  |   ✅   | Nvidia-A100  | 
+| Aquila-7B         | 已发布  |   ✅   | Nvidia-A100  |  
+| AquilaChat-7B          |已发布  |    ✅    | Nvidia-A100  | 
 | AquilaCode-7B-NV          |已发布  |    ✅   |   Nvidia-A100   | 
 | AquilaCode-7B-TS           |已发布 |   ✅    |  Tianshu-BI-V100   |
-| AquilaChat-7B           |已发布  |    ✅    | Nvidia-A100  | 
+| Aquila-33B          | **敬请期待**  |   ✅   | Nvidia-A100  |
+| AquilaChat-33B           |**敬请期待**  |    ✅    | Nvidia-A100  | 
 
 我们使用了一系列更高效的底层算子来辅助模型训练，其中包括参考[flash-attention](https://github.com/HazyResearch/flash-attention)的方法并替换了一些中间计算，同时还使用了RMSNorm。在此基础上，我们升级了[BMtrain](https://github.com/OpenBMB/BMTrain)技术进行轻量化的并行训练，该技术采用了数据并行、ZeRO（零冗余优化器）、优化器卸载、检查点和操作融合、通信-计算重叠等方法来优化模型训练过程。
 

diff --git a/examples/Aquila/README.md b/examples/Aquila/README.md
@@ -14,11 +14,12 @@ We also support [Huggingface](https://huggingface.co/BAAI).
 
 |   模型/Model          |  状态/State    | 能否商用/Commercial use?  |  所用显卡/GPU   |                                    
 | :---------------- | :------- | :-- |:-- |   
-| <font color=red>Aquila-7B </font>         | 已发布  |   ✅   | Nvidia-A100  | 
-| <font color=red>Aquila-33B </font>         | 敬请期待  |   ✅   | Nvidia-A100  | 
+| Aquila-7B         | 已发布  |   ✅   | Nvidia-A100  |  
+| AquilaChat-7B          |已发布  |    ✅    | Nvidia-A100  | 
 | AquilaCode-7B-NV          |已发布  |    ✅   |   Nvidia-A100   | 
 | AquilaCode-7B-TS           |已发布 |   ✅    |  Tianshu-BI-V100   |
-| AquilaChat-7B           |已发布  |    ✅    | Nvidia-A100  | 
+| Aquila-33B          | **敬请期待**  |   ✅   | Nvidia-A100  |
+| AquilaChat-33B           |**敬请期待**  |    ✅    | Nvidia-A100  | 
 
 我们使用了一系列更高效的底层算子来辅助模型训练，其中包括参考[flash-attention](https://github.com/HazyResearch/flash-attention)的方法并替换了一些中间计算，同时还使用了RMSNorm。在此基础上，我们升级了[BMtrain](https://github.com/OpenBMB/BMTrain)技术进行轻量化的并行训练，该技术采用了数据并行、ZeRO（零冗余优化器）、优化器卸载、检查点和操作融合、通信-计算重叠等方法来优化模型训练过程。
 

diff --git a/setup.py b/setup.py
@@ -26,7 +26,7 @@
         'tensorboard==2.9.0',
         'transformers==4.20.1',
         'datasets==2.0.0',
-        'setuptools==59.5.0',
+        'setuptools==66.0.0',
         'protobuf==3.19.6',
         'ftfy == 6.1.1',
         'Pillow >= 9.3.0',