本项目代码仍在整理,一个月内可以上传 首先本仓库要感谢尹俊希老帅哥的大力支持,为本项目做出了非常大的帮助
数据集:
train_plan.json和test_plan.json分别为进行任务规划的训练数据集和测试数据集。可以放入qwen1/qwen1.5中训练,训练后qwen模型可获得任务规划能力。
将main.py文件中allparams_split_task_chain的default值改为训练后的任务规划qwen模型。将execute_model_path改为qwen72b的的模型地址,execute_reflexion改为false。其他不变,运行即可获得任务规划和执行能力。
数据集2:
train_react.josn和test_react.json分别为对任务规划和任务执行两个模型蒸馏出来的数据,并且进行人工标注的数据。
将train_react.json放到qwen1/qwen1.5内进行训练,可将任务规划和任务执行能力导入同一个模型,建议使用qwen1.5 14b进行训练.
训练完成后将main.py文件中allparams_split_task_chain的default值改为false。将execute_model_path改为以上模型训练的模型地址,execute_reflexion改为false。
推理可得一个模型同时获得任务规划和任务执行两个效果。
任务规划阶段效果如下:
任务执行阶段效果如下: