license | task_categories | language | ||
---|---|---|---|---|
apache-2.0 |
|
|
进度 [1-5093, 5794-last]
*指【1~5093行】和【5794行到最后一行】这连续两段间的内容已经处理完毕,余下行数待处理
原项目为 https://huggingface.co/datasets/LooksJuicy/ruozhiba,原部分答案为 GPT-4 生成。贡献者们人为审阅了每一条的原文和回复,剔除了一些原文中的格式错误,修改或重写了部分答案。希望对大语言模型的中文语料有所帮助。
PS. 正儿八经回答弱智吧的问题,真是一种奇妙的感觉
如果有意参与贡献,请查看此 issue
如果本项目对你有所帮助,请引用:
@misc{better-ruozhiba,
title={Better Ruozhiba},
author={Ruozhiba, FunnySaltyFish, Misdirection},
year={2024},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/FunnySaltyFish/Better-Ruozhiba}}
}
我的更多项目列表:https://web.funnysaltyfish.fun/
另一个语料相关项目:基于 B 站评论区数据构建大语言模型训练用对话数据集