WechatRobot, ChatGLM3-6B, langchain,RAG
目前存在的问题是:
- 本身机器人的属性是什么,是作为某个专属领域的机器人吗?如果是,需要做哪一个领域的,如果不是,是否需要一个启动指令或本身需要存储哪些知识。 是的,做特定领域的机器人,需要的是用户提供相关文件后能够实现对于其中信息的提取和总结
- 如果没能在本地找到相关知识,是否允许其进行搜索来寻找更相关的知识。 暂时不做打算
- 作为一个“微信机器人”,哪些功能是微信独有的、需要并且可以实现的,例如表情包的生成(需要涉及图片) 暂时不打算
- langchain 本身的检索逻辑优化,目前是使用固定的数值 13 和 16。是否可以选择优化检索的逻辑,检索到之后的 prompt 处理。
- 关注 RAG 目前存在的问题
- 作为微信的助手,需要能够添加处理对于其他消息类型如语音,图片的处理吗
- 还需要实现其他哪些"服务",需要哪些程序接口呢?
11.6 暂时不考虑通用文件夹,用户个人的知识库与向量化均完成,日后加入通用知识库的话则将新文件夹纳入处理路径即可 用户需要:“查询”,“查看我的知识库文件”,“删除某知识库文件”,“全部删除知识库” RAG的申报书内容完成 回去看一下微调怎么做,
11.5 申报书第一版完善中,实现了文件对于不同私聊用户的分开存储 但问题在于群聊中发送的会记录为私聊用户的会话ID,且不同用户的知识库构建代码还没有完成(现在的knowledge代码智能实现单一文件夹下的处理) 增加为通用文件夹和用户ID对应的文件夹两个文件夹一起处理,保存到其下的知识库下的对应文件夹就好了(先不考虑冗余的问题)
11.4 申报书第一版完整完成。 下一步计划:
- 完善申报书,更改
- 结合申报书找找论文
- 研究回复文本的代码,微调使得不会出现英文回复吧
- 补充普通知识库,思考安全隐私保护的操作,
- Elasticsearch 和 FAISS 库是什么
- BERT embeddings 和 TF-IDF 是什么
- KBQA 和 RAG?
10.31
已经完成了文件上传和处理,遗留问题是没能将不同用户的下载目录分开,没有实现对于特定用户的特定知识库
目前使用消息的前缀”查询:“来区分是否使用知识库来进行回复
下一步工作:研究回复文本的代码,解决出现奇怪回复的问题。正常的回复中会出现英文,需要对模型进行微调,
普通知识库的内容需要补充,思考用户个性知识库如何实现,了解一下 KBQA 和 RAG 的异同
增加一个指令列表
研究一下哪些文件是可以删除的,只保留自己的模型文件和一点有用的部分
10/30 凌晨:
目前完成到了将服务器端的代码基本逻辑完成,使用 v1/upload 的端口来接受文件并且使用 knowledge 的代码将它吸收进知识库当中。
微信机器人这边,在 MyModel 里面增加了对于文件上传的处理,同时优化了结构
下一步:char_channel 里调用父类 channel 的方法实现文件上传,channel 的方法调用 bridge 里的函数,里面 getbot 之后在 bridge 里面划分到了不同的模型怎么处理,这里可以仿照对于消息逻辑的处理来实现,但是要注意和 MyModel 里面已经写好的的函数名字对应而且不要冲突了。
下一步工作:channel 中的 chat_channel 文件中可以修改添加对于文件的处理逻辑,注意其父类和子类的关系,同时前往 MyModel 中进行修改代码,添加对于文件信息的处理
重点在微信机器人,下面的内容属于附属的可删除部分。
对于大语言模型的下一步工作:目前已经可以在服务器运行 RWKV,下一步运行为 api,接入微信机器人,之后看一下为什么不聪明
后续:查找关于 RWKV 的相关资料,RWKV 是否可以生成无限长度的文本?
不是的,无限长文本是一种概念,infinite content length,指的是模型在处理序列时能够有效利用更长的上下文而不受传统 Transformer 模型中自注意力机制的限制。RWKV 的设计目标是使其在长序列生成和理解任务中具有更好的性能。
在这之前至少要知道 RNN 和 Transformer 的相关优劣势,论文
目标:基于 RWKV 的在线学习问答算法(存疑)
本项目旨在开发一款智能机器人,利用大语言模型技术,做到及时有效地回应所有群成员的需求,提供学习辅助、专业知识解答、制作表格、画图和信息查询等服务。本项目将探索知识增强(RAG)技术,在给定知识库的情况下,让大模型可以形成更加专业准确的回答,通过智能化的交流与互动,提高交流效率。
在如今信息爆炸的时代,为了用户迫切需要一个智能助手,能够快速准确地解答问题,提升学习和工作效率。该微信智能机器人基于 ChatGLM3-6B 模型,并计划未来整合 RAG 技术,以提供更为精准的回答。目前,机器人能存储用户发送的文件,分析其内容并回答相关问题,辅助学习和提供专业知识。同时,它可以帮助用户处理数据,制作表格和图表,以及进行信息查询。通过这些功能,机器人旨在提高用户的交流效率,简化信息获取与处理过程。
在信息爆炸的时代,信息量庞大且良莠不齐,且当前大模型的应用多依赖于特定程序或 App,无法满足个性化定制需求,限制了普及度。该项目旨在基于微信这一高频、便捷的工具,利用 ChatGLM3-6B 大模型与 RAG 技术,打造智能机器人。机器人能对用户上传的文件进行信息筛选和存储,基于内容提供学习辅助、专业咨询、数据分析、表格生成等服务,满足用户个性化需求并显著提升交流效率,为学习和工作提供精准支持。
在信息化时代,由于大量复杂信息的轰炸,人们迫切需要一个便捷的可个性定制的智能助手来帮助自己实现对于信息的提炼与加工以提升效率.本项目旨在依托微信这一高频便捷的工具,利用大语言模型与 RAG 技术,打造能够回应各类需求的智能机器人,提供学习辅助、专业知识解答、数据分析、制作图表、信息查询等服务.同时根据用户需要提供定时提醒等其他个性化服务.同时探索 RAG 技术,使得给定知识库的情况下,让大语言模型生成更加专业准确的回答.
该机器人能够解决目前便捷与功能齐全(的服务)之间的矛盾 实现各类功能的统一,更加的用户友好 弥补市场的空缺 个体化定制
对比微信与其他的平台机器人,微信的其他 AI 功能呢,其他的大语言模型的研究进展,RAG 的研究进展,对于大语言模型和 RAG 的评价体系,结合科学研究发展趋势来论述科学意义
研究内容:为什么选择微信这个平台,为什么选择 ChatGLM3-6B 这个大模型,模型算法的介绍与升级,RAG 技术是什么,为什么要加入 RAG 技术,其他个性功能的实现 总体框架: 重点难点: 目的意义:扩写项目概述 具体目标:机器人正常使用,大语言模型的优劣测试,RAG 技术的问题探索与解决,在线回答算法
研究方法,技术路线,实验手段,关键技术??
项目特色与创新点 研究基础 研究项目支撑条件