Skip to content
/ eva Public
forked from ylsdamxssjxxdd/eva

一款直观的大模型应用软件: 机体

Notifications You must be signed in to change notification settings

ltf930714/eva

 
 

Repository files navigation

机体

一款直观的大模型应用软件:机体 (qt5+llama.cpp-b2409)

特点

  • 轻量
    • 机体没有其它依赖组件,就是一个exe程序
  • win7
    • 最低支持32位windows7
    • 具有编译到(x86,arm,windows,linux,macos,android,cuda,rocm,vulkan)的潜力
  • 多功能
    • 本地模型交互,多模态,在线模型交互,对外api服务,智能体,知识库问答,模型量化,文生图,声转文,语音朗读
  • 直观
    • 输出区的内容就是模型的全部现实
    • 状态区的内容就是运行的全部流程

快速开始

  1. 下载一个机体
  1. 下载一个gguf格式模型
  1. 装载!
  • 点击装载按钮,选择一个gguf模型载入内存
  1. 发送!
  • 在输入区输入聊天内容,点击发送

功能介绍

  1. 对话模式
  • 机体的默认模式,在输入区输入聊天内容,模型进行回复
  • 可以事先约定好角色
  • 可以使用挂载的工具,但是会影响模型智力
  • 可以上传csv格式的题库进行测试
  • 可以按f1截图,按f2进行录音,截图和录音会发送给多模态或whisper模型进行相应处理
  1. 补完模式
  • 在输出区键入任意文字,模型对其进行补完,这是机体所有功能实现的基础
  1. 服务模式
  • 机体成为一个开放api端口的服务,也可以在网页上进行聊天,但是挂载的工具失效
  1. 链接状态
  • 机体可以链接到其它api服务的对话端点,不需要装载模型也能运行
  1. 知识库
  • 用户可以上传文档,经过嵌入处理后成为模型的知识库,挂载后可供模型调用
  1. 文生图
  • 可以使用sd模型绘制图像,挂载后可供模型调用

源码编译

  1. 配置环境
  1. 克隆源代码
git clone https://github.com/ylsdamxssjxxdd/eva.git
  1. 根据CMakeLists.txt文件中的说明修改相应配置
  2. 编译

主线

  • 装载流程
    • 【ui】->用户点击装载->选择路径->发送设置参数->【bot】->处理参数->发送重载信号->【ui】->预装载->装载中界面状态->发送装载信号->【bot】->开始装载->发送装载动画信号->装载完重置->发送装载完成信号->【ui】->加速装载动画->装载动画结束->滚动动画开始->动画结束->强制解锁->触发发送->发送预解码(只解码不采样输出)指令->【bot】->预解码系统指令->发送解码完毕信号->【ui】->正常界面状态->END
  • 发送流程
    • 【ui】->用户点击发送->模式/标签/内容分析->对话模式的话->推理中界面状态->发送输入参数->发送推理信号->【bot】->预处理用户输入->流式循环输出->循环终止->发送推理结束信号->【ui】->正常界面状态->END
  • 约定流程
    • 【ui】->用户点击约定->展示最近一次配置->点击确认->记录用户配置->发送约定参数->【bot】->记录用户配置->发送约定重置信号->【ui】->触发界面重置->发送重置信号->【bot】->初始化模型运行所需组件->发送重置完成信号->【ui】->如果系统指令变化则预解码->END
  • 设置流程
    • 【ui】->用户点击设置->展示最近一次配置->点击确认->记录用户配置->发送设置参数->【bot】->记录用户配置->分析配置变化->END/发送重载信号/发送设置重置信号->【ui】->预装载/触发界面重置->END
  • 预解码图像流程
    • 【ui】->用户上传图像/按f1截图->触发发送->推理中界面状态->发送预解码图像指令->【bot】->预解码图像->占用1024个token->发送解码完毕信号->【ui】->正常界面状态->END
  • 录音转文字流程
    • 【ui】->用户初次按下f2->需要指定whisper模型路径->发送expend界面显示信号->【expend】->弹出声音增殖界面->选择路径->发送whisper模型路径->【ui】->用户再按f2->录音界面状态->开始录音->用户再按f2->结束录音->保存wav文件到本地->发送wav文件路径->【expend】->调用whisper.exe进行解码->解码完毕保存txt结果到本地->发送文字结果->【ui】->正常界面状态->显示到输入区->END
  • 工具调用流程
    • 【ui】->用户点击发送->模式/标签/内容分析->对话模式的情况->推理中界面状态->发送输入参数->发送推理信号->【bot】->预处理用户输入->流式循环输出->循环终止->发送推理结束信号->【ui】->提取模型本次输出中的json字段->发送json字段->发送工具推理信号->【tool】->根据json字段执行相应函数->执行完毕返回结果->【ui】->将返回结果作为发送内容并添加观察前缀->触发发送->···->没有合理的json字段->正常界面状态->END
  • 构建知识库流程
    • 【expend】->用户进入知识库选项卡->用户点击选择模型->选择嵌入模型->启动server.exe->启动完成->自动将server的v1/embeddings端点写入地址栏->用户点击上传选择一个txt文本->文本分段->用户可以按需求修改待嵌入文本段内容->用户点击嵌入文本段->将每个文本段发送到端点地址并接收计算后的词向量->表格中显示已嵌入文本段->发送已嵌入文本段数据->【tool】->END
  • 知识库问答流程
    • 【ui】->工具调用流程->json字段中包含knowledge关键字->发送json字段->发送工具推理信号->【tool】->执行knowledge函数->向嵌入端点发送查询字段->【server】->返回计算后的词向量->【tool】->计算查询字段词向量和每个已嵌入文本段词向量的余弦相似度->返回三个相似度最高的文本段->【ui】->将返回结果作为发送内容并添加观察前缀->触发发送->···->没有合理的json字段->正常界面状态->END
  • 链接流程
    • 【ui】->用户右击装载->配置ip和端点->点击确认->锁定界面->记录配置->连接测试->测试通过->解锁界面->END
    • 链接状态下的其它流程与上面类似,【bot】替换为【net】

待办事项

  • 优化代码结构
  • 适配linux
  • 适配国产cpu/gpu
  • 英文版本

已知BUG

  • 模型推理有内存泄漏,定位在xbot.cpp的stream函数,待修复
  • 达到最大上下文后截断一次后再达到,解码会失败,通过暂时置入空的记忆来缓解,定位在xbot.cpp的llama_decode返回1(找不到kv槽),待修复
  • 链接模式下,无法无间隔的连续发送,通过定时100ms后触发来缓解,定位在xnet.cpp的QNetworkAccessManager不能及时释放,待修复
  • 挂载yi-vl视觉后模型输出异常,待修复
  • csv文件存在特殊符号时不能正确解析,定位在utils.cpp的readCsvFile函数待修复

  • 部分字符utf-8解析有问题,已修复(模型输出不完整的utf8字符,需要手动将3个拼接成1个)
  • 切换模型时显存泄露,已修复(使用cuda时,不使用mmp)

About

一款直观的大模型应用软件: 机体

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 69.7%
  • C 17.5%
  • Cuda 3.9%
  • Python 3.4%
  • Metal 2.3%
  • Objective-C 1.4%
  • Other 1.8%