muvtuber

Makes your AI vtuber.

让 AI 成为虚拟主播：看懂弹幕，妙语连珠，悲欢形于色，以一种简单的实现

不定期的测试直播：http://live.bilibili.com/26949229
QQ 交流群：569686683
介绍文章：知乎 - 写个AI虚拟主播：看懂弹幕，妙语连珠，悲欢形于色，以一种简单的实现

[TOC]

项目构成

服务	说明	基于
blivechat	获取直播间弹幕消息。	xfgryujk/blivechat 做的非常好，直接用了，没有额外封装。
Live2dView	前端：显示 Live2D 模型	guansss/pixi-live2d-display
Live2dDriver	驱动前端 Live2D 模型动作表情	-
ChatGPTChatbot	基于 ChatGPT 的优质聊天机器人	acheong08/ChatGPT
MusharingChatbot	基于 ChatterBot 的简单聊天机	RaSan147/ChatterBot_update musharing-team/chatbot_api
Emotext	中文文本情感分析	cdfmlr/murecom-verse-1
externalsayer	调用公开的 API （external API）进行 TTS 文本语音合成。	Azure: TTS
audioview	基于 Web 的音频播放。用于从 docker 中输出音频到 OBS	-
muvtuberdriver	组装各模块，驱动整个流程	-
muvtuber-proto	proto 定义

快速开始

v0.3.0 版本已实现了完全 Docker 化，所以应该支持任意常用操作系统了。现在只需要几个命令即可启动整个项目：

安装 Docker 以及 Docker Compose。
拉取代码：

# 拉取代码
git clone --recursive https://github.com/cdfmlr/muvtuber.git
cd muvtuber

⚠️ 由于使用了 git 子模块，一定要递归拉取，不能下载 zip，或不带 --recursive 参数的 clone。

🚧 默认的 main 分支是开发中的最新版本，不保证能运行。请使用打了 tag 个版本。（今天有点忙，有时间再写详细教程哈。如果你会的话，可以帮我修改，直接 PR 就行。）

修改配置：（详见配置详解）

vim docker-compose.yml
# 按照你的实际情况修改 HTTP_PROXY、HTTPS_PROXY 的值
# 如果不需要，直接删掉就行。

vim configs/externalsayer/config.yaml
# 配置 TTS 文本语音合成: 
# 配置 azure 语音合成服务的 key、region 和 role (SSML 模板)

vim configs/muvtuberdriver/config.yaml
# 主程序的配置:
# 你的房间号（roomid）、ChatGPT 的 apiKey 以及 initialprompt.
# 各种 server 的地址都不用改，已经配合 docker-compose.yml 设好了.

启动服务：

# 启动各种服务
# 首次运行需要 build 各种镜像，耗时较长，并且请确保网络能够访问 Docker Hub、GitHub （我已尽量写了使用国内源，但不保没有遗漏）
# 之后我可能会把打包好的镜像上传，到时候直接 pull 就行了。
docker compose up -d
# docker compose ps       # 查看服务状态
# docker compose logs -f  # 查看日志（Ctrl+C 停止）

（如果遇到问题，可以先看一看 Troubleshooting）

配置 OBS，开始直播：（下面三个都是新建浏览器源）
- 主播 Live2DView：http://localhost:51070/#/?driver=ws://localhost:51071/live2d
- 语音 AudioView：http://127.0.0.1:51082/?controller=ws://127.0.0.1:51081/
- 弹幕 Blivechat：先用浏览器打开 http://localhost:51060，按需配置，然后复制粘贴链接和样式。

配置详解

网络环境配置

如果你的网络环境不好，直连 GitHub 和 ChatGPT 有困难，就需要做一些代理配置。

预先条件：你拥有一个可以让网络变好的魔法道具（行业黑话：代理）。

在你的代理设置中（可能还藏的比较深，如高级设置中），可以找到类似「本机 http 监听端口」之类的值，把这个端口填到：

musharing_chatbot/Dockerfile 中：
```
HTTPS_PROXY=http://host.docker.internal:1000
```
替换掉 1000

docker-compose.yml 中：

  chatgpt_chatbot:
    ...
    environment:
      - HTTP_PROXY=http://host.docker.internal:1000
      - HTTPS_PROXY=http://host.docker.internal:1000

替换掉 1000

（当然你也可以反过来，把代理软件的端口改成 1000 哈哈，但不推荐，我怕有冲突，或者给你造成其他问题）

externalsayer 配置详解

这里将配置使用免费、高质量的 Azure 的 TTS 服务。（目前也只支持这一种。）该服务的介绍: https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/

这一块的配置在 configs/externalsayer/config.yaml 中：

SrvAddr: "localhost:50010"
EnabledSayer: "azure"
AzureSayer:
  SpeechKey: "your-key"
  SpeechRegion: "eastus"
  FormatMicrosoft: "audio-16khz-32kbitrate-mono-mp3"
  FormatMimeSubtype: "mp3"
  Roles:
    "default": '<speak version="1.0" xml:lang="zh-CN"><voice name="zh-CN-XiaoxiaoNeural">{{.}}</voice></speak>'

你需要更改：SpeechKey, SpeechRegion 以及 Roles。

SpeechKey, SpeechRegion：你在 Azure 上申请的 TTS 服务的 key 和 region。
- 具体的申请流程可以参考文档：快速入门：将文本转换为语音
Roles：<voice name="xx-XX-Xxx">这里的 name 应该填写 voice，即“发音人”的名字。具体的列表可以通过以下命令获取：

curl https://eastus.tts.speech.microsoft.com/cognitiveservices/voices/list --header 'Ocp-Apim-Subscription-Key: xxx'

我把请求的结果格式化放到了这个文件里，方便查找：externalsayer/azuresayer/voices /voices-list.json。

你可以在网页上的「Speech Studio」里试听、选择声音。然后在文件里找到对应 voice 的 "ShortName": "xx-XX-Xxx" 填写到 <voice name="xx-XX-Xxx">。

🌟 更推荐的一种方式是，在「Speech Studio」中随便写点内容，选择声音让它说，并微调各种参数，满意之后，把 SSML 导出出来，把内容替换为 {{.}}，去掉换行（我写了个脚本帮助做这件事，可以点这里找到）写到配置里。

OBS 配置详解

给新手的 OBS 配置详解：

虚拟形象（Live2DView）：来源 > + > 浏览器 > 新建 > URL: http://localhost:9000/#/
- 注意把「通过 OBS 控制音频」勾上哦，然后把那条声音关掉，不然有机会听到可爱捏鬼畜日语。
弹幕框（blivechat）：来源 > + > 浏览器 > 新建 > URL:
- 先用浏览器打开 http://localhost:12450
- 首页 > 房间号：设置为你的房间号 > 进入房间
- 弹出的窗口 -> 拷贝地址
- 粘贴到 OBS 的 URL
主播说话的音频（audioview）：
- 来源 > + > 浏览器 > 新建 > URL
- 填入 http://127.0.0.1:51082/?controller=ws://127.0.0.1:51081/
- 建议把「通过 OBS 控制音频」勾上，方便按需调节音量。
其他音频（BGM）：来源 > + >音频输入采集 > 新建 > 设备：BlackHole 2ch
- 要先安装一个虚拟声卡，这里以 mac 系统使用 BlackHole 为例。
- 在开始直播前，控制中心 > 声音> 右边 AirPlay 图标 > 选 BlackHole。
- 然后电脑输出的声音就会 -> BlackHole -> OBS。
B 站推流：设置（Preferences）> 直播 > 服务：选 Bilibili Live ...，推流码填「B 站首页 > 头像 > 推荐服务 > 直播中心 > 左侧“我的直播间”> 填好直播分类、房间标题 > 开始直播，然后会显示的串流密钥」

Troubleshooting

💥 docker compose up 构建 musharing_chatbot 镜像时 ProxyError

如果出现 ProxyError，或者：

Cannot connect to proxy.
Name or service not known.

需要修改 musharing_chatbot/Dockerfile 中的代理设置。

# TODO: modify port 1000 to your own port to your local proxy
RUN	HTTPS_PROXY=http://host.docker.internal:1000 poetry run python -m spacy download en_core_web_sm

这个东西必须访问 GitHub，如果你的网络环境不允许直接访问 GitHub，可以使用代理。如果你可以直接访问 GitHub（你用旁路由也算），可以删除 HTTPS_PROXY=http://host.docker.internal:1000。

💥 启动后 chatgpt_chatbot 一直出现网络问题

查看日志发现：

...
muvtuber-chatgpt_chatbot-1    |     raise ProxyError(e, request=request)
muvtuber-chatgpt_chatbot-1    | requests.exceptions.ProxyError: HTTPSConnectionPool(host='openaipublic.blob.core.windows.net', port=443): Max retries exceeded with url: /encodings/cl100k_base.tiktoken (Caused by ProxyError('Cannot connect to proxy.', NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x7f968bfdbac0>: Failed to establish a new connection: [Errno -2] Name or service not known')))

需要在 docker-compose.yml 中修改代理配置：

  chatgpt_chatbot:
    ...
    environment:
      - HTTP_PROXY=http://host.docker.internal:10809
      - HTTPS_PROXY=http://host.docker.internal:10809

如果你的网络环境不允许直接访问 OpenAI 的 API，可以使用代理。如果你可以直接访问 ChatGPT（你用旁路由也算），需要删除两行配置。

如果配置后，仍然有 Name or service not known 的错误，可以尝试通过 Docker Desktop 的 settings-resources-proxies 写宿主机的 IP（就是宿主机以太网下的本地 IPv4 地址）。（感谢 @RAINighty 提供的解决方案，详见 cdfmlr#30 的讨论）

配置开发环境

目前仍不支持用 docker 作为开发环境。需要在本地开发，然后 docker 构建部署。

-1. 本地开发环境：

$ uname -mrs
Darwin 22.3.0 arm64
# 目前 TTS 模块还依赖于 macOS，其他系统可能不行。
$ go version  
go version go1.20.1 darwin/arm64
$ python3 --version
Python 3.9.16  # blivechat
Python 3.10.10 # others
$ poetry --version
Poetry (version 1.4.0)
$ node --version
v18.14.2
$ pyenv --version
pyenv 2.3.14
$ pnpm --version
7.29.0

Node.js 和 Python 的包管理配置：

# 前端统一使用 pnpm (珍爱硬盘，远离 npm)
pnpm config set auto-install-peers true -g
# python统一使用 pyenv + poetry
poetry config virtualenvs.prefer-active-python true
poetry config virtualenvs.in-project true  # 只是个人的保守偏好

现在可用 git submodule 一次性拉取整个项目，无需手动 clone 各个模块了:

git clone --recursive https://github.com/cdfmlr/muvtuber.git

接下来编译运行各个模块，可以预先开 7 个终端页，然后：

blivechat

cd blivechat

# 编译前端
cd frontend
pnpm install
pnpm run build
cd ..

# 运行服务
pyenv local 3.9.16
poetry install
poetry run python main.py
# 服务运行在 http://localhost:12450，会自动在默认浏览器打开

Emotext

cd emotext

pyenv local 3.10.10
poetry install
poetry run python emotext/httpapi.py --port 9003
# emotext server: http://localhost:9003

ChatGPTChatbot

cd chatgpt_chatbot

pyenv local 3.10.10
poetry install
poetry run python chatgpt
# ChatGPTChatbot gRPC server: localhost:50052

MusharingChatbot

cd musharing_chatbot

pyenv local 3.10.10
poetry install
poetry run python -m spacy download en_core_web_sm  # 一个执行不到的依赖，但是不装跑不起来。
PYTHONPATH=$PYTHONPATH:. poetry run python musharing_chatbot
# MusharingChatbot gRPC server: localhost:50051

Live2dDriver

#git clone https://github.com/cdfmlr/live2ddriver.git
cd live2ddriver

go run . -shizuku localhost:9004 -verbose
# live2d shizuku driver: localhost:9004
# websocket message forwarder: localhost:9001 # 前端会连这个

# 不开发该模块也可以 build 出来再运行

Live2dView

#git clone https://github.com/cdfmlr/live2dview.git
cd live2dview

pnpm install
pnpm exec quasar dev
# 浏览器访问: 调试(戏)页: http://localhost:9000/#/debug
# 生产环境: OBS 添加浏览器源: http://localhost:9000/

# 如果不开发这个模块可以 build & serve:
pnpm exec quasar build
httpstatic -d dist/spa/ -l :9000  # 你的某种静态网页服务工具，如 python -m http.server，如果开发环境最好有宽松的 CROS。这里用的是 https://github.com/cdfmlr/tools/#httpstatic

audioview

cd audioview

pnpm install
pnpm run dev
# pnpm run build

externalsayer

cd externalsayer

go run . -h

muvtuberdriver

muvtuberdriver 必须在前面所有服务正确启动后才能启动，否则会 panic 退出。

#git clone https://github.com/cdfmlr/muvtuberdriver.git
cd muvtuberdriver

go run . -c config.yaml
# chatgpt_access_token: 浏览器访问https://chat.openai.com/api/auth/session获取
# roomid 你的 b 站直播间 id，https://live.bilibili.com/000000?... 中的000000

# 不开发该模块也可以 build 出来再运行

OBS

brew install obs
# 或：https://obsproject.com

# 启动 OBS，设置：
# - blivechat 的弹幕框：localhost:12450/...
# - Live2DView：localhost:9000
# - 音频（say）的输出：你使用的音频设备
# 【开始直播】

部署

使用前文的 docker compose 方式部署。不再提供散装微服务的部署文档了。

FAQ

我（个人/商业/以及任意情况）可以使用这个项目嘛？

可以。在 MIT 协议下开放源代码，没有任何限制。
- Permissions：✅ Commercial use ✅ Modification ✅ Distribution ✅ Private use
- Limitations：❌ Liability ❌ Warranty

在 Microsoft Windows 系统中可以运行嘛？

可以。v0.3.0 完成了完全 Docker 化，只要宿主机能装 docker 就行：所有服务都跑在容器中，所有客户端都是浏览器（可以嵌入 OBS）。

作者寻求合作嘛？

✅ 你要和我一起写代码（贡献）
✅ 你要给我钱让我写我想写的东西（捐赠）
❌ 你要给我钱让我写你想要的东西（外包）
- 非常抱歉，我的时间精力和能力有限。

为何如此复杂？|| 这个项目的意义是什么？

我自己都觉得复杂。但这是刻意为之的，用来自己的走出舒适区。这是个学习项目，为磨练技术而生。她充满了探索，而没有明确的目标。它不是用来赚钱的工具，亦不是用来娱乐的玩具。
在机器学习方面：用来学习包括但不限于 AIGC 等技术（实用技术，从模型到服务的，真正有用的，不是只能躺在 Jupiter Notebook 里的 demo）虽然现在都是调 API，但我也有在研究自己做模型......
在云计算方面：用来学习散装微服务 -> Docker -> Docker Compose -> Kubernetes 的云化流程，以及探索 Serverless、FaaS 等技术......
在软件工程（开发）方面：用来学习这种一大堆乱七八遭的东西如何组合、重构，使之更协调、更优雅地工作。而且这个甚至不是个正常的 web 项目，我对这种工程如何实现一无所知......
在软件工程（管理）方面：这一大堆东西在高层次如何协调、推进：哪怕只有一个人开发，现在它的复杂度也已经到了需要去管理了。父、子模块、容器以及依赖的版本规划；想法 -> TODO -> 实现的规划......
以及我一个人如何在有限的时间内兼顾学习（📖）、工作（💰）、爱好（💻）、生活（🎮🎸📷🎬🎧...）以及多个（复杂）项目：时间、精力、知识如何管理？我需要更加高效。我已被逼上 GTD，Zettelkasten 也已经写入了 inbox。
为达成这些目标，需要相当长的时间来推进这个项目。

TODO

开放源代码

所有下属项目除非特别说明，一律在 MIT 协议下开放源代码。

欢迎任何有关 Issue 问题、PR 贡献以及讨论。

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
attachments		attachments
audioview @ 7559d7e		audioview @ 7559d7e
blivechat @ 85d7539		blivechat @ 85d7539
chatgpt_chatbot @ cb2d6a3		chatgpt_chatbot @ cb2d6a3
configs		configs
emotext @ 81fce0c		emotext @ 81fce0c
externalsayer @ 23e32a0		externalsayer @ 23e32a0
live2ddriver @ 1580103		live2ddriver @ 1580103
live2dview @ ce2d0c2		live2dview @ ce2d0c2
musharing_chatbot @ d90bc31		musharing_chatbot @ d90bc31
muvtuberdriver @ 41390d6		muvtuberdriver @ 41390d6
proto @ 8d7cc02		proto @ 8d7cc02
roompad		roompad
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
check-images-in-compose.py		check-images-in-compose.py
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

muvtuber

项目构成

快速开始

配置详解

网络环境配置

externalsayer 配置详解

OBS 配置详解

Troubleshooting

💥 docker compose up 构建 musharing_chatbot 镜像时 ProxyError

💥 启动后 chatgpt_chatbot 一直出现网络问题

配置开发环境

部署

FAQ

TODO

开放源代码

About

Releases

Packages

Languages

keithyzk/muvtuber

Folders and files

Latest commit

History

Repository files navigation

muvtuber

项目构成

快速开始

配置详解

网络环境配置

externalsayer 配置详解

OBS 配置详解

Troubleshooting

💥 docker compose up 构建 musharing_chatbot 镜像时 ProxyError

💥 启动后 chatgpt_chatbot 一直出现网络问题

配置开发环境

部署

FAQ

TODO

开放源代码

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages