Releases: xhnbzdl/feishu-doc-export
0.0.4.1
0.0.4
-
支持导出知识库内的文件类型文档,如:pdf、image等。
-
支持个人空间云文档导出(需要指定文件夹的Token)
-
优化了程序异常处理,保证下载尽可能不中断
-
新增了命令行参数
--type
和--folderToken
,选择导出知识库或个人空间云文档,可选值:cloudDoc
、wiki
,为空则默认为wiki
。当type=cloudDoc
时,需要填写--folderToken
参数,type=wiki
或空,则不需要填写。使用方式如下:# win 导出个人空间文档 将文档保存为markdown文档 ./feishu-doc-export.exe --appId=xxx --appSecret=xxx --saveType=md --exportPath=E:\temp\test --type=cloudDoc --folderToken=xxx
-
如何导出个人空间的文档
- 将要导出的文件夹分享给自建应用,让自建应用拥有可导出文档的权限。
- 获取
folderToken
:
-
为什么不支持列举文件夹列表?
因为飞书对于个人空间做了登录限制,未登录情况下个人空间相关的部分
API
无法直接调用。而要支持登录,飞书只提供了网页端和小程序的接入方案,因此该项目不支持。
0.0.3
-
这个版本新增了两种格式的导出,可支持将飞书文档导出为
markdown
和pdf
,加上原有支持的docx
一共是三种格式。 -
新增了命令行参数
--saveType
,文档保存的格式类型,可选值有md
,pdf
,docx
,如果参数不传,或值为空,或值为不存在的格式,则默认导出为docx
。使用方式如下:# win 不指定知识库 将文档保存为markdown文档 ./feishu-doc-export.exe --appId=xxx --appSecret=xxx --saveType=md --exportPath=E:\temp\test # mac 不指定知识库 将文档保存为pdf sudo ./feishu-doc-export --appId=xxx --appSecret=xxx --exportPath=/home/feishu-document --saveType=pdf # linux 不指定知识库 将文档保存为docx sudo ./feishu-doc-export --appId=xxx --appSecret=xxx --exportPath=/home/feishu-document sudo ./feishu-doc-export --appId=xxx --appSecret=xxx --exportPath=/home/feishu-document --saveType= sudo ./feishu-doc-export --appId=xxx --appSecret=xxx --exportPath=/home/feishu-document --saveType=docx sudo ./feishu-doc-export --appId=xxx --appSecret=xxx --exportPath=/home/feishu-document --saveType=abcdefg
-
耗时测试
- 导出为
docx
最快 - 导出为
markdown
和docx
的速度差不多 - 导出为
pdf
速度最慢,因为pdf
的图片是内嵌的 - 实际速度与网速和飞书服务器响应,电脑磁盘写入速度都有关系
- 导出为
-
注意事项:
-
文档导出为
markdown
时,存在文档格式丢失的问题,原因是因为我的实现方式是利用飞书自提供的接口先将文档下载为docx
,然后再将docx
转为markdown
,文档下载为docx
后就已经存在格式丢失的问题了,所以不能很好的转换为markdown
。而上面提到的两个开源库都是自己做的处理,它们都是直接将飞书原始数据转换为markdown
语法的。feishu-backup
是作者自己对飞书原始数据做的转换(牛逼),feishu2md
则是用了一个针对飞书数据转换的库。 -
feishu-doc-export
目前已发现docx
转为markdown
丢失的格式有:引用语法、表格、行内代码块 -
对于飞书文档中引用的其他文档,如果引用的文档是当前知识库的文档,则该文档下载到本地后会以相对路径引用另一个文档,因为另一个文档也会下载到本地。
如果引用的文档是其他知识库或者是外链,则当前文档下载后还是以原文方式引用。
-