Skip to content

0.0.3

Compare
Choose a tag to compare
@xhnbzdl xhnbzdl released this 15 Jul 11:42
  • 这个版本新增了两种格式的导出,可支持将飞书文档导出为markdownpdf,加上原有支持的docx一共是三种格式。

  • 新增了命令行参数--saveType,文档保存的格式类型,可选值有mdpdfdocx,如果参数不传,或值为空,或值为不存在的格式,则默认导出为docx。使用方式如下:

    # win 不指定知识库 将文档保存为markdown文档
    ./feishu-doc-export.exe --appId=xxx --appSecret=xxx --saveType=md --exportPath=E:\temp\test
    
    # mac 不指定知识库 将文档保存为pdf
    sudo ./feishu-doc-export --appId=xxx --appSecret=xxx  --exportPath=/home/feishu-document --saveType=pdf
    
    # linux 不指定知识库 将文档保存为docx
    sudo ./feishu-doc-export --appId=xxx --appSecret=xxx  --exportPath=/home/feishu-document 
    sudo ./feishu-doc-export --appId=xxx --appSecret=xxx  --exportPath=/home/feishu-document --saveType=
    sudo ./feishu-doc-export --appId=xxx --appSecret=xxx  --exportPath=/home/feishu-document --saveType=docx
    sudo ./feishu-doc-export --appId=xxx --appSecret=xxx  --exportPath=/home/feishu-document --saveType=abcdefg
  • 耗时测试

    • 导出为docx最快
    • 导出为markdowndocx的速度差不多
    • 导出为pdf速度最慢,因为pdf的图片是内嵌的
    • 实际速度与网速和飞书服务器响应,电脑磁盘写入速度都有关系
  • 注意事项:

    1. 文档导出为markdown时,存在文档格式丢失的问题,原因是因为我的实现方式是利用飞书自提供的接口先将文档下载为docx,然后再将docx转为markdown,文档下载为docx后就已经存在格式丢失的问题了,所以不能很好的转换为markdown。而上面提到的两个开源库都是自己做的处理,它们都是直接将飞书原始数据转换为markdown语法的。feishu-backup是作者自己对飞书原始数据做的转换(牛逼),feishu2md则是用了一个针对飞书数据转换的库。

    2. feishu-doc-export目前已发现docx转为markdown丢失的格式有:引用语法、表格、行内代码块

    3. 对于飞书文档中引用的其他文档,如果引用的文档是当前知识库的文档,则该文档下载到本地后会以相对路径引用另一个文档,因为另一个文档也会下载到本地。

      如果引用的文档是其他知识库或者是外链,则当前文档下载后还是以原文方式引用。