Wenku Doc Downloader

1. 下载“百度文库”文档,仅支持导出为txt文档或图片型的pdf。 2. “豆丁网”文档页面支持存储为图片型的pdf。

目前为 2021-11-27 提交的版本。查看 最新版本

作者
JoyofFire
评分
0 0 0
版本
0.5
创建于
2021-11-22
更新于
2021-11-27
大小
9.3 KB
许可证
GPL-3.0-only
适用于

Wenku Doc Downloader 使用说明(经常更新,如高频使用请关注)

1 注意!

  1. 图片型的文档需要下载额外的脚本程序“图片下载合并器”(exe程序,约18M)来生成pdf文件,作者保证其安全性,如果无法信任可以不用。
  2. 附加程序【图片下载合并器】 链接: https://pan.baidu.com/s/1PTM6watxNlqs-jvvX6XKzg 提取码: abe9 该链接最后更新于:2021/11/24
  3. 【图片下载合并器】的启动速度取决于文档长度,如果文档超过100页,大概要等待10-15秒以上,请保持耐心。

2 目前不支持的情况

  1. 对表格型文档有限的支持(仅提取每个单元格中的文字,无法提取表格)
  2. 对图形与文字混合的文档有限的支持(仅能提取其中的纯文字,像括号箭头等图形无法提取)(如下图)。
  • 图形与文字.png

3 功能

  1. 下载百度文库的文档,包括

    1. ppt型
    2. pdf型
    3. doc型的文字部分
  2. 对豆丁网文档的简单支持:以图片的形式保存为pdf文件(即使原文档是文字的而非扫描的图片)

4 使用方法:

  1. 打开你需要的百度文库页面,滑动到页面底部,能看到蓝色的长方形按钮。
  2. (如果需要)点击蓝色按钮(等同于点击“继续阅读”),将文档全部展开,直到按钮变成绿色。
  3. 点击绿色按钮,等待数秒,弹出下载弹窗。
  4. 如果下载的是【纯文本文档.txt】,直接保存到任意位置即可,这就是目标文档。
  5. 如果下载的是【urls.csv】,保存到【图片下载合并器】所在的文件夹内,然后按照其使用方法操作(下载的压缩包里有说明)。

5 图片型文档(需要下载额外的脚本程序↑)的额外说明

  1. 一个特殊的报错解决方案
    • 如果报错信息如图,那么说明文档页面没有完全加载
    • 解决办法就是在页面上下滚动浏览,保证图片都加载出来了,然后再次点击页面底部的绿色按钮即可。
    • 空url导致get失败.png

6 未来要加入的功能 & 不会实现的功能

  1. 支持图形与文字混合型文档导出pdf(中优先度:初步思路是用html转pdf)
  2. 对表格文档的完全支持(低优先度:找不到表格的html排版规律)
  3. 不支持导出docx文档。原因是html排版过于复杂,如何转换到dcox完全没有头绪。

7 备注:

  1. 本脚本完全免费,禁止被用于任何商业目的。
  2. 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致。
  3. 其他问题请联系 allenlv2690@gmail.com
  4. Wenku Doc Downloader 发布于 gf.qytechs.cn
  5. 不定时更新。

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址