Wenku Doc Downloader

下载百度文库文档

目前为 2021-11-22 提交的版本。查看 最新版本

作者
JoyofFire
评分
0 0 0
版本
0.1
创建于
2021-11-22
更新于
2021-11-22
大小
5.5 KB
许可证
GPL-3.0-only
适用于

Wenku Doc Downloader 使用说明

注意!

  1. 图片型的文档需要下载额外的脚本程序(exe程序,约18M)来生成pdf文件,作者保证其安全性,如果无法信任可以不用。
  2. 附加程序【图片下载合并器】 链接: https://pan.baidu.com/s/1SB9vh9jHPEmvGvZkaG_3aA 提取码: 2n7k

使用方法:

  1. 在你的浏览器中安装 tampermonkey(油猴脚本管理器)。
  2. 在 gf.qytechs.cn 中搜索“Wenku Doc Downloader”,安装并启用。
  3. 打开你需要的百度文库页面,滑动到页面底部,能看到蓝色的长方形按钮。
  4. (如果需要)点击蓝色按钮(等同于点击“继续阅读”),将文档全部展开,直到按钮变成绿色。
  5. 点击绿色按钮,等待数秒,弹出下载弹窗。
  6. 如果下载的是 doc文档.txt,直接保存到任意位置即可,这就是目标文档。
  7. 如果下载的是 urls.csv,保存到 所在的文件夹内,然后按照 图片下载合并器 使用方法操作。

常见问题:

  • Q1: 程序运行失败,提示“读取 urls.csv 文件失败”,怎么办?
  • A:

    • 检查是否使用了代理来访问目标页面,如果有请关闭;
    • 下载的 urls.csv 文件的时刻与运行 百度文库.py 的时刻间隔太长(可能超过1小时或更长);
    • urls.csv 文件不存在;
    • urls.csv 编码不为 ASCII (请使用记事本打开 urls.csv 文件->另存为->编码选择ASCII)
  • Q3: 程序运行失败,提示“未知错误,发生在合并图片为PDF阶段。”

  • A: 请检查是否满足运行需求;若满足需求仍出现问题,请联系作者([email protected])。

  • Q2: pdf里面的字不可选中,怎么办?

  • A:

    • 本程序只负责下载文档,如果文字无法选中,说明原文档就是图片;
    • 本程序没有OCR(文字识别)功能,请使用其他OCR程序扫描PDF文档。
    • 建议使用Adobe Acrobat软件来打开pdf,然后使用其中的文字扫描功能来识别文字。

备注:

  1. 本脚本完全免费
  2. 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致。
  3. 其他问题请联系 [email protected]
  4. Wenku Doc Downloader 发布于 gf.qytechs.cn

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址