知乎备份剪藏

将你喜欢的知乎回答/文章/想法保存为 markdown / zip / png

当前为 2024-02-04 提交的版本,查看 最新版本

您需要先安装一个扩展,例如 篡改猴Greasemonkey暴力猴,之后才能安装此脚本。

You will need to install an extension such as Tampermonkey to install this script.

您需要先安装一个扩展,例如 篡改猴暴力猴,之后才能安装此脚本。

您需要先安装一个扩展,例如 篡改猴Userscripts ,之后才能安装此脚本。

您需要先安装一款用户脚本管理器扩展,例如 Tampermonkey,才能安装此脚本。

您需要先安装用户脚本管理器扩展后才能安装此脚本。

(我已经安装了用户脚本管理器,让我安装!)

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

(我已经安装了用户样式管理器,让我安装!)

作者
qtqz
评分
0 0 0
版本
0.7.4
创建于
2024-02-04
更新于
2024-02-04
大小
207.3 KB
许可证
MIT
适用于

源代码:https://github.com/qtqz/zhihu-backup-collect 修改自:知乎下载器

在这个互联网没有记忆的时代,帮你保存知乎上珍贵的内容,方便日后查阅。

  • 一键复制知乎文章/回答/想法为Markdown
  • 下载文章/回答/想法为zip(包含图片与文本,以及赞数时间等信息)
  • 剪藏文章/回答/想法为图片
  • 可选添加保存备注
  • 可选保存当前页评论

注:此项目爬蟲,仅用于用户日常保存喜欢的内容。请尊重内容作者权利,切勿用于洗稿、抄袭。

已支持的页面有关注页,个人主页,回答页,问题页,文章页,想法页,收藏夹页;已支持的内容有文章/回答/想法。

此项目基于github.com/Howardzhangdqs/zhihu-copy-as-markdown(MIT)开发而来,感谢原作者的探索。原作者实现了Markdown相关和zip下载,我进行优化并适配各种场景和内容类型,添加存图、备注和评论支持。

Usage

安装油猴脚本:https://greasyfork.org/zh-CN/scripts/(未进行全面测试,可能存在bug)

鼠标移到知乎内容上,会出现保存按钮,点击即可保存(到下载目录)。具体功能解释:

  • 复制Markdown:复制到剪贴板,语法见Markdown Reference
  • 下载zip:将内容的图片、Markdown文本、信息(赞数、时间等)、当前页评论(如果启用)保存为zip,文件名格式标题_作者_日期_备注.zip
  • 剪藏图片:将当前内容(和评论)截为PNG图片,会自动隐藏你的头像以保护隐私。
  • 备注:备注会保存在文件名末尾,最长16字符,空格会转义为“-”,不能包含\ / : * ? " < > |
  • 保存评论:执行以上操作时包含当前显示的评论,只能保存内容下方的(弹出式窗口的评论不能),存到zip还未解析为Markdown,凑合用。

可能的问题:

  • 能不能保存更多评论?不能
  • 能否添加保存PDF功能?因实现过于复杂臃肿,暂不添加,可以右键-->打印-->打印为PDF
  • 能否批量保存某答主/问题?不能,请找爬蟲
  • 已知问题:保存图片时部分样式(点赞栏等)轻微异常
  • 已知问题:未适配带视频的内容
  • 已知问题:按钮与专栏文章的目录重叠

其他推荐:SingleFile,浏览器扩展,扩展商店自寻,可以将网页的全部或部分保存为html单文件。

原理

  1. 获取页面中所有的富文本框 RichTextDOM
  2. DOM 使用 ./src/lexer.ts 转换为 Lex
  3. Lex 使用 ./src/parser.ts 转换为 Markdown
  4. 根据每个 DOM 获取标题等信息

TODO

  • [ ] 下载文章时同时包含头图
  • [ ] TOC解析
  • [ ] Markdown纯文本转义
  • [ ] 解析当前页评论为Markdown
  • [ ] 为Markdown添加frontmatter
  • [ ] 快捷键支持

更新日志

 * 
 * 24.1.19(0.7.4):
 *     截图适配专栏
 * 
 * 24.1.13(0.7.x):
 *     粗略解析评论并添加到zip
 *     修复大量bug
 *     准备发布
 * 
 * 24.1.13(0.6.x):
 *     适配想法中的复杂情形
 * 
 * 24.1.11(0.5.x):
 *     添加截图功能
 *     初步适配想法
 * 
 * 24.1.2(0.4.x):
 *     初步重制
 * 
 * 23.12.29:
 *     立项