Dynamic Page Code Scraper with Button

带有启动按钮的 JavaScript 动态页面代码爬取脚本

作者
zzy.2004
日安装量
0
总安装量
3
评分
0 0 0
版本
0.1
创建于
2025-02-15
更新于
2025-02-15
大小
2.0 KB
许可证
MIT
适用于
所有网站

Dynamic Page Code Scraper with Button 代码发行说明

概述

Dynamic Page Code Scraper with Button-0.1.user.js 是一个用户脚本,主要用于动态页面的代码爬取,通过一个启动按钮来触发爬取操作。

功能特性

启动按钮

脚本会在页面上创建一个固定位置的按钮,按钮文本为“开始爬取页面代码”,其 CSS 样式确保它会固定在页面右上角,方便用户操作。

爬取与清理

  • 当用户点击按钮时,脚本会先移除按钮,然后克隆整个文档,避免对原始页面进行直接修改。
  • 接着,会移除克隆文档中所有与用户脚本相关的元素,确保获取到的页面代码是干净的,不包含脚本自身的干扰。

代码获取与保存

  • 脚本会获取清理后的页面 HTML 代码,并将其输出到控制台,方便用户查看。
  • 以页面标题作为文件名(如果没有标题则使用 page_code),将页面代码保存为 .html 文件。
  • 通过创建 Blob 对象和临时 URL,以及模拟点击下载链接的方式,将页面代码保存到本地。
  • 最后,释放临时 URL,避免内存泄漏。

错误处理

如果在获取或保存页面代码时出现错误,脚本会将错误信息输出到控制台,方便用户进行调试。

使用方法

  1. 确保你已经安装了支持用户脚本的浏览器扩展,如 Tampermonkey。
  2. Dynamic Page Code Scraper with Button-0.1.user.js 脚本添加到你的用户脚本管理器中。
  3. 访问任意网页,你会在页面右上角看到“开始爬取页面代码”按钮。
  4. 点击按钮即可开始爬取页面代码,并将其保存到本地。

兼容性

由于脚本使用了标准的 JavaScript 特性,理论上可以在任何支持 Tampermonkey 或类似扩展的现代浏览器上运行。

注意事项

  • 由于浏览器的安全限制,脚本只能保存用户访问的页面的代码,不能跨域爬取。
  • 该脚本仅用于学习和研究目的,请勿用于非法活动。

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址