通义千问OCR内容替换

为通义千问添加OCR识别结果替换和恢复功能

当前为 2025-08-14 提交的版本,查看 最新版本

作者
caiping Peng
评分
0 0 0
版本
1.0
创建于
2025-08-14
更新于
2025-08-14
大小
13.4 KB
许可证
暂无
适用于

通义千问OCR并格式化到飞书能识别的markdown文本脚本

📖 脚本简介

这个脚本为通义千问(Tongyi Qianwen)添加了便捷的OCR识别结果替换和恢复功能,让你可以轻松地将AI回答内容替换为OCR识别的文本,并主动写入剪贴板,在飞书粘贴即可完美解决飞书markdown和原生markdown有一些不太支持的地方

✨ 主要功能

  • 🔄 一键替换: 将AI回答内容替换为剪贴板中的OCR识别结果
  • 📋 智能解析: 自动解析JSON格式的OCR结果,提取识别文本
  • 📐 数学公式优化: 自动格式化数学公式,确保LaTeX语法正确显示
  • ⚡ 恢复原文: 一键恢复到替换前的原始AI回答内容
  • 🎨 可视化编辑: 替换后的内容支持直接编辑修改
  • 🔍 实时监听: 自动为新出现的AI回答添加功能按钮

🚀 使用方法

安装步骤

  1. 安装 TampermonkeyGreasemonkey 浏览器扩展
  2. 点击本脚本的"安装"按钮
  3. 在弹出的安装页面中确认安装

操作指南

  1. 准备OCR内容:

    • 使用任意OCR工具识别图片中的文字
    • 将识别结果复制到剪贴板
    • 支持纯文本或JSON格式的OCR结果
  2. 替换AI回答:

    • 在通义千问的对话页面找到想要替换的AI回答
    • 点击回答下方的蓝色"替换"按钮
    • 脚本会自动获取剪贴板内容并替换AI回答
  3. 编辑和调整:

    • 替换后的内容自动进入编辑模式
    • 可以直接修改文本内容
    • 数学公式会被自动格式化
  4. 恢复原文:

    • 如需恢复到原始AI回答,点击灰色"恢复"按钮
    • 原始内容会被完整恢复,包括格式和样式

📝 支持的OCR格式

纯文本格式

这是识别出的文字内容...
包含数学公式: $x^2 + y^2 = r^2$

JSON格式

{
  "识别结果": "这是识别出的文字内容..."
}

🔧 技术特性

  • 智能公式处理: 自动识别并格式化 $...$$$...$$ 数学公式
  • 防重复加载: 避免重复添加按钮,确保页面整洁
  • 内存优化: 使用WeakMap存储原始内容,避免内存泄漏
  • 实时响应: 监听DOM变化,为动态加载的内容自动添加功能
  • 错误处理: 完善的异常处理机制,确保脚本稳定运行

🎯 适用场景

  • 学术研究: 将纸质文献的OCR结果与AI分析结合
  • 作业辅导: 快速将题目图片转换为可编辑的文本格式
  • 文档整理: 将扫描文档内容与AI处理结果对比编辑
  • 多语言处理: 结合OCR和AI翻译功能进行文本处理

⚠️ 使用说明

  • 脚本需要剪贴板读写权限,首次使用时浏览器会询问授权
  • 仅在 tongyi.aliyun.com 域名下生效
  • 替换操作会触发原有的复制按钮功能
  • 恢复功能仅在当前会话中有效,刷新页面后无法恢复

🔄 更新日志

v1.0 (2024-12-XX)

  • 🎉 首次发布
  • ✅ 基础替换和恢复功能
  • ✅ OCR结果智能解析
  • ✅ 数学公式自动格式化
  • ✅ 实时DOM监听

🙋‍♂️ 反馈与支持

如果您在使用过程中遇到任何问题或有改进建议,欢迎通过以下方式联系:

  • 在 Greasy Fork镜像 页面留言反馈
  • 提交使用中发现的bug或功能建议
  • 分享您的使用心得和技巧

📄 许可协议

本脚本采用开源许可,欢迎学习、使用和改进。


让OCR与AI完美结合,提升您的工作效率!

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址