跳到主要内容

Obsidian Better Image Helper:让你的图片体验更高效!

· 阅读需 5 分钟

在 Obsidian 写作过程中,图片管理一直是一个痛点。为此,我开发了一个插件:

Obsidian Better Image Helper —— 一个专注于图片体验提升的小助手,正式发布!

目前,插件已经实现了右键图片,一键 OCR 提取文字的功能,并且将持续扩展更多实用特性。


插件简介

Obsidian Better Image Helper 致力于让 Obsidian 中的图片处理变得更高效、更智能。

当前版本提供了图片右键 OCR 文字识别功能,未来将扩展更多围绕图片的增强工具,包括压缩、转格式、智能搜索等。

插件特点:

  • 无需离开 Obsidian,直接在图片上右键即可 OCR
  • 接入高准确率的 OCR 云服务(当前支持阿里云)
  • 极简体验,快速响应
  • 未来版本计划支持更多云厂商(如腾讯云、百度云)及本地 OCR 引擎

开发花絮

这款插件的起点,源于一次简单的念头:

在 Obsidian 中浏览笔记时,常常需要从图片中提取文字,但试用了几个已有插件,总觉得体验不够顺滑。

于是心想,不如自己动手,顺便练练 AI 辅助开发。没想到,这一写就是整整一天,期间踩了无数坑(尤其是阿里云 SDK 的坑)。

最终版本,简单、直接、高效,正是我自己真正想用的样子。


核心功能演示(需要更新)

在 Obsidian 中,找到一张图片,右键,选择「OCR 提取文字」,几秒钟后,文字内容自动提取完成。

适合:

  • 快速整理会议白板照片
  • 扫描纸质笔记、摘录
  • 处理截图中的文字内容

技术挑战与解决方案

开发过程中遇到了不少技术挑战,做了一些关键优化:

1. 编辑模式下的复杂 DOM 事件

Obsidian 的不同模式(编辑、预览、源码)下图片 DOM 结构各异,特别是编辑器内部图片右键拦截处理极为复杂。

为此,我实现了跨模式的统一图片捕捉与事件绑定机制,保证任何状态下都能顺利触发。

2. 云服务 API 调用兼容性

阿里云 OCR 接口官方 SDK 存在 Electron 环境不兼容的问题(如 timer.unref 报错)。

最终采用了自定义封装打包阶段清理不兼容代码的方案,完美兼容 Obsidian 插件环境。

3. 极简用户配置体验

OCR 调用需要 AccessKey,但插件做了精简处理,只需要用户简单填入密钥即可,无需复杂设置。


安装方式

目前正在准备插件市场提交。

在此之前,可以通过以下方式体验:

  1. 下载最新的 Release 包 (链接待补充)
  2. 将解压后的 .obsidian/plugins/obsidian-better-image-helper 文件夹放入你的插件目录
  3. 在 Obsidian 中启用「Obsidian Better Image Helper」

后续会支持通过 Obsidian 插件市场一键安装,敬请期待!


更新计划

  • v0.2(即将上线)
    • 支持多 OCR 引擎选择(阿里云 / 腾讯云)
    • 图片压缩、转码工具集成
    • 智能图片批量重命名
    • OCR 后自动插入到笔记指定位置
  • 未来版本
    • 离线 OCR 支持
    • 图片语义搜索(基于向量检索)
    • 插件内图片管理面板

项目愿景

Obsidian Better Image Helper 不只是一个 OCR 工具,而是一个为 Obsidian 用户量身定制的图片体验提升套件

未来,我希望它成为每一位重度笔记用户的必备插件,让图片不仅仅是「插图」,而是「知识的一部分」。


联系与反馈

插件仍在快速开发中,欢迎任何反馈与建议!

  • 微信公众号:手工川 - AI版
  • GitHub 项目页(即将上线)
  • 或直接在评论区留言交流~

🚀 Obsidian Better Image Helper,让你的 Obsidian 图片体验更上一层楼!