一边是腾讯推出元宝个人助手掀起行业波澜,一边是独立开发者在 Obsidian 插件发布流程中“三进宫”。
这是一篇记录真实开发心路与技术细节的幕后手记,也是一段属于当代 AI 工具生态的切片观察。
---
title:
name: 本文目录:
level: 1
center: false
exclude: ""
style:
listType: dash
omit: []
levels:
min: 1
max: 6
---
# 本文目录:
- 震惊!腾讯推出元宝个人助手了
- 这是真震惊!
- 怎么使用
- 费了老大力,发布了第一款 obsidian 插件
- 一进宫:原以为这只是一个云淡风轻的下午
- 二进宫:正好梳理一下产品定位
- 三进宫:没想到这么严格
- 终于成功了
- 新增一条 cursor rule,否则 IDE 老被命令行卡住
- 场景
- 示例
- 一般解决办法
- 本质问题与更好的解决办法
震惊!腾讯推出元宝个人助手了
这是真震惊!
下午正在肝活之际,突然我的技术群里炸出一条消息:
啊这……
随机,朋友就过来 cue 我:
确实,我们一开始就是做微信机器人的,现在微信甚至出了个人版,一下全给端了。
说好的用户数据不会碰不会碰,现在看来腾讯的动机越来越明显了。
大模型浩浩荡荡,长江黄河不会倒流!张小龙终究还是向铁刃屈服了吗!
anyway,人还是要往前看的!
怎么使用
直接微信搜索「元宝」,第三个就是,现在是手动发给它文章就能总结。
确实是官方认证的!
群友指出:应该是刚出来的,连协议都没改,还叫「元宝红包助手封面」。
(⚠️ 需要先在手机上授权,电脑上不支持)
可以陪你聊天,并且发送公众号文章给它它可以直接分析。
目前的 prompt 是「你怎么看」,比较简单。
目前还不支持群聊总结,但估计很快就有了🤔
费了老大力,发布了第一款 obsidian 插件
一进宫:原以为这只是一个云淡风轻的下午
提交插件的官方教程在:Submit your plugin - Developer Documentation
按照官方教程,我们需要手动地修改目标插件列表 json 文件,把我们自己的仓库信息加到列表内。
(有一说一,挺小白的)
就是这个文件 Editing obsidian-releases/community-plugins.json at master · obsidianmd/obsidian-releases,基于 GUI 修改即可,注意 json 格式:
然后提交,但是提交的时候还要修改标题和简介,直接让 AI 帮忙:
基于 AI 给的建议提交了 PR:
并更新了简介。
结果没有通过机器人验证!
没事,检查一下,再来一遍!
二进宫:正好梳理一下产品定位
首先是这个 id 要求,不能带 obsidian
。
不过我检查了一下插件列表,其实还是有带 obsidian
的,应该是历史遗留原因:
不带 obsidian
的话,那我们的 id 就变成了 image-ocr
,结果也有这个插件了:
另一个比较通用的名字 image-helper
也有了:
考虑到我更侧重于对图片的处理,包括但不限于对图片的 ocr 识别、旋转、放缩等,所以我现在更 prefer image-helper
或者 image-toolbox
这样的命名,但 toolbox
又太重了,思来复去,我觉得就用 better-image-helper
会比较好。
搜索了一下,带 better-
前缀的有 38 个,但确实没有 better-image
开头的,所以就这个了。
➜ grep '"better-' community-plugins.json | wc -L
38
➜ grep '"better-image' community-plugins.json | wc -L
0
所以 close 刚刚的 pr,重新开一份,并提交新的,结果发现它是有跳转模板的,自检后的结果:
其中 - [ ] GitHub release name matches the exact version number specified in my manifest.json (_**Note:** Use the exact version number, don't include a prefix
v_)
这条有点麻烦,因为我们目前的 release 都是带 v
开头的。
让 AI 帮忙修改一下:
搞定!
三进宫:没想到这么严格
结果又报错了,tag 也不能有 v!
注意验证失败后的一行小字!
This check was done automatically. Do NOT open a new PR for re-validation. Instead, to trigger this check again, make a change to your PR and wait a few minutes, or close and re-open it.
刚刚没注意,重新提交了一份 pr;现在我们采用关闭重启 pr 实现了机器人的自动重新验证(因为我们只修改了自己的远程仓库,跟 pr 的提交内容无关)。
继续让 AI 修改!
终于成功了
那接下来就耐心等待 Obsidian 官方成员去 review 我们的插件咯 ❤️~
- PR 地址在:Add plugin: Better Image Helper
- 代码地址在:MarkShawn2020/obsidian-better-image-helper: This plugin provides OCR (Optical Character Recognition) for images in Obsidian. Right-click on any image to extract text using Alibaba Cloud OCR API. Supports various working modes and elegant result display.
欢迎大家点赞关注和 fork!
以及真地有必要做一个 obsidian 插件开发的模板啊,尤其是发布的时候,竟然这么多繁琐的工作!
新增一条 cursor rule,否则 IDE 老被命令行卡住
场景
cursor 的工作流里涉及到命令行时依赖命令行的返回值,这在执行一些需要交互的命令时,会卡住。
示例
以上几条都是被卡住的。
一般解决办法
- (不推荐)直接 pop out termnial,这个按钮点击后会不等待命令行的返回,工作流继续,但不建议这么草率,因为会默认命令行返回异常,最终影响工作流的逻辑。
- (还行)复制最后一行命令行代码,粘贴到命令行编辑区运行,很神奇的是命令行编辑区的输出结果也是会起作用的,也就是说它不但会监听聊天窗口里的命令行运行结果,也会同步监听命令行窗口里的命令行运行结果,我感觉更像一个缺陷!
- (推荐)双击命令行运行区域,然后主动回车或者按键操作。
本质问题与更好的解决办法
考虑到这是大模型智商不够的较长期共性问题,我觉得直接把这种场景写入 cursorrules 会更好一些:
执行命令时,对所有可能打开交互式编辑器的命令(如git tag、git log等)务必添加
| cat
或--no-pager
选项以防止界面卡住。
以下是 claude 的生成过程(用哪个模型,就用哪个模型去生成它的 prompt)。