跳到主要内容

当腾讯出手元宝,我在插件审核三进三出/04-16-当腾讯出手元宝,我在插件审核三进三出

· 阅读需 9 分钟

一边是腾讯推出元宝个人助手掀起行业波澜,一边是独立开发者在 Obsidian 插件发布流程中“三进宫”。

这是一篇记录真实开发心路与技术细节的幕后手记,也是一段属于当代 AI 工具生态的切片观察。

---
title:
name: 本文目录:
level: 1
center: false
exclude: ""
style:
listType: dash
omit: []
levels:
min: 1
max: 6
---

# 本文目录:

- 震惊!腾讯推出元宝个人助手了
- 这是真震惊!
- 怎么使用
- 费了老大力,发布了第一款 obsidian 插件
- 一进宫:原以为这只是一个云淡风轻的下午
- 二进宫:正好梳理一下产品定位
- 三进宫:没想到这么严格
- 终于成功了
- 新增一条 cursor rule,否则 IDE 老被命令行卡住
- 场景
- 示例
- 一般解决办法
- 本质问题与更好的解决办法

震惊!腾讯推出元宝个人助手了

这是真震惊!

下午正在肝活之际,突然我的技术群里炸出一条消息:

image.png

啊这……

随机,朋友就过来 cue 我:

image.png

确实,我们一开始就是做微信机器人的,现在微信甚至出了个人版,一下全给端了。

说好的用户数据不会碰不会碰,现在看来腾讯的动机越来越明显了。

大模型浩浩荡荡,长江黄河不会倒流!张小龙终究还是向铁刃屈服了吗!

anyway,人还是要往前看的!

怎么使用

直接微信搜索「元宝」,第三个就是,现在是手动发给它文章就能总结。

2c9ed7822b4cba7db2317884667cb252.png

确实是官方认证的!

d37df7cf130a9ba476369b42af52b9e4.jpg

群友指出:应该是刚出来的,连协议都没改,还叫「元宝红包助手封面」。

(⚠️ 需要先在手机上授权,电脑上不支持)

49214b6b7f39477633b63268eff5f1d4.jpg

可以陪你聊天,并且发送公众号文章给它它可以直接分析。

29dc06c85e4a83691ed8a942c0e6e5e1.jpg

目前的 prompt 是「你怎么看」,比较简单。

f6995a294ff9f55805aed7298b4a5056.jpg

目前还不支持群聊总结,但估计很快就有了🤔

image.png

费了老大力,发布了第一款 obsidian 插件

一进宫:原以为这只是一个云淡风轻的下午

提交插件的官方教程在:Submit your plugin - Developer Documentation

按照官方教程,我们需要手动地修改目标插件列表 json 文件,把我们自己的仓库信息加到列表内。

(有一说一,挺小白的)

b44f8bde7c65274a7c3ff969a9969e62.png

就是这个文件 Editing obsidian-releases/community-plugins.json at master · obsidianmd/obsidian-releases,基于 GUI 修改即可,注意 json 格式:

a6a7e71a17ffd77b0fb7b0d5d2cd1e6d.png

然后提交,但是提交的时候还要修改标题和简介,直接让 AI 帮忙:

image.png

基于 AI 给的建议提交了 PR:

image.png

并更新了简介。

image.png 结果没有通过机器人验证!

image.png

没事,检查一下,再来一遍!

二进宫:正好梳理一下产品定位

首先是这个 id 要求,不能带 obsidian

不过我检查了一下插件列表,其实还是有带 obsidian 的,应该是历史遗留原因:

image.png

不带 obsidian 的话,那我们的 id 就变成了 image-ocr,结果也有这个插件了:

image.png

另一个比较通用的名字 image-helper 也有了:

image.png

考虑到我更侧重于对图片的处理,包括但不限于对图片的 ocr 识别、旋转、放缩等,所以我现在更 prefer image-helper 或者 image-toolbox 这样的命名,但 toolbox 又太重了,思来复去,我觉得就用 better-image-helper 会比较好。

搜索了一下,带 better- 前缀的有 38 个,但确实没有 better-image 开头的,所以就这个了。

grep '"better-' community-plugins.json | wc -L
38
grep '"better-image' community-plugins.json | wc -L
0

所以 close 刚刚的 pr,重新开一份,并提交新的,结果发现它是有跳转模板的,自检后的结果:

image.png

其中 - [ ] GitHub release name matches the exact version number specified in my manifest.json (_**Note:** Use the exact version number, don't include a prefix v_) 这条有点麻烦,因为我们目前的 release 都是带 v 开头的。

让 AI 帮忙修改一下:

image.png

搞定!

image.png

三进宫:没想到这么严格

结果又报错了,tag 也不能有 v!

image.png

注意验证失败后的一行小字!

This check was done automatically. Do NOT open a new PR for re-validation. Instead, to trigger this check again, make a change to your PR and wait a few minutes, or close and re-open it.

刚刚没注意,重新提交了一份 pr;现在我们采用关闭重启 pr 实现了机器人的自动重新验证(因为我们只修改了自己的远程仓库,跟 pr 的提交内容无关)。

继续让 AI 修改!

image.png

终于成功了

image.png

那接下来就耐心等待 Obsidian 官方成员去 review 我们的插件咯 ❤️~

欢迎大家点赞关注和 fork!

以及真地有必要做一个 obsidian 插件开发的模板啊,尤其是发布的时候,竟然这么多繁琐的工作

新增一条 cursor rule,否则 IDE 老被命令行卡住

场景

cursor 的工作流里涉及到命令行时依赖命令行的返回值,这在执行一些需要交互的命令时,会卡住。

示例

image.png

以上几条都是被卡住的。

一般解决办法

  1. (不推荐)直接 pop out termnial,这个按钮点击后会不等待命令行的返回,工作流继续,但不建议这么草率,因为会默认命令行返回异常,最终影响工作流的逻辑。
  2. (还行)复制最后一行命令行代码,粘贴到命令行编辑区运行,很神奇的是命令行编辑区的输出结果也是会起作用的,也就是说它不但会监听聊天窗口里的命令行运行结果,也会同步监听命令行窗口里的命令行运行结果,我感觉更像一个缺陷!
  3. (推荐)双击命令行运行区域,然后主动回车或者按键操作。

本质问题与更好的解决办法

考虑到这是大模型智商不够的较长期共性问题,我觉得直接把这种场景写入 cursorrules 会更好一些:

执行命令时,对所有可能打开交互式编辑器的命令(如git tag、git log等)务必添加 | cat--no-pager 选项以防止界面卡住。

以下是 claude 的生成过程(用哪个模型,就用哪个模型去生成它的 prompt)。

image.png