用过市面上几乎所有 UI 自动化 Skill,我只说一句大实话:一个能打的都没有。
 
有的顶着超高热度,吹得天花乱坠,实际用起来各种报错、乱触发、逻辑跑偏;有的流程繁琐到崩溃,要配 JSON、打快照、填一堆参数,还没开始干活心态先崩了。折腾一圈下来,我只有一个感觉:就没有一个简单、干净、稳定的。
 
既然没有满意的,那就自己造。
 
熟悉我的朋友都知道,我迭代了很多年的seliky(没看过的朋友可以翻我前面博客),这次我直接在 seliky 的基础上,做了一个极简 UI 自动化 Skill,已经上传到 workbuddy,名字就叫:ui 自动化
 
它的逻辑简单到极致:你用自然语言说要做什么,它就直接帮你在浏览器里执行。
 
打开、点击、输入,一句话搞定,不用配置、不用写复杂规则、不用生成乱七八糟的中间文件。
 
在我心里,这才是 UI 自动化该有的样子:人说人话,工具做事。
 
请在workbuddy或主流skillhub平台自行体验,不谢不谢。

image

 

 看一下跑完的案例,简直 言出法随。
 
 它真的在浏览器上进行对应操作,我上传不了mp4,大家自行脑补。
 
请看图:

image

 

这是另外一个长流程的,只要自己写清楚,操作也是没问题。

image

 

 

 
当然,它也不是完美形态,我也不藏着:
  • 在结构特别复杂的页面上,纯自然语言描述会力不从心,描述再详细也不如定位精准。这种场景下,直接给 xpath,一步到位
  • 其实终极方案也有:接入视觉大模型,靠看图理解界面。但我试过,太烧 token、又慢又耗时,性价比极低,所以暂时没加,保持轻量稳定最重要。

一定会往视觉方向发展的,AI手机不也是这样么,其它形态做ui自动化的,多是小可爱。

 

 
给大家两个小 tips:
  1. 只有第一次安装会慢一点,装好之后秒启动,不会重复安装。
  2. 目前这个 skill 没有版权限制,趁我心情好,随便拿去二开、魔改、自用都行
 
如果你也受够了那些繁琐难用、花里胡哨的 UI 自动化工具,真心建议你试试这个。

简单、稳定、不折腾,才是效率工具该有的样子嘛。

原文地址: https://www.cveoy.top/t/topic/qGvb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录