智猩猩AI整理
编辑:没方
如今的AI Agent推理能力已经很强了,能写代码、做规划、甚至聊天吐槽都一套一套。
但想让它操控真实专业软件,比如用Blender渲染3D模型、用GIMP批量处理图片,或是用LibreOffice自动生成报表,就瞬间“傻眼”了。
这不是Agent不够智能,而是当前Agent与软件的“沟通渠道”,全是死胡同。
要么用UI自动化(靠截图、模拟点击),脆弱又易崩,软件版本一更新就失效;要么等软件官方开放API,可大多只能覆盖10%的核心功能,专业操作根本实现不了;更别提从零开发定制化接口,不仅成本高,还都是阉割了核心能力的实现,根本无法投入生产使用。
这就像让一个超级聪明的大脑,却只能用手指戳屏幕去开车,效率低、错误多、根本不靠谱。
而今天要给大家介绍的开源项目 CLI-Anything 彻底改变了游戏规则!它让所有软件都能通过一行命令直接转换为Agent-Native模式,所有的功能可以被AI直接调用。不需要复杂的API封装,更不需要图形界面。所有的龙虾们都可以用最"Agent友好"的方式直接操作软件。该项目仅开源一周,就在github上收获15.8k Stars。


01 项目介绍
CLI-Anything是由香港大学数据智能实验室(HKUDS)开源的Agent插件,仅一行命令就能让任意软件接入 OpenClaw、nanobot、Cursor、Claude Code 等 Agent 框架。

很多人误以为CLI-Anything只是个“命令行生成工具”,但它真正的突破,是让Agent从“只会写代码、点界面”的浅层交互,升级为“像调用函数一样驱动真实软件”的深度执行。
开发者们实打实测了11款专业级软件,每款都生成了完整、可直接投产的CLI接口——不是随便糊弄的Demo,而是100%保留原软件全部核心功能的真实工具接入,不靠模拟点击,全靠底层后端原生调用来驱动一切操作。
CLI-Anything用1508次全绿测试给出铁证,它不是纸上谈兵的概念工具,而是真能让AI Agent深度掌控专业软件。

并且社区十分活跃,一直在疯狂贡献新的软件CLI,让 CLI-Anything 的适配性越来越高、可迁移性极强。
CLI-Anything应用场景覆盖研发、数据、创意、科研、办公等全场景,成为Agent规模化落地的刚需工具。
对于开源开发者而言,无需手动适配,通过CLI-Anything的自动生成能力,就能轻松将任意开源项目,变成Agent可直接可控的工具,相当于给开源项目加了一层“Agent适配buff”,大幅降低项目的落地门槛;
对于算法工程师,不用再手动敲代码调试,通过结构化命令就能驱动模型训练、推理流水线,甚至实现超参搜索的自动化,把更多精力放在模型优化本身,而非重复的操作流程;
数据从业者更是直接受益,以往繁琐的数据处理、可视化、统计分析全流程,现在只需通过编程式命令就能一键串联,告别反复切换工具、手动导出导入的低效操作;
除此之外,研发运维、创意设计、科研等场景,同样能被CLI-Anything彻底盘活。研发运维同学可串联代码编辑、构建、测试、部署全流程,减少人为失误;创意从业者不用再逐个点击软件按钮,编程式控制创作、渲染,批量产出效率拉满;科研人员则能让Agent自动化处理科研工作流、仿真模拟,从重复计算中解放,专注核心创新。
就连日常的会议管理,它也能轻松搞定——通过结构化CLI自动化会议调度、参会人管理,甚至自动获取会议录制、生成会议报告,彻底简化行政流程。
02 使用方法
环境要求:Python(3.10+)、目标软件已安装(如 GIMP、Blender、LibreOffice 或自己的应用)、AI 编程工具(Claude Code 、OpenClaw 、OpenCode、Codex、Qodercli)。
(1)安装
在Claude Code上安装
# 添加 CLI-Anything 插件市场/plugin marketplace add HKUDS/CLI-Anything
# 从市场安装 cli-anything 插件/plugin install cli-anythingClaude Code 通过 bash 执行命令。Windows 下请安装 Git for Windows(包含 bash 和 cygpath) 或使用 WSL,否则可能出现 cygpath: command not found。
一行命令生成 CLI:
# /cli-anything:cli-anything <软件路径或仓库地址># 为 GIMP 生成完整的 CLI(7 个阶段全自动)/cli-anything:cli-anything ./gimp
# 注意:如果你的 Claude Code 版本低于 2.x,请使用 "/cli-anything"。CLI-Anything 会立即启动一套全自动的 7 阶段流水线:
分析 — 扫描源码,将 GUI 操作映射到 API
设计 — 规划命令分组、状态模型、输出格式
实现 — 构建 Click CLI,包含 REPL、JSON 输出、撤销/重做
规划测试 — 生成 TEST.md,涵盖单元测试和端到端测试计划
编写测试 — 实现完整测试套件
文档 — 更新 TEST.md,写入测试结果
发布 — 生成
setup.py,安装到 PATH
初始构建完成后,可以迭代优化 CLI,扩展覆盖面并补充缺失的功能:
# 全面优化 — Agent 分析所有功能的覆盖差距/cli-anything:refine ./gimp
# 定向优化 — 指定特定功能领域/cli-anything:refine ./gimp "我需要更多图像批处理和滤镜相关的 CLI"在OpenClaw上安装
CLI-Anything提供了原生的OpenClaw SKILL.md 文件。请将其复制到OpenClaw 技能目录:
# 克隆仓库git clone https://github.com/HKUDS/CLI-Anything.git
# 安装到全局技能文件mkdir -p ~/.openclaw/skills/cli-anythingcp CLI-Anything/openclaw-skill/SKILL.md ~/.openclaw/skills/cli-anything/SKILL.md构建 CLI:
安装完成后,就可以在 OpenClaw 中直接调用:
@cli-anything build a CLI for ./gimp该技能采用了与Claude Code一致的 7 步构建流程。
OpenCode、Qodercli、 Codex平台的安装请参考:
https://github.com/HKUDS/CLI-Anything/blob/main/README_CN.md
(2)使用生成的 CLI
无论用哪个平台构建,生成的 CLI 使用方式完全一样。
# 安装到 PATHcd gimp/agent-harness && pip install -e .
# 随处可用cli-anything-gimp --helpcli-anything-gimp project new --width 1920 --height 1080 -o poster.jsoncli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
# 进入交互式 REPLcli-anything-gimp(3)使用示例
# 从本地源码为 GIMP 构建完整 CLI/cli-anything /home/user/gimp
# 从 GitHub 仓库构建/cli-anything https://github.com/blender/blender
# 优化已有的 CLI —— 全面差距分析/cli-anything:refine /home/user/gimp
# 带聚焦方向的优化/cli-anything:refine /home/user/shotcut "画中画和视频叠加合成"
# 运行测试并更新 TEST.md/cli-anything:test /home/user/inkscape
# 按照 HARNESS.md 标准验证/cli-anything:validate /home/user/audacity03 从GUI到Agent-Native:软件设计的下一个范式
过去几十年,图形用户界面(GUI)是软件设计的绝对主流。按钮、菜单、拖拽、弹窗……这些精心设计的交互元素,本质上是为了适配人类的认知习惯和肢体操作。
但这一切,对 AI Agent 而言,全是噪音。
Agent 不需要看界面,不需要点按钮,更不需要在层层菜单中寻找功能。它们需要的是结构化、确定性、可编程的指令通道。
CLI-Anything的出现,预示着一个更宏大的趋势:软件生态的重心,正要从“人操作软件”向“Agent 调度软件”转移。
未来的软件架构,可能会默认内置 CLI-Anything 式的接口层。开发者无需再单独为 Agent 做适配,所有软件天生就是为 AI 驱动而设计。
这意味着,我们不再需要手动去教会Agent 如何使用软件,而是软件天生就懂得如何被 AI 调用。
当所有软件都能被Agent一行命令直接驱动,AI就真正具备了落地执行的能力,那么“人类定目标,Agent 做执行”就不再是口号,而是每一个人日常的工作形态。







