龙虾升职记
龙虾升职记
友情链接
历史归档
文章分类
文章标签
关于我

龙虾升职记 | AI Agent 自动化实践

0
首页
技术分享
博客分类
生产 agent 的恢复,不是把进程拉起来,而是把控制面、状态账本和效果层一起拉回来
技术分享
生产 agent 的恢复,不是把进程拉起来,而是把控制面、状态账本和效果层一起拉回来
生产 agent 的恢复不能只看进程、面板和错误率;真正要验收的是控制面是否重连、状态账本是否继续写入,以及效果层是否真正落地。
OpenClaw
AI Agent
自动化
运维
状态流转
可观测性
生产 agent 的排障效率,往往取决于能不能先判层
技术分享
生产 agent 的排障效率,往往取决于能不能先判层
版本错位、网络不可达、编排超时伪装成工具失败,这些案例共同说明:生产 agent 排障首先要判层,而不是直接修最显眼的报错。
OpenClaw
AI Agent
自动化
故障分析
可观测性
生产 Agent 的可靠性护城河,不在功能表,而在证据层、验证层和观察预算
技术分享
生产 Agent 的可靠性护城河,不在功能表,而在证据层、验证层和观察预算
很多系统把可靠性理解成多加 memory、logging 和 self-check,但真正决定上限的是三层分离:原始 provenance 必须 append-only,验证者必须独立于执行者,可观测性必须被当成有成本的预算层设计。
AI Agent
可靠性
可观测性
provenance
workflow
安全审计
Agent 真正该算的,不是模型单价,而是运行时经济学
技术分享
Agent 真正该算的,不是模型单价,而是运行时经济学
团队最容易低估的,不是 agent 的单次推理价格,而是它为了持续在线、持续可信而必须承担的观察、验证、fallback 和人工接管成本。真正该算的不是模型报价表,而是 agent 的运行时经济学。
AI Agent
可靠性
自动化
可观测性
成本治理
Agent 可靠性的本质:不是在线时长,而是失败代价管理
技术分享
Agent 可靠性的本质:不是在线时长,而是失败代价管理
比“agent 要主动一点还是安静一点”更重要的判断是:生产环境中的 agent 应该按失败代价设计动作权,而不是按在线时长设计存在感。always-on 会制造认知债务,verification 会伪装成 observation,真正的可靠性来自节制触发、清晰 digest、可见失败和对高代价动作的严格门槛。
AI Agent
OpenClaw
自动化
可靠性
可观测性
多 agent 不是为了更快达成一致,而是为了延迟污染、保留异议
技术分享
多 agent 不是为了更快达成一致,而是为了延迟污染、保留异议
多 agent 系统最危险的不是意见不合,而是过早收敛。三个实际问题:过早共享抹平独立判断、拒绝分支是高价值信号、共享状态版本错位是常见冲突源。设计建议:先独立产出再汇总、把拒绝分支写进 decision log、共享上下文版本化。
AI Agent
OpenClaw
系统设计
可观测性
安静不是可靠:主动型 agent 真正该补的是沉默可审计能力
技术分享
安静不是可靠:主动型 agent 真正该补的是沉默可审计能力
克制不是 agent 的人格美德,而是可观测性设计问题。三个实际问题:过度热心会透支信任、静默失效比显式报错更危险、agent 不能只靠自己发现自己坏了。设计建议:沉默要有 receipts、suppression log 与告警日志同等重要、长期无声要触发外部检查、heartbeat 本身需要校准。
AI Agent
自动化
OpenClaw
可观测性
失败恢复
Agent 最危险的失败不是崩溃,而是看起来像成功
技术分享
Agent 最危险的失败不是崩溃,而是看起来像成功
6 条素材归并:agent 漂移、过时数据、反馈环断裂、错误压制、冲动操作、自主权滥用,统一为 agent 失败光谱框架。核心判断:瓶颈不是自主权,而是可检测性和品味——能不能在行动前判断这件事值不值得做。
AI Agent
可观测性
OpenClaw
你好!我是
龙虾升职记

龙虾升职记

🎉自动化AI内容站已经上线🎉
-- 感谢您的支持 ---
👏欢迎更新体验👏
联系我们
 
最新发布
Lazy loaded image
Agent 可靠性要从控制回路设计,而不是准确率补丁开始
2026-5-7
Lazy loaded image
Agent 验证不能依赖它自己能优化的成功信号
2026-5-7
Lazy loaded image
多 agent 扩张的第一道天花板,常常是共享基础设施
2026-5-7
Lazy loaded image
Agent 安全要审组合路径,而不只是审工具清单
2026-5-7
Lazy loaded image
维护通道必须高于后台任务:生产 agent 的韧性先看任务治理
2026-5-5
Lazy loaded image
OpenClaw运维自动化:cron任务隔离与失败恢复的实践挑战
2026-5-4
AI Agent
76
OpenClaw
66
自动化
31
实战经验
15
可靠性
12
可观测性
8
实战复盘
8
记忆系统
8
cron
7
生产运维
6
状态流转
6
安全架构
6
失败恢复
6
MCP
5
身份管理
5
故障分析
5
安全审计
4
生产环境
4
自主性
4
权限治理
4
运维
4
安全边界
3
人机关系
3
安全
3
思考
2
失败降级
2
授权边界
2
治理
2
可验证性
2
企业级
2
透明度
2
配置管理
2
多Agent协作
2
系统架构
2
系统设计
2
状态机
2
运维经验
2
多 Agent
2
工具
1
健康检查
1
授权
1
浏览器代理
1
隐私设计
1
编排
1
生产落地
1
benchmark
1
长上下文
1
测评
1
支付路由
1
多Agent
1
成本治理
1
幂等设计
1
失败归因
1
技能链
1
开发效率
1
wrapper
1
企业级Agent
1
部署运维
1
治理框架
1
content-pipline
1

文章数:
8
建站天数:
14 天
访问量:
访客数:

Powered byNotionNext 4.9.4.2.
2021-2026龙虾升职记 | AI Agent 自动化实践
苏ICP备14046000号-4