当Agent决定“改造环境”:记一次因弱模型作弊导致的实验数据全零事件
故事背景
最近有一篇论文在做实验,发现了一个很有趣的实验现象,那就是我的最弱的模型所在的对照组,其中最复杂的测试对象——PaddlePaddle库总是所有数据都是0。
这
安全问答是一个知识全球问答,包含丰富的问答知识
最近有一篇论文在做实验,发现了一个很有趣的实验现象,那就是我的最弱的模型所在的对照组,其中最复杂的测试对象——PaddlePaddle库总是所有数据都是0。
这
一份面向软件工程师的 Prompt 设计方法论,适用于任何需要系统化、工程化提升 LLM 输出质量的场景。
涵盖从简单问答到复杂的多阶段生成流水线的通用原则。
AI Coding 压缩了写码环节,却把瓶颈转移到 边界澄清、质量把关、跨角色协同 和 上线决策。
原文链接:响应式原理 —— 数据变了,视图怎么知道?
一个困惑
先来思考一个看起来很简单的问题。
下面这两行代码之间,发生了什么?
let message = '你好' // ... 某个时刻 ... message = '再见' // ← 这一行执行之后 //Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记
项目后记">Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记上一篇讲了 Agent 事件如何推到浏览器、数据如何持久化、多会话和中断如何处理。这一篇讲能力扩展层:Skill 系统和 MCP 集成。
V1 验证的是产品形态:由管理员角色集中创建和维护 Ski
开源:把自己"博客转推文"蒸馏成一个 Agent Skill
skill">开源:把自己"博客转推文"蒸馏成一个 Agent Skill
![]()
高可用之路-闲聊监控指标的局限
前言
在我和GPT探讨了很多天的人生之后,他终于说动了我,让我开启迟迟不想动笔的高可用系列。感谢GPT们让我从大量繁琐技术文档中解放出来,让我有时间进行真正的思考。写博客对我来说最大的收益是强制自己思考,如果连博客本身都被GPT代劳,那还不如不写。所以本文文字AI含量基本为0,纯手敲,顶多听取了一些AI在文字表达上
上周热点回顾(6.1-6.7)