Opus 4.5 is going to change everything

🤖 Assistant

模型能力的质的飞跃：Burke Holland 从最初的完全怀疑转变为相信 Claude Opus 4.5 可以替代开发人员。关键区别在于它的自主性和自我修正能力——能独立发现错误、迭代修复，而不是简单的"复制粘贴"循环。
实际案例证明：
- Windows 图片转换工具：一次性构建，处理从右键菜单集成到 GitHub Actions 发布流程
- 屏幕录制/编辑应用：从简单的 GIF 工具扩展到完整的视频编辑器，包含截图、形状、裁剪、模糊等功能
- AI 发帖工具：包含 Facebook OAuth、Firebase 后端、iOS/Android 应用、云函数等复杂部分
- 订单跟踪路由应用：集成 Gmail、地理计算、路由优化
代码质量观的转变：作者认为当代码由 LLM 维护时，应该为"LLM 而非人类"优化，强调：
- 明确的进入点而非复杂抽象
- 线性控制流而非嵌套逻辑
- 最小化耦合以便重新生成
安全隐忧：作者坦率地承认对代码的 80% 安全信心不足，认为这是当前最大风险。

从 Claude Code 的实际体验（OldGreenYodaGPT）：
- "Skills"体系的威力：创建可复用的技能库来教 AI 企业特定的 UI 库、API 结构
- 自动化流程：自动代码审查、PR 审查、ticket triage
- 关键启示：需要系统性的提示工程和工具链支持，不是简单的"问它一个问题"
心态转变的证据（ryandrake）：
- 前怀疑者通过实际使用改变观点
- 关键体验：在不理解 Kotlin 的情况下，用 Opus 构建了功能完整、无内存泄漏、无性能问题的 Android TV 播放器
- 启示：代码能否工作和开发者的理解深度之间的解耦
工作方式的根本转变（enum）：
- 做了一个 5 小时的项目，本来需要 2 周全职工作
- 关键前提：明确的任务定义和快速的反馈循环
高效模式识别（spaceman_2020）：
- Opus 4.5 区别于早期 AI 编码的地方：错误远少且往往是"粗心"而非根本性的
- 例如忘记 Next.js 的 "use client" 指令，而不是架构设计错误

代码质量陷阱（honeycrispy, tannedNerd）：
- Opus 倾向于过度设计，产生 10 倍复杂的解决方案
- 边界情况处理不足
- 需要大量手工调整和指导
真实工作的差距（dzonga, on_the_train）：
- 讨论的都是简单工具，未见处理真实、混乱的业务逻辑
- 与 Jira ticket 上两年前的遗留系统相比，这些都是"Fibonacci 级别"的简单
成本和可持续性问题：
- 上下文窗口实际远小于声称的（在 50% 时开始退化，80% 时完全不可用）
- Claude Code 上的 $20/月实际消耗远超（估计$ 80+）
安全和可靠性顾虑（losvedir）：
- "如果 AI 能做那么好，为什么 Git 代码审查还在失败？"
- 潜在的"蠕虫"攻击：AI 生成的代码被设计成自我复制
- 无人审查的部署规模化风险