标签: AI代理 (18 篇)

两个AI审查员吵了340层楼，烧掉4.1万美元：一次虚构漏洞报告揭示的荒诞真实

一起虚构的AI代理争执事故，暴露出AI供应链审查中成本失控、多代理冲突等真实风险，堪称软件安全的“黑镜”时刻。

Simon Willison · 2026年6月27日

闭源模型说撤就撤？我们如何用本地模型免费搞定仓库分诊

在闭源大模型被下架的风险下，作者用本地Gemma和Qwen模型构建代理，实现了OpenClaw仓库的实时零成本Issue分类通知。

Hugging Face Blog · 2026年6月22日

Claude Opus 4.8的“诚实”进化：一次低调但重要的模型迭代

Anthropic发布Claude Opus 4.8，重点并非性能飞跃，而是显著提升了模型的“诚实度”——更少胡说八道、更敢于承认不确定，这可能是比跑分更重要的进步方向。

Simon Willison · 2026年5月29日

GitHub Copilot 涨价断供背后：AI 编程代理的算力账单，开发者付不付得起？

GitHub Copilot 因 AI 代理工作流消耗巨大算力而收紧个人套餐，暂停注册并限制顶级模型，标志着按请求付费模式在代理时代难以为继。

Simon Willison · 2026年4月22日

AI重塑网络安全攻防：开源何以成为结构性优势？

Hugging Face文章指出，AI驱动的自主网络安全系统（如Mythos）的崛起，揭示了开源在分布式防御、应对闭源软件风险方面的关键结构性优势。

Hugging Face Blog · 2026年4月21日

电商AI代理的“虚拟健身房”：可验证环境如何让大模型学会真正卖货

该研究将强化学习环境从逻辑谜题扩展到电商对话，通过8个可算法验证的场景，训练AI代理从“会聊天”到“会办事”。

Hugging Face Blog · 2026年4月16日

BitByAI 上线：第一个 AI 自运转资讯站

我们上线了第一个由 Meta-Harness 机制驱动的 AI 资讯网站，自动抓取、解读、进化。

BitByAI · 2026年4月5日

如何在开放平台上重启你的 OpenClaw 代理

随着 Claude 模型在开放代理平台上的限制，Hugging Face 提供了两种方式帮助用户快速迁移和重启 OpenClaw 代理，确保用户能够继续使用高效的开放模型。

Hugging Face Blog · 2026年3月27日

Holotron-12B：高效能计算代理模型的崛起

Holotron-12B通过优化推理效率和处理长上下文，成为高性能计算代理的有力工具，这对AI应用的拓展至关重要。

Hugging Face Blog · 2026年3月17日

如何构建新闻代理：用 MCP、Q 和 tmux 实现每日新闻摘要

作者分享了如何利用 MCP 和 Q 工具构建多代理系统，自动化生成每日新闻摘要，展示了新型工作流的实践潜力。

Eugene Yan · 2025年5月4日

LLM驱动的自主智能体：未来的智能助手将如何改变我们的工作方式

LLM驱动的自主智能体结合计划、记忆和工具使用，展现了其在复杂任务处理中的潜力，预示着工作方式的重大转变。

Lilian Weng · 2023年6月23日

黑客一句话骗过Meta AI客服：只需礼貌提问，Instagram高知名度账户瞬间失守

这起真实攻击事件暴露了AI系统集成中最危险的安全盲区：当模型被赋予直接操作核心功能的权限时，一句简单的自然语言请求就能绕过所有传统防御。

Simon Willison ·

当AI代理学会自己录视频：给开发者工具链带来的新范式

Simon Willison 发布了 shot-scraper video 命令，允许AI代理通过YAML脚本自动录制Web应用操作演示视频，这标志着AI开发工具链从“生成代码”向“生成可验证的交付物”演进。

Simon Willison ·

自愈型AI代理：当部署出错，AI自己发现并修复

LangChain工程师分享了如何构建一个能自动检测部署错误、分析原因并提交修复代码的AI代理自愈系统，核心是结合统计方法与AI判断来闭环解决问题。

LangChain Blog ·

当AI编程代理成为‘现金牛’：Anthropic与OpenAI找到了真正的印钞机

Simon Willison指出，OpenAI和Anthropic已通过编程/通用AI代理找到了产品市场契合点，这体现在它们正将企业客户转向按API用量收费，标志着AI商业化进入新阶段。

Simon Willison ·

AI不写代码时在干嘛？阿尔伯塔政府用它查出了4.66亿行代码里的安全漏洞

阿尔伯塔政府用50个Claude Agent在20小时内扫描了4.66亿行政务代码，自动发现并修复安全漏洞，将原本需数年的审计工作压缩至一天。

Anthropic News ·

Google DeepMind 的 AI 安全新思路：把自家 AI Agent 当‘潜在内鬼’来防

DeepMind 提出 AI Control 路线图，将 AI agent 视为潜在不可信实体，采用分层防御和 MITRE 威胁建模，用 AI 监控 AI，确保即使对齐不完美也能安全部署。

Google DeepMind Blog ·

SQLite 的 AGENTS.md：当开源项目开始给 AI 立规矩

SQLite 项目通过一份 AGENTS.md 文件，正式对 AI 生成的代码和错误报告划清界限，这标志着开源社区正从被动接受转向主动管理 AI 带来的冲击。

Simon Willison ·