标签: 强化学习 (9 篇)

你以为搜索记录是安全的？MosaicLeaks 揭开 AI 研究智能体的“马赛克泄露”危机

深度研究智能体混合调用内外部数据时，其查询日志会拼凑出企业机密；新基准与隐私强化训练法为这一隐患提供了量化标准与解法。

Hugging Face Blog · 2026年6月19日

OpenEnv从单一工具转型为开源智能体强化学习的通用互操作协议，旨在打破闭源实验室的训练壁垒，让任何模型都能无缝对接各类执行环境。

Hugging Face Blog · 2026年6月8日

vLLM 推出原生强化学习 API，通过标准化权重同步和异步训练支持，解决了大模型在线强化学习中框架碎片化和部署脆弱的核心痛点。

vLLM Blog · 2026年5月28日

Hugging Face TRL 库引入差量权重同步技术，通过仅传输模型微小变化（约1-2%），将异步强化学习中的模型同步开销降低两个数量级，使万亿参数模型训练成本大幅下降。

Hugging Face Blog · 2026年5月27日

ServiceNow AI团队在将强化学习训练从vLLM V0迁移到V1时，发现推理引擎的微小差异会导致训练崩溃，通过修复四个关键后端问题恢复了训练稳定性。

Hugging Face Blog · 2026年5月7日

该研究将强化学习环境从逻辑谜题扩展到电商对话，通过8个可算法验证的场景，训练AI代理从“会聊天”到“会办事”。

Hugging Face Blog · 2026年4月16日

系统分析RL中奖励黑客的成因和案例，重点讨论RLHF训练大模型时的奖励黑客问题及缓解方案。

Lil'Log · 2026年4月5日

奖励黑客在强化学习中由于奖励函数的缺陷而引发的挑战，特别是在语言模型中的影响，亟需更多的研究和应对策略。

Lilian Weng · 2024年11月28日

Lilian Weng 的新文章深入探讨了 Transformer 的演变与新特性，揭示了这一重要架构在自然语言处理中的持续影响力。

Lilian Weng · 2023年1月27日