ServiceNow发布企业级AI智能体评测新基准
大语言模型正从“聊天助手”迈向能自主执行专业任务的AI智能体,但在真实企业环境中落地仍面临巨大挑战——现有评测基准大多基于简单对话或短序列任务,难以反映企业场景特有的复杂性:比如跨多...
让确定性工作回归确定性:AI开发中的关键原则
在AI驱动的软件开发浪潮中,一个常被忽视却至关重要的工程信条正在回归:把本该确定的工作,真正做成确定的。这不是一句空话——它直指当前“智能代理(Agentic)系统”开发中的核心矛盾:我们...
AI不是给家电贴标签,而是催生真正的新应用
过去我们常听说‘AI将催生全新应用’,但究竟新在何处?作者坦言,自己也曾想象不出具体形态——而现实中的‘智能冰箱’‘智能门铃’‘智能电视’,大多只是在传统设备上叠加语音助手和广告推送...
AI决策必须实时把关吗?快路径与慢路径的博弈
当AI系统越来越“自主”——能独立推理、检索信息甚至执行动作时,一个尖锐问题浮出水面:是否每个决策都必须经过同步审核才能确保安全?直觉上答案似乎是肯定的。但现实正悄然打破这一假设。越...
别再盯着代码看了!程序员最该警惕的思维陷阱
在最近一次与技术作家Tim O'Reilly的对谈中,前Google工程师、知名技术思想家Steve Yegge抛出一个尖锐观点:程序员花太多时间“凝视代码”,却严重忽视了代码背后的**人、场景与问题本质**。他...
大模型落地关键:后训练到底在做什么?
当大模型走出实验室,真正用在客服、医疗或企业知识库中时,光靠预训练远远不够——后训练(Post-Training)才是让AI“听话”“懂行”“守规矩”的关键一步。AMD AI副总裁Sharon Zhou在O'Reilly...
每天300万人用ChatGPT查工资?AI正在填补薪酬信息鸿沟
最新数据显示,美国用户每天向ChatGPT发送近300万条与薪资相关的问题——从“产品经理在纽约的平均年薪是多少?”到“转行做AI工程师需要涨薪多少才合理?”,问题五花八门,但核心诉求高度一致...
AI工程落地难?症结不在技术,而在协作
过去几年,AI技术飞速发展,但真正将AI深度融入日常研发流程的团队仍是少数。O'Reilly最新观察指出:当前AI工程化的最大瓶颈,已不再是工程师的能力或算法水平,而是协作鸿沟——缺乏统一的工作...
AI写代码时代,程序员还需手艺人精神吗?
3月26日,谷歌工程师Addy Osmani与O’Reilly资深编辑将联合举办第三届AI Codecon大会,主题直指当下最尖锐的行业命题:当AI代理已能自动生成函数、调试错误甚至重构整套模块,我们是否还需要坚...
AI成黑产新宠?暗网论坛热议激增
据O'Reilly Radar最新观察,2025年下半年,暗网论坛中“AI代理(AI agent)”一词的提及频次较上半年飙升数倍。这一突变并非偶然——大量犯罪讨论正从传统脚本工具转向AI驱动的自动化攻击方案:...

