Chrome Auto Browse:AI代理的浏览器革命
在AI技术迅猛发展的当下,Google Chrome浏览器悄然推出了一项实验性功能——Auto Browse。这是一个基于Gemini模型的AI代理,能够自主'冲浪'网页,执行用户指令如查找信息、购物比价甚至预订行程。Ars Technica记者Ryan Whitwam于2026年2月12日发表文章《We let Chrome's Auto Browse agent surf the web for us—here's what happened》,亲身测试了这一功能,结果令人既惊叹又无奈:它能完成令人印象深刻的任务,却也可能'壮烈牺牲'。
Auto Browse并非孤例。早在2023年,Google就通过Project Astra和Gemini扩展了浏览器AI能力。2025年,Chrome Canary版引入了这一代理,允许用户输入自然语言指令,让AI模拟人类浏览行为:点击链接、填写表单、提取数据。这标志着浏览器从被动工具向智能助手的转变,与Anthropic的Claude Computer Use和OpenAI的o1模型类似,AI代理正从聊天转向行动。
测试场景:从简单查询到复杂任务
Whitwam的测试从基础入手。他输入“帮我找一张去巴黎的廉价机票”,Auto Browse迅速打开Kayak网站,筛选日期、比较价格,最终输出一份包含链接和价格的报告。整个过程仅需几分钟,准确率高达90%。在购物测试中,它浏览Amazon和Best Buy,生成一份'最佳无线耳机推荐清单',甚至考虑了用户预算和评论分数。
原文作者感慨:“Auto Browse有时像个熟练的网络侦探,能在层层嵌套的网页中挖掘金矿。”
更复杂任务如“规划周末露营行程,包括装备清单和天气预报”,AI代理展示了多步推理能力:先查天气API,再搜索国家公园预订,最后汇总Excel-like表格。这得益于Gemini 2.0的视觉理解和工具调用能力,能解析动态网页和JavaScript渲染内容。
崩溃时刻:AI的'黑天鹅'事件
然而,光鲜背后是频发的惨败。一次简单指令“查找最新iPhone价格”,Auto Browse陷入无限循环:反复刷新Apple官网,导致浏览器内存暴增至5GB,最终崩溃重启。另一测试中,它误将广告弹窗当作正文,输出荒谬建议如“买这个神奇的减肥药”。隐私测试更令人担忧:指令“查我的银行余额”时,它试图访问未授权页面,触发安全警告。
Whitwam统计:10次测试中,成功6次,部分失败3次,完全崩溃1次。问题根源包括网页变化敏感性(动态布局易迷失)、幻觉(hallucination)生成假链接,以及缺乏鲁棒性(对CAPTCHA或反爬虫无解)。
行业背景:AI代理的崛起与瓶颈
Auto Browse是浏览器AI浪潮的一部分。Microsoft Edge的Copilot已集成类似功能,Safari的Apple Intelligence也在追赶。2025年Gartner报告预测,到2028年,50%的浏览器将内置自主代理,推动'零点击上网'时代。但挑战犹存:数据隐私(AI需访问cookies和历史)、计算成本(本地运行Gemini需高配硬件)和伦理风险(自动化刷单或假新闻传播)。
相比之下,桌面代理如Adept的ACT-1更稳定,但浏览器环境更碎片化。Google的优势在于Chrome 70%市场份额,能快速迭代。
编者按:潜力无限,落地需谨慎
作为AI科技新闻编辑,我认为Auto Browse预示着未来:AI将从'问答机'变'执行者',解放用户双手。但当前不成熟,适合早期采用者而非大众。Google应加强沙盒隔离、用户控制和透明日志。长远看,与Web3和去中心化身份结合,或解决信任问题。期待稳定版Chrome 120,它可能重塑上网范式。
总之,Auto Browse的'惊艳与惨败'折射AI代理双刃剑:创新加速,却需平衡可靠性。开发者与用户共勉。
(本文约1050字)
本文编译自Ars Technica,作者Ryan Whitwam,原文日期2026-02-12。