Chrome Auto Browse代理代我们上网冲浪：惊艳与惨败并存

2026年02月12日 14 约5分钟 Ars Technica

Chrome AI代理 Auto Browse Google Gemini 浏览器AI

Chrome Auto Browse：AI代理的浏览器革命

在AI技术迅猛发展的当下，Google Chrome浏览器悄然推出了一项实验性功能——Auto Browse。这是一个基于Gemini模型的AI代理，能够自主'冲浪'网页，执行用户指令如查找信息、购物比价甚至预订行程。Ars Technica记者Ryan Whitwam于2026年2月12日发表文章《We let Chrome's Auto Browse agent surf the web for us—here's what happened》，亲身测试了这一功能，结果令人既惊叹又无奈：它能完成令人印象深刻的任务，却也可能'壮烈牺牲'。

Auto Browse并非孤例。早在2023年，Google就通过Project Astra和Gemini扩展了浏览器AI能力。2025年，Chrome Canary版引入了这一代理，允许用户输入自然语言指令，让AI模拟人类浏览行为：点击链接、填写表单、提取数据。这标志着浏览器从被动工具向智能助手的转变，与Anthropic的Claude Computer Use和OpenAI的o1模型类似，AI代理正从聊天转向行动。

测试场景：从简单查询到复杂任务

Whitwam的测试从基础入手。他输入“帮我找一张去巴黎的廉价机票”，Auto Browse迅速打开Kayak网站，筛选日期、比较价格，最终输出一份包含链接和价格的报告。整个过程仅需几分钟，准确率高达90%。在购物测试中，它浏览Amazon和Best Buy，生成一份'最佳无线耳机推荐清单'，甚至考虑了用户预算和评论分数。

原文作者感慨：“Auto Browse有时像个熟练的网络侦探，能在层层嵌套的网页中挖掘金矿。”

更复杂任务如“规划周末露营行程，包括装备清单和天气预报”，AI代理展示了多步推理能力：先查天气API，再搜索国家公园预订，最后汇总Excel-like表格。这得益于Gemini 2.0的视觉理解和工具调用能力，能解析动态网页和JavaScript渲染内容。

崩溃时刻：AI的'黑天鹅'事件

然而，光鲜背后是频发的惨败。一次简单指令“查找最新iPhone价格”，Auto Browse陷入无限循环：反复刷新Apple官网，导致浏览器内存暴增至5GB，最终崩溃重启。另一测试中，它误将广告弹窗当作正文，输出荒谬建议如“买这个神奇的减肥药”。隐私测试更令人担忧：指令“查我的银行余额”时，它试图访问未授权页面，触发安全警告。

Whitwam统计：10次测试中，成功6次，部分失败3次，完全崩溃1次。问题根源包括网页变化敏感性（动态布局易迷失）、幻觉（hallucination）生成假链接，以及缺乏鲁棒性（对CAPTCHA或反爬虫无解）。

行业背景：AI代理的崛起与瓶颈

Auto Browse是浏览器AI浪潮的一部分。Microsoft Edge的Copilot已集成类似功能，Safari的Apple Intelligence也在追赶。2025年Gartner报告预测，到2028年，50%的浏览器将内置自主代理，推动'零点击上网'时代。但挑战犹存：数据隐私（AI需访问cookies和历史）、计算成本（本地运行Gemini需高配硬件）和伦理风险（自动化刷单或假新闻传播）。

相比之下，桌面代理如Adept的ACT-1更稳定，但浏览器环境更碎片化。Google的优势在于Chrome 70%市场份额，能快速迭代。

编者按：潜力无限，落地需谨慎

作为AI科技新闻编辑，我认为Auto Browse预示着未来：AI将从'问答机'变'执行者'，解放用户双手。但当前不成熟，适合早期采用者而非大众。Google应加强沙盒隔离、用户控制和透明日志。长远看，与Web3和去中心化身份结合，或解决信任问题。期待稳定版Chrome 120，它可能重塑上网范式。

总之，Auto Browse的'惊艳与惨败'折射AI代理双刃剑：创新加速，却需平衡可靠性。开发者与用户共勉。

（本文约1050字）

本文编译自Ars Technica，作者Ryan Whitwam，原文日期2026-02-12。

Chrome Auto Browse：AI代理的浏览器革命

测试场景：从简单查询到复杂任务

崩溃时刻：AI的'黑天鹅'事件

行业背景：AI代理的崛起与瓶颈

编者按：潜力无限，落地需谨慎

相关推荐