传统搜索引擎为人类浏览而设计的“蓝色链接列表”正在成为 AI 智能体(Agents)高效工作的瓶颈。在处理复杂研究任务时,AI 只能通过硬性调整搜索词进行多轮、手工作坊式的 API 调用,面临架构僵化与上下文窗口被垃圾信息塞满的痛点。
为了打破这一局限,Perplexity 近日发布了一项名为“搜索即代码”(Search as Code, 简称 SaC)的全新架构。该技术不再让模型调用现成的、整体式的搜索 API,而是允许 AI 模型以 Python 代码的形式,动态构建并运行自定义的搜索工作流程。
三层核心架构
Perplexity 的 SaC 架构垂直堆栈共分为三层:
-
模型层(最顶层): 负责理解复杂任务并制定高层面的搜索策略。
-
安全沙箱(中间层): 为代码提供运行环境,并具备用于存储中间状态的文件系统。
-
智能搜索 SDK(最底层): 将检索、扇出、过滤、去重、重新排序和解析字段等原子级操作打包成基础原语函数,赋予生成的代码组件级的搜索基础设施访问权限。
通过这种设计,AI 智能体可以并行执行查询、以编程方式过滤无关信息,并将高度提炼的相关结果提取到上下文窗口中,从而保证了长文本研究任务中的思维连贯性。
CVE 漏洞研究实测:性能跃升与 Token 暴降
为了验证该架构在现实世界中的表现,Perplexity 针对一项混乱的专业网络安全任务进行了测试:追踪200个在2023年至2025年间发布的关键软件漏洞(CVE),并精确提取官方公告、受影响软件及修复版本。

在 SaC 的支持下,AI 模型自发编写了一个“三阶段脚本”:先针对不同厂商(如 Mozilla、Google)的公告格式运行并行定制化搜索;随后自动扫描结果、捕捉信息遗漏并进行定向补充查询;最后利用 Schema(模式)校验确保漏洞数据完全对齐。
测试结果表明,该系统在精准完成任务的同时,比传统标准管道节省了85% 的 Token 消耗。在 Perplexity 自身的基准测试集(包含 DSQA、BrowseComp、HLE、WideSearch 和最新推出的广度研究基准 WANDR)中,SaC 在五项测试中独占四项鳌头,相比旧架构实现了巨大的性能飞跃。尤其在 WANDR 基准上,相对提升幅度高达45%。
代码成为 AI 的新操作层
行业调查报告指出,编写代码正逐渐成为 AI 智能体与物理世界交互的默认方式。传统的软件依赖确定性指令,而前沿大模型则在 Token 空间进行推理,最强大的系统往往将两者结合——即利用大模型制定策略,利用确定性的运行环境进行批量处理与过滤,并将搜索基础设施作为输入/输出(I/O)层。
目前,“搜索即代码”功能已正式在Perplexity Computer及 Agent API 中陆续推出,这也将为解决当下 AI 搜索智能体“通过训练数据作弊、无法应对新鲜事实”的行业痼疾提供全新的技术解法。