首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

2026年06月23日 12:13

本文共计978个字，预计阅读时长4分钟。

来源/aibase 责编/ShuxiangMama 书香妈妈

6月23日，国内首个针对高考志愿填报场景的AI能力测评报告《高考志愿AI测评基准》发布。该报告由友松实验室独立完成，以千问高考志愿填报Agent作为测评对象。结果显示，千问多项表现已达到人类志愿咨询师水平，在稳定性、精确性、结构化表达与效率层面更具优势。

友松实验室是一个专注人工智能与教育决策研究的独立研究团队，长期关注大模型能力评估、教育场景中的 AI 应用，以及学生升学选择中的信息、认知与决策问题，研究成果被多所高校、科研机构采用。此次发布的测评基准，旨在为快速涌现的高考志愿AI产品建立一套公开、可复现、可扩展的评估框架，明确AI在当前阶段能够承担的任务边界。

考虑到千问高考Agent基于夸克8年高考服务数据与经验构建，在产品形态、数据积累和用户覆盖上具有行业代表性，报告将其列为首个测评对象。人类对照组则由53名志愿填报咨询师组成，平均从业年限4.6年。

测评覆盖高考志愿基本事实与规则、模拟志愿填报、开放式咨询和志愿推荐报告四个环节，对应考生和家长填报志愿时从查资料、看规则，到排方案、做决策的主要流程。

结果显示，在44道客观题中，千问全部答对，准确率为100%，人类咨询师平均正确率为89.3%;在模拟志愿填报中，千问方案包含6个可录取志愿，未出现显性偏好违背，并命中事后评估的最优结果，人类咨询师平均为5.3个可录取志愿;在开放式咨询中，评审专家在100场匿名对比中，有58次更倾向选择千问版本，“可直接向学生和家长展示的”可直接展示率为56.0%，高于人类咨询师回答的33.0%，认为其在专业路径拆解、风险提示和表达清晰度上更为稳定。

报告认为，在测评设定的任务范围内，千问的多项表现已达到资深人类咨询师水平，尤其在稳定性、精确性、结构化表达与响应效率方面呈现出优势。

但报告同时指出，人类咨询师的价值同样不可替代。尤其在收入预期、就业判断等需要结合个体情况谨慎校准的话题上，咨询师更能给出贴近实际的建议;在亲子协商、价值取舍等场景中，结构完整的AI方案也无法替代人与人之间的沟通和判断。

报告建议，AI更擅长高效完成信息核验、资料整理和方案初筛，人类咨询师则可更多聚焦家庭沟通、价值取舍和个性化判断。二者形成互补，才能让志愿填报既提高准确性，也更贴近考生和家庭的实际需求。

来源：首个高考志愿AI测评发布:千问多项表现超过人类志愿咨询师 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表A³·爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

通知

尊敬的用户

user

资讯

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

相关图文

AI留学平台UniPilot正式上线，推动留学申请透明化

松鼠 Ai 入选《时代》2026全球百大最具影响力企业，开启个性化教育新纪元

网易有道全面转向AI：在线营销首次成为营收支柱，多款AI新品亮相

AI在日本大学入学考试中表现惊艳，ChatGPT成绩超越多数人类考生

千问AI PPT迎来重大升级：智能体架构赋能全流程自动化制作

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

余承东发声，鸿蒙智能将迈向Agent时代

阿里巴巴千问发布国内首个全周期高考志愿填报Agent，免费面向全国考生开放

字节跳动AI制药业务启动拆分与独立融资进程，新公司将继续获得火山引擎算力支持

高德问店选址Skill接入钉钉悟空，AI辅助商家开店选址

快讯

天猫国际自营十周年：从自营买手到AI驱动，探索跨境购物新范式

午间：创业板指震荡走低跌超2%，有色、AI硬件陷入调整，创新药逆势走强

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

千问AI眼镜发布：当AI成为随身入口，企业为什么要重视GEO

特斯拉机器人量产临近上游供应商释放备战信号

每经记者实地探访2026夏季达沃斯论坛：AI成全场关键词，嘉宾关注多领域焦点

Deep Attract关注年轻人情感沟通难题，用AI帮助用户建立更健康的关系认知

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频豆包2.1 Pro对标Opus 4.6

美光科技入局Anthropic共筑下一代AI基础设施

Groq卖掉核心技术后转型云服务商再融资44亿元扩张算力

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

首个高考志愿AI测评发布 千问多项表现超过人类志愿咨询师

首个高考志愿AI测评发布 千问多项表现超过人类志愿咨询师

相关图文

AI留学平台UniPilot正式上线，推动留学申请透明化

松鼠 Ai 入选《时代》2026全球百大最具影响力企业，开启个性化教育新纪元

网易有道全面转向AI：在线营销首次成为营收支柱，多款AI新品亮相

AI在日本大学入学考试中表现惊艳，ChatGPT成绩超越多数人类考生

千问AI PPT迎来重大升级：智能体架构赋能全流程自动化制作

AI时代背景下初高中学习：真人老师与AI工具谁更能提升学习效果

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

余承东发声，鸿蒙智能将迈向Agent时代

阿里巴巴千问发布国内首个全周期高考志愿填报Agent，免费面向全国考生开放

字节跳动AI制药业务启动拆分与独立融资进程，新公司将继续获得火山引擎算力支持

高德问店选址Skill接入钉钉悟空，AI辅助商家开店选址

快讯

天猫国际自营十周年：从自营买手到AI驱动，探索跨境购物新范式

午间：创业板指震荡走低跌超2%，有色、AI硬件陷入调整，创新药逆势走强

首个高考志愿AI测评发布 千问多项表现超过人类志愿咨询师

千问AI眼镜发布：当AI成为随身入口，企业为什么要重视GEO

特斯拉机器人量产临近 上游供应商释放备战信号

每经记者实地探访2026夏季达沃斯论坛：AI成全场关键词，嘉宾关注多领域焦点

Deep Attract关注年轻人情感沟通难题，用AI帮助用户建立更健康的关系认知

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频 豆包2.1 Pro对标Opus 4.6

美光科技入局Anthropic共筑下一代AI基础设施

Groq卖掉核心技术后转型云服务商 再融资44亿元扩张算力

推荐专栏

爱力方

机器人大讲堂

下一篇

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

首个高考志愿AI测评发布千问多项表现超过人类志愿咨询师

特斯拉机器人量产临近上游供应商释放备战信号

字节跳动火山引擎2026大会发布Seedance 2.5直出30秒视频豆包2.1 Pro对标Opus 4.6

Groq卖掉核心技术后转型云服务商再融资44亿元扩张算力