2025年初,DeepSeek以更低训练成本实现比肩世界级通用大模型的能力,被业内称为“DeepSeek时刻”。这一突破不仅改变了通用AI领域,也带来一个重要启示:
模型能力的提升,不再只依赖参数规模,而取决于方法论创新。
而在医疗这一高度专业化的领域,中国团队正在给出属于自己的答案。
近期,一家长期低调深耕医疗领域的AI公司——良医汇,正式推出其医学智能产品 MedSeek.Ai。该产品基于自研的 Medical-based Harness Engineering(医学工程化架构),结合国产32B模型,在核心医疗任务中实现了对通用大模型的性能超越。
不同于依赖“大模型通用能力迁移”的路径,MedSeek选择了一条更贴近临床本质的技术路线:让AI先“学会医学”,再做推理。
用医学工程化能力,重构医疗AI
在传统路径中,医疗AI往往依赖更大参数规模的模型,通过通用能力去“逼近”专业场景。但良医汇团队认为,这一路径在复杂临床任务中存在天然瓶颈。
为此,团队提出 Medical-based Harness Engineering 方法,将医学知识、临床规则与推理流程进行工程化拆解,使AI在决策过程中遵循真实的医学逻辑,而非仅依赖统计相关性。
这一方法的核心,不是让模型“更大”,而是让模型:
· 按照医学规则逐步推理
· 在关键节点具备可解释性
· 在不同任务中采用差异化优化策略
论文验证:中等规模模型,超越通用大模型
这一技术路线,已在非小细胞肺癌(NSCLC)TNM分期任务中得到验证,相关研究成果发表于国际医学信息学期刊《JMIR AI》。
在该研究中,良医汇团队基于国产32B模型GLM-4-Air,通过医学工程化方法,将复杂的分期过程拆解为可追溯的推理链条,并针对不同任务采用“按需优化”的策略,而非统一训练。
在由三甲医院资深医师标注的测试集中,模型表现出显著优势:
· 整体分期准确率:90%(GPT-4o为80%)
· M分期实现零重大临床错误
· 多项关键指标全面优于通用大模型
不仅如此,模型在每一次判断中均输出完整推理路径,医生可以清晰看到每一步决策依据,从而实现“可审核”的AI辅助诊断。
这意味着,在关键临床决策场景中,AI不仅更准确,也更可信。
从论文到产品:MedSeek.Ai已落地临床场景
基于这一技术路线打造的 MedSeek.Ai,目前已全面上线,覆盖全临床科室知识体系,并在真实医疗场景中服务超过10万名医生。
相比依赖海外模型的通用医学工具,MedSeek更强调:
· 本地化部署与数据安全(数据无需出院)
· 符合中国临床实践的推理逻辑
· 可解释、可审核的医学决策过程
在基层医疗机构与专科资源不足的场景中,其价值尤为突出:
一个基层医生,也可以借助AI完成接近三甲水平的复杂分期判断。
中国AI医疗,正在进入“专业化时刻”
如果说DeepSeek代表了通用AI领域的方法论突破,那么MedSeek正在证明:
在医疗这样的高门槛场景中,真正的竞争力来自“行业理解 + 工程能力”,而非单纯的模型规模。
当行业仍在追逐更大参数模型时,一条更具现实意义的路径已经浮现——
用专业化工程能力,让AI真正进入临床。
中国AI医疗,正在迈入属于自己的“MedSeek时刻”。
良医汇团队表示:
“本次成果是我们在医学智能化领域的重要一步。未来,我们将持续推动AI技术与临床实践深度融合,让更多医生和患者真正受益于医学智能化。”