万象有声上线全自动AI多播有声书创作，万字成本不到8元

2026年06月11日 16:27

本文共计3454个字，预计阅读时长12分钟。

来源/aibase 责编/PixelHunter 像素猎人

公测两个月后，万象有声将一套名为“全自动 AI 多播有声书创作”的自动化生产系统正式推向市场，该系统曾在内部演示中震撼过版权方。

这家由原懒人听书核心团队所创立的AI有声内容平台，于6月上旬成功完成了此项战略级功能的公测工作。其核心在于，将此前已得到验证的AI能力，包括智能拆章、角色分析、画本生成、多角色配音以及后期合成等，进行打包组合，并借助任务编排引擎，将其串成一条能够实现'无人值守'运转的数字音频生产线。

这套系统并非一个孤立的新产品，而是平台所倡导的‘双轨制生产引擎’这一底层战略构想的具体落地与体现。它与万象有声平台现有的专业创作工作台，在架构上共享同一套底层的技术基础设施。然而，它能够以一种完全自动化的运行模式来执行任务。其核心目标，正精准指向当前音频内容产业所面临的最艰巨挑战：即在确保内容质量的前提下，如何有效实现产能的跨越式增长以及生产成本的显著下降。

从“手动挡”到“自动驾驶”：一套引擎，两条轨道

公测两个月后，万象有声正式向市场推出了一套名为“全自动 AI 多播有声书创作”的自动化生产系统。该系统曾在内部演示中，其高度的完成度与自动化水平曾深深震撼过版权合作方。这家由原懒人听书核心团队所创立的AI有声内容平台，于6月上旬成功完成了此项战略级功能的公测工作。其核心在于，将此前已得到验证的AI能力，包括智能拆章、角色分析、画本生成、多角色配音以及后期合成等，进行打包组合，并借助先进的任务编排引擎，将其成功串联成一条能够“无人值守”的全自动数字音频生产线。

这套系统并非一个孤立的新产品，而是平台所倡导的“双轨制生产引擎”这一底层战略构想的具体落地与体现。它与万象有声平台现有的专业创作工作台，在架构上共享同一套底层的技术基础设施。然而，它能够以一种完全自动化的运行模式来执行任务。其核心目标，正精准指向当前音频内容产业所面临的最艰巨挑战：即在确保内容质量的前提下，如何有效实现产能的跨越式增长以及生产成本的显著下降。

传统精品有声剧的制作过程构成了一条冗长且成本高昂的手工操作链，这包括了文稿整理、拆章分集、画本制作、选角配音、对轨、后期混音、审听以及最终导出等多个环节。对于一部精品多人剧而言，完成全套流程通常需要30天以上的时间，而其成本则在数千元到数万元之间。

万象有声的第一条产品线，即“轨道一：精品提效”，正是为解决“做得更好”的需求而推出。

它主要面向专业工作室与配音团队，提供了一套覆盖全流程的AI创作工具。通过智能画本、智能对轨与智能审听等功能模块，这套系统得以将创作者从大量繁琐、重复的机械性工作中解脱出来，使他们能够将精力完全投入到更具价值的艺术构思与情感表达之中。这种模式的核心逻辑，始终是人与机器之间深度且默契的协同合作。

而此次正式对外推出的全自动AI多播剧工作台，则被规划在“轨道二：产能跃迁”之中。

这两条产品路线所设定的目标存在显著差异。它并非指向那些追求极致打磨的个体创作者，而是精准定位为掌握了海量版权资源、对于这些库存资产有着迫切的批量化转化需求的B端客户，例如网络文学平台与出版机构。其内在的运作逻辑也更为直接和清晰——通过采用全自动化解决方案，来应对这些在数量、长尾效应以及投资回报率方面都极为敏感的内容所面临的规模化生产难题。

用户上传文稿之后，系统便如同一座高度自动化的数字工厂般运转起来：它会自动完成章节的拆分工作，借助智能分析技术对角色进行识别并匹配最为适宜的AI音色，生成带有情绪标注与精准注音的完整画本，调用经过精细调优的近千种音色来完成多角色的协同演播，最终合成出配备音效的完整成品。生成完毕后，作品会自动转入标准编辑界面，用户可以运用新上线的"自定义读音"与"全文批量标音"等功能对细节进行局部调整，从而实现"先批量生成初步版本，再逐步精修打磨"的柔性化生产模式。

万象有声为此所设定的价格极具市场竞争力：AI配音服务定价为7.9元/万字，智能画本服务为0.2元/万字，进行批量采购时，单字成本最低可降至6.58元。据此计算，制作一万字体量的多播有声剧，其全包综合成本可控制在7至8元人民币之间。

相比之下，在传统有声剧制作模式下，单部作品的制作成本通常介于5000元至50000元之间；目前市场上其他AI配音工具的定价也普遍处于10至15元/万字的区间。对于那些储备了数以万计中长尾IP的版权平台而言，如果采用传统方式将全部作品有声化，需要投入的资金高达数千万甚至上亿元，即便仅对其中10%的库存进行开发，这笔开支也显得力不从心。然而，依据万象有声所公布的定价标准，一部50万字小说的全流程有声化成本仅需350至400元。这意味着，一家中等规模的出版机构，仅需投入数万元预算，便能系统性地将整个品类的库存内容转化为具备商业潜力的有声资产。

阅米文化创始人李吉曾在万象有声公测期间评价道：“万象有声的AI播音在情感传达层面已达到接近真人演绎的水准。结合其智能画本与自动对轨功能，该平台能够稳定地产出B+级以上的精品有声书作品。”

该平台所建立的整套质量基准体系被成功平移至全自动生产线，从而将“单条产线的产出质量可接受”转化为了一个明确的前提条件。在此基础上，剩余的核心挑战，便转变为一个纯粹的经济学问题。

瞄准 B 端:双轨制引擎的战略深意

最初作为内部向版权方及资方进行展示的“技术王牌”，这套全自动工作台如今已随着市场策略的推进而完成正式商用，这一转变传递出明确的市场信号。

这标志着万象有声的业务版图，从"服务创作者"正式延伸至"服务版权方"——而后者才是拥有大规模付费能力与刚性需求的核心客户群体。平台独创的"双轨制生产引擎"，并非单纯的功能叠加，而是源于对行业深层逻辑的洞察：有声内容市场同时存在"精品化"与"规模化"两种看似矛盾的需求，而真正的瓶颈在于缺少一套能够灵活适应不同内容价值与制作需求的标准化生产系统。

对于个人创作者或小型团队而言，该平台扮演着高效“内容验证器”的角色。它使得用户无需依赖专业制作团队，便能快速将文字小说转化为具备听觉呈现、情感传递与分享功能的音频Demo，从而以较低的成本进行市场测试。

对于网文平台或版权机构而言，该系统精准地应对了处理“食之无味，弃之可惜”的中长尾IP时所面临的进退两难局面。它通过全自动化的生产流程，提供了一条清晰的解决路径，能够以极低的边际成本，将这些被搁置的库存内容进行批量化转换与激活。这种高效的内容唤醒方式，从而可以快速帮助平台填补其在有声内容供给上的缺口。

对于专业音频工作室而言，这种技术得以开启一种“人机混编”的新模式。在该模式下，可以将情感复杂的核心主角角色留给真人配音演员来塑造，而将旁白以及海量的NPC角色交由高品质的AI进行生成，从而在保障听感品质的同时，极大地拓宽了产能的边界。

其背后的工程化壁垒，诸如拥有百万级规模的发音纠错字典、用于保障角色声线一致性的算法，以及具备局部修改能力的智能重绘技术——该技术能够降低高达90%的算力消耗——正是将有声行业多年积累的制作经验进行深度沉淀与转化后的产物。这不仅代表了技术层面的成功，同时也为音频内容生产走向工业化路径提供了清晰的定义与范式。

内部流水线已通过测试验证，团队因此将其正式推向市场。业务范围也因此得以从“服务创作者”延伸至“服务版权方”——后者才是具备真实批量付费能力的核心客户群体。

对阅文、七猫等网络文学平台以及传统出版集团而言，核心痛点并非"能否打造一部精品有声作品"，而是"库存中的数千部作品如何以较低成本实现规模化有声内容转化"。该全自动工作台便是为满足这一需求而设计的一条可按需启用的自动化生产线，其目标用户为平台与机构，而非个人创作者。

版权机构的决策周期通常较长，这是因为从接触到实际产出需要耗费一定时间。传统出版方长期以来习惯了外包运营模式，因此在转向AI自动化生产时，其内部流程与质量控制体系都需要进行相应调整。然而，有声内容的制作成本正在经历快速压缩。当制作一万字有声剧的成本从数千元显著下降至数元水平时，整个行业的供给逻辑便会发生根本性转变。

关于万象有声

万象有声（即Audimind）作为AI赋能的一站式有声内容创作平台，由原懒人听书核心管理团队于2024年正式创立。该平台依赖于双轨制生产引擎的技术架构体系，为专业创作者与版权机构提供了覆盖有声内容创作全链路的解决方案。

官网:https://www.audimind.com/

来源：万象有声上线「全自动 AI 多播有声书创作」，万字成本不到 8 元 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。