返回行业动态

StepAudio 2.5 Realtime发布:支持副语言感知与人格化语音交互

2026/05/23 22:09
查看原文

OmniTools 5月24日消息,阶跃星辰(StepFun)近日推出StepAudio 2.5 Realtime实时语音模型。该模型可深度识别语音中的语气、语速、停顿及微表情等副语言特征,显著提升语音交互的自然度与拟真感。

模型支持通过API接入自定义人格,开发者可设定角色个性、背景故事与语言风格;平台提供上万种原生人格选项,支持组合生成数百万种特征。产品内置5个预设人格,均已通过RLHF调优,在复杂角色扮演压力测试中可保持高度一致性。目前该模型已支持中文与英文。