StepAudio 2.5 Realtime发布：支持副语言感知与人格化语音交互

OmniTools 5月24日消息，阶跃星辰（StepFun）近日推出StepAudio 2.5 Realtime实时语音模型。该模型可深度识别语音中的语气、语速、停顿及微表情等副语言特征，显著提升语音交互的自然度与拟真感。

模型支持通过API接入自定义人格，开发者可设定角色个性、背景故事与语言风格；平台提供上万种原生人格选项，支持组合生成数百万种特征。产品内置5个预设人格，均已通过RLHF调优，在复杂角色扮演压力测试中可保持高度一致性。目前该模型已支持中文与英文。