OmniTools 5月24日消息,阶跃星辰(StepFun)近日推出StepAudio 2.5 Realtime实时语音模型。该模型可深度识别语音中的语气、语速、停顿及微表情等副语言特征,显著提升语音交互的自然度与拟真感。
模型支持通过API接入自定义人格,开发者可设定角色个性、背景故事与语言风格;平台提供上万种原生人格选项,支持组合生成数百万种特征。产品内置5个预设人格,均已通过RLHF调优,在复杂角色扮演压力测试中可保持高度一致性。目前该模型已支持中文与英文。
OmniTools 5月24日消息,阶跃星辰(StepFun)近日推出StepAudio 2.5 Realtime实时语音模型。该模型可深度识别语音中的语气、语速、停顿及微表情等副语言特征,显著提升语音交互的自然度与拟真感。
模型支持通过API接入自定义人格,开发者可设定角色个性、背景故事与语言风格;平台提供上万种原生人格选项,支持组合生成数百万种特征。产品内置5个预设人格,均已通过RLHF调优,在复杂角色扮演压力测试中可保持高度一致性。目前该模型已支持中文与英文。