元宝-智能语音理解算法研究员
1.本职位承接元宝2c和2b场景各类实时和离线语音内容理解工作。进一步提升内容识别和理解质量,包括但不限于结合降噪的语音识别,富语言信息识别,多语种内容识别等;
2.从长度和内容的丰富度上,研发超长音频,超长上下文,多说话人,多语种,多方言,多轮,连续语流场景下,全面理解音视频内容的大模型方案;
3.从可利用的信息上,充分利用各类多模态输入信息,提升元宝各类产品语音理解内容理解的质量和效率;
4.研发和工程优化模型小型化,边缘计算,完赛模型的PaaS能力,赋能司内各类元宝生态下的音频理解基础能力。