中译语通智能语音技术平台拥有成熟的多语种语音识别和语音合成技术,可面向真实语音交互场景,提供中、英、日、韩、德、葡等语种的语音交互解决方案。
语音作为最自然便捷的人机交互方式,是下一代人机交互的重要入口。中译语通在语音领域积极布局,研发了国际领先的基于自适应的上下文相关-深度神经网络-隐马尔科夫模型语音识别技术,同时将深层卷积神经网络技术应用于声学建模中,将其与基于长短时记忆单元(LSTM)和连接时序分类(CTC)的端对端语音识别技术相结合,降低识别错误率,大幅度提升了语音识别的性能。
在大规模、深度整合高质量语料的基础上,应用自主研发的深度学习技术框架,构建了包含中、英、日、韩、德、葡等语种的语音识别引擎,每个语种的语料训练超过1万小时。目前这些语音识别引擎已应用于公司自主研发的字幕通、视频会议同传系统LanguageBox、悦译翻译机等多个语言科技产品中,在语音识别市场上奠定了良好的基础。未来将不断扩充语种,为全球不同语种、不同场合的用户提供语音识别解决方案。
方案咨询:[email protected]