讯飞语音云的介绍

2024-05-09 12:54

1. 讯飞语音云的介绍

讯飞语音云,是科大讯飞基于云计算技术基础,将业界领先的智能语音核心技术向广大移动互联网开发者开放的全球首个同时提供语音合成、语音搜索、语音听写等智能语音交互能力的智能语音交互平台。通过讯飞语音云,移动互联网应用开发伙伴可以像使用水、电那样“即开即有、按需取用”,短期内构建出“能听会说”的特色移动互联网应用,开发周期大为缩短。

讯飞语音云的介绍

2. 讯飞语音云的产品简介

作为移动互联网基础能力设施,“讯飞语音云”将上述业界领先的智能语音技术向移动互联网开发厂商和用户同时开放。移动互联网应用开发伙伴可以像使用水、电那样“即开即有、按需取用”,在很短时间内构建出“能听会说”的特色移动互联网应用,从而使移动互联网语音创新开发的门槛显著降低、开发周期显著缩短,将有力于移动互联网应用的不断创新和丰富。此次与“讯飞语音云”同时发布的该平台第一个示范应用——“讯飞语音输入法”体验版,用户可以在科大讯飞公司网站免费下载客户端进行体验。

3. 语音云的讯飞语音开放介绍

近年来国内外IT巨头纷纷投入巨资加大对智能语音技术市场的争夺,科大讯飞作为亚太地区最大的语音上市公司,拥有全球领先的中文智能语音技术,多年来一直致力于研发将语音技术应用到千家万户,MSP(iFLY Mobile Speech Platform)便在此背景下诞生。通过MSP,移动互联网的终端用户可以随时随地的使用语音服务。语音技术带来品质生活,始终是MSP团队所坚持不懈的理念。主要功能iFLY Mobile Speech Platform(以下简称MSP)是一个应用于移动互联网的语音服务平台,其主要目标是:1)实现可面向移动2G/3G网络及互联网提供语音服务的服务器,在现有科大讯飞电信级语音服务平台ISP基础上为移动终端应用程序提供多路并发的语音合成、语音识别、语音听写功能,通过架设在互联网的语音应用服务器,用户可以随时随地获得高质量的语音服务;2)实现基于移动终端以及桌面平台的语音应用客户端,提供统一的语音应用开发接口,通过该接口用户可以方便、快速地开发语音应用;同时,MSP也将开放一些基于移动以及桌面平台的语音应用,用于展示MSP语音服务平台的功能和使用方法,让用户直接体验到最新的语音技术;MSP最终提供了架构于互联网的语音云服务和一套移动互联网语音解决方案、应用示例,把语音服务的应用范围拓宽到移动互联网领域,为语音服务产品走向移动互联网市场开辟全新的应用模式。MSP平台整合了科大讯飞研究院、中国科技大学讯飞语音实验室以及清华大学讯飞语音实验室在语音识别、语音合成等技术上多年的技术成果,语音核心技术上达到了国际领先水平。MSP系统采用分布式架构,继承了科大讯飞成熟的电信级语音平台高稳定的特点,可以满足电信级应用的高可靠性、高可用性要求。针对传统语音应用集成开发困难,业务设计繁琐的问题,MSP产品大大简化了集成开发和业务开发的复杂度,为系统集成人员和业务开发人员提供了便捷、高效的开发环境。MSP作为一个向互联网和移动互联网开放的语音引擎,提供了功能完善、简单易用的集成开发接口,以便开发人员能够将其与应用程序进行集成,实现具有完整语音能力的应用。MSP提供的主要开发接口从提供功能考虑可以分为语音识别(包含语音听写)、语音合成开发接口和语音检测开发接口:1)语音识别开发接口  语音识别接口(QISR)是应用开发者使用识别引擎和语音听写引擎进行语音应用开发所必需使用的接口,该接口接受用户输入的语音,把语音识别结果返回给应用程序。2)语音合成开发接口  语音合成接口(QTTS)可以让应用开发者在应用程序中集成讯飞语音合成引擎的功能,该接口接受应用程序传入的文本内容,返回符合应用要求格式的音频数据。3)语音检测开发接口  语音检测(VAD)是语音识别一个重要的输入环节,用于判断用户语音何时开始、何时结束,该接口集成在MSC客户端内部,通过QISR接口的参数来返回语音状态。移动互联网应用程序需要使用在成千上万各式各样的用户终端之上,用户终端类型从非智能终端到智能终端、从手机到智能玩具、从PC到互联网电视,应用操作系统环境形形色色、品类众多。为了满足各类客户端操作系统环境上都能够使用讯飞语音云提供的语音功能,MSC为多种终端环境提供了语音开发接口,主要包含Android、iOS、Windows Phone、Windows、Linux、Java、Flash等。基于讯飞语音云,第三方开发者可以通过集成SDK,轻松实现产品的语音能力,基于讯飞语音云诞生了一批有代表性的产品。讯飞输入法全球首创“蜂巢”输入模型,独家支持拼音、手写、语音“云+端”立体输入引擎。讯飞输入法,创造极致输入体验!灵犀语音助手由科大讯飞和中国移动共同打造的贴心生活小秘书,基于科大讯飞语音云、语义云,能够完美支持普通话及部分方言,更能深入理解用户的对话,智能的提供相应的服务。灵犀语音助手集打电话、发短信、设置提醒、音乐查找与播放、打开应用、餐饮美食、火车航班、查询天气、查询股票、查询酒店、查询话费流量等众多生活领域。讯飞语音+面向终端用户与开发者提供不同的功能。终端用户提供的微信输入助手,通过语音在微信中直接快速输入文字,让你成为输入达人不再是梦!  面向开发者提供语音合成、语音识别、语音唤醒等能力,轻松集成,就能让你的应用实现能听会说。

语音云的讯飞语音开放介绍

4. 讯飞语音云的研发背景

语音作为人们获取和沟通信息最方便、最有效的手段,智能语音交互技术对于各种移动互联网终端(输入不方便、显示屏幕有限)改善用户体验具有不可替代的作用,已经被业界公认为移动互联网时代的关键技术之一,蕴藏着巨大市场前景,并有重要战略意义。美国、欧盟、日本等国政府均专门立项予以重点扶持;IBM、摩托罗拉、微软、Google、苹果等国外IT巨头先后成立专门研究机构,集中大批优秀的开发力量进行相关方面的研究,目的就是抢占移动互联网时代“人机界面”的制高点。面对移动互联网革命浪潮带来的语音应用的重大机遇和更加激烈的全球竞争,科大讯飞之所以敢于在移动互联网的主战场亮剑,一方面是在语音核心技术领域的长期积累,不但在中文语音技术上保持领先,并且在英文语音技术上也达到国际领先水平,从05年起,已在由美国和日本联合发起的全球顶级英文合成大赛“Blizzard Challenge”中获“五连冠”;08/09/10年连续三年在NIST(美国国家标准与技术研究院)语音评测比赛中名列前茅。另一方面,作为中国语音产业唯一的上市公司,科大讯飞语音技术应用已经深入各行各业,拥有上千家的应用开发伙伴,在电信、金融等重点行业市场占有率达到80%,以讯飞为核心的中文语音产业链已初具规模,科大讯飞对国内用户需求的理解要比国际厂商更为准确。

最新文章
热门文章
推荐阅读