预告:语音交互前沿技术分享——INTERSPEECH 2017系列

今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,共历时5天。据了解,本次大会共有839篇论文被大会接受,分成109个session。众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。

首期分享将在10月25日(本周三)晚上7点半正式开始,欢迎关注语音识别技术的同学报名参与(报名请戳这里)!。

直播主题:语音识别技术之自适应技术

内容简介:语音识别技术是将语音转换成文字的技术,而说话人自适应技术的目的是降低语音识别中不同说话人之间的差异性带来的影响,这些差异性主要包括生理构造、语音环境和说话人情绪等。本次直播主要向大家介绍INTERSPEECH2017会议中的语音识别的自适应技术的一些研究成果。

观众受益:了解语音识别中的自适应技术及该技术的最新研究成果

讲师:黄智颖(云昔),阿里巴巴-iDST算法工程师

注:INTERSPEECH (Annual Conference of the International Speech Communication Association)是由国际语音通信协会ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,和ICASSP (International Conference on Acoustics, Speech, and Signal Processing)并称为国际语音领域最著名、影响力最大的两个学术会议。相对于ICASSP会议侧重声学、语音信号相关的学术讨论,INTERSPEECH会议的讨论范畴则包罗万象,从信号处理到语音识别、语音合成,以及各种相关的前处理、后处理方法,再到口语理解和语音交互,包含了语音技术相关的各个方面,堪称国际语音行业的一个年度盛会。

时间: 2017-10-23

预告:语音交互前沿技术分享——INTERSPEECH 2017系列的相关文章

专访阿里 iDST 语音组总监鄢志杰:智能语音交互从技术到产品,有哪些坑和细节要注意?

雷锋网按:在外界看来,阿里 iDST 是一个神秘的部门,大家知道里面聚集了很多技术大牛,但是对这个部门真正在做的事情,以及其在阿里集团内扮演的角色却不一定清楚.为此,雷锋网对阿里 iDST 的语音专家鄢志杰博士进行了专访,带大家了解有关阿里 iDST 的事情,以及他们是如何看待当下最火的一些 AI 产品的. 鄢志杰简介 鄢志杰,阿里巴巴 iDST (Institute of Data Science and Technologies) 智能语音交互团队总监.在 2015 年加入阿里巴巴前,就职于

INTERSPEECH 2017系列 | 语音合成技术

1.2 语音合成的应用场景和研究范围 语音合成技术是人与计算机语音交互中必不可少的模块.从地图导航(例如高德地图高晓松语音导航),语音助手(Apple Siri, Google Assistant,微软 Cortana, Nuance Nina), 小说.新闻朗读(书旗.百度小说), 智能音箱(Amazon Alexa, 天猫精灵, Google Home,Apple Pod Home 等 ),语音实时翻译,到各种大大小小的客服,呼叫中心,甚至机场广播,地铁公交车报站都少不了语音合成技术的身影.

INTERSPEECH 2017系列 | 语音识别之语言模型技术

随着iPHONE 4S中siri的出现,越来越多的民用语音识别出现在大家眼前.现在市面上各种语音输入法.语音机器人层出不穷.下图是去年阿里云栖大会,基于iDST语音技术的ET机器人.现在市面上漫山遍野的智能音箱大战,其中也包含语音识别技术. 语音识别技术,通俗讲叫语音转文字,speech-to-text,是将观测得到的语音输入信号,转化成与之对应的文本序列的过程.传统语音识别系统如下图所示,包括特征提取.声学模型.语言模型和解码器四部分,通过特征提取将原始音频信号分帧加窗,转化成有利于机器进行识

智能语音交互:阿里的研究和实践

云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲.本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出.   在众多的人工智能应用中,智能语音交互是大众能够最近距离接触到的一个.从几年前的手机语音助手,到近年来的互联网汽车.智能音箱.电视.IoT设备等,语音交互正以前所未有的深度和广度,融入雨后春笋般涌现的各种智能设备中.国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域,并视其为下一

数据智能时代,语音交互将是第一爆发领域

在云栖TechDay第十五期活动上,阿里云iDST总监初敏博士给大家带来了题为<数据智能时代的语音交互>的分享,初敏博士认为当今是一个数据驱动的智能时代,语音交互将是这个时代的第一爆发领域,将会形成新一轮入口之争.她主要从语音识别与合成.人机对话.应用案例分析三部分展开了此次分享. 下面是现场分享观点整理. 自从谷歌的Alphago战胜李世石后,人工智能在全世界范围内引起了高度关注.细看近年来备受热议的人工智能案例,实际上是机器学习特别是深度学习技术的发展和普及的结果.而今天的深度学习,跟三四

AI与大众最近的接触——智能语音交互

互联网的变迁过程 互联网的变迁主要体现在内容.入口.人机界面三个方面. 互联网内容的变迁 图一 互联网内容的变迁 时至今日,互联网的内容已经发生了很多变迁,早期的互联网以获取信息为主,例如人们通过Email收发信息.在BBS上灌水.通过门户网站了解新闻等等.阿里巴巴的起点也是从Alibaba.com开始,最初仅是为国外买家获取信息.购买国内供应商的产品起到牵线搭桥的作用. 随着网络的发展,互联网不仅仅再局限于获取信息,消费者逐渐可以通过淘宝.天猫.聚划算等网站购买生活必须品:现在,除了提供信息和

阿里云智能语音交互技术实践干货分享

阿里云技术总监/研发总监陈一宁博士通过直播分享了<阿里云智能语音交互技术实践>.他首先介绍了智能语音面临的技术挑战,然后对智能语音技术做了详细介绍.其中,他主要分享了阿里云使用的BLSTM & LFR声学模型的优化过程,并对基于深度学习的自然语言理解的不同场景进行了详细分享.   以下内容根据直播视频整理而成.   阿里云智能语音概述 阿里云智能语音交互=语音+自然语言处理,语音包括语音识别.语音合成.声纹等,自然语言处理包括自然语言理解.对话系统.问答系统等.阿里云智能语音团队不是一

由WMT机器翻译双向夺冠看搜狗语音交互布局

Alex Graves在<Neural Turing Machines>论文中提到的一句话一直让陈伟印象深刻--" What is possible in principle is not always what is simple in practice".也正因此,"知易行难"成为镌刻在陈伟行为模式中的一个准则. 陈伟是搜狗语音交互中心总监,他与搜狗语音团队似乎一直恪守着低调准则:没有准备好不发布.没有成果不发声.9月8日,WMT官方公布成绩:搜狗语

百度工程师高校开课传授网络前沿技术

7月11日,由百度与中科院研究生院.北京航空航天大学联合开设的<Web前沿技术系列讲座>结业课在百度"搜索框"大厦举行.来自上述两所院 校100余名学生代表对学期作业进行了分组演示,百度web前端研发部架构师黄方荣.高校课程组织方代表中科院研究生院齐洪钢博士出席结业课并对同学们 作业进行了现场点评.这也是国内首个由互联网企业技术专家参与教学的普及Web前沿知识的高校学分课程. 据悉,此次面向中科院研究生院.北京航空航天大学所开设的Web前端技术系列课程时长一个月,包括百度首