作为一个完整的语音识别系统,最终的效果不仅由识别的算法决定,许多相关因素都直接影响着语音识别结果。端点检测就是语音识别的重要环节,也是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果,因此端点检测方法的研究一直是语音信号处理中的热点。


分享时间:4月27日 19:00—20:30
互动方式:官方微信群进行问题解答
适合人群:人工智能技术爱好者、语音技术从业者

本期AI公开课将为你深度解析语音技术中的热点——端点检测、降噪、音频压缩。
作为一个完整的语音识别系统,最终的效果不仅由识别的算法决定,许多相关因素都直接影响着语音识别结果。端点检测就是语音识别的重要环节,也是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果,因此端点检测方法的研究一直是语音信号处理中的热点。
分享时间:4月27日 19:00—20:30
互动方式:官方微信群进行问题解答
适合人群:人工智能技术爱好者、语音技术从业者
美女主播开房记录大曝光~!活捉一只叮咚音箱!今晚来斗鱼直播,不见不散
百度音乐耳机 10 个
我是单身我骄傲!没有什么事情是撸串代码不能解决的,如果有,那就两串~~~API撸代码大赛,你可以的!
阿尔法蛋首批评测活动在开放平台火爆开始啦~~想要体验的小伙伴赶紧戳文参与申请吧!
11月2日,“阿尔法蛋”京东众筹金额突破100万元,不仅达到了众筹目标,众筹金额目前还在一路飙升。在上线的半个月中,已经有近万人参与到了此次项目中。
为了答谢大家对阿尔法蛋的支持,现在开通首批申请评测的机会咯~想要感受阿尔法蛋的小伙伴,赶快看过来把!
一、活动时间:
1、申请报名:2016.11.02—2016.11.25
2、名单公布:2016.11.26
3、发货时间:2016.11.27
4、试用时间:收到产品后1个月内
二、活动流程
1、申请:讯飞开放平台注册用户即可参与申请,对本次活动有问题想咨询的亲可以在文章下方留言;
2、申请方式:请按照以下格式发送邮件到 open@iflytek.com邮件标题务必书写成:【阿尔法蛋】申请评测+姓名+手机号码(如没有按照规范书写,则申请无效)
用户名称(昵称):
您的年龄:
用户所在地(精确到省、市):
论坛等级+经验值:
如发布过类似产品使用报告请发帖子链接:
是否愿意支付所需费用:
是否能按要求进行发评测报告:
3、筛选:根据申请者在官网论坛的活跃程度以及发来的申请进行筛选。试用名单将会在讯飞开放平台资讯页公布;
4、试用确认:工作人员将会通过短信和电话的方式通知到申请成功的开发小伙伴,2天内得不回复算弃权;
5、评测报告格式:为确保拿到阿尔法蛋的开发小伙伴能规范输出评测报告,请按照以下书写格式要求(以下个人信息我们将严格保密)
邮件标题:【阿尔法蛋】评测报告+姓名+手机号码
姓名:
年龄:
性别:
手机:
QQ号码:
邮箱:
用户所在地(详细地址):
使用环境(如家、学习、公司等等):
对产品外观的评测:
对产品使用中出现的问题:
对产品使用时的感受:
您的产品是否满意:
您对产品的改进意见:
你对产品还有那些看法等:
友情提示:评测报告请小伙伴们在2016年12月27日之前发送到邮箱 open@iflytek.com
产品介绍:
阿尔法蛋智能机器人,是由科大讯飞旗下合肥淘云科技有限公司倾力打造的一款教育陪伴智能机器人。集成教育内容、超级电视、视频通话、智能音箱和自然语交互机器人的阿尔法蛋是一款功能聚合的机器人,功能与服务面向家庭所有成员。阿尔法蛋智能机器人基于科大讯飞人工智能技术,搭载讯飞淘云TY OS智能系统,拥有“类人脑”,其理解能力、表达能力、智商都会随着深度自我学习,不断成长,是一款“真”机器人!
阿尔法蛋机器人,身高约26厘米,太空白镜面抛光蛋型外壳,拥有非常顺滑却又不失圆润的手感,呆萌的头部上有一块内置5寸高清屏的高品质TP玻璃盖板,配合玻璃盖板包边和腰线的哑光金属烤漆,打造出简约却又极富生命力的外观设计。
基于“让语音交互解放双手”的新形态人机交互设计理念,在按键设计上追求极致简约,阿尔法蛋正面头顶只配有一个简单的触控按键。与触控按键巧妙结合,并分布在头顶上的5个隐形开孔,是科大讯飞非常成熟的“4+1声源定位”麦克风阵列。
在阿尔法蛋圆溜溜的小屁股上,有1个支持1080P的HDMI高清输出接口、1个支持数据读取USB和1个电源接口。另外,1个私隐保护开关实体拨动开关也与上述三个接口并列。
机械结构上,阿尔法蛋支持上下摆动的摄像头舵机和左右转动的头部舵机,完美结合科大讯飞脸部追踪和声源定位技术,带给用户不一样的全新体验。
另外,阿尔法蛋配备四核Cortex-A53处理器,500万摄像头,8GB内置存储,1GB云端相册存储,支持声源定位的4+1麦克风阵列。无线支持wifi网络链接,支持蓝牙音箱及键盘等外设的蓝牙4.1。阿尔法蛋还配备多点触控触摸屏。
机器人参数 | ||
项 目 | 名 称 | 参 数 |
系统参数 | 主处理器 | 四核 Cortex-A53 |
图形处理器 | Mali400MP2 GPU | |
内存 | 2GB | |
内置存储 | 8GB | |
摄像头参数 | 传感器 | 500万 |
焦距 | 3.46mm | |
畸变 | <1% | |
摄像头电机参数 | 马达 | 高性能舵机 |
转动范围 | 上下≤15° | |
头部电机参数 | 马达 | 高性能舵机 |
转动范围 | 左右≤80° | |
显示参数 | 屏幕类型 | IPS TFT |
分辨率 | 854*480 | |
色彩 | 16M | |
可视角度 | 178° | |
音频参数 | 音频输入 | 4+1麦克风阵列 |
音频输出 | 3W高保真扬声器 两个 | |
全双工语音输入 | 支持 | |
声源定位 | 支持 | |
回声消除 | 支持 | |
语音唤醒 | 支持 | |
噪声抑制 | 支持 | |
触控参数 | 多点触控 | 支持 |
响应时间 | <10ms | |
通讯接口 | 无线通讯 | WiFi 802.11 b/g/n |
蓝牙 | 4.1版本 | |
视频电话 | 1对1视频通话 | 支持 |
多方视频通话 | 支持 | |
电源 | 外接适配器 | 12V 2A |
材料 | 外壳 | 优质安全环保ABS+PC材料 |
屏幕面罩 | 高透光TP玻璃板 | |
扩展存储 | 扩展存储 | U盘 |
环境参数 | 工作温度 | 0°C ~ 35°C |
相对湿度 | ≤90% |
阿尔法蛋机器人,小小身材里蕴藏大智能,它究竟智能在何处?
一、教育:从“说”开始
阿尔法蛋互动式教育,“说”“教”结合,一问一答学知识。云端教育资源库,多样化的学习模块,给孩子更多选择。故事儿歌不在话下,诗词、英语、数学、百科、成语、近/反义词应有尽有。
“蛋蛋,‘孤帆远影碧空尽’的下一句是什么?”
“很高兴见到你用英语这么说?”
“善良的近义词是什么”
“我想听成语故事《守株待兔》”
“什么是质数?”……
小故事蕴含大道理,阿尔法蛋懂的用故事启发孩子:“听完《撒谎的小狐狸》你要告诉我,为什么我们不能说谎“。
值得一提的是,阿尔法蛋还能根据日常互动不断学习,丰富知识储备,形成独特的知识图谱,打造多元智能和全脑思维模式。通过孩子和阿尔法蛋的互动,家长也能发现孩子的思维优势。
阿尔法蛋伙伴式教育,“说”着帮孩子养成好习惯。“7点啦,小朋友快起床!”“玩了半个小时了,快去做作业吧!”“眼睛累了吗?做做眼保健操,休息一下吧!”贴心的日程提醒,帮助孩子养成良好的生活和学习习惯。
阿尔法蛋独有儿童识别引擎,会与小朋友“说”孩子的话题。孩子平时的小秘密都可以和阿尔法蛋倾诉,阿尔法蛋是他忠实的小伙伴,会陪伴孩子并耐心倾听他的心事,分享孩子的喜悦,宽慰孩子的失落,安抚孩子的情绪。
二、陪伴:随“叫”随到
陪伴从不缺席,想念的人就在眼前。“阿尔法蛋,爸爸又出差了,我想见见爸爸。”一声思念的呼唤,即可开启父母和孩子之间的视频通话。
想孩子的时候,家长也能通过手机随时捕捉孩子即时动态,不错过孩子每一个精彩的成长瞬间。或许,你会无意中看到女儿在试穿妈妈的连衣裙,儿子在有模有样的学着爸爸用电动剃须刀……
想要保存和分享这些孩子的成长瞬间,只需一键上传云端家庭相册,就能让全家人都能看到这些不容错过的精彩照片!
三、生活:就该轻松“点”
HDMI视频输出功能,支持1080P全高清输出,云端音乐,轻松点播。周末下雨不能出去玩儿怎么办?别担心!阿尔法蛋支持HDMI视频输出,链接电视,海量视频资源和音乐,轻松享受。想看什么想听什么任你点播!想要“跳过片头”“快进10分钟”“暂停播放”“音量增大”等,只要随口“说”一下!
四、“真”机器人:“语”众不同
阿尔法蛋智能机器人是如何做到如此“聪慧”的呢?这一切都得益于讯飞淘云的TY OS智能系统平台。
TY OS系统是讯飞淘云基于科大讯飞领先的人工智能技术和智能硬件能力储备,着力打造的国内最具特色的儿童运营服务平台。借助世界领先的科大讯智能语音技术,阿尔法蛋能听得懂你,对童声识别进行深度优化,94%的童声识别率,让其他机器人望尘莫及;搭载讯飞超脑,它能够自我学习进化,通过与孩子的相处逐渐了解孩子的需求,从而提供更多孩子喜欢和需求的内容。
不仅如此,基于先进的4+1环形五麦克风阵列和面部识别系统,阿尔法蛋能准确的听声辨位,随时找到你的位置,时刻与你面对面;凭借智能语音双工技术,不管你如何打断,它都能跟上你天马行空的思维和随时变换的话题。这种便捷和人性化体验岂是一般机器人所能做到?
同时,阿尔法机器人的系统将会不断更新升级,使这款机器人的功能变得更加强大,为用户带来更加难忘的体验。讯飞淘云这个从科大讯飞内部孵化出来的年轻团队,本着一切为了孩子的开心学习和快乐成长的理念,以工匠之心打造人工智能,不断推翻从前建造未来,把“机器人情结”从儿时带给下一代。
阿尔法蛋机器人众筹将持续到11月20日,感兴趣的朋友可以关注“阿尔法蛋”官方微信或微博,获取更多信息。目前,这款机器人京东众筹仍在进行中,想获取专属自己的机器人吗?移步京东,领取属于自己的阿尔法蛋吧!
(众筹链接)
https://z.jd.com/project/details/67909.html?from=jr_search&type=0
六周年,感恩有你一路相伴成长。66折的全线大优惠,还不赶紧约起来!
3!
2!
1!
活动详情:
1.活动优惠时间:10.28~10.31,共四天;
2.一个appid在活动时间内仅优惠购买一个产品(一块评估板、或一个离线语音包)。
10月28日,讯飞开放平台6周年庆。平台产品统统6.6折,快来选购吧!
![]() 1955年10月28日
微软创始人比尔盖茨出生
他重筑了人与计算机之间的交互方式
2010年的同一天
以语音交互为核心的人工智能开放平台
——“讯飞开放平台”诞生
从这一天开始
语音将为人机交互树立新的里程碑!
怀着对下一个时代的期许
我们悄然推开了人工智能的大门….
如今,6岁的我们不再踽踽前行
我们为20万+合作伙伴提供服务
覆盖终端用户数超过8亿
日服务量达30亿
是你们的鞭策让开放平台越走越远,不断前行
是你们的信任让越来越多的语音产品走进千家万户
一起成长的每一步都有许多的故事和回忆
希望接下来的每一天,也有你们在身边!
![]() 所以…
(准备好,画风要突变了)
10月28日在6周年庆这么一个锣鼓喧天,
鞭炮齐鸣的欢乐日子里
讯飞开放平台要搞事情,放大招!
给一直陪伴我们的小伙伴们送福利啦!
原价两千多,四千多,八千多的平台产品
统统6.6折!
66折,66折!统统66折~
![]() 不想错过的小伙伴记得密切关注我们的服务号
10月28日生日当天有惊喜推送哦~
购买平台产品连续四天(10.28~10.31)
6.6折优惠折扣,更有免单福利!
限量版T恤、充电宝…礼物抢不停~
微博论坛参与互动皆有惊喜!让我们一起倒计时吧!
关于讯飞开放平台
讯飞开放平台是全球首个开放的智能交互技术服务平台,
致力于为开发者打造一站式智能人机交互解决方案。
目前,
开放平台以“云+端”的形式向开发者提供
语音合成、语音识别、语音唤醒、语义理解、
人脸识别、麦克风阵列、AIUI等多项服务。
小伙伴们请关注服务号在10月28日当天推送的活动详情,
参与我们的周年庆活动,
就有机会获限量版T恤、充电宝等礼物。
想要购买平台产品的用户更有大力度折扣,
收费产品一律6.6折,参与互动更有免单回馈。
10月28日!我们不见不散!
|
AIUI评估板评测资格免费申请中~优秀评测报告将有机会免费获得AIUI评估板、优惠购买等资格。还在等什么?快来申请吧!
有关更多AIUI评估板详情
请点击官网链接:http://www.xfyun.cn/aiui/index
精彩小视屏不容错过
欢迎加入AIUI评测活动微信讨论群~
“机器人想要真正走进、融入人类社会,产业化发展是必然趋势”,康力优蓝CEO刘雪楠先生在接受采访时说出了他对服务型机器人的发展看法。AIUI作为人机交互的解决方案,通过全双工持续交互、远场精准识别等功能特点,吸引着越来越多的合作伙伴的携手共进。
“机器人想要真正走进、融入人类社会,产业化发展是必然趋势”。2016年第六届智博会分论坛的现场,康力优蓝CEO刘雪楠先生在接受采访时说出了他对服务型机器人的发展看法。
这场围绕“机器人-地球新物种”的主题论坛引发各位人工智能领域的专家各抒己见。将机器人看做是新物种的存在,是人类对人机交互无障碍提出的高要求。而产业化的发展思路,也是应对这种高要求的最佳解决办法。科大讯飞推出的AIUI作为革命式的人机交互解决方案,在很大程度上消减了人类与机器之间的隔阂。通过全双工持续交互的功能特点,让每个心向未来的人,在渴念人工智能尽早落地这件事上,多了从容少了焦灼。
小优和优友的精彩亮相
本次智博会,康力优蓝带来了两款机器人小优和优友用作展示。作为to C和to B的不同系列,它们分别有着自己擅长的领域和功能。小优作为家庭型的机器人,从最初主打幼教功能到现在智能家居控制、远程双向视频交互、家庭内部信息管理、健康医疗技术等,小优一直是老人和孩子们的贴心管家。而1.28米的优友,作为商业型机器人,从人工智能的角度融入了视觉智能、感知智能、运动控制智能、语义智能等。它本身就是一个集各种优质技术为一身的载体。目前在上海世贸酒店做试点运行。在那里,你会看到优友努力工作的身影。
选择AIUI是产业化思路的体现
康力优蓝一直是科大讯飞的优质合作伙伴之一。对于今年第一时间就与科大讯飞的AIUI及麦克风阵列技术进行了深度合作,刘雪楠先生认为,这是择优而取的必然,同时也是产业化思路的体现。“对于我们的机器人,我们一直都是要打造标杆性的产品,希望在国内做到引领性的水准。基于这种标准,我们始终锁定国内最好的人工技术进行合作。”“我们认为,目前科大讯飞的AIUI无论从声控交互的识别率、交互的效率以及后期可延展的功能来看,都是目前我们接触过的最好的。比如说,目前其他的声控引擎,不具备识别那么多种方言。所以我们选择了产业化程度高的AIUI。”
佛教也可以很现代,比如贤二机器僧
对于贤二机器僧,刘雪楠也跟我们分享了他的看法。“佛教给普通人的感觉一直是古老的,难以理解的。龙泉寺当时找到我们想要做机器僧就是想要告诉大家,佛教并不是人们想象中的难以接近。我们也希望通过一个现代智能的机器人,让更多人知道佛教并不是只有拜佛、烧香。为了让更多人了解佛教,寺庙首先创作了贤二的卡通形象,基于卡通形象又做了机器僧。目前我们已经开始制作贤二师傅的机器僧形象,师傅的身高是1.28米。制作完成后,两师徒之间会增加很多交流和互动。贤二的声音是讯飞的语音合成提供的技术支持,师傅的声音暂时没有选定。“
未来,消费者会参与机器人性能的优化过程
在谈到机器人未来发展趋势上,刘雪楠先生提到 “我们希望在视觉智能部分趋向引导消费者参与。消费者可以自己训练机器人,优化性能,这种参与感会使机器人更加容易贴近生活。可能会在这几年之内出现类微性的、消费者级的人工智能可参与工具。”消费者能够参与到机器人的优化过程,也体现着产业化发展的思路。想要规模化的量产、贴近人心的市场定位,消费者也是产业化中的重要角色。刘雪楠先生对机器人优化的长期重点做了简单表述。
以下是访谈原文部分:
1、问:本次智博会康力优蓝带来了两款机器人作为展示,优友和小优。您在这里大致跟我们介绍一下这两款机器人吧。
答:我们公司的两个主流的产品系列,一个是to C的,一个是to B的。
To C的就是爱乐优系列,爱乐优主打的定位是家庭物联网的核心控制中枢和家庭信息的端媒体入口。为了快速和市场结合,爱乐优在切入市场的具体功能上主打幼教。就好比当年电视机进入市场时,主打电视剧和新闻这个切入点。但是机器人是一个综合体,只是当前为了快速进入市场,所以选取幼教作为切入点。目前这款产品除了幼教功能之外,还具备智能家居的控制,远程的双向视频交互,家庭内部的信息管理,还融合了健康医疗的技术。这款产品就是我们看到的小优,它是8年前已完成外观设计,硬件一直持续迭代,过去一直是行业的标杆。明年将推出1米高的家用版机器人,会有更强大的功能。这是to C 系列的情况。
To B 就是1米28的优友机器人。优友就是商用、类人机器人,它对标的是日本软银的pepper。目前这款产品从人工智能的角度,也是融入了视觉智能、感知智能、运动控制智能、语义智能、意识智能等等。其中,讯飞开放平台的AIUI和麦克风阵列都是这个机器人的标配。具体到一些小的技术上,还包括英特尔的realsense、深度视觉识别、也有slim基础上的室内场景地图自建的模块和室内导航避障的模块。基于这些功能,改产品目前锁定了银行、场馆的导览、教育教学这三大市场方向。目前在国内知名酒店上海世贸开始做试点的运行,同时和一些博物馆、展览馆、教学机构都有合作。
2、问:您刚刚提到,在优友机器人身上用到了AIUI的技术,您选择AIUI的理由是什么。
答:我们是今年第一时间就开始与科大讯飞进行深度合作。对于我们的机器人,我们是一直都是要打造标杆性的产品。希望在国内做到引领性的水准,基于这种
标准,我们始终锁定国内最好的关联人工技术进行合作。以讯飞开放平台的AIUI为例,我们认为,目前讯飞开放平台的AIUI无论从声控交互的识别率、交互的效率以及后期可延展的功能来看,都是目前我们接触过的最好的。比如说,目前其他的声控引擎,不具备识别那么多种方言。所以,我们还是始终希望能够把最好的技术融入我们的机器人,而经过评估,我们觉得讯飞开放平台的AIUI最好,产业化程度高。
3、问:您在演讲中提到短期重点是语义、视觉,您可以简单介绍目前康力优蓝的机器人做到什么程度了?以及,长期的重点又是什么?
答:视觉从三个重点来讲,第一是人脸识别,第二是物体识别,第三是室内的定位导航。从人脸识别角度来讲,目前我们正在处理的这个技术能做到身份证级别的人脸识别。而物体识别方面,目前可以识别到2000多种物体。室内定位导航已经可以在酒店这样的复杂环境执行有效的室内地图自建和避障导航的作用。从未来趋势看,我们希望在视觉智能部分趋向两件事:第一是消费者参与;第二是成本低。消费者参与就像是物体识别,因为物体实在太多、千差万别,我们希望未来的技术能够让消费者训练机器人识别更多的物体。而室内定位导航功能,目前国内外的模组,真正能做到很好的,都在几千到上万的价格。而我们的目标是通过持续的优化能够把价格降到千元以内,能够让普通消费者和低成本的家庭级机器人都具备认路的功能。而语义方面的特点,主要还是像科大讯飞这样的公司可能经验更丰富,但是我们认为一个巨大的趋势是:在一个已有语义的基础上,能够放消费者参与语义的定制。因为目前后台内容的定制,可能像讯飞这边来源于客户和自身人工在做,但是普通消费者没有广泛参与。我们认为,可能会在这几年之内出现类微性的、消费者级的人工智能可参与工具。
4、问:您提到服务性机器人需要一个产业化的模式运转下去,您可以简单聊聊这方面的思路。
答:机器人想要获得好的发展,特别是想要融入生活规模化,那么它的产业化必须要做的很好。产业化对产品的研发链条、生成链条、检测链条、售后服务链条以及营销,都有着比较高的要求。所以,这是一个综合成长的过程。但是,我们也看到一些公司,包括我们,都在积极做产业化的工作。特别是科大讯飞,在整个中国机器人的人工智能发展领域中,是产业化进程中必不可少的环节。
5、问:最近很火的贤二机器僧,您如何定位它在龙泉寺中的角色?
答:佛教一直给人感觉是古老的、难以理解的存在。龙泉寺当时找到我们想要做机器僧就是想要告诉大家,佛教并不是人们想象中的难以接近。而我们又向探索佛教和机器人之间的关系,基于这样双向的需求,我们也希望通过以一个现代的机器人让现代人知道佛教并不是古老的,不仅是只有拜佛、烧香。为了让现代人喜欢佛教,寺庙先创作了贤二的卡通形象,基于卡通又做了机器僧。
目前我们已经开始给贤二做了一个师傅,1米28的高度。师傅和贤二之间会有一些交流。贤二机器僧(二代)的声音是科大讯飞的技术支持。
9月22日,讯飞开放平台在上海举办的创客茶话会圆满结束。下一站,如果你希望我们的活动来到你的城市,就请留言吧!
考虑到活动在工作日的晚上举行,工作人员贴心地为下班赶来的开发者准备了丰富的茶歇,不少小伙伴早早的来到现场与技术人员切磋交流。“给我来首周杰伦的歌”“好的为你播放周杰伦的《晴天》”“低头思故乡,下一句是什么”“亲,这已经是最后一句了哦”AIUI极佳的用户体验给大家带来很多惊喜,好奇宝宝们玩得不亦乐乎。
讯飞开放平台成立以来开发者、用户、服务量、应用呈指数型增长,市面上基于语音技术的新产品层出不穷,随着技术覆盖的场景越加丰富,很多小伙伴并未了解开放平台的所有功能;对于技术如何用于自己的产品一头雾水…在本次活动上,讯飞开放平台技术总监吴江照,就现阶段讯飞开放平台的核心能力作概括总结,并就大家的问题给予详尽的解答,让小伙伴们更深刻地感受到我们在人工智能道路上的深耕细作。
在一屋子开发者中,两个妹纸显得格外亮眼,俨然成为本场活动的颜值担当,这两位来自游族网络mob部门的的工作人员,虽然不是技术出身,但是她们表示参加本次活动,一方面是想了解更多的语音技术,另一方面希望通过这次活动与开发者们多多交流,同时期待和讯飞开放平台的深度合作。
大连和创懒人科技有限公司刘先生在得知这场活动后,第一时间报名,并专程从大连飞到上海参加活动。针对他想要了解的技术和反馈的问题,我们找到相关的技术负责人为他详细的答疑解惑。对于这次活动,他觉得很有意义:因为一直都是线上进行沟通,很多技术问题很难说清楚,这样的线下活动简单直接,拉近了大家的距离。
这两个萌萌的机器人吸引了现场很多人的目光,纷纷围绕在它身边与其互动。它们来自木牛科技,木牛科技正在打造一个机器人智能协作平台,在这个平台,各机器人公司可以根据自身产品的能力特点,打造属于自己的独特的机器人协作场景,从而完成单个机器人无法实现的功能。
创始人俞先生特地带来两个不同的机器人为大家进行展示,他介绍说,当前使用了讯飞麦克风阵列等技术,下一步将采用环形麦克风阵列为用户带去更好地体验。同时他还提出一个问题:目前机器人的中文的发音人很满意,但暂时还没有合适的童声英文发音人。
和俞先生一样希望尽快使用上童声发音人的还有来自工程师爸爸的耿先生,工程师爸爸是国内领先的家庭教育平台,旗下有面向0-12岁婴幼少儿推出的儿童故事平台“口袋故事”。
针对这个大家关心的问题,语言合成技术负责人刘坤给出了解释:童声英文发音人制作周期相较于其他发音人会长一些,虽然暂时没有上线,但已经提上日程,不久优质的童声英文发音人就能与大家见面啦!
9月22日讯飞开放平台将携手博客园在上海与小伙伴们见面,现在想要报名的小伙伴还有机会哟~
讯飞开放平台的离线语音服务全部打8.5折啦!包括离线语音合成、离线命令词识别、语音唤醒三项离线语音服务,有需要的小伙伴们赶快去官网下载SDK吧!
巷口一声“卖冰棍咯”总能馋坏嬉笑打闹的顽童,叫卖声夹杂着童年记忆伴着我们长大。如今,记忆中的叫卖声也不曾消失:在超市、商场、步行街,听到志玲姐姐喊你来份台式奶茶、外婆来喊你回家吃饭,蜡笔小新邀请你尝试店内新款,还有男神杨洋约你来看手机~
借助离线语音合成,即使在没有网络的情况下,你也能够用特色的语音给身边的人一个惊喜!
科大讯飞将于8月30日在上海举办“胡郁有约-人工智能领域独家干货分享”沙龙,会是这个夏天最不容错过的科技聚会!
原文链接:http://t.cn/Rt8fRhV
王小川还对 AI 技术有哪些思考?我们又到底该用 AI 来创造什么?在7 月 15 日的「奇点·创新者峰会」上,王小川将在现场分享他对 AI 技术的思考以及我们可以看到的未来。
今年 5 月 7 日,一位名叫 Joshua D. Brown 的美国俄亥俄州白人男子成为了第一位死于自动驾驶技术的人,而Tesla 和人工智能技术再一次走向了评论的风口浪尖。
过去一年,你可能已经见过或听过各种以「人工智能」为噱头包装的公司,随着「人机大战」带来的持续讨论,「人工智能」似乎也成为了企业争相抢夺的未来入口。
除了「机器学习」、「模式识别」和「神经网络」这些晦涩的词汇和各种层出不穷的借势营销,这个看似离我们越来越近的市场却在「互联网玄学」的外衣下显得愈发迷雾重重。
在外界普遍认为的人工智能元年里,我们看到更多的是初创型企业的活跃,尽管危机重重的百度已经将发展重心重新回归到人工智能,腾讯和阿里也相继计划建立各自的 AI 研究体系,但产业内关键性力量的缺失也成为了一些评论家质疑市场可行性的口实。
但 搜狗 CEO 王小川肯定算是这其中的「异类」。近几年,在搜索、输入法和地图等业务上稳步发展的同时,面对人工智能浪潮的王小川似乎是 AI 技术的最坚定站台者。在出资 1.8 亿元联合清华大学成立「天工研究院」后,这家以搜索和工具起家的公司更是将未来和人工智能紧密地结合在了一起。
事实上,从搜索、输入法、地图到语音助手,「人工智能」的基因似乎扎根于每一件搜狗想做的事。而在王小川眼里,搜索引擎公司是人工智能基因最足的模式,拥有了这一基因的搜狗将怎样让人工智能技术更好地与产品应用相结合?王小川又如何看待有关 AI 的那些事儿?
「这是我觉得近几年最懊恼的一次。」
去年年初,搜狗CEO王小川已经开始意识到了深度学习技术有机会应用于围棋博弈,但限于资源、精力,一直没有在内外部找到合适的机会来启动这个项目。
直到 AlphaGo 相关的论文出现,王小川才万分后悔懊恼,于是在 AlphaGo 和李世乭的比赛中,花了较多时间去参与技术的解读和现场直播解说,但也可能只是「弥补了 10%,还是有很大的遗憾。」
「一方面是自己本身有这样一个信仰,然后一看谷歌已经走在前面了,我也相信它的技术实力,也就是 80% 是对技术的理解,20% 是对谷歌和人工智能情怀的认同。」
王小川并不认为在未来人类和人工智能的关系是「对立」的,他还是认为机器更多的是对人类的一种辅助,而且强调这种辅助早已存在,「机器可能不是一个机器人的形态,大家现在手机里或者各种智能家居都是机器的表现之一。」人工智能的大趋势是和人实现融合。
当然,对于机器取代人的话题,王小川的判断是:「如果同样一件事情,机器干得比人好,那人就会被机器取代,这是规律和趋势。」
但是,人工智能并非将要替代人类,而是人类未来的发展方向,如同今天的机械工具一样,最终将成为人类能力的延伸。
「只有忘却恐惧,我们才能进步与觉醒,在我们建造的世界里,让生活更加美好。」
Google 在收购 DeepMind 团队之前,双方曾签署了一份协议,协议规定双方不得以 DeepMind 的技术进入到军事和监控等领域;同时,他们还成立了九席的道德委员会,其中,Google 和 DeepMind 团队各占三席,另外的三席由独立的倒是占据,这其中就包括曾对人工智能发表过隐忧言论的 Elon Musk。
王小川就觉得这是一个非常好的风险防控机制,并且人工智能带来的正面意义要远大于他所带来的危险。
在 机器是否会取代人这个问题上,一项工作如果面临的环境越简单,最后的动作越标准,比如审计师、司机,就越有可能被机器取代。但其实还有很多机器解决不了的 问题,比如:创造力的问题、认知上的问题、人的好奇心的问题。人工智能到今天为止还只是帮助完成简单的重复性的脑力劳动,更加具有挑战性、更有创造性的事 情还需要人类来完成。
「在用户需求的场景下,未来会面临两个挑战:第一是自然交互的技术进步,包括图像及语音。第二是知识的索引,更好地与搜索结合。」
在 图像处理领域,以人脸识别为例:每个人的脸长什么样子,使用程序去描述是非常困难的,而深度学习的方法,在建立一套数学模型之后,只要把人脸照片放进去, 告诉计算机这张照片对应的名字是什么,在大量数据的基础上,它就能开始自动提取特征,把复杂的物理图片抽象成机器智能懂得的特征。
在语音识别领域中,到今天为止机器对语音的识别能力也已经开始接近于人。输入方式也可能会越来越自然。比如说语音输入开始了,以后你的表情,你的手势,甚至通过数据分析对你的理解,都能够让机器懂你要什么,而不是打字的方式了,甚至脑电波都有可能。
而 在搜索领域中,之前搜索引擎是让你获得知识和答案,但这还是一种初级的形态:你需要给它一个关健词,然后它从数百亿网页里面找十条最好的给你。但是随着人 工智能的发展,这个产品形态会发生变化:机器开始具有对概念理解的能力,知道你实际需要什么,然后通过计算给你一个它认为正确的答案,而不是单纯的十条链 接。
「输入法朝着交互技术在走。所以以后一方面,输入法输入的不仅仅是文字了,我们语音已经做了,以后你的视觉、你的表情、你的眼神、你的手势也变成输入的一部分,它变成你交互的界面,我们这方面也开始做一些探索。」
在王小川眼中,搜索可以提供你要的答案:
「因为今天给你 10 条链接,它也不知道你干吗,反正你自己点就行了,但当它懂你以后,它就会给你答案,给你解决这个问题了。」
「做搜索引擎本质上就是做人工智能,搜索引擎就是知道你要什么,在众多的机会面前帮你做选择,并具有一定的智力去思考。搜狗在人工智能领域也已经做了非常多的事情,在包括语音识别、图像处理、网页排序和商业广告体系等领域中都开始大量使用深度学习的方法。」
王小川觉得,搜狗的人工智能基因存在于具体的产品模式中。
在 语音识别方面,因为搜狗在做输入法,有上亿人次使用搜狗语音输入然后转化成文字;图像处理方面,拍摄照片,然后通过图片搜索找到类似产品,这样的功能也已 经上线了。比如当用户开车时,是无法用手输入文字的。搜狗的语音助手不仅让用户可以用语音输入文字,还能用语音进行修改,比如说出「弓长张改成立早章」、 「大钟寺改成牡丹园」,系统都会立即对文字进行相应的修正。
另一方面,机器输出的也不一定是文字,而是可以帮助你产生一些你想要表达的答案。比如聊天场景中,我们说下午两点还是三点见?用户就不用像做填空题一样输入两点还是三点,而是机器给你选择甚至直接给你答案。
而 在导航方面, 传统意义上的导航仅仅解决了「如何从 a 地前往 b 地」的问题,但其实使用导航时,用户并不只是为了前往 B 地,他的真正的意图是「去 B 地做什么」。比如一个人要去机场,这个人是要去哪个航站楼?到底是去出发层还是到达层?航班的情况如何?什么时间到最合适?这些问题都是用户潜在需要考虑 的。
所以对导航背后意图数据做足够的分析,可以把首都机场分为 T1、T2、T3 航站楼,导入所有的航班信息,当用户给出航班号便可以得知航班的情况,对应出发和到达,并给出出发时间建议,把这些和语义技术结合在一起做出更好的服务。
王小川认为,接下来搜狗要做的是让机器变得更加聪明,去真正理解人类的想法。
「我们也希望在人工智能里面走的更远,包括对于视觉图象的理解,计算语言的推理。使得我们的输入法,走向一个能够更多地理解人表达的一种输入,也使得我们搜索引擎变成一个懂人的,能回答并提供服务的智能机器人。」
在这样的一个背景下,搜狗也和清华大学合作联合成立了「清华大学天工智能计算研究院」,该研究院将致力于人工智能领域的前沿技术研究, 而研究成果也将应用于搜狗相关产品及服务中。
「一 方面我们会去开放大量搜索引擎独有的数据,使中国科研界所拥有的数据能力超过全球其他科研界所拥有的数据能力;另一方面我们也会去开放更多的计算的能力和 算法的能力,使得中国的科研界或者说企业界拥有一个更好的人工智能的起点。从而使得搜索引擎天生拥有大数据以及计算能力,在整个人工智能的元年能够更好地 推动人工智能的发展。」
【转自极客公园】
16年5月13日,备受瞩目的第二届中国硬件创新大赛以“突破蜕变”之势迎来了“全国巡回实战培训会”首站北京场活动。培训会上,来自主办方的星云智能硬件加速器、华强聚丰联合知名企业科大讯飞,IdeeBank等,从硬件创业的“供应链制造”、“资本对接”“技术方案”“市场营销”4个重点方向为创业者答疑解惑,并提供一对一30分钟辅导环节,为硬创者提供全方位支持。