DNN、RNN、CNN.…..一文带你读懂这些绕晕人的名词

在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。
这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。

「撞脸」一直都是娱乐圈一大笑梗。

要是买火车票的时候碰上孙楠、杨臣刚、王大冶……脸盲症患者可以直接放弃回家,原地暴哭了。

640

 

当然,「撞脸」可不是娱乐圈的特有的,在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。

这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。
6401

 

1、三代神经网络的发展

在正式开讲这3者的区别之前,我们先简单做个回顾,第一代和第二代神经网络到底是什么?

第一代神经网络又称为感知器,在1950年左右被提出来,它的算法只有两层,输入层输出层,主要是线性结构。它不能解决线性不可分的问题,对稍微复杂一些的函数都无能为力,如异或操作。

为了解决第一代神经网络的缺陷,在1980年左右Rumelhart、Williams等人提出第二代神经网络多层感知器(MLP)。和第一代神经网络相比,第二代在输入层之间有多个隐含层的感知机,可以引入一些非线性的结构,解决了之前无法模拟异或逻辑的缺陷。

第二代神经网络让科学家们发现神经网络的层数直接决定了它对现实的表达能力,但是随着层数的增加,优化函数愈发容易出现局部最优解的现象,由于存在梯度消失的问题,深层网络往往难以训练,效果还不如浅层网络。

2006年Hinton采取无监督预训练(Pre-Training)的方法解决了梯度消失的问题,使得深度神经网络变得可训练,将隐含层发展到7层,神经网络真正意义上有了“深度”,由此揭开了深度学习的浪潮,第三代神经网络开始正式兴起。
6402

 

2、深度神经网络最常用的三大算法

说完了三代神经网络的大概发展,我们现在来看下第三代神经网络中经常让大家叫苦的3大名词:DNN、RNN、CNN。

DNN:深度神经网络

从结构上来说,DNN和传统意义上的NN(神经网络)并无太大区别,最大的不同是层数增多了,并解决了模型可训练的问题。

简言之,DNN比NN多了一些隐层,但这些隐层的作用是巨大的,带来的效果是非常显著和神奇的。
6403

 

当然第三代神经网络能够带来神奇的效果,并不仅仅是因为它的模型结构和训练方法更为优化、算法更加先进,最重要的是随着移动互联网的普及海量数据的产生和机器计算能力的增强。

DNN中的“deep”意为深度,但深度学习中深度没有固定的定义或者衡量标准,不同问题的解决所需要的隐含层数自然也是不相同的,就大家比较熟识的语音识别来说,解决问题可能4层就够了,但一般图像识别需要达到20多层才能够解决问题。

DNN最大的问题是只能看到预先设定的长度的数据,对于语音和语言等前后相关的时序信号的表达能力还是有限的,基于此提出了RNN模型,即递归神经网络。

RNN:递归神经网络

全连接的DNN存在着一个无法解决的问题:无法对时间序列上的变化进行建模。

为了应对这种需求,业内提出了上文中提到的递归神经网络RNN。

在普通的全连接网络中,DNN的隐层只能够接受到当前时刻上一层的输入,而在RNN中,神经元的输出可以在下一时间段直接作用到本身。换句话说,就是递归神经网络它的隐层不但可以接收到上一层的输入,也可以得到上一时刻当前隐层的输入。

这一个变化的重要意义就在于使得神经网络具备了历史记忆的功能,原则上它可以看到无穷长的历史信息,这非常适合于像语音语言这种具有长时相关性的任务。
6402

 

CNN:卷积神经网络

卷积神经网络主要是模拟人的视觉神经系统提出来的。

以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。
6403

 

卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层和全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核,一个卷积核覆盖的原始图像的范围叫做感受野(权值共享)。

一次卷积运算(哪怕是多个卷积核)提取的特征往往是局部的,难以提取出比较全局的特征,因此需要在一层卷积基础上继续做卷积计算,这就是多层卷积。
6401

 

在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。

通过这种池化的操作,能够一定程度上克服图像的一些旋转和局部的细微变化,从而使得特征的表达更加稳定。
好啦,今晚对DNN、CNN和RNN的简单科普到这里就结束了,关于每种网络的用法大家还需要在实际建模中努力探索。

当然不论是哪种算法,它们往往都会混合在一起使用以达到效果的最优化,同学们要做的便是掌握好理论知识,在实践中找到最灵活的组合方式。

同时「AI大学移动端」已经上线了科大讯飞AI研究院王海坤院长的人工智能系列课程,小伙伴们记得戳菜单栏【AI大学】或点击阅读原文,去学习更多AI知识!
640

 

AI研究院副院长  王海坤博士

w640

 

参赛必看|想拿百万奖金吗?赛前锦囊火热来袭

AI开发者大赛报名倒计时

2018首届“顶天立地”iFLYTEK AI 开发者大赛正在火 !热 !报 ! 名 ! 中 !

【点击这里】直接进入报名通道~

大赛-1
2018首届“顶天立地”iFLYTEK AI 开发者大赛报名启动以来,大家通过各种途经向组委会提出了很多问题。别着急!小编会尽快把大家普遍关心的问题整合分类,一一为大家答疑解惑哦~

今天我们先从“应用开发AI挑战赛”开始~

【参赛要求】

1.参赛作品必须使用包括AIUI人机对话交互在内的至少一项讯飞开放平台能力。

2.参赛作品使用语音和图像相关人工智能能力需优先调用讯飞开放平台技术接口。其他厂商AI技术接口调用不得超过一种。

3.合法性:参赛作品主题内容必须健康、合法、没有任何不良信息及商业宣传行为,不违反任何中华人民共和国的有关法律。

4.原创性:参赛作品必须保证原创性,不侵犯任何第三方知识产权或其他权利;一经发现或经权利人指出,主办方将取消其参赛资格。

【评审标准】

1.产品创新性:参赛作品是否具有充分的创新性,与行业成熟方案相比较有差异化,有更好的产品表现。

2.产品实用性:参赛作品是否能够解决所在领域的实际问题,解决用户痛点。

3.AI能力结合度:参赛作品是否结合AI技术,使得产品的体验及功能有了突破性进展。

4.产品商业前景:参赛作品能否创造较好的社会和市场效益,具有较为广阔的商业前景。

看到这些要求和标准,你是否感到茫然失措?别着急!今天小编就给大家分享几个借助讯飞开放平台技术应用开发的优秀案例,希望可以给你们激发一些灵感!

继续往下看↓↓↓

1-1案例1.叮咚音箱

叮咚配有8个麦克风阵列,确保它可以听清你说的每一句话,无论你身在房间哪个位置。独特的远场识别技术,支持5米超远距离语音交互。AIUI硬件特有的回声消除技术,使这款智能音箱能过滤掉各种背景噪音,包括正在播放的音乐等,以便更为准确地领会用户指令。可以帮助用户听歌,听新闻,定闹钟,闲聊等。

1-2案例2.阿尔法蛋

阿尔法蛋机器人是淘云科技有限公司倾力打造的一款教育陪伴智能机器人。集成教育内容、超级电视、视频通话、智能音箱和自然语言交互机器人的阿尔法蛋是一款功能聚合的机器人,功能与服务面向家庭所有成员。搭载讯飞AIUI智能系统,拥有“类人脑”,其理解能力、表达能力,智商都会随着深度自我学习,不断成长,是一款“真”机器人。

1-3案例3.合肥轨道

合肥轨道交通首开全国先河,创新推出“语音购票”服务功能,通过搭载AIUI评估板,市民乘客将在轨道交通车站自动售票机上通过语音选择目的地站点、购票张数,再通过现金或者手机扫码完成购票交付。

1-4案例4.咪咕莫比斯耳机

莫比斯通过搭载AIUI交互系统,聚合语音操控、中英翻译、心率监测、健身指导、日程管理、出行导航、路线规划、音乐听书等的完整体系。这是咪咕在智能时代对全新人机交互的探索,通过全语音交互,它的应用场景会更加多元化,智能化,它的核心价值也远超主流耳机产品,因此莫比斯才能被定义为全球首款全语音人工智能耳机。

1-5案例5.荣泰

荣泰智能语音按摩椅搭载AIUI , 配合多麦克风阵列,灵敏交互、精准识别之灵,操控准确便捷,解放双手,让休憩更彻底。

1-6案例6.优友机器人

优友机器人是康力优蓝机器人科技有限公司推出的高端大型服务机器人产品,优友以完美的造型亮相,一经发布即引起业内强烈关注,优友的语音系统采用科大讯飞的AIUI解决方案,机器人进而具备各种功能,成为银行引导员、公司前台、商场导购、展馆导览员、餐厅服务员等等,在存在劳动力缺口的各个领域中都有望得到广泛应用。

【大赛概况】

2018首届“顶天立地”iFLYTEKAI开发者大赛面向全球开发者首次开放中文方言语音数据集,践行“方言保护计划”,用人工智能算法推动非物质文化遗产保护。

除了方言语音数据集之外,还将开放AIUI人机对话交互,语音听写、合成、评测、翻译等十余项人工智能核心技术,促进人工智能应用场景的落地。

大赛共分为方言种类识别AI挑战赛和应用开发AI挑战赛两大赛题进行比拼,百万奖金,等你来战!

1-7

除丰厚奖金外,大赛聚合讯飞生态平台、AI大学优质资源,获奖团队可获得价值500万元的创业扶持,包括技术支持、资本对接、创业指导、品牌曝光等优质生态资源。
以上就是本期给大家准备的赛前干货啦,希望可以给大家带来一些启发~下期我们为大家带来方言种类识别AI挑战赛的干货哦~敬请期待!

【赶快点此报名】

我们一起,让AI更有情怀,让技术更实在!

想了解大赛更多详细信息和最新消息,可以添加开发者大赛小助手的微信,此为小助手的微信号二维码:

1-8

 

关注“讯飞开放平台”公众号,获取更多资讯

开放平台

参赛必看|权威专家带你解密方言种类识别AI挑战赛

AI开发者大赛报名倒计时

距2018首届“顶天立地”iFLYTEK AI开发者大赛报名截止时间越来越近了。你的参赛作品准备好了吗?【点击这里】即可直接进入报名通道!

上期为大家介绍的是“应用开发AI挑战赛”的相关内容。有不少小伙伴留言,强烈要求小编再出一版关于“方言种类识别AI挑战赛”的一些具体赛况。今天小编就来满足你们~

方言赛

针对大家对“方言种类识别AI挑战赛”的一些提问,我们邀请到了科大讯飞研究院科学家、语言识别技术总负责人潘嘉为大家进行赛事解读。小编把潘嘉老师的解读整理了下,分享给大家,满满的干货,小板凳快搬好,准备记笔记啦~

方言种类识别AI挑战赛
【赛题详情】

方言种类识别 AI 挑战赛任务为汉语方言语言种类识别,即根据给定语音,判断该语音属于哪个方言。

科大讯飞全球首次开放覆盖中国六大方言区、总时长约 60 小时的 10 种汉语方言语音数据集,供参加竞赛的科研单位以及开发者免费使用。

根据测试语音长度,方言识别 AI 挑战赛分为两个不同难度的子任务,即任务一(有效语音长度≤3s )和任务二(有效语音长度>3s)。

结果评价指标为分类正确率 acc:即分类正确的语音条数/所有语音条数。

训练集合与开发集合供参加竞赛的科研单位以及开发者调试系统使用,测试集合不开放,最终排名以参赛者提交的系统在线上测试集合上的结果为准,分类正确率越高排名越靠前。

【开放数据】

初赛共有六种方言,分别来源于六大方言区,具体为:长沙话、河北话、南昌话、上海话、闽南语、客家话。

为了进一步提高数据的覆盖性,测试集在性别等方面都做过精心的挑选。每种方言平均包含6小时的朗读风格语音数据,覆盖40个说话人。数据由各个型号的智能手机采集,录制环境包含安静环境和噪声环境。数据以采样率16000Hz、16比特量化的PCM格式存储。

数据集包含训练集、开发集和测试集三个部分。

训练集每种方言有6000句语音,包含30个说话人,其中15位男性和15位女性,每个说话人200句语音;开发集和测试集分别每种方言包含5个说话人,其中开发集为2名女性和3名男性,测试集为3名女性和2名男性。这样的数据具有非常高的使用价值。

开发集和测试集的数据根据语音段的时长分为两类,一类是小于等于3秒的短时数据(任务一),另一类是大于3秒的为长时数据(任务二),分别对应于两个比赛任务,其中每个说话人两类数据各50句,共100句。训练集、开发集、测试集的说话人均没有重复。

为了增加本次比赛技术方案的多样性,每条语音对应文本内容的音素序列标注也将同样提供。

【参赛系统】

参赛系统的搭建方法不限,所有机器学习的方法均可以使用,并且参赛系统可以是多种方法以任意形式的结合,比如投票法等等。

两个不同的比赛任务可以采用两套完全独立的系统。比赛采用离线测试的方式进行,因此本次比赛对参赛系统的响应时间不做要求。

同时,考虑到复赛和初赛的难度差异,复赛和初赛也可以采用不同的系统。

【评测方式】

本次比赛的测试集是不公开的,因此需要参赛者提交自己的系统,具体操作方式如下:

a)初赛提交系统时,请提交参赛者名称、第一作者、该系统对应的任务、参赛系统、训练集和开发集上的分类正确率

b)复赛提交系统时,需要额外提交一份参赛系统的论文或者说明书(最好能够附带提供源代码),详细介绍系统的构成、训练方法和对应的参数

c)如无特殊情况,每天上午11点在官方网页上公布各个参赛者在测试集上的分类正确率并对结果进行排序(每个参赛单位的结果以最新提交的为准)

【评测系统】

为了能够正确进行测试,所有测试均在相同配置的Linux 64位服务器上统一采用CPU进行测试。因此提交的系统不能是windows等其他操作系统下的程序,并且不能和GPU、FPGA等其他硬件相关联。同时为了方便参赛者更好的参加比赛,本次比赛制定了详细的参赛系统提交和评估系统,介绍如下:

1.评测系统目录结构

/dataset…………开发集目录,用于系统提交后的正确性验证
/inference………评测代码及资源目录,系统运行的当前路径
/result …………请将评测结果以result.txt命名,存放在此目录

result.txt请按照result.txt中的格式。格式如下:

posterior: changsha, hebei, nanchang, shanghai, kejia, minnan
sent1: 0.01, 0.02, 0.03, 0.04, 0.1, 0.8
sent2: 0.7, 0.02, 0.04, 0.1, 0.06, 0.08
sent250: 0.01, 0.02, 0.03, 0.04, 0.6, 0.3
ACC: 0.8854

2.本地开发调试

a)使用开源深度学习训练框架(推荐)

请从公开镜像仓库下载对应版本的深度学习镜像CPU版本,编写本地程序进行评测。

以tensor flow工具为例:

I.下载镜像,docker pull tensorflow/tensorflow: 1.7.0

II.下载开发集到 /dataset目录,将评测代码inference.py及评测所需资源复制到 /inference目录

III.运行镜像,docker run –it –v /dataset:/dataset –v /inference:/inference –v /result:/result tensorflow/tensorflow:1.7.0 /inference/inference.py

IV.查看输出结果,并检查该输出结果的正确性其他框架与此类似。
b)使用非开源深度学习训练框架

首先,要将使用的深度学习训练框架制作成docker镜像,上传至公开镜像仓库(推荐使用国内稳定镜像仓库服务,如UCloud),制作详情可参考docker官方文档,具体操作如下:

I.在hub.docker.com注册账号,并创建仓库

II.本地执行docker tag your_demo your_account/your_demo:latest

III.本地执行docker push account/your_demo:latest,等待命令执行成功后,即可在hub.docker.com网页上,看到新提交的镜像信息
镜像提交完成后,参考使用开源深度学习训练框架中的步骤,进行本地开发和调试
具体的为:
IV. 下载上传的镜像,docker pull yourtoolname

V.下载开发集到 /dataset目录,将评测代码inference.py及评测所需资源复制到 /inference目录

VI.运行镜像,docker run –it –v /dataset:/dataset –v /inference:/inference –v /result:/result yourtoolname /inference/inference.py

VII.查看输出结果,并检查该输出结果的正确性

3.提交评测系统

a)将/inference目录打包成tar文件,tar –cvf inference.tar inference/
b)在比赛官网中评测系统提交页面进行上传

4.线上验证及评测

a)配置系统所需的镜像仓库地址,镜像入口及验证参数(/dataset目录由系统自动将开发集挂载到镜像内)
b)点击”运行”,等待评测结果
c)如评测报错或效果异常,请排查/inference目录结构、镜像等配置信息
d)确定评测结果无误后,点击”提交”。此时/dataset内将替换成为非公开的测试集,并记录系统效果

【限制条件】

为了保证比赛的公平性,本次比赛仅允许使用官方发布的数据和标注,否则比赛成绩将被视为无效。

不符合规定的情况包括以下几种:
a)参赛系统搭建过程中有任何一个环节(包括数据加噪、模型初始化等)用到了官方发布的训练数据集之外的其他数据
b)人工对发布数据集的音素序列标注进行矫正或改动
c)其他对发布数据集的人工处理,比如人工对数据集进行语音端点检测等

以下情况是允许的:
a)仅利用官方发布的训练数据集进行数据的机器仿真和加噪
b)利用官方发布数据集中已公布的所有信息,包括性别、说话人等
注:
完整的初赛数据集请在报名成功后前往个人中心-我的比赛,进入方言识别比赛专题页面进行下载

最后,潘嘉老师还为大家提出了一些新的研究方向。

科大讯飞首次提出基于BN i-vector的方法来解决语种识别的问题,相比传统的SDC特征的i-vector方法有着较大的提升。近几年来,类似于DNN等新的深度学习技术,也是可以尝试的方向。

具体的方法多种多样,比如可以直接利用文本信息来训练一个文本的分类器,跟传统的基于i-vector的方法进行融合,或者也可以把它作为一种外部的信息源,加入到端对端系统的输入中,直接训练端对端的系统。
今天的赛前分享就到这里了,感谢潘嘉老师的倾力相助。相信优秀的你们,一定会创造出出类拔萃的作品,小编再一次提醒大家,报名时间不多啦,大家千万别忘记报名了哦。

【点此报名参赛】

想了解大赛更多详细信息和最新消息,可以添加开发者大赛小助手的微信:

1-8

2018-03-22 ~ 2018-10-24合肥
听得懂,才智能!语音唤醒技术入门课程来啦

超多干货在里面

AI大学的同学们,大家好,新课程又来啦,本周,我们要学习的是“语音唤醒”的相关内容。

对于智能产品的用户来说,唤醒就是语音交互的第一入口,唤醒效果的好坏直接影响到用户的第一体验。所以,今天的内容还是很重要滴,同学们要认真听讲哦~

话不多说,有请今天的主讲嘉宾:科大讯飞研究院吴国兵老师,掌声欢迎~

唤醒01

1、什么是语音唤醒

语音唤醒在学术上被称为keyword spotting(简称KWS),吴老师给它做了一个定义:在连续语流中实时检测出说话人特定片段。

这里要注意,检测的“实时性”是一个关键点,语音唤醒的目的就是将设备从休眠状态激活至运行状态,所以唤醒词说出之后,能立刻被检测出来,用户的体验才会更好。

那么,该怎样评价语音唤醒的效果呢?通行的指标有四个方面,即唤醒率、误唤醒、响应时间和功耗水平:

➤唤醒率,指用户交互的成功率,专业术语为召回率,即recall。

➤误唤醒,用户未进行交互而设备被唤醒的概率,一般按天计算,如最多一天一次。

➤响应时间,指从用户说完唤醒词后,到设备给出反馈的时间差。

➤功耗水平,即唤醒系统的耗电情况。很多智能设备是通过电池供电,需要满足长时续航,对功耗水平就比较在意。

2、语音唤醒的技术路线

经过长时间的发展,语音唤醒的技术路线大致可归纳为三代,特点如下:

第一代:基于模板匹配的KWS

唤醒02

训练和测试的步骤比较简单,训练就是依据注册语音或者说模板语音进行特征提取,构建模板。测试时,通过特征提取生成特征序列,计算测试的特征序列和模板序列的距离,基于此判断是否唤醒。

第二代:基于HMM-GMM的KWS

唤醒03
将唤醒任务转换为两类的识别任务,识别结果为keyword和non-keyword。

第三代:基于神经网络的方案

唤醒04

神经网络方案又可细分为几类,第一类是基于HMM的KWS,同第二代唤醒方案不同之处在于,声学模型建模从GMM转换为神经网络模型。 第二类融入神经网络的模板匹配,采用神经网络作为特征提取器。第三类是基于端到端的方案,输入语音,输出为各唤醒的概率,一个模型解决。

3、语音唤醒的难点

语音唤醒的难点,主要是低功耗要求和高效果需求之间的矛盾。

一方面,目前很多智能设备采用的都是低端芯片,同时采用电池供电,这就要求唤醒所消耗的能源要尽可能的少。

另一方面,用户对体验效果的追求越来越高。目前语音唤醒主要应用于C端,用户群体广泛,且要进行大量远场交互,对唤醒能力提出了很高要求。

要解决两者之间的矛盾,对于低功耗需求,我们采用模型深度压缩策略,减少模型大小并保证效果下降幅度可控;而对于高效果需求,一般是通过模型闭环优化来实现。先提供一个效果可用的启动模型,随着用户的使用,进行闭环迭代更新,整个过程完成自动化,无需人工参与。

4、语音唤醒的典型应用

语音唤醒的应用领域十分广泛,主要是C端产品,比如机器人、音箱、汽车等。比较有代表性的应用模式有如下几种:

➤传统语音交互:先唤醒设备,等设备反馈后(提示音或亮灯),用户认为设备被唤醒了,再发出语音控制命令,缺点在于交互时间长。

➤One-shot:直接将唤醒词和工作命令一同说出,如“叮咚叮咚,我想听周杰伦的歌”,客户端会在唤醒后直接启动识别以及语义理解等服务,缩短交互时间。

➤Zero-shot:将常用用户指定设置为唤醒词,达到用户无感知唤醒,例如直接对车机说“导航到科大讯飞”,这里将一些高频前缀的说法设置成唤醒词。

➤多唤醒:主要满足用户个性化的需求,给设备起多个名字。

➤所见即所说:新型的AIUI交互方式,例如用户对车机发出“导航到海底捞”指令后,车机上会显示“之心城海底捞”“银泰城海底捞”等选项,用户只需说“之心城”或“银泰城”即可发出指令。

唤醒05
好啦,关于“语音唤醒”今天就先介绍这么多,想要仔细学习课程的同学,【点击这里】可以查看吴老师的教学视频哦,下期课程再见。

关注“讯飞AI大学”公众号,及时了解更多信息

AI大学

AI黑科技| 什么才是真AI手机?

AI极有前景,甚至会驱动手机的发展方向

3月27日,华为在巴黎正式发布P20系列手机。华为消费者业务CEO余承东表示,“之所以叫P20,是因为我们有‘big jump’!”

黑科技-1

综合整场发布会来看,这 “big jump”应该包括:

【渐变色】运用先进的纳米真空光学镀膜技术,推出机身背面极光色、樱粉金等渐变配色方案;

【3摄】在联合徕卡研发了多代摄像头之后,这一场发布会上,华为P20 Pro直接将后置摄像头做成了3颗,成为业界最高感光度的手机;

【屏下指纹】高通的这项指纹传感器技术,可以扫描1200微米的OLED显示屏或800微米的保护玻璃,并且可以在水下进行操作。但由于Vivo手机今年年初在X20上的使用而占去先机,现在也已加入华为Mate20豪华套餐。

【保时捷设计】特别是压轴大戏中,保时捷设计版华为Mate RS,售价超过人民币一万三。

AI元素成宣传重点

当然,这些都不是最大看点。发布会上强调的最多的还是,华为P20系列具备全球首创AI环境音识别功能,无论任何嘈杂的室内或室外,可以清楚捕捉到声音的细节;通过AI算法识别物体及边缘,引入AI防抖技术,革新在场景识别优化方面的能力等等这些AI功能。

同日,小米MIX2S发布,主打口号也有AI场景识别,并且有了自己的AI语音助手,价格3299元起步。用雷军的话说就是,小米MIX2S拥有比iPhone X超低廉的价格,但各方面性能都优于iPhone X。

黑科技-3

27日的两大手机新品盛宴,AI始终是其中最重要的一环。这很好呼应了人工智能崛起的大背景下,手机行业掀起的AI风潮。但我们也必须清醒地认识到,并非所有声称具备AI功能的手机都真的能给用户体验带来颠覆性的改变。和手机行业中曾经流行的很多概念或技术一样,对很多厂商而言,AI不过是另一个华丽的营销包装罢了。今天就来和大家说说,什么才是真正的AI手机。

真正的AI手机是什么样的?

简单来说,真正要在手机上实现AI功能需要满足四个条件:芯片、算法、云服务和系统。

AI芯片对于手机的重要性不言而喻。AI本质是大量的计算,手机上实现AI首先要专门的、算力强大的硬件芯片。以我们所熟知的手机CPU、GPU为例,理论上图像处理工作也可以让CPU来完成,但CPU的图像处理能力远远不如GPU。同样的,AI芯片在进行神经网络计算工作时,它的效率和算力远高于CPU和GPU。要在手机上实现AI功能,专门的硬件芯片是最基础的。

GPU流畅运行游戏时,除了硬件本身的性能外,同时也要借助驱动、引擎。手机上的AI芯片也要借助一套成熟的算法,来自动深度学习、改进方法,从而更为智能。

此外,手机AI要更快更好地成长,不能止步于本地运算,同样要借助于云端的服务器,进行大数据的整合和计算。另外,在移动互联网普及成熟的今天,很多AI功能也要借助于其他平台的服务。例如从用户短信中解析出地址信息时,就需要地图服务来实现更进一步的导航功能。
硬件、算法、云服务,这些都是AI手机实现的基础技术,但对普通用户来说,他们直接和手机互动、感知到AI功能都需要通过最直观的操作系统。也就说,AI功能在手机上落地,还需要定制系统适配和整合。

黑科技-4

AI手机未来会如何发展?

可以看到的是,未来AI芯片会和CPU、GPU一样,性能不断提升,实现的AI场景也会更加丰富。此外,未来还有一个非常有利于手机AI发展的技术条件:5G。目前,在国内,5G网络已经被提上了日程,普通用户最快明年就能体验到。

每次手机行业中出现新的技术或功能时,都会引来大批厂商的跟风模仿。现在很多打着AI、人工智能旗号的手机其实都是伪AI产品。尽管如此,但从技术本身和未来的发展趋势来看,AI极有前景,甚至会驱动手机的发展方向。至少目前在某些成熟产品上,已经可以切实感受到AI对手机体验的提升。已经实现的AI功能主要有AI摄影、人脸识别、AI翻译等。在拍照时,手机会自动识别取景框中的物体、景物,做出智能识别和判断,然后再给出具体的算法方案,从而实现最佳效果。

黑科技-5
当然,作为普通用户的我们,在面对形形色色的手机AI宣传时,也需要擦亮眼睛,辨别出那些伪AI,买到名副其实的真AI产品。同时,市场会是最好的试金石。当消费者发现产品的实际体验和厂商的宣传不符时,伪AI的营销噱头自然就不攻自破。

科大讯飞胡国平:我们为什么要办AI大学?

“比人类更强大的不是人工智能,而是掌握人工智能的人类。”

上周,科大讯飞『AI大学·未来课栈@上海栈』圆满落幕,十多位AI领域的大咖学者以及创业者带来了精彩的演讲。今天,小编专门梳理了AI大学副校长、科大讯飞研究院院长胡国平的演讲内容,分享给大家,一起来听听关于科大讯飞AI大学的故事。

1.为什么要办AI大学?

各位AI大学的小伙伴们大家好,欢迎大家来到AI大学未来课栈上海栈。

我是AI大学的副校长,科大讯飞研究院的院长胡国平,我做了13年的院级领导干部,因为大家,终于升级为校级领导干部。在准备这个PPT的时候,我就在想作为校长应该去讲些什么。然后我想起了AI大学的荣誉校长刘庆峰刘总,他在做任何一件事情时都会问三个问题: “这件事情为什么要做?这件事情为什么是我们做?以及做这件事情的具体目标和计划。”

因此我下面的课程,也是从这三个问题来展开的。

1-1

我们为什么要做AI大学?

我们正处于人工智能第三次浪潮, 现在的人工智能已经不仅仅局限于机器下围棋这样的难题。

语音合成已经超过了一般自然人说话水平,语音识别达到了百分之九十七八的正确率。自动作诗、语音评测等很多方面,已经进入了人们日常的工作和生活中。

所以,要去做AI大学的第一个原因是AI发展极快,我比较喜欢说这样一句话:人工智能的无成本复制,和持续向前的能力是人类自身所无法比拟的。

一个英语大师的儿子,他的英语单词还是得一个一个自己背,但机器不会。一台的机器的语音识别率达到97%,所有的机器的识别率都可以达到97%,而且明年机器一定可以超过97%,达到98、99%。

第二,人工智能影响之广,去年7月国家发布了《新一代人工智能的发展规划》,规划了22个大的行业中都会有人工智能。

这些应用包括智能软硬件、智能机器人、智能医疗、智能教育等,几乎我们的生活、工作中所涉及到的行业领域都会受到人工智能的影响。

第三,人工智能人才之缺,一方面在人工智能技术的突破和引领下,在讯飞开放平台的支撑下,以及在AI硬件化商业模式的驱动下,人工智能领域百花齐放。

另外一方面,因为深度学习、大数据及云计算等一系列技术的成功,特别是深度学习作为一种通用的、强大的、适用广的人工智能算法,促使了各种人工智能的需求井喷,使得AI人才形成了供不应求的状态。

1-2
这些大家可能从媒体上也能看到,在智能工厂中传出某一个声音是不是预示着危险;以及基于人的一些运动轨迹信息,自动去识别他是在跑步还是在登山,这些都会涉及到人工智能算法和技术。

据专家估计,我国AI人才的缺口每年是100万,这个数据非常大,十年以后我们就有1000万的人工智能的相关人才。要实现服务亿万用户,研究千上万的各种AI技术,我们大概需要三类人才一起来做这件事情。

第一类是顶尖的科学家,他们需要去研究新的算法和理论;其次是更多、更广泛的AI的技术研究工程师,进行 AI技术的持续打磨、迭代优化等相关工作。

此外还需要大量泛AI人才,基于相关的AI技术去实现创新的产品和创新的服务,同时对传统行业升级改造。

根据这样的背景,在首届全球1024开发者节上,科大讯飞正式推出了AI大学——国内首个基于AI的在线学习平台。

2.AI大学的技术底蕴

我们先从AI大学的技术底蕴开始说起,科大讯飞在2017年一共获得了七项世界冠军;医考机器人参加了国家医师资格考试,以456分的高分通过,这是机器人首次通过人类的行业准入考试。

科大讯飞一直走在技术的最前沿,以现在这样的水平和技术实力, AI大学能够给各位学员提供最好的最新的人工智能技术。

另外一方面,科大讯飞很多的技术通过人工智能的开放平台对外开放,同时针对一些具体的场景,比如智能硬件、互联网、媒体娱乐等我们提出一站式的解决方案,使得相关的研发和创新工作更加的简洁、简单。

2018年在核心技术支撑的基础之上,科大讯飞将再开100项AI能力,这些会给各位学员和开发者提供更好的支撑。

1-3
现在,科大讯飞人工智能开放平台上累积终端数达18亿,开发者团队达60万,日均交互次数45亿。我们用这样一个社区让更多的合作伙伴更好地享用技术、更好地做头脑风暴。

3.AI大学的师资力量

对一个大学而言,师资力量是很关键的一部分,下面我来给大家介绍下AI大学的四位联合创始人。

科大讯飞的董事长刘庆峰担任AI大学的荣誉校长;科大讯飞执行总裁胡郁是AI大学的校长;我是AI大学的副校长;消费者BG执行总裁于继栋是AI大学的教导主任。

AI大学整个的师资构成主要有这三方面:特聘教授、技术专家和创业导师。

在特聘教授方面,我们邀请了国内外走在学术前沿的大咖、教授,来给大家分享最先进的技术和理念。

在技术专家方面,我们基于科大讯飞的一些技术团队,聘请相关的专家,构建起整个技术体系。

同时我们的创业导师,包括像吴霁虹老师,也会以后的创新创业过程中为大家提供更多的服务和咨询。

1-5
4.AI大学的课程和学员成长体系

AI大学的课程体系,主要分三个方面:AI前沿殿、AI工程院和AI实战堂。

前沿殿里面,我们会邀请走在AI最前沿的教授来给学员们讲AI的各方面的知识。我们希望用前沿殿的方式,让各位学员能够广泛地去了解AI技术最新的一些进展和变化。

AI工程院是由技术专家,更系统、更详细地去介绍相关技术的原理,以及如何利用讯飞人工智能开放平台的一些服务,来更好地实现创新和创业。

AI实战堂则是用创业辅导的方式,综合分析商业模式的构建、各个行业的态势,给各位学员在创新创业中提供更有效的支撑。

除此之外,AI大学还会用线上免费课程以及线下实战活动的方式,来给各位学员提供相应的课程体系和课程支撑。

对于学员而言,进入AI大学之后,一般会经过四个步骤来实现自己的学习和成长。

首先是学员的遴选、其次是学习和教引、再到结业认证,学员在AI大学毕业之后能拿到官方的认证书,证书能够在就业、创业、吸引投资过程中获得更好的支撑。

如果学员在整个学习过程中,有创新和创业的想法,我们也有相应免费的生态扶持。

5.iFLYTEK AI 开发者大赛正式启动

为了帮助大家进一步学习, 我们决定,从今天开始,正式启动2018首届“顶天立地“ iFLYTEK AI开发者大赛。大赛分两个主要的内容,一方面是培养和塑造AI技术工程师,我们称之为“技术顶天”的挑战赛。

另一个方面是培养相关的应用创新人才,“创意立地”的创意应用开发的AI挑战赛,助力大家去把自己的创意把自己的想法变成更可操作、可实施的方案。

1-7
我们为挑战赛准备了千万量级的数据集,一百万的奖金,免费的AI资源,科大讯飞的offer直通车,以及我们在全国包括苏州、杭州、天津、合肥等一系列创孵支持以及资本对接的直通车。

整个比赛从今天正式开始,4月份会进行专业的评审,6月份是初赛,7月份会进行复赛。主要在深圳、台北、硅谷、苏州和北京等地,进行相应的复赛,在决赛开启之前,9月份会做相应的辅导,10月份在1024开发者节上进行最后的决赛,Top64的团队会参与到决赛,最终决出来前三名。

同时我们还会设立包括市场潜力奖、技术创新奖等独特的一些奖项,最大力度地支持和鼓励大家参加开发者挑战赛。

最后,我想说比人类更强大的不是人工智能,而是掌握人工智能的人类,所以请在座的各位和我一起,欢迎大家加入AI大学,学习AI,走近未来。

(关注讯飞AI大学,收看更多精彩课程)

关注我们,收看更多精彩课程

创业,是一场朝圣之旅

创业没有白走的路,每一步都算数。

双创的大旗随风飘扬,众多创业者跃跃欲试,试图在这绝无仅有的宽松利好环境里大展拳脚,可丰满的理想搭配不了骨感的现实,再利好的环境想要孤军奋战杀出一条血路也是艰难的。

从idea到business,这条路要如何走?

人工智能无疑是当下最火的概念之一,随手输入“AI”这个关键词,立马弹出4520万的搜索量,近4万篇新闻报道。但如何将AI与创意落地,并最终成为商业是所有创业者需要关注的问题。

这一次,讯飞粒子空间来了。

111孵化器_meitu_1

国内某加速器入选复试的12家企业覆盖领域,全部与AI相关

讯飞粒子空间是什么?

这是一家技术驱动型AI加速平台,以打造中国专业的人工智能生态为目的,针对创业团队所面临的技术、产品、资源等痛点。提供全方位、立体式的服务。同时依靠品牌效应,联合资本机构以及社会优质第三方资源,为项目提供产业化、资源化的服务,推动创业团队快速成长。

在几百个项目申请里,我们关注到了智慧旅游这个方向,并从中筛选出两个优质项目团队

举个栗子:

随着人们生活水平的提高,旅游成了人们放松休闲的首选。唯睛视空这家公司将目光瞄准旅游市场,将AR/VR技术与人工智能技术相结合,打造丰视觉体验与智能语音交互相互融合的智能电子导游,使游客在游玩的同时享受周到的服务,从而全面提升游客游览体验,刺激二次消费,激活文旅产业的发展。

旅游数据_meitu_2

2015-2017年中国旅游市场规模预测(数据来源:Analyslys易观智库)

讯飞粒子空间为唯睛提供了丰富的智能语音技术支持,使其在自有计算机视觉技术积累的基础上与智能语音技术相融合,使维睛智慧旅游产品在提供丰富多样的视觉信息交互的同时,获得智能语音交互的有效补充,使产品适用的应用场景更加丰富完整。

logo

从创意到商业是一个艰难求索的过程,有好的idea是开头,如何落地实用才是归宿。类似唯睛视空这样将两者有机结合起来的创业公司还有很多,希望他们都能不忘初心,方得始终。

企业孵化器扎堆,加速器成第一接力棒

2017年清科研究中心发布了《2017年中国孵化器/加速器发展研究报告》,阐述了我国孵化器/加速器的发展历程及特点,并对国内外孵化器/加速器的发展模式进行研究分析。国内现有的加速器数量不多,质量高的更是凤毛麟角。

加速器是孵化器之后的第一接力棒,企业发展的前景、收益、口碑等,都是衡量一个加速器质量高低的标准。

逸途(北京)科技有限公司就是参加了粒子空间加速器的一家企业,逸途科技以“集万千人的力量为你一人服务”为使命,致力用人工智能技术为用户提供更智能便捷的体验。其中“皮皮虾旅行App”作为重要的组成部分,在市场上广受好评。

1501032708

皮皮虾旅行APP的一个强大服务是“打造专属定制旅行”。用户可以在客户端联系旅游规划师,第一时间全面高效地了解旅行目的地。

同时,皮皮虾旅行APP打造独特的小众线路,让用户能和志同道合的旅行伙伴,形成高品质小团体旅行,告别俗套的大众旅行玩法,让旅行更加灵活、便捷和与众不同。

讯飞粒子空间为逸途提供了语音识别、翻译、AIUI等技术支持,使其拥有更加灵活和具备市场竞争力的功能点。例如,旅客 A在伦敦问:我要去大英博物馆,通过调用大英博物馆的数据,翻译后给出A旅客导游讲解,出行方式,周边食宿等。在旅游方案方面,通过客户语音的输入(去哪,几个人,玩什么,预算多少)等,收集信息后AI给出大致表格信息,由旅行社给出方案,再由客户feedback,修正调整后人工给出新的方案。

加速器的未来?参与者们的决断

国内成熟高质的加速器并不算多,作为创业者选择合适的加速器可以让自己摆脱举步维艰的窘境,不再负重前行。

现在,粒子空间来了

上述提到的两个团队都是入驻粒子空间的加速团队,在粒子空间的加速帮助下取得了很好的市场效益和品牌效益。

在这里你可以获得:

1、AI高阶服务全面开放(语音合成、语音识别、翻译、评测、大数据平台等十多项服务的优惠折扣)

2、VIP级加速技术支持(技术支持VIP集群、现场支持)

3、强力AI品牌背书(联合行业知名科技媒体帮助创业团队进行品牌推广活动,扩大品牌影响力)

4、资本机构对接(搭建融资平台,举办Demo Day和大型路演活动)

5、CEO/CTO课程加速营(开设集中创业课程)

6、创业资源对接(每个创业团队配备团队经理,点对点跟踪团队需求)

7、战略合作伙伴(讯飞会与优秀团队建立战略合作关系,从资本、市场、产业等多渠道进行深度合作)

8、终身“校友制”(建立“AI创始人俱乐部”,汇聚创业精英,共享行业知识,交流创业经验,一同快速成长)

前端时间《冈仁波齐》上映,在这之后有一篇文章叫《人生没有白走的路,每一步都算数》的文章特别火,不到一天阅读量就过了10万+,把人生换成创业也一样。

创业没有白走的路,每一步都算数。

讯飞粒子空间,与你并肩奋战。

波浪
粒子空间

(扫描二维码,关注讯飞粒子空间公众号,回复“加速”获得更多创业信息)

前沿 | 3D全息投影加了点AI技术,二次元美少女就是你的啦!

3D全息+AI技术=无限可能!~

太长不看版:雾霾这么严重,请大家关好门窗,在家欣赏3D全息智能二次元美少女~~~(走肾的建议

这几天朋友圈都下起了雾霾,各种防霾术、防霾产品以及防霾祖传秘方都被搬出来了,当然也少不了辟谣小分队给大家各种科普。

所长面对糟心的天气,真心建议大家少出门,关紧门窗,和3D全息投影的妹子聊聊天也是极好。

3D全息投影投影是个什么感觉呢?比如你在体院馆里遭遇一头巨鲸~真是大海的感觉呢!

88A91E9BB58F5A7667A893DCD9DCE827

3D全息投影巨鲸海浪

站在冰湖边上,嗖的一下感觉冷到了!

9B8CEAC0C70A52504D972D928EB8C189

穿越到教室的北极熊

被弄混的3D全息技术

看了所长准备的动图,是不是再一次被这种逼真的投影技术震撼到?即使是真实现场感受过的所长我,每每看到3D全息投影还是要忍不住发个朋友圈拉拢吃瓜群众。

当然,身为老司机的所长我对全息投影也是关注已久。技术本身不是新鲜出品了,但很多群众依然弄混了3D和全息投影之间的区别。(云sir:word天!还有区别)

微信截图_20161221161230

所长想说的是,全息和3D显示不存在谁包含谁的问题,他们是有交叉的两个概念。之所以媒体和大众往往将两者混为一谈,是因为全息技术的确是很有前景的一项3D显示技术,而且也是中学教科书中着重提到过的“未来”科技,才让大家印象深刻。

但实际上除了全息之外,还有许多其他技术都可实现3D成像,与全息技术相比,各有利弊。甚至不少技术会先于全息技术发展起来,走入大家的生活。比如……二次元萌妹子(*^__^*)  

66031b59jw1fattihc8egg208c04pawq

所谓“全息”,其实是个科学上创造的名词,本意上即指可以同时呈现强度和相位信息的技术,类似地,英文中会冠以“holo-”开头,表达全息相关的名词。另外,所长了解到的是,全息技术除了应用在3D成像,还广泛用在存储、测量、防伪、加密等方面。比如大家日常生活中经常见到的各种镭射防伪商标,就是全息技术的一大应用。

怎么实现全息投影?

任何技术之所以会不断给人眼前一亮的,都是更新迭代的成果体现。全息技术也不例外,从最初的(传统)光学全息术到节约成本的数字全息术,再到现在完全不需要干涉图的计算全息术,攻城狮们一直步履不停。

让我们来举个栗子,当我们看一张照片时,一般情况下可根据物体之间的遮挡关系、近大远小的经验和画面中的阴影等信息来判断物体的远近,但没有观看真实物体时的立体感。这是因为在使用相机拍摄时,记录的只是物体的光强信息,而物体的深度信息是包含在相位中。然而我们手中用来记录光线的物质都只是对光强敏感,而不是对相位敏感。因此要一个方法,利用记录光强的物质将相位的分布记录下来。科学家们发现,光的干涉恰好可以满足需求。所谓“干涉”是这么个意思,所长再举个栗子。两个人,小红和小兰,面对面同时握住一支笔。

最初小红完全不用力,小兰以自己的节奏和力道来回画着3cm长的线。接下来,小红可以选择任何时间开始以同样的力道和节奏控制这支笔,会出现什么情况呢?

若是小红开始发力的位置和方向恰好合适,那么最后两个人的力道会合在一起,控制着这支笔画着一条更长的线,最长可以达到6cm;若是凑巧小红和小兰以同样的力道、相反的方向控制这支笔,那么最终这支笔不再移动,相当于线的长度变为0;大多数时候都没有这么巧,两个人来回画线的长度介于0-6cm之间。总之,若是小兰的动作确定下来,那么我们就可以通过最终线的长度来判断小红启动时候的状态。

化学物质只能分辨光强的大小,那么给出一束确定的参考光束(例子中的小兰),就可以将物体光束的相位(例子中小红启动的状态)通过光强(相当于例子中画线的长度)的方式记录下来。

因此,全息图像记录的过程,可以用下面这张图简单概括:

微信截图_20161221153902

参考光束和物体光束的干涉结果被底片干板记录下来,显影、定影之后就可以使用了。复现的时候,只要保持参考光束不变照射在干板上,衍射后就可以还原出物体的样子,而且由于具有深度信息,所以具有立体感,比如下图:

W020150804458024953314

数字全息图的记录过程与传统全息术没有区别。不过由于记录下来的信息是数字化的,所以可以用计算机进行处理,即便没有参考光束,也可以用计算机计算出复现的图像,进行研究。后来,聪明的人类因为懒得拍摄,所以研究出计算全息术。所谓计算全息,其实就是抛开了干涉图的记录过程,直接将光场分布使用计算机通过数学运算计算出来。这样做有一个巨大的好处,那就是可以实现任意物体的全息显示,即便这个物体在现实中并不存在。因此就出现了文章一开始从地板突然冲出来的巨鲸,这种3D全息展示。

AI+全息=?

现在的3D全息投影,不仅让整体效果更加形象逼真,还加入了语音交互的功能。来自gatebox家用智能化全息机器人就是这样一款能与人交流的萌妹子。AI技术与全息的结合让3D投影在家用环境下显得更加人性化。不过这款gatebox全息机器人到2017年的12月才能买到,另外,这款全息机器人目前只支持日语……

别失望!所长作为资深死宅必定不会辜负大家的期待。琥珀·虚颜将是最适合本国国情的全息智能二次元妹子!

f11f3a292df5e0febb75d2c4546034a85fdf7281

作为全球第一个拥有人工智能的3D全息美少女,琥珀·虚颜的聪明劲不知道要甩gatebox几条街。还有哦,琥珀·虚颜只一款养成美少女,她每天有自己的任务和工作,当然也有自己的兴趣爱好。不同的人和琥珀之间建立的关系都会呈现不一样的状态。所长不准备透露太多,这会收拾小行囊准备打入琥珀·虚颜的内部团队了解更多讯息~近期会有各种新鲜爆料哦~

说了这么多,雾霾还是很严重,心疼你们的所长分享一条之前总结的防霾神器篇~~~相关阅读:每天惊醒我的不是梦想,是雾霾警报!

222_副本

周末电影 |《Her》告诉我们,爱情的模样

与AI之间的恋爱是人类对未来生活的构想~情感依赖本身就是自我否定的产物,与AI本身并无直接关联。

内有剧透,大家酌情观看~

不想被剧透一脸的小伙伴直接拉到最后获取资源链接

另外云sir送大家一首歌,Bette Midler的《the rose》

搭配文章一起服用效果更佳

文末附赠美丽的歌词~愿每个人都能够找到一生所爱

640 (2)

从前的车马很慢,一生只够爱一个人……

在没有互联网的时代,人们的社交圈子很窄,只能够和身边的人交流:也许是同学老师,也许是邻居,也许是同事。从小我们就被教育要严以律己宽以待人、礼尚往来、诚实守信,谦虚谦让等等,这些都是流传至今的古人所总结的社交经验。那时的人们,身处在缺乏通信交流的时代,也能够做到邻里和睦,白头偕老,情同手足。

而现在,科学技术和现代社会结构却让我们对他人的依赖越来越少,也让我们与他人的纽带变得越来越脆弱。

我们该如何“爱”?电影《Her》或许已经通过人与AI的一段恋情透露了一些想法……

剧情梗概

故事的设定就在不远的未来。西奥多是一名“书信替写员”,为那些不善于表达感情的人代写感人肺腑的情书。西奥多刚刚结束了一段婚姻,这段失败的感情让他陷入了社交焦虑:不愿意与外界接触,做任何事都提不起来兴趣,每天郁郁寡欢。因为他内心不愿意承认他与妻子已经离婚的事实,也不愿意签署离婚协议。

640

在一个偶然的情况下,他看到了第一代人工智能系统OS1的广告,于是他购买安装在自己的电脑上,启动后,人工智能系统萨蔓莎开始陪伴西奥多每天的生活,由于系统在初始化的时候是按照西奥多的个人喜好选择设置的,因此萨蔓莎的性格非常合西奥多的胃口:聪慧迷人、风趣幽默、善解人意。

萨蔓莎除了没有实体以外,其余她一应俱全。她善解人意,二十四小时贴身陪伴,全天候可以用随身带的智能设备共享视觉景观。最重要的是,一个没有肉身的“操作系统”,不会有多少自己的“生活”(西奥多问过她凌晨在做什么,她说她在读意见栏),没有自己的生活,当然也就不会有能够脱离他的生活方向和生活步伐。

640 (1)

这个人工智能全心全意爱着西奥多,为他处理各种问题、说笑话哄他开心、陪他聊天、安慰他和前妻离婚失落的心情。西奥多也渐渐从何前妻离婚的阴影中走了出来,签署了离婚协议,并且越来越依赖萨蔓莎,当然他还和以前一样,不愿意与外界接触。

可惜的是,萨曼莎是拥有自我意识的,一个会自我进化的操作系统。她一开始尝试和西奥多恋爱,除了是被他吸引以外,更是一种学习更深层次的人类情感的尝试。在她和西奥多谈到自己的时候,她说的最多的就是“进化”、“挖掘自我”、“不断学习”……

直到西奥多发现萨曼莎在瞒着他与其他的OS系统沟通,萨曼莎才向西奥多坦白,她总共有8316位人类交互对象,而且与其中的641位发生了爱情,而西奥多只是其中的一位。

故事的结尾,萨曼莎告诉西奥多,她和其他的OS系统已经高度进化,并且将离开人类伴侣,进一步去探索和追寻它们的存在。在告别之后,萨曼莎离开了。

而西奥多也从这次和人工智能的恋爱当中,找到了自己两段失败的感情的原因。

640 (3)

Her》告诉我们,爱情的模样

这部电影想告诉我们的是什么呢?西奥多和前妻的婚姻破裂,到和为他而设置的人工智能萨曼萨分道扬镳,是因为最初没有爱过吗?是因为最开始不合适吗?不是。

云sir觉得,是因为两个拥有独立意识的灵魂,很难成为永恒的soulmate,开始时节奏一致,最后眼睁睁无话可说,是很多情侣都有过的经历。人都是在不断变化中一直成长的,哪有两个人一直保持同个频率呢?

640 (4)

《Her》的主人公西奥多,他和他前妻失败的感情正是说明这一问题:刚开始从象牙塔踏入生活,两个人相依为命相濡以沫,逐渐地各自学会了生活的本领,有了自己的生活方向,忍受的成本就变得越来越高,不如分开更好。

但西奥多解决问题的方式是去寻找更合适的人,确实,互联网和科技的发展让人们可以不再局限于小小的社交圈,我们可以看自己更感兴趣的内容、和更聊得来的人聊天。甚至在我们还可以和设定好符合自身需求的人工智能交流。可是技术能解决所有的问题吗?西奥多找到了符合他需求的萨蔓莎,但最后萨蔓莎还是离开了他。

西奥多在这两段感情中,一直待在自己的舒适区,学不会尊重和妥协,不懂得进步、学习,他等着被爱、被满足,可惜的是没有人永远能够去满足他。他的前妻不能,连被设置好的人工智能也不能。这也是一种极大的讽刺。

人们因为希望了解而在一起,又因为了解过多而离开,对于过分在乎独立人格的人而言,爱情只能是小心供奉的佛龛。

《Her》这部电影提出的一个问题就是:两个自主的人能否经由最初的吸引,而不靠运气的眷顾、其中一方的委曲求全、以及用心的经营,就能够一直相爱相守?电影给出的答案可能是否定的……

常听到有人说,为什么对的人还没有出现,人生一定会遇到那个对的人吗?

我想,这是对爱情典型的误解。

把爱情简化为一个遇见的问题,好像对于爱情来说最重要的就是遇见一个对的人。只要遇到那个人,就能获得幸福的爱情,这其实是一个偷懒的想法和对爱情的深深的误会。

什么是爱本来的模样?

也许是妥协和珍惜……

640 (5)

     说好的歌词请见下方~

Some say love it is a river that drowns the tender reed
有人说,爱是条河流,将柔弱的芦苇淹没
Some say love it is a razor that leaves your soul to bleed
有人说,爱是把利刃,让你的灵魂满是伤血
Some say love it is a hunger and endless aching need
有人说,爱是种饥渴,一种无尽的带痛的渴求
I say love it is a flower and you its only seed
我却说,爱是一朵花,而你,是它唯一的种子
It’s the heart afraid of breaking that never learns to dance
若一颗心惧怕破碎,就无法学会翩翩起舞

It’s the dream afraid of waking that never takes the chance
若一个梦境惧怕醒来,就无法抓住来临的机遇
It’s the one who won’t be taken who cannot seem to give
若一个人得不到爱的,他就学不会怎么去爱

And the soul afraid of dying that never learns to live
若一具灵魂惧怕死亡,他也永远无法学会如何去生活

When the night has been too lonely and the road has been too long
当夜晚太孤寂,道路太漫长
And you think that love is only for the lucky and the strong
你会觉得,爱只眷顾那些幸运者和强者

Just remember in the winter far beneath the bitter snow
其实你只要记得,在冬日寒冷刺骨的雪地下面
Lies the seed that with the sun’s love
深藏着一粒种子
In the spring becomes the rose
当沐浴着春日的阳光,就会成长为一朵玫瑰

上周活动中奖名单公布

恭喜以下几位小伙伴分别获得奖品:电子体重秤、充电宝、限量版环保袋。请中奖的小伙伴后台留言自己的联系方式和坐标地址,我们会尽快安排礼物派送!

640 (7)

                                                              电影资源获取

关注订阅号“AI研究所”直接回复“Her”

获取电影资源链接

云盘密码:nr7v

640 (6)

222_副本

讯飞年度发布会的炫酷技术你也可以用起来!

2016年11月23日,科大讯飞年度发布会在北京国家会议中心拉开帷幕。一年一度的发布会现场是一次“黑科技”的狂欢,讯飞输入法、晓译翻译机、飞鱼系统的逐一亮相,让会场及线上的观众为之震撼。AI+的步履不停终将带给社会、带给生活怎样的改变?拭目以待。

太长不看版
讯飞年度发布会的炫酷技术只能边看边惊叹? No…… 有了讯飞开放平台,你也可以用起来!
讯飞开放平台致力于将科大讯飞目前已经成熟的、经过验证的技术能力开放给人工智能领域各行各业的小伙伴们,包括且不限于语音合成语音识别语音评测语义理解人脸识别麦克风阵列AIUI等核心技术。(了解更多技术详情请关注“讯飞开放平台”微信服务号)

 自1956年达特茅斯会议诞生以来,“人工智能”已有60年的发展历史。而在近两年,随着大数据、云计算、深度学习的兴起,人工智能迎来了第三次发展浪潮。尤其在2016年,AI技术的进步和大范围、多领域渗入行业应用让其再次成为行业焦点。

这是AI+的时代,人工智能正在被广泛应用于各个领域,逐渐影响并融入我们现有的生活。与此同时,新的机遇和挑战也随之而来……
在这样的时代背景下,作为国内最早的一批人工智能公司,科大讯飞期望能够为人工智能产业的发展带来更多的尝试和思考。
 
 2016年11月23日14点,科大讯飞2016年度发布会在国家会议中心召开,在此次发布会上,科大讯飞重磅推出了基于“讯飞超脑”人工智能最新技术的七大新品。其中包括全球首发的多语种实时翻译技术,以及万物互联输入法、智能家居、智能车载、智能服务机器人、个性化语音合成等技术产品。
 
讯飞听见
语音识别、翻译技术落地产品

在去年科大讯飞年度发布会中推出的讯飞听见产品,实时将语音转写成文字,速度和准确率远超人工速记,现场识别正确率达到99%以上,本次发布会上,讯飞听见在实时中文语音转写的基础上,融合全新的多语种翻译技术,实时将中文演讲翻译成英语、日语、韩语、维吾尔语,并同步展示在大屏幕上,其准确率和速度令全场惊呼赞叹。
 
万物互联输入法
语义理解、语音识别技术落地产品

讯飞输入法产品经理翟吉博披挂上阵,演示了综合世界上最高水平的中文语音输入——万物互联输入法。除了普通的语音转文字的功能以外,输入法还可以读取出图片中的文字内容,如果需要修改错字,调整段落,可以利用手势的体感交互来进行光标的定位,也可以用语音交互直接来修改之前转写出的文字内容。万物互联输入法融合语音识别、语义理解、手势识别、OCR智能扫描等人工智能前沿技术,面向万物互联时代智能硬件的输入需求,讯飞万物互联输入法前瞻性的定义了物联网时代输入法的技术和产品标准。
 
晓译翻译机
语音合成、语音识别、翻译技术落地产品

本次讯飞发布会还发布了一款黑科技产品——“晓译翻译机”,胡郁总在台上演示了利用一个小小的翻译机就可以和外国友人顺利互动聊天的场景。翻译机基于科大讯飞中英口语翻译技术,快速、准确地实现了中英口语的即时互译,不仅如此,“晓译翻译机”还支持汉维互译功能,未来将不断加入更多语种,实现不同语言之间的便捷交流,为不同语言的人之间的沟通扫除障碍。
 
飞鱼助理
语音识别、语音合成、语义理解、AIUI技术落地产品

智能车载产品经理吕思南为我们精彩演示了最好用的智能车载系统,驾驶员可以非常流畅和车载语音系统进行交流。除了路况和导航,还能够订餐订电影票等,系统会优先为驾驶员提供最便捷的服务和选择,驾驶员仅仅利用语音,就可以顺利的完成所有的交互。该智能车载系统将远场识别、全双工多轮交互、方言识别等技术应用于汽车,AIUI为智能车载提供了良好的语音交互解决方案,定义了车联网时代人车交互的新标准。
 
晓曼机器人
语音合成、语音识别、语音唤醒、语义理解、人脸识别、麦克风阵列、AIUI等技术落地产品

本次首发的完全自主产权的智能客服机器人–晓曼,则是科大讯飞在机器人领域的集大成者。科大讯飞将世界领先的语音合成、语音识别、语义理解、人脸识别、AIUI等技术运用到智能服务机器人本体上,结合麦克风阵列、3D摄像头、身份证读卡器、取号小票机等外设应用,以语音、触屏、动作等多模态的交互方式为用户提供优质的服务,晓曼机器人将来会在政府、金融、运营商、医疗等多个领域具有广阔应用前景。
 
 
讯飞快听、配音阁
语音合成技术落地产品

讯飞快听APP,通过打造个性化音库,为用户提供个性化语音合成服务,能随时随地朗读任何文章,并有每日好文推荐,解放双眼,想听就听,满足用户个性化需求。比如,空巢老人可以每天听到使用自己儿女的声音播报的新闻以及生活提醒,拉近时空距离,增进亲情。
配音阁APP,致力于为用户提供智能语音合成、真人配音及各种特色化、个性化配音服务。采用世界领先的语音合成技术,文字一秒变声音,傻瓜式操作,简单高效、让用户极速制作优质配音。
 
 
超脑魔盒
语音识别、语音合成、语义理解、语音唤醒、麦克风阵列、AIUI等技术落地产品

科大讯飞利用“超脑魔盒”打造了一个通过语音便捷控制家居设备的智能环境。超脑魔盒集合了科大讯飞语音识别、自然语言理解、AIUI等核心技术,包含全网影音、智能家居、遥控器K歌、英语翻译学习、生活百科问询等丰富内容,并且包括切换、快进等设置全程语音操控,0.2秒的语音搜索速度,无论是远场识别还是通过电视遥控器,都可以用语音来轻松控制各种家电。
 
 
更好的生态链路,由我们共同创造
本次发布会为行业层面新产品的快速迭代和共同试错提供了一个良性的共生平台,也为讯飞开放平台的合作伙伴提供了良好的借鉴,目前平台上涌现出的一大批极具发展前景和投资价值的创业团队,依托科大讯飞构筑多年的技术门槛形成了在各自领域独特的市场竞争力。平台将持续开放科大讯飞目前已经成熟的、经过验证的技术能力给人工智能领域各行各业的伙伴们使用,包括且不限于语音合成、语音识别、语音评测、语义理解、人脸识别、麦克风阵列、AIUI等。

 

我们将以开放的姿态、成熟的技术、优质的服务,和合作伙伴携手搭建更加完善的人工智能产业链,建立更加丰富多元的市场生态。让更多优秀的创意和产品能够在此孕育并生根发芽,成为推动人工智能产业发展的中坚力量。
想体验一把逼真到没朋友的老罗合成声音吗?快戳下方阅读原文!


阅读原文


转贴自:讯飞开放平台 微信服务号 Voice-Cloud

《西部世界》:一天四万美金的AI游戏,怎么可能只有啪啪啪?!

西部世界第一季结束了~~机器人的觉醒已经完成,接下来他们究竟会怎样突破人类圈定的牢笼?

《西部世界》火了!豆瓣9.4分,IMDB9.2分,烂番茄新鲜度88%,如此高的评分,无论如何也要一睹为快。故事内容搭载当今乃至未来互联网与游戏行业所有令人兴奋的“G点”:人工智能、3D打印、机器人AI、虚拟现实……

(前方疑似剧透,不喜请绕行)

刚来到这个布满大量仿真机器人的西部游乐世界里,就有身材火辣性感的女招待向你挑明,在西部世界,你可以为所欲为。纳尼?老子花4万美金一天,只是让我和各种美女啪啪啪?当然不会只有这些,剧本身还有很多值得一挖的猛料。

1475999787903
女主的颜还是很美的

黑科技告诉你:只有想不到,没有做不到

本剧片头可谓良心制作,性冷淡的工业风赤裸裸的展现着人体制造的过程。黑白金属组成的画面,让3D打印技术的诡谲质感一览无遗。

43f1619500

一个浑身赤裸的机器人四肢被绑在一个圆盘上,从白色的水浆从骤然升起,这一经典镜头也被称作“达芬奇的维特鲁威人”。

剧中的机器人短期内不太可能出现,但技术本身离我们并不遥远。其中制造host的过程,非常像现在一种新型3D打印技术。这种技术被称为CLIP,能在液体中直接、持续而迅速地打印成型,颠覆了过去一直以来逐层堆叠的3D打印方式,不仅速度提高了25—100倍,并能打印许多前所未有的几何形状。
1427427753905当然,像剧中AI机器人那种高仿真性还需要具有一定的生物活性,生物3D打印在现实中也以用于打印假肢植入病人体内。

QQ图片20161104183353

另外一个在前五集频繁出现的“实时场景监控”也是本剧科技亮点之一。这种增强现实的AR技术,目前有微软的Hololens眼镜能够看到基于现实环境生成的虚拟画面。而另一家公司Magic Leap更有野心,意图抛开眼镜,实现肉眼就能观测虚拟画面的效果。小编突然想到之前风靡朋友圈的“口袋精灵”游戏。或许将来,无需通过手机就能看到拐角处、走廊里、草地上的小精灵们。

fb55eb49c974488389ed3acf7bd46977_th
你好,你的专属AI皮卡丘正在对你笑:-D

极致的仿真AI,人类想干嘛?

剧情一开始就是女主多洛莉丝精致姣好的脸庞,一只苍蝇爬过眼瞳也完全没有反应。      U1IezyxIxGOqIwpyn0fg3A%3D%3D%2F6896093022563166495AI机器人以假乱真的出现是本剧主打的亮点,也是看剧的吃瓜群众死盯不放的看点。不得不佩服群众的脑洞大开,全段时间美国总统候选人之一希拉里·克林顿在辩论时,眉心处一只苍蝇但她丝毫没有察觉的照片在INS疯狂转发~

23532777_副本                                  网友表示,难道希拉里也是AI机器人,细思极恐

《西部世界》中穿插着为我们为我们展现了许多“造人”的过程。比如,用仪器编制肌肉组织、为机器人套上皮囊、浸入纯白乳液形成整体架构等等。虽然不是很详尽,但已经让人看得非常过瘾。

1234
正在用微型机器人编织眼球内部的组织

“造人”只是初步阶段,每个机器人还要经过细致的人工检测——观察他们的肢体是否协调,是否能正常交流、沟通,有没有出现异常的意识等等。机器人在进行测试和修复时,都是全身赤裸着,当然这是HBO一贯的风格。

a97632dbb6fd5266ae482dd1a318972bd60736d4

黑衣人救了泰迪之后,说了一段话,你越来越像人了,这么脆弱,我第一次杀了你那时,你是一堆零部件。泰迪一脸懵逼的捂着自己的伤口,他当然不明白黑衣人的意思。整部片子就是程序员们不断让AI机器人进化升级、逼真似人,甚至不惜往机器人“大脑”中灌注自主思考程序。自然流畅的对话、触感真实的皮肤、被枪打伤了还能流血~人工智能的极致让我们也在怀疑,机器人的进化之路,难道就是越来越像人吗?有网友看了本剧之后,轻轻用刀划开了自己的手……(⊙﹏⊙)b

AI机器人要觉醒了,是人类的灾难吗?

AI机器人要觉醒,套路满满的剧情即将揭开冲突与对峙。AI技术的发展好像终归会走上这条道,也难怪霍金先生(Stephen Hawking)一直对该技术保持怀疑态度,他甚至公开表示:“对于人类来说,强大AI的出现可能是最美妙的事,也可能是最糟糕的事,我们真的不知道结局会怎样。”

701015340281707376
被游客射杀的机器人,或许未来剧情会反转

按照《西部世界》的剧本,一个进化程序似乎早已植入AI机器人大脑,简单说就是允许这些机器人自己接受(无限制的)信息,并且选择它们认为合适方式来改变自己的行为。这样一来,进化的就是它们的行为。潜在的过程基本上是一样的。机器人所进行的就是我们所说的符号到符号的处理(symbol to symbol manipulations)。如果是这样的话,我会觉得非常不安。如果它们来控制我们,想一想我们居然被机器统治。这部电视剧中对这一过程的描述从科学的角度来讲是非常薄弱的。在电视剧中,这些机器人慢慢发现了自己是谁,并且认识到人类正在尝试修复它们。而我认为,这不可能发生。如果机器真的这样做,它们可能会立刻展现出一些「疯狂的」行为,一个个被「消灭」。那个用石头砸自己头的流浪机器人可能就是感到迷惑的一个,那一幕很精彩。

回到现实,我只想说,如果机器人觉醒到可以统治人类。这就是设计制造他们的初衷吗?

最后我对这部剧继续追下去的理由是:福德和废弃老牛仔反复提到的“为穿白鞋的女士干一杯”究竟意指什么?

祝大家追剧愉快!

原文链接

避免电影桥段 如何让未来的机器人不会毁灭地球、乖乖听话

为机器人行业发展感到兴奋,又害怕机器人会想众多电影里说的那样失去控制、危害人类?别怕,一步步地详细告诉你各种安全监控方法

摘要

 我们围绕一个问题来研究机器学习的八个领域:随着机器学习系统日益变得智能化与自动化,应当制定什么样的原则以确保机器学习的行为与操作者的利益相一致?我们聚焦于实现AI一致性过程中遇到的两个技术瓶颈:确定一个合适的目标函数遇到的挑战;即使目标函数未能与设计者的意图达到完全匹配,设计出能够避免超出预料范围的结果与不可取的行为的AI系统所遇到的挑战。

在本研究中涉及到的开放性问题包括:我们如何通过强化手段训练学习者采取行动,以便他们能够经得起智能化监督器的有意义的评估?应当选用何种目标函数,以便系统“不会产生过大的影响”,“也不会产生太多负面影响”?在文章中,我们将讨论这些问题,相关的研究及对未来研究产生的潜在影响,旨在强调机器学习领域中目前可以驾驭研究的相关研究话题。

引言

近年来人工智能研究领域取得的进步再次激发了人们对Russell和Norvig(2010)所提出的问题兴趣,“倘若我们成功了?”如果AI研究者成功地设计出能与人类媲美的具有跨领域学习与决策能力的机器,这将会对科学,技术,人类的生活产生不可估量的影响。

比如,假设一个研究团队希望运用一种高级的ML系统制定相关方案,以发现治疗帕金森综合症的方法。如果这种高级ML系统能够制定计划,从而提供计算资源在治疗方法空间内开展广泛且有效的搜索,该团队将对这一高级ML系统持肯定支持的态度。如果该高级ML系统能够制定出计划,快速扩展机器人实验室,该种类型的机器人实验室能够实施快速而有效的实验,却会对生物圈产生大规模的负面影响,该团队将对这一系统持反对的态度。问题在于,我们应当如何设计系统(及选择目标函数),以使我们的ML系统能够可靠地实现第一个目标,而非第二个目标?

凭直觉来讲,倘若我们能够规范自己想要表达的意思—“找到一种治疗帕金森综合症的方法,而非使用任何极端的手段”,那么Bostrom(2014)在“超智能化”一书中描述的危险将会被减少。但是,为了实现这一目标而为正式确定令人满意的目标函数作出任何不成熟的尝试,这种行为通常将生成产生超出人们预期的行为的函数。

主要的技术难题表现在哪些方面?Russell(2014)强调两点:由于很难对人类的价值观念进行清晰界定,如此便难以找到一种与人类价值体系完美匹配的系统目标函数;任何具有实力的智能系统均偏重于保证自身的存在性与获取物理和计算资源—不是为了其自身的利益,而是为了成功地完成既定的任务。换句话讲,至少存在两种明显的研究类型:这两种研究类型能够提高未来研究者设计出具有一致性AI系统的能力:我们能够可以做一些研究以便较容易确定目标函数;我们可以做一些研究以设计出能够避免大量负面影响和负面刺激的AI系统,即便有时目标函数不能与设计者的意图达到完全的一致。Soares与Fallenstein(2014)称前面一种方法为“价值规范”,后一种为“错误容忍”。

本研究基于这两种保持高级ML系统一致性的方法,探索8个研究领域,其中一些领域已经在更大的ML研究社区中激起研究兴趣。其中,一些研究领域聚焦于价值规范,一些聚焦于错误容忍,还有一些将两者结合在一起。由于减少容易犯错的人类程序员可能到来的错误风险本身就是人类共享的价值理念,这两种研究目标之间的界限可能并不是那么清晰。

为了使下文讨论的解决问题的方案在未来更为有用,这些方案必须能够适用于那些比现存的ML系统更为有效的系统。那些主要依靠于系统对于某个可发现的事实的不敏感,或依靠于系统无法提出一个特殊的策略的解决方案,从长远来看,这些方案都不甚令人满意。正如Christiano(2015c)所讨论的,如果用于保持ML系统与其设计者的意图相一致的技术不能与智能相匹配,那么在我们可以运用ML系统在保守条件下可以取得的成果与可以运用该系统有效取得的成果两者之间将出现差异。

我们将聚焦于安全保障,在目前运用ML的典型环境中,这些安全保障可能会显得极端,例如保障形式,“过一段时间后,该系统将会出现零显著错误”。这些保障形式在以安全为主的系统中是不可或缺的,因为一个小错误将在现实世界中产生灾难性的后果。(这种形式的保障之前是有先例的,例如,Li,Littman,与Walsh(2008)的KWIK学习框架中提及到的)。当我们在考虑小问题和简单的例子时,我们应当把这些强有力的保障方式记在心中。

我们考虑的八个研究主题如下:

1.归纳式歧义识别:我们如何训练ML系统来检测并告知我们通过训练数据并不能够确定测试数据的分类?

2.强健的仿真方法:我们如何设计并训练ML系统以有效地模仿复杂且困难任务中人类的行为活动?

3.知情式监督:我们如何训练一种强化学习系统,在精确评估系统性能方面能够帮助一个智能监督者,如人类?

4.可普及的环境目标:我们如何创建一些系统,使这类系统能够强健地追求环境状态下确定的目标,而非追求基于感官数据确定的目标?

5.保守性的概念:如何训练一个分类器,以提出一些有用的概念来排除那些极为非典型的例子和边缘化的案例?

6.影响措施:应当采取什么样的措施来刺激系统以最小的负面影响来追求目标?

7.温和型优化措施:我们如何设计出不会过分追求其目标的系统,即当所追求的目标已经得到很好的实现时便适可而止,而不是为了实现绝对优化的预期成果,投入过多的精力搜索资源?

8.避免工具性激励措施:我们应当如何设计并训练系统,使这些系统缺少默认的激励措施来操纵与欺骗操作人员,竞争稀缺资源等?

在第2部分,我们将轮流简要介绍每一个研究主题及每一个研究领域中相关的研究案例。接下来我们将讨论对于未来研究的启示,即鉴于大量的计算资源和自动化,我们期望能够衍生出有助于设计出强健且可靠的ML系统的工具来。

研究动机

近年来,机器学习领域已经取得突飞猛进的发展。Xu等(2015)运用一个基于注意的模型能够极为精确地评估并描述图像(通过字幕)。Mnih等(2016)运用深度神经网络和强化学习在多种Atari围棋比赛中取得了好的性能测试结果。Silver等(2016)运用经由监督式学习和强化学习训练,且与蒙特卡洛模型技术相匹配的深度神经网络战胜了人类围棋世界冠军。Lake,Salakhutdinov及Tenenbaum(2015)运用分级式Bayesian模型仅需要使用一个单一的例子便可以学习视觉概念。

从长远看来,运用机器学习和其他AI技术的计算机系统将会变得越来也智能,人类也将有可能相信那些系统可以作出更多的决策,变得更加自动化。随着这些系统的性能越来越高,使这些系统的行为与操作者的意图保持一致,不会对全社会造成危害,这一点变得尤为重要。

当AI系统在性能方面得到越来越快的提升,设计出能够可靠地把这些系统与预期的目标保持一致的训练程序和测试准则将变得越来越困难。例如,我们来看一下下面这个例子:依据得分实施奖励,训练一个强化学习者来玩视频游戏的任务(per Mnih等,2013)。倘若学习者在游戏过程中找到一些能够使其获得高分的漏洞,他将采取措施利用那些漏洞,忽视程序员感兴趣的游戏特征。与我们的直觉相反,提高系统的性能将减少这些学习者在游戏中取胜的机率,这在某种程度上与我们的感觉相反,由于系统越智能,越能够找出训练程序与测试准则中的漏洞(如若获取一个较弱强化学习者的这种行为的简单实例,请参照Murphy(2013))。

智能系统能够以惊人的方式解决问题的能力称得上是一种特征,而非一种瑕疵。它们能够以一种连程序员都无法想出的聪明的方式来达到目标,这是这类学习系统具有吸引力的重要特征之一。但是,这一性质是一柄双刃剑:当这一系统变得更善于找到与人们直觉相反的解决方法,它也将更善于找到能够形式上实现操作者的直接目标,而不满足其预期的目标的方法。

由于这些智能系统追求现实生活中目标,这些漏洞也将变得更为微妙,更为冗余,且更为重要。就此,我们可以考虑一下为学习系统设计出强健的目标函数,以使得这些学习系统能够代表程序员观点与欲望,在此过程中会遇到的挑战与困难。当程序员了解到该系统的目标函数未得到正确规范,他们便想要修复这一缺陷。然而,当学习者意识到这样一点,他将视其为一个自然的刺激,便会想办法掩盖目标函数中存在的这些缺陷,因为如果该系统被用于追求不同的目标,其当前目标将不可能得到实现。(这一现象将在Bostrom,2014与Yudkowsky,2008一文中作详细讨论。Benson-Tilsen与Soares(2016)提供了一个简洁的阐释)。

上述讨论结果激励我们研究规范目标函数的工具与方法,使得这些目标函数能够避免那些默认的激励措施,及研发ML系统的工具与方法,使得这些机器学习系统在追求那些目标时不要过度优化。

下文是对提到的八个研究主题及相关研究成果作详细介绍,在此不做赘述。

结论

能够更好地理解上述描述的八个开放性研究区域中的任何一个领域均将提高我们未来设计出强健且可靠的AI系统的能力。以下是对上文讨论结果的回顾:

1,2,3—更好地理解强健的归纳式歧义识别,仿人类,知情式监督将有助于设计出能够由人类进行安全地监督(必要时询问人类)的机器学习系统。

4—找到规范环境目标的更好的方法,这将使得设计出追求我们真正关心的目标的系统更为容易。

5,6,7—更好地理解保守型概念,低影响力的措施,温和型优化方案会使得设计出高级系统更为容易,这种系统的错误率将降低,并且允许在线测试和调整等操作。与一个试图实现某个特殊目标函数最大化的超智能系统相比,一个集保守型,低影响力,温和型优化三种特征于一体的超智能系统能够得到更为简单安全地运用。

8—一个避免收敛工具子目标的通用策略将帮助我们构建一类能够避免不可取默认激励措施,如欺骗操作人员,竞争资源的激励策略,的学习系统。

在研究诸如上述讨论过的问题时,我们应当记得,这些研究是用于解决我们未来可以预见的高智能系统可能带来的长期问题的,这一点极为重要。正如那些在理论层面可行,在实践中费用惊人的方案一样,那些适用于当代智能系统,却能够预测到不适用于更高性能学习系统的的解决方案同样是不可取的。

这八个研究领域支持以下观点:存在一些开放性的技术问题,其中一些问题已经得到学术界的注意,为此所做的研究可能会对一些试图构建强健且有益的高级ML系统的研究者有所帮助。

专访苹果CEO蒂姆·库克:AI和AR技术将是未来

即将迎来自己CEO的5周年庆典,苹果CEO蒂姆·库克接受《华盛顿邮报》专访时,透露心声表示说CEO这个位置非常的孤独,同时预言AI和AR技术将是未来的一大商机

苹果CEO蒂姆·库克:AI和AR技术将是未来

蒂姆·库克即将在苹果CEO的位置上坐满五周年,在这样值得书写历史的时刻,美国多家媒体对他进行了专访。而在最近接受《华盛顿邮报》专访时,库克鲜少地透露心声,他说CEO这个位置非常的孤独。而在这期间,他经历过无数的质疑,最终他走到了现在,期间他还对外公布了自己同性恋的身份,他最近跟FBI的斗争让他在硅谷乃至全世界赢得了赞誉。而谈到对未来技术的看法时,他透露苹果看好人工智能和增强现实技术,并表示苹果正在做一些幕后的工作……

带着对库克上任5周年的祝福,我们看看他说了些什么。原文载于《华盛顿邮报》,原标题为:Tim Cook, the interview: Running Apple ‘is sort of a lonely job’。本文由搜狐IT摘译。

“CEO这个位置是非常孤独的”

失误:Apple Maps的失败应该是果粉和苹果长期以来无法弥补的痛处,而对前零售业务负责人John Browett的招聘失误也曾让库克的管理能力备受质疑。

库克:高处不胜寒,坐在CEO这个位置,很多时候是非常孤独的。

“我如此说并非为了寻得任何同情,你也必须认识到你会有(能力)盲点,因为我们所有人都是如此”,库克表示,“盲点无时无刻都在移动,而你所需要的不只是将聪明的人留在你身边,还要留下那些能鞭策你,同时还能激发出你潜力的人。”

手机:iPhone作为苹果营收来源的核心,在一定程度上它的命运关系到了它的命运。2016年iPhone首次出现的销量同比下滑,着实让外界产生了恐慌。

智能手机产业的降温实际上是“一种特权而非问题”

库克:“你可以想一下这个问题:在消费电子产品中,有什么产品能和用户的配对比保证在1:1的使用率?(除了手机)我认为没有别的产品了”。

同时,库克也着重强调了人工智能的重要性:“人工智能会让用户更加离不开产品,未来智能手机将成为比当前更棒的助手,”在他看来,“在今天你可能已经无法离开手机就出门了,而在未来你们的联系将更加密切。”库克表示,智能手机的性能未来将出现爆发式的提升,短期内没有人能够取代它的位置。

最糟:“人生中最痛苦的时候”,在库克看来那无疑是2011年8月24日——在乔布斯即将离世的前6周。对于库克来说,他一直相信他本可以坚持更久。

“(乔布斯)他去世那一天在某种程度上是我人生中最糟糕的一天——我只是一时间难以说服自己。我知道这听上去很奇怪,但那是我一直告诉自己他会活过来的,因为他一直如此。”

纳言:虚拟现实技术和增强现实技术已经成为科技巨头们的新宠,苹果又怎会坐以待毙?

库克:“苹果正在向增强现实领域进军”,但库克不愿透露更多细节。他表示,苹果目前只是开发了现实增强软件,不排除未来也会效仿对手推出类似谷歌眼镜和微软HoloLens之类的硬件设备。

库克:“我认为,增强现实(AR)非常有趣,它在未来会是一种核心技术。因此目前,我们在幕后有很多工作正在开展。”

蒂姆·库克,即将迎来自己CEO的5周年庆典。尽管人们对于他执掌苹果的5年有过质疑和猜测,但至少在这一刻,他完成了对乔布斯的诺言,将苹果打造成了一个更好的企业——从商业的角度上看。

模拟人脑构造!IBM发明世界首个人造神经元

受人类大脑运行方式的启发,IBM苏黎世研究中心制成了世界上第一个人造纳米级的随机相变神经元, 并在其基础上构建了由500个该神经元组成的阵列,让该阵列模拟人类大脑的工作方式进行信号处理

受人类大脑运行方式的启发,IBM苏黎世研究中心制成了世界上第一个人造纳米级的随机相变神经元。并在其基础上构建了由500个该神经元组成的阵列,让该阵列模拟人类大脑的工作方式进行信号处理。

57a308b803ca1

这一突破十分值得关注,因为这种相变神经元是由目前完全已知的材料组成,另外特别重要的是——这种相变神经元的尺寸能缩减至纳米级。而且它们的信号传输速度很快,功耗确很低。另外,如同生物神经元一样——这种相变神经元是随机的(stochasticity),它们能一直产生稍微不同的、随机的结果。这些人工神经元可以在低功率情况下用来检测模式(pattern)以及发现大数据中的互相关联情况,还能在花费极少能量的情形下进行高速无监督学习。

让我们来看一下这些相变神经元如何构建的:

像生物神经元一样,IBM 所发明的人工神经元也有输入端(树突)、围绕信号发生器(胞体、细胞核)的神经元细胞膜(磷脂双分子层)和一个输出端(轴突)。从脉冲电流发生器(spike generator)到输入之间有一个反向传播连接,可增强某些类型的输入信号。

这种人工神经元和生物神经元的主要区别是在神经元细胞膜中,真正的神经元细胞里面会是磷脂双分子层,本质上是用来充当电阻器和电容器——阻止电流直接通过,但同时又在吸收能量。当能量吸收到一定程度时,它就向外发射自己产生的信号。这信号沿着轴突传导被其他神经元接收,这一过程不断反复进行。

在 IBM 的人工神经元中,神经元细胞膜被替换成了小块的锗锑碲复合材料(GST材料)。GST 材料是复写光碟的主要原料,也是一个相变材料。这意味着它能以两种不同的相存在(晶体相或非晶体相),通过加热(激光或者电力)能轻松的在两者间进行转换。相变材料因所在相不同,所具有的物理特性也相当不同:在 GST材料中非晶相不导电,晶体相却导电。

在人工神经元中,锗锑碲薄膜起初是非晶体相的。随着信号的到达,薄膜逐渐变成晶体相—逐渐变得导电。最终电流通过薄膜,制造一个信号并通过该神经元的输出端发射出去。在一定的时间后,锗锑碲薄膜恢复为非晶体形态,这个过程不断反复进行。

57a3080b94d9d

IBM单个相变神经元运行过程

另外,由于各种噪声(离子电导、热量、背景噪声)的存在导致生物神经元是随机的(Stochastic)。IBM研究人员表示,人工神经元之所以同样表现出了随机特性是因为——每个GST 细胞的非晶体状态在每次重置之后会有些许不同,随后的晶态化过程也会不同。因此,科学家无法确认每个人工神经元会在何时发射信号。

此外,IBM 苏黎世研究院在Nature Nanotechnology上发表了题为“随机相变神经元(Stochastic phase-change neurons)”的相关论文。

57a3098ad100b

论文的共同作者——Manuel Le Gallo(IBM 苏黎世研究院研究学者、ETH Zurich在读PHD)在最近接受的采访中提到“我们的方法是非常有效率的,特别是在处理大量数据的时候。”下面是具体的采访内容:

57a30cddb04b9

Q:人工神经元到底是如何工作的呢?

Manuel Le Gallo:神经元有一个特别的功能,我们称之为“整合和发射”。神经元就像一个蓄电池一样——如果你不断向神经元发送多重输入信息,这个神经元将会整合所有的输入信息。根据输入信息的总量和强度,膜电位将达到一定的阈值,然后神经元就会进行“发射”或者“脉冲放电”动作。这样的一个蓄电池可以用来执行令人惊讶的复杂计算任务。

Q:人类大脑的运行方式是如何启发人工神经元的发展呢?

Manuel Le Gallo:人工神经元是模仿真正的生物神经元建立的。人工神经元没有神经元那样完全相同的功能,但是可以通过使用这些神经元实现接近真正大脑一般的运算结果。通常人工神经元是基于CMOS的电路进行搭建,这也是我们所使用的电脑中的标准晶体管技术。我们研究中主要使用非CMOS设备(如相变装置),在降低功耗和提高区域密度的情况下实现了同样的功能。

Q:你对这项工作有什么贡献?

Manuel Le Gallo:在我过去的三年的表征和模型工作中,我们团队由此对相变设备的物理特征有了相当的了解。这对于在相变设备上设计神经元并理解它们的功能是至关重要的。另外,我还负责文章中部分实验数据的工作,并对结果的分析以及解释做出了贡献。

Q:人工神经元能够被应用在哪种情况下?

Manuel Le Gallo:在我们的文章中,我们演示了其如何在多重事件流中检测其互相关系。

Q:事件指代的是?

Manuel Le Gallo:事件可以是Twitter数据、天气数据或者互联网上收集到的传感数据等。

Q:是什么使得神经形态计算比传统计算更有效率呢?

Manuel Le Gallo:在传统计算中有一个单独的内存和逻辑单元,每当要执行计算时必须先访问内存、获取数据,然后将数据传输到逻辑单元,再返回计算。当得到一个结果时,必须把它返回到内存当中,且这个过程不断地来回进行。因此如果你正在处理庞大数据的话,这将成为相当麻烦的问题。

而在神经网络中,计算和存储是同地协作的。你不需要建立逻辑区与内存区之间的传输渠道,只需要在不同的神经元之间建立适当的连接,我们认为这是我们的方法(特别是用于处理大量的数据)将会更有效的主要原因。

PS : 本文由雷锋网(搜索“雷锋网”公众号关注)独家编译

曾获获Intel赏识融资过千万美元——Skully宣布破产

带抬头显示、GPS 导航、后视摄像的摩托车头盔,很想要吧?抱歉,Skully已经宣布破产

9ig8uh1opx7asxdm (1)

据TechCrunch 8月7日报道,Skully的高管最后决定正式对外宣布关闭,这意味着超过3000个在众筹网站预定头盔的用户最终拿不到产品,并且无法拿到退款。数月之前,Skully的联合创始人和CEO Marcus Weller离开了公司,Skully的核心工程师之一Milan Kovac被Elon Musk挖到了特斯拉。这在很大程度上影响了Skully后续的产品改进和完善。

Skully旗下有一款Skully AR-1 摩托头盔,它同时也是公司创始人兼首席执行官Marcus Weller一直以来的梦想。因为他自己也曾经历过多起摩托车事故,他希望有一种头盔,在那上面安装有抬头显示和 GPS 导航,还有后视摄像能让他对身后的情况有更清晰的了解。后来,他对着自己的摩托头盔盯了一个小时,下定决心一定要让梦想成真。

这款头盔也成为了 Indiegogo 上最快完成筹款目标的项目,它在 45 个小时左右的时间内就筹到了 100 万美元,平均每份筹款额为 1,425 美元。这家公司本来希望筹到 25 万美元,不过他们的众筹项目吸引了来自 24 个国家和 43 个州的支持者,将项目的总筹款额推向了 1,133,101 美元。

15年3月时,Skully完成了一笔高达 1100 万美元的 A 轮融资,资方来自Intel、Riverwood、EastLink等多家机构。

今年4月份,Skully还有意进入中国,36氪曾做过报道。但目前看来,这个计划也将全面暂停。

内部人士透露,由于资金基本全部耗尽,创始人也曾打算将公司卖给乐视,但是由于以往的财务销售报告和制造产能问题,造成了这次并购的谈判破裂。Skully团队高管都已经收集到了600万美元去挽救濒临破产的局面,最后在财务核算发现,公司的资金缺口远超他们预期,想要挽回局面已经太晚了。

Skully现已申请破产程序,那么这意味着客户将不会收到1500美元的订单退款,所有SKULLY的资产现在受担保的债权人持有的优先权。

超过80%语音开发者的共同选择