初学者不可错过的分布式机器学习4大知识点 | AI知识科普

分布式机器学习成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

随着“大数据”概念而兴起的分布式机器学习,在人工智能的新时代里解决了大量最具挑战性的问题。

近几年,机器学习在很多领域取得了空前的成功,也因此彻底改变了人工智能的发展方向。大数据时代的到来一方面促进了机器学习的长足发展,另一方面也给机器学习带来了前所未有的新挑战。

在这些发展与挑战中,分布式机器学习应运而生并成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

1、起源:大数据和大模型带来的挑战

在开始聊起源之前,我们先来看张图:
1

 

这张图是展示了ImageNet近几年的错误率,2011年的时候错误率还将近有25%,这样的错误率很难运用到实际应用中。到2015年,ImageNet错误率已经降低到3%左右,比人类的错误率(5%)还要低, 短短的4-5年时间,机器在ImageNet上的识别率便超过了人类。

导致这一结果的原因有2个:一是数据,另一个是模型。

大规模训练数据的出现为训练大模型提供了物质基础,大规模机器学习模型具有超强的表达能力,可以解决很多复杂和高难度的问题。

在解决这些问题的同时,大规模机器学习模型也有着非常明显的弊端:包含参数众多,训练耗时;模型巨大,传统的计算机和工作站难以处理;容易过拟合,在训练数据集上表现良好,在未知测试数据上表现不尽人意。

比较典型的例子是电商网站上的用户行为数据,比如在淘宝上很多用户每天都能看到系统推荐的产品,这些产品是根据用户日常浏览和点击习惯进行推荐的,淘宝的服务器将用户点击的产品行为记录下来,作为分布式机器学习系统的输入。输出是一个数学模型,可以预测一个用户喜欢看到哪些商品,从而在下一次展示推荐商品的时候,多展示那些用户喜欢的商品。

类似的,还有互联网广告系统,根据几亿用户的广告点击行为,为其推荐更容易被点击的广告。
2

 

淘宝推荐系统大致如图所示

由上述案例可以知,现在我们很难用一台计算机去处理工业规模的机器学习模型了,所以说分布式训练已经成为了一个先决条件。

2、流程:了解-探索-设计

分布式机器学习说白了,其实就是把任务发放给许多机器,然后让它们协同去帮忙训练数据和模型。
3

 

如图所示,我们会把任务下发给许多的worker,然后这些worker协同的去训练模型。

通过对分布式机器学习起源的讲解,我们可以将分布式机器学习的使用场景粗分为三类:计算量太大、训练数据太多、训练模型太大太过复杂。

这三种场景都有相对应的解决办法,对于计算量太大可采用共享内存的多机并行运算;对于训练数据太多,可以将数据进行划分,分配到多个工作节点上进行训练;而对于训练模型太大,也可以将模型进行划分,分配到不同的工作节点上进行训练。
4

 

不管是以上场景中的哪一种,还是几种场景混合在一起的情况,分布式机器学习都可以分为三步流程:

第一步是了解机器学习的模型以及优化方法;第二步是要去探索分布式机器学习的范式;第三步是设计系统,无论系统的设计者还是系统的使用者,都要知道系统为什么要这样设计,这样设计对我们选择什么样的机器学习有怎样的帮助。

3、算法:数据并行、模型并行、梯度下降

数据并行

数据并行是指由于训练样本非常多模型非常大,我们需要把训练数据划分到不同的机器上,比如说我们用100台机器同时存储这些数据,如果这些模型有10万个数据样,用100台机器来存储,每台机器存储1000条数据即可。

对于每一台worker来说,训练算法、分布式和在单机上没有什么区别,只是需要在节点之间同步模型参数。

其中参数平均是最简单的一种数据并行化。若采用参数平均法,训练的过程如下所示:

1、基于模型的配置随机初始化网络模型参数

2、将当前这组参数分发到各个工作节点

3、在每个工作节点,用数据集的一部分数据进行训练

4、将各个工作节点的参数的均值作为全局参数值

5、若还有训练数据没有参与训练,则继续从第二步开始

5

模型并行

模型并行将模型拆分成几个分片,由几个训练单元分别持有,共同协作完成训练。

深度学习的计算其实主要是矩阵运算,而在计算时这些矩阵都是保存在内存里的,如果是用GPU卡计算的话就是放在显存里,可是有的时候矩阵会非常大。面对这种超大矩阵便需要将其拆分,分到不同处理器上去计算。6

 

梯度下降

1847年梯度下降被提出来之后,这些年业内提出了各种各样的优化算法,优化算法是一个非常漫长的演变过程。
7

 

大家可以看到图中有一条分界线, 在2010之前的算法主要是Deterministic algorithms,这种算法具有很强确定性。换句话说,就是可以在数学上保证此算法进行的每一步都是精确的,能够指导我们的优化目标。

2010年之后的这些模型被称做stochastic algorithms,不再要求每一步都是精确的梯度下降,或者每一步要做最精确的优化。stochastic algorithms让每一步只进行随机的优化,最终把所有数据优化完以后,还是能够优化到最低点。

随着数据越来越大,Deterministic algorithms规则已经越来变得越来越不适用了。对于大量的计算数据,我们不可能每一次都做梯度下降,随机梯度下降变得越来越有优势,资源利用率也会更高。

4、分布式机器学习三大平台:Spark、PMLS、TensorFlow

在纽约州立大学布法罗分校计算机科学与工程教授、Petuum Inc. 顾问 Murat Demirbas 和他的两位学生一起发表的那篇对比现有分布式机器学习平台的论文中,将分布式机器学习平台归类为了三大基本设计方法:

1.基本数据流(basic dataflow)

2.参数服务器模型(parameter-server model)

3.先进数据流(advanced dataflow)

并根据这三大基本设计方法,使用了业内著名的三大分布式机器学习平台,其中基本数据流方法使用了 Apache Spark、参数服务器模型使用了 PMLS(Petuum)、先进数据流模型使用了 TensorFlow 和 MXNet。

并在测试中得出相应的结论,班主任摘取关键部分出来,供大家参考(论文原文可访问:https://www.cse.buffalo.edu/~demirbas/publications/DistMLplat.pdf,译文参考网络翻译)

Spark

在基本的设置中,Spark 将模型参数存储在驱动器节点,工作器与驱动器通信从而在每次迭代后更新这些参数。对于大规模部署而言,这些模型参数可能并不适合驱动器,并且会作为一个 RDD 而进行维护更新。

这会带来大量额外开销,因为每次迭代都需要创造一个新的 RDD 来保存更新后的模型参数。更新模型涉及到在整个机器/磁盘上重排数据,这就限制了 Spark 的扩展性。

PMLS

PMLS节点会存储和更新模型参数以及响应来自工作器的请求。工作器会请求来自它们的局部 PS 副本的最新模型参数,并在分配给它们的数据集部分上执行计算。

PMLS还采用了 SSP(Stale Synchronous Parallelism)模型,这比 BSP(Bulk Synchronous Parellelism)模型更宽松——其中工作器在每次迭代结束时同步。SSP 为工作器的同步减少了麻烦,确保最快的工作器不能超过最慢的工作器 s 次迭代。

 TensorFlow

 TensorFlow使用节点和边的有向图来表示计算。节点表示计算,状态可变。而边则表示多维数据数组(张量),在节点之间传输。

TensorFlow 需要用户静态声明这种符号计算图,并对该图使用复写和分区(rewrite& partitioning)将其分配到机器上进行分布式执行。(MXNet,尤其是 DyNet 使用了图的动态声明,这改善了编程的难度和灵活性。)
8关注我们,收看更多精彩课程

640

过去活跃在科幻片中的“克隆人”可自提,这事儿好像成真了……

在前不久刚刚结束的科大讯飞1024开发者节上,关于首届“顶天立地”iFLYTEK A.I. 开发者大赛总决赛中,一家名为“奇幻科技”的企业果断get到了如此“妙不可言”的科技点。

发表于2018-11-14 17:23| 来源CSDN| 作者刘晶晶


289_181114172457_1
《邓丽君·传奇》全息演唱会现场

(图片来源:https://item.btime.com/m_9d090cf74ff9f25c7?page=1

看到曾经的华人巨星邓丽君再现舞台,并真实领略了天后的倩影和歌声的经典重现,着实有点儿小鸡冻!

话说,如果好莱坞大片中的“替身小分队”纷纷主动“换角”,动作演员替身要失业,你会怎么想?

据可靠“情报”,如今确实有很多大牌动作明星都选择使用虚拟替身,就连好莱坞自己也并不想再使用真实演员完成高危动作,其中成本是首要被考虑的因素。例如我们熟悉的热门电影《创:战纪》、《复仇者联盟》三、四季以及前段时间霸屏的《头号玩家》等,在拍摄过程中均延用此道。

虽说以上发生的这些事儿在鸡冻之余确实有些麻烦,但以虚拟人技术与MR技术(AR+VR)混合成的“虚拟人全息”技术,的确让“随时随地创建属于自己的阿凡达”这事儿成功突破了科学幻想的边界。

试想一下,过去活跃在科幻片中的“克隆人”可自提?实在有趣!

需要解释说明的一点,这里提到的“克隆人”并非我们通常意义上的以生物学为基础的基因复制,而是来源于美国知名生物制药公司联合治疗公司创始人兼CEO玛蒂娜·罗斯布拉特的争议之作《虚拟人》,书中提出的“思维克隆人、网络人等虚拟人将如何颠覆人类对‘我’的定义”。
289_181114172521_1

图片来源:www.cyzone.cn

说来也巧,就在前不久刚刚结束的科大讯飞1024开发者节上,关于首届“顶天立地”iFLYTEK A.I. 开发者大赛总决赛中,一家名为“奇幻科技”的企业果断get到了如此“妙不可言”的科技点。

通过图像建模、语音识别、语义识别等人工智能技术,搭建了一套数字化人物模型及智能的中心系统,用户使用后可以通过上传自己的照片来快速获得虚拟人形象,这款基于AI技术的智能虚拟人系统被大家称作“Amazing Me”,并荣获了应用开发 AI 挑战赛的亚军圣冠。

奇幻科技方面表示,研发Amazing Me最初的想法,是想让每个人都可以创建与自己长相一样的虚拟人,更重要的是能够让虚拟人成为人类的“陪伴者”,填补精神层面的缺失与空虚。


289_181114172551_1

Amazing Me 虚拟人

(图片来源:http://finance.huanqiu.com/cjrd/2017-08/11068843.html 

据了解,除了长相的高度重合外,奇幻科技的研发团队还通过AI 算法为每个虚拟人在表情、动作、记忆等细节中“生发”个性化的形象特点,更有趣的是,新鲜出炉的虚拟人还能做到自我学习,在外形和思维方面不断趋近于真人,果然如名字般够惊喜!

具体来说,为了让上线的虚拟人形象越来越像“真的你”,Amazing Me采用了一套“AI自适应整容”方案。就是利用照片与视频建立与真人一样的虚拟人模型之后,通过AI 算法,捕捉和学习与真人在形象上的细微变化,不断对虚拟人模型加以调整优化,从而达成虚拟人与真人同步成长。

此外,虚拟人还可以学习真人的表情和动作,通过捕捉建立个人的表情动作数据库;具备的人脸识别和唤醒功能让其在机器学习的技术“影响”下,做到与人真正对话,在交谈中提升技能,值得提出的一点,应用中涉及到的语音能力均是讯飞开放平台所提供。

不同于美国科幻电影《Her》中陪伴男主人公的萨曼莎只有声音,智能虚拟人还有一个逼真的实体。对此奇幻科技表示,未来,高度类同真人的智能虚拟人前景优势巨大,可以融入到很多实际应用中“放光发热”!

“首先,他们真的可以创造一种新的生活场景,例如虚拟人的VR电影!”让每个人走入电影中成为主角,明星的虚拟人甚至可以代替真人表演发挥,是一个驱动电影发展的好办法!奇幻科技方说。
289_181114172614_1

篮球运动员马布里虚拟人首发

(图片来源:http://ent.ifeng.com/a/20181015/43124051_0.shtml

另外就是目前比较常见的应用类型,对故去人物的还原。这方面主要通过历史故事或者相关的数据信息,将历史名人、故去的明星偶像等搬到故居、蜡像馆甚至是舞台上,与游客以及观众实现交互,产生活灵活现的对话。

此外,还可以模拟斯坦福大学虚拟人机界面实验室(VHIL)的虚拟角色,创建一个老师的虚拟镜像。怎么用?系统会根据每个学生的言行举止“创造”出一个与学生相貌以及举止行为类似并更有亲和力的老师形象,从而提高听课的效率。事实证明,让一个学生喜欢的老师来授课,确实会大大提高其学习效率,何乐而不为呢?

现如今市场上在售的、具有陪护功能的智能机器人多不胜数,虚拟人的成熟上线正可打破机器人“第三者”的身份,从“真正亲人”的角度出发,甚至可以在特殊时间代替家庭重要角色进行互动交流,让诸如留守儿童等特殊群体随时得到父母关爱。

更重要的是,智能虚拟人通过自我学习可以不断加深对服务对象的了解,还能够实时记录个人成长,例如在不同的年龄阶段建立档案等,或许未来某一天,人类可以与某个时期的自己对话也说不定呢!

畅聊智能虚拟人之后,我们再来详细聊一聊这家名为“奇幻科技”的企业吧!

“我们是一家以内容为切入点的技术公司。”这是奇幻科技团队上下赋予自己的定位。

创业之初,在VR发展的五大方向(操作系统、硬件、线下体验、应用于内容)中,奇幻科技妥妥选择了从内容出发,寻找与产品和技术的结合点。在这个前提下,加大技术的自研力度,例如语音交互、眼球追踪等,成为团队一直以来的不断追求达成的目标。

技术的高效研发需要一支高精尖的团队,据悉奇幻科技还有一支强大的、来自国内以及美国的人工智能团队,同时包括高校资深的科研任务为其提供技术指导,如此来看内容以及交互技术才有了落地的可能性。

除了“智能虚拟人”的新鲜上线之外,奇幻科技还在线下打造了一种全新模式——“奇幻乐园”,将人工智能与VR技术有机结合,目前已在成都、青岛、厦门、宁波等地陆续落地。

例如在宁波,奇幻科技的线下VR主题乐园已经建立并投入运营,乐园涵盖二十多项VR体验项目,是目前最大的一处VR乐园,主要包括探索宇宙的天文馆、探索太空的虚拟航天飞机、回到侏罗纪时代的恐龙馆等诸多基于虚拟现实的体验项目。

289_181114172727_1

图片来源:http://www.sohu.com/a/168535878_117206 

其中VR教室能够为中小学生提供科学类、自然灾害的安全教学以及红色教育等“真实”内容,这些在传统课堂中都很难实现。“我们在所有VR主题乐园中都设有VR教室,主要面向宁波几十万小学生,让广泛开展的课外实践活动可以具备身临其境的体验。”据小编了解,未来智能虚拟人将成为主题乐园的核心。

关于未来,奇幻科技的规划很清晰,就是把人工智能和VR、AR、全息投影等创新技术结合起来,打造虚拟人的技术体系,并以此建立线上线下的各种应用。更重要的是,做成一家真正关注未来、关心人性且不以盈利为唯一目的企业,是奇幻科技的初心所在。

凭借创新的AI应用,奇幻科技在科大讯飞首届iFLYTEK AI开发者大赛上表现亮眼。

据了解,本次大赛共设置了“方言种类识别AI挑战赛”和“应用开发AI挑战赛”两项赛事,历时6个多月,吸引了1万余名世界各地的优秀开发者踊跃参加,共计收到全球3千多支团队提交参赛作品,经过决赛的选拔,眼前一亮的厉害作品更是层出不穷。

更重要的是,大赛面向全球首次开放中文方言语音数据集以及 AIUI 人机对话交互,语音听写、合成、评测、翻译,人脸识别,声纹识别等十余项人工智能核心技术,极大促进人工智能应用场景的升级。

不但技术上大力支持开发团队,还将为参赛选手们提供百万现金、科技晚宴、就业通道等全方位资源扶持,试想一下,在科大讯飞如此给力的助动下,未来如同奇幻科技一样的出色企业以及醉心语音研究的开发者们,定会迅速崭露头角,大放光彩……

新能力上线 | 精准识别2万种物体,还能看人脸测颜值!

现在,由科大讯飞能力星云计划的优秀A.I.服务合作伙伴,图普科技提供的人脸特征分析、场景识别、物体识别在讯飞开放平台上线!让你可以开发拥有更多样化智能识别能力的产品。

划重点

科大讯飞能力星云计划的优秀AI服务合作伙伴——图普科技,带来人脸识别、自然场景识别新能力!戳一下了解详情:人脸特征分析场景识别物体识别

如今,打开微信朋友圈,一条条动态几乎没有不配图的。晒风景,晒美食,晒自拍……一天不“晒图”简直浑身难受。

 

全世界每天每分钟会上传超过5亿张图片到互联网,随着高速网络的普及与智能设备的发展,图片已成为用户表达、事件记录中不可或缺的部分。内容审核、照片管理、营销推广等需要处理大量图片的工作对图像识别能力的需求正在不断增强。

对于开发图像智能识别产品的开发者,想让产品脱颖而出,不仅要让识别高效精准,还要能通过独一无二的功能带来全新的玩法,比如可以给好友的自拍评一个颜值指数、从一张晒吃照片中迅速获得美食信息……

现在,由科大讯飞能力星云计划的优秀A.I.服务合作伙伴,图普科技提供的人脸特征分析、场景识别、物体识别在讯飞开放平台上线!让你可以开发拥有更多样化智能识别能力的产品。

 

人脸特征分析

颜值、表情多维度识别,准确度99.5%

基于深度学习算法,可以检测图像中的人脸并进行一系列人脸相关的特征分析,当前支持识别出包括性别、颜值、年龄、表情多维度人脸信息。可用作基础人脸信息的解析,智能分析人群特征。

 

年龄

对上传的图片中人物的年龄段进行判断分类,如婴儿、青年、中年、老年等。

性别

识别出上传的图片中人物的性别。对露出全脸、侧脸的真人或动漫人物进行“男性”、“女性”的分类。图中有多个可辨别面部特征的人或动漫人物时识别为“多人”。对画面无人、面部未显示或无法辨认的图片归为“其它”。

颜值

对上传的图片中人物颜值进行分析,给出对应结果:漂亮、好看、普通、低颜值等。

表情

识别出图片中人物的表情特征:喜悦、愤怒、悲伤、惊恐、厌恶等。

能力优势

1、准确度达99.5% 

对于日常生活中的人脸,准确率高达 99.5%。

2、可适应多种复杂环境

在遮挡、光照不佳、头部姿态变化等复杂场景下均具备高性能表现。

3、处理高效稳定

毫秒级响应速度,在 PC、移动设备上均能迅速处理。

可应用场景

1、客流属性识别 

通过对图像或视频中的人脸特征分析,分析客流的性别、年龄等属性。

2、广告精准投放

通过人脸特征分析,可以实时分析受众人群的性别、年龄等特征和分布状况,精准投放广告。

3、线下营销

基于人脸特征分析,商场、餐厅等场所可展开颜值测试类的互动营销活动,增加与顾客的互动。

自然场景识别

覆盖数十种场景,2万种物体

场景识别

精准识别自然环境下数十种场景,让智能相册管理、照片检索和分类等基于场景的应用展现得更加直观。

对实际应用场景分为室内、室外、自然风景和其他四大分类,每个分类都会按照实际场景细分为多个类别,根据用户上传的图片里对应的实际场景返回结果。

 

物体识别

全球领先的通用物体检测算法,有效检测图像中的动物、交通工具、生活家具等2万多种生活常见物体。可分析图片主要内容,帮助技术团队对图像语义进行自动化解读。

 

能力优势

1、超高准确度

全球领先的智能识别算法,让图片内的场景和物体可以被准确识别。

2、功能强大

支持数十种场景、数万种物体识别,并在持续增加中。

3、适应复杂环境

在模糊、倾斜、光照不均、背景杂乱等情况下均保持高性能表现。

4、处理高效稳定

毫秒级响应速度,并在实际场景中不断优化性能表现。

可应用场景

1、拍照识图

自动识别所拍照片的内容,减少人工录入成本及出错率。

2、图片内容检索

根据图片场景自动分类,建立快速检索系统。

3、智能相册

根据用户上传照片进行主体检测,精准识别照片信息,批量读图实现相册智能分类管理。

4、内容及广告推荐

识别用户经常浏览的网页中的图片信息,推送相关内容或广告。

5、以图搜物

在不知道图片中物体的名称时,自动化检测并展示图片内的物体信息,方便进一步搜索物体的相关内容。

来官网进一步了解吧!
人脸特征分析

场景识别

物体识别

A.I.能力星云

除了自研能力,科大讯飞还与业内优秀的技术厂商进行战略互补形式的合作。带来能力星云计划

讯飞开放平台自2010年成立以来,经过8年的积累,现已开放近百项A.I.能力,赋能88万开发者团队。在能力星云中,A.I.服务合作伙伴通过讯飞开放平台的桥梁,为更多的A.I.开发者和爱好者提供服务,让技术为在更多场景中落地,为各行业赋能。

A.I.服务合作伙伴在能力星云中拥有:

官网专栏产品页

讯飞开放平台上线A.I.能力详情页,产品介绍,接入流程,能力提供方等信息一应俱全!

全渠道推广宣传

线上渠道,线下市场活动,会针对A.I.服务合作伙伴的产品进行全网宣传和推广,扩大影响力,吸引更多开发者使用A.I.能力!

商机即时对接

专业团队负责商机梳理和对接,A.I.新能力商机将会即时处理,定期同步给A.I.服务合作伙伴,带来更多商业资源引流。

共享开放平台开发者

讯飞开放平台丰富的开发者将率先体验A.I.新能力,并应用在产品中,形成更多的合作案例以及解决方案!

未来,能力星云将让厂商的实用级核心技术陆续与讯飞的核心能力一起,汇聚成A.I.能力的星云,释放巨大的组合效应!

科大讯飞魏思:技术在不断发展的同时,也在朝着历史「回归」

技术在不断发展的同时,也在朝着历史「回归」
如何去定义这些问题,并在有限的场景下去部分解决问题,才是我们下一步的发展方向.

在刚刚结束的全球1024开发者节上,科大讯飞研究院魏思就模式识别和人工智能的发展关系和发展历史问题,做了他自己15年来的A.I.追光故事分享。

他在分享中提出如下观点:

技术在不断发展的同时,也在朝着历史「回归」

如何去定义这些问题,并在有限的场景下去部分解决问题,才是我们下一步的发展方向

……

这些观点是非常值得我们去学习和思考的,我们将魏思院长的演讲文稿整理出来,希望对大家未来的研究之路能够有所启发。

以下为演讲稿的文字整理,有部分微调

我叫魏思,来自科大讯飞研究院,我大概有15年的时间一直在从事模式识别方面的工作。

模式识别大概有60、70年的发展历史,最近这十年好像行业技术发展得很好,但实际上我认为它是朝着历史回归了

目前所有研究的方向、模型都回归到了条件相关性或者是条件依赖性的数学模型上,而此模型是在80年代中期由美国科学家Judea Pearl提出来的,后来这套模型演变成了图模型,目前的基于深度学习的模型和图模型在数学上的变化非常小,但是实际效果变化却非常大。

接下来我会从4个方向去讲述这几十年来技术的发展脉络。这4个方向分别是人类或者动物的神经元信号的传递机理和人工神经网络;统计和模式识别;语音和语言方面的研究;图像识别的研究进展

 

点击查看魏思演讲全部视频

从生物神经网络到人工神经网络

18世纪,意大利的科学家伽伐尼发现青蛙的蛙腿放在金属上会引起抽搐,这是人类第一次发现肌肉可以由电刺激而产生动作,于是伽伐尼猜测了生物电的存在。

1920年阿德里安通过实验证明了神经元动作电位的存在。而早在20世纪初的时候,科学家伯恩斯坦提出了静息膜电位的概念,并发现静息膜电位为-70mv,同时他猜测带电物体穿越细胞膜或许是动作电位产生的机理。

1939年霍奇金和赫胥黎通过枪乌贼神经元的系列精细实验证明了神经元的细胞内外确实存在电流,并测量出了动作电位的大小(110mv)。他们发现是钠离子的内流形成了真正的动作电位,钠离子内流之后钾离子外流保持细胞内外的静息膜电位然后他们猜测了两件事情,第一,膜上有离子通道,第二,存在离子转运蛋白保持膜内外离子平衡,这些后来都被分子生物学所证明。静息膜电位,离子内外流动和转运蛋白一起完成了动作电位的产生。
h'y640

 

魏思现场演讲

同期(1920-1930)Loewi,Dale,Katz发现了神经递质乙酰胆碱,乙酰胆碱引起离子通道打开从而在神经元间形成动作电位,完成了信息在不同神经元之间的传递,至此,神经元的信号传递分子机理基本梳理清楚了。

在此基础上,1943年McCulloch和Pitts提出一种非常简单的数学模型(MP模型)去近似神经元的信号处理机制。1958年美国科学家罗森布拉特首次发现可以用MP模型,去完成很简单的模式识别任务,也就是让机器识别物体和数字,这也是第一代神经网络,我们称之为感知机

我们把那个阶段称之为神经网络第一次浪潮,但很快浪潮就过去了,因为当时的感知机的识别性能比较低,在实际中很难发挥作用。

同时在50年代,Kuffler,Hubel和Wiesel发现了视觉神经系统的工作机理,原来视觉不是响应弥散光的照射,而是响应不同形状的光照。他们创造性的提出了感受野的概念,现在我们知道这就是滤波器。

受此研究的影响,贝尔实验室的科学家LeCun在80年代末90年代初想到了利用卷积或者形状响应机理设计一种算法去进行文字的识别,但当时,模式识别界被SVM主导,这个发明并没有引起很大的反响。

640了魏思现场演讲

同时,从80年代到90年代,Hopfield提出了动态神经网络,Schmidhuber和Hochreiter提出带遗忘机制的动态神经网络模型。但那时并不被看好,直到近几年这个模型才逐渐流行开来。2006年以后,Hinton复兴了深度学习,并在语音和图像上取得了突破性进展,深度学习也获得了极大的应用这就是我们说的从神经元的工作机理,到人工神经网络的发展历史。

 

统计和模式识别的发展

统计的雏形是概率和计算而最早的广为人知的统计算法是最小二乘法,它是在1805年由勒让德首先发明的,并在1824年由高斯用误差分析的方式重新阐述以后获得了极大的影响力,是前模式识别时代应用最广泛的算法。

1885年弗朗西斯·高尔顿发明了回归,同时利用数据统计和图形化首次得到了二维正态密度的分布图和相关系数等重要概念,要说现代统计肇始于高尔顿也不为过。

高尔顿赞助卡尔.皮尔逊在伦敦大学学院(UC London)成立了统计实验室,造就了20世纪早期开始的统计学革命。费舍尔(Sir R. A. Fisher)在1936年提出的线性区分性分析(LDA),纽曼,爱根·皮尔逊(卡尔·皮尔逊的儿子)同期提出的似然比检验(Likelihood Ratio Test)则可以称之为现代分类器的雏形。这些概念后来演变成了现代模式识别体系。

1950年美国科学家Abraham Wald系统地将“统计决策理论”阐述清楚。从那时候开始,模式识别慢慢成熟,我们有了很多可用的模型,比如说线性分类器、树分类器,GMM模型,HMM模型等。

这里面特别值得一提的就是条件相关性模型,1985年Judea Pearl提出来贝叶斯网络, 此后,Judea Pearl对图模型的学习、推理等进行了系统性的研究,并解决了一系列数学问题他在科普书(The book of why)中自豪的称自己的工作解决了人类智慧的秘密(寻找事物之间的因果关系),他也因此得了2011年图灵奖。

64045魏思现场演讲

但事实上图模型的学习和推理非常难(数学上的术语是图模型的学习是NP-Hard的),在实际应用中的效果并不是很好。在2006年到2010年期间,以Hinton为代表的人工智能学者发现在用神经网络让模型通过数据和算法自动去获数据之间以及数据和标签之间的条件相关性,可以获得非常好的效果

从上面我们可看到,模式识别也慢慢地发展到了对条件相关性的利用和训练方向上来了。

 

语音和语言的发展

在语音方面我会讲两个方向,语音合成和语音识别。

语音合成在90年代以前都只是实验室的项目,到了90年代后,研究人员发现可以通过预先录制很多的语音,在实际使用的时候把数据拿出来进行拼接来进行语音合成。奇怪的是,这么简单的做法,居然可以获得相当好的效果。但是这样得到的语音连贯度和平滑度不够,所以研究人员设计了很多的启发式的规则和方法,去调整语音合成的连贯度和平滑度。

2000年,日本科学家Tokuda把语音识别中的常用方法HMM用到了语音合成上,提出了新的语音合成方法,虽然在当时它的效果不是很好,但很快人们发现用这种新的方法,在语音合成的效率、平滑度问题上,都有很好的表现。

2016年年Google提出了WaveNet,我们也利用条件自回归模型取得了较大进展。目前,由于利用了长时的相关性,我们的语音合成效果非常棒,语音合成也慢慢收敛到条件相关性上来了。

语音识别历史就更长了,而且更有意思。 1971年JennyBaum发明了HMM,1975年James Baker把HMM用到了语音识别上80年代到90年代,GMM/HMM的EM算法被几个小组(CMU,IBM,Bell lab)重新定义(1977年Dempster就已经从数学上把EM算法做出来了),一批科学家从无到有地将EM算法和HMM语音识别上的整套体系建立起来了。自此语音识别被HMM主导并由于HTK(HMM Toolkit, Cambridge)的出现而得到了大面积的推广。

2010年,Hinton首次提出利用深度网络结合HMM进行语音识别,并和微软研究院俞栋和邓力合作在SWB上获得了相对30%的提升,从此语音识别翻开了新的一页。

综上所述,可以看出语音合成和语音识别也都收敛到条件相关性的数学模型上来了


64088

 

魏思现场演讲

下面,我们来看看语言。

在很早的时候,语言是定性和分析的科学。

到了90年代,随着HMM模型的普及,特别是HMM在机器翻译上的成功应用,语言也进入了统计的时代。

2001年JohnLafferty发明了条件随机场模型,这个模型考虑了特征域和标签域的条件相关性(相比HMM,多考虑了标签域的相关性),由于考虑到了更多的条件相关性,条件随机场的效果好过其他的模型,也获得了大量的应用在2001年之后,条件随机场几乎主导了需要处理动态信息的自然语言处理系统。

2012年,Minklov首次利用(RNN)语言模型取得了语音识别的显著提升,同时他们发现可以利用RNN语言模型生成符合语法规范的句子,而在此之前机器自动生成合乎语法规范的句子几乎是不可能完成的任务。

2015年,Google和Universityof Montreal几乎同时提出了利用编码解码机制去进行机器翻译,再加上注意机制(Attention)的引入,机器翻译在过去的几年间发生了翻天覆地的变化。机器翻译的效果在简单场景下已经达到了人工的水平。而这套模型也是利用了神经网络实现了特征域和标签域的全部条件相关性

由上我们可以看到,语音和语言,也都收敛到了条件相关性模型上了。

 

图像识别的研究进展

图像识别的发展可以分为2个阶段, 2012年之前和2012年之后。

在2012年以前,大部分图像识别类的任务都是在发明非常精巧的算法,或者定义更加复杂有效的滤波器。这些工作虽然比较漂亮,但在实际复杂场景下的推广性不佳,如说人脸识别和物体识别。视觉识别方面(如人脸,物体,物体分割等)的研究也一直没有获得大规模应用。

2012年Krizhevsky和Hinton首次提出了利用多层子卷积神经网络来进行图像识别在2012年的ImageNet比赛上遥遥领先传统方案,以显著优势获得第一名。从2012年以后,深度卷积网络几乎主导了计算机视觉的研究,现在几乎所有的视觉类任务都可以看到深度卷积网络。

为什么会出现这样的现象?实际上所有人工设计的分类器或者特征,都是在试图用人工的方法去找到特征之间的条件相关性,这是非常困难的。

而深度卷积网络让机器通过海量数据自动去提取条件相关性,这样可以发现非常复杂和隐藏的相关性

由此可见,图像识别也收敛到了条件相关性上来了。
64000

 

魏思现场演讲

下一步的发展方向

我讲完了刚才的四个方向,大家会发现在模式识别的各种实际应用领域,模型通通都回归到条件相关性这个数学概念上

唯一的区别是,我们现在找到了非常棒的一个动态模型,它能够比较自然地去描述条件相关性,然后我们再给模型很多训练数据,用基于梯度下降的BP算法去训练此模型,便可以在实际应用中取得很好的效果。

看到这里大家可能要问,这便是人工智能了吗?

不,并不是。

智能和我们现在算法的差距非常远。我们现在的算法是给定了模式、给定输入,通过模型找到模式和输入之间的条件相关性,仅此而已。

64099魏思现场演讲

但是人类的智能是什么?人类的智能并不是在给定的模式下面做分类。人类会新定义模式(发现新模式)、拆解模式(进行模式重组和加工),所有这些都是现在我们模型所不具备的

总结来说,现在的模型可以让我们非常自如地去发现数据中的复杂的条件相关性或者依赖关系。但由于这种关系可能是远距和复杂的,直接利用梯度信号训练,我们需要非常多的训练数据。

现在的模型虽然好,但是它的实现原理和人类机理差别还是很大的。人是通过无监督学习,把所有的结构或者相关性梳理好,然后通过有监督的学习去进行标注和贴标签并不是直接用有监督数据来进行模型训练的(请大家回顾一下小孩子学习语言和进行图像识别和分类时,他得到的有监督数据是非常有限的)。

同时,人类智能更多体现在认知上,也就是从无到有地产生概念和模式,这是机器所更加不具备的。给机器一幅图,让它用有逻辑、有语义的方式来描述这幅图,我们就会发现机器的表现非常糟糕。

这是因为机器只具有模式分类和识别的能力,它不具有概念生成糅合拆解、新概念产生的能力,也就是机器无法深层理解语义并对语义进行加工。

在这些方面我们如何去定义问题?怎么在有限的场景下去部分解决它?我认为这才是我们下一步的方向

来1024生态展区,未来真的触手可及!

为期两天的1024开发者节已圆满结束,除主论坛、分论坛外,生态展区也吸引了很多观众驻足观看、体验。在这里,我们仿佛以最近的距离靠近未来。

为期两天的1024开发者节已圆满结束,除主论坛、分论坛外,生态展区也吸引了很多观众驻足观看、体验。在这里,我们仿佛以最近的距离靠近未来。

除了技术与产品,1024开发者节还准备了多个惊喜。会场外,占地约3000平米的生态展区,汇聚了超过50家优秀合作伙伴和A.I.企业,打造了集中式、场景式、浸入式的A.I.应用体验。同时分设主题展、特色展、创新展,向现场A.I.追光者们展示着想象之中、预料之外的奇幻之约。

6433

 

24号当天上午,在1024开幕式致辞之后,安徽省政府副省长何树山带队前往展区视察,科大讯飞轮值总裁陈涛、科大讯飞高级副总裁胡戈宁陪同,并对展区情况做了相关介绍。

6434

 

安徽省政府副省长何树山视察展区

除莅临现场的领导外,还有大到要家人陪着来看机器人产品的老奶奶、小到被工程师父亲带到现场看热闹的七岁男孩,有来自斯坦福设计联盟的外国友人、谷歌lunchpad合作伙伴,还有很多在校大学生,大家都一起徜徉在这片科技的海洋中。展区1000+ A.I.黑科技产品,以人工智能产业集群内优秀合作伙伴产品展示为主,通过合作伙伴生态长廊的现场体验进行汇聚展示,凸显产品种类多样性与性能前瞻性。

6435

 

科技有情怀——中国声谷

主题展以“中国声谷”为主,展示省内智能语音及人工智能技术和产品;同时征集并邀请优秀国内外企业代表参展。特色展以科大讯飞为主,突出智能语音模拟应用和历史声音再现主题,收集并展示世界伟人、历史名人等“声音”,用技术打造一个有情怀、有互动、有感触的特色展示效果。创新展以“中国声谷”为主,展示第一届国际智能语音及人工智能产品创新大赛涌现出的优秀作品。

6436

 

自带30多个合作伙伴——图灵机器人

作为科大讯飞优质合作伙伴的图灵机器人参与了本次1024,并携带着图灵30多个合作伙伴的儿童智能硬件产品亮相。图灵是以语义对话技术为核心的技术型公司,而其合作伙伴们均是接入了图灵的NLP和讯飞的ASR,彰显出了两家公司的“飞图计划”,产品类型则涉及了智能故事机、绘本机器人、智能音箱、儿童智能手表、儿童机器人等产品。

6437

 

在现场,尤以绘本机器人luka baby, 儿童机器人熊卡,好帅豆乐以及富士康生产的Robohon 引发了众多开发者们的围观。和展区各式形态、功能的机器人各显神通,彰显了科技带给我们的乐趣。

携“网红”而来——苏宁智能

苏宁智能成立未久,主要基于苏宁物联网技术、苏宁内容优势及苏宁智慧零售生态,打造服务于家庭及个人消费者的硬件产品及智能生活解决方案。聚焦产品、内容、技术,构建苏宁智能家居平台,并布局智慧家庭硬件产品,打造苏宁智慧家庭生态。

6438

 

10月22日在苏宁易购开售的苏宁小Biu音箱•极智版,也作为本次苏宁智能的亮点产品出现在科大讯飞1024全球开发者节上。它不仅深得第一代网红苏宁小Biu音箱的”真传”,还进行了全面升级,简约机身,250g超轻巧。同时拥有强大的智能语音交互功能和海量的内容资源,呼唤“小Biu小Biu”,可实现影音娱乐、生活服务、儿童陪伴、语音购物、家居控制、百事大全等600多项智能操作。在智能操控方面,苏宁小Biu极智版可智能控制100+个品牌,5000+款智能家居家电,是家中全能型的“神助手”

宣传册被一抢而空——咪鼠鼠标

节日当天,前往咪鼠展区的人员络绎不绝,咪鼠凭借独具特色的互动演示方式以及用更自然的人机交互产品吸引了众多业内人士以及参会人员的青睐,成为当场人气颇高的展位之一。

6439

 

咪鼠展区的互动参与方式更为丰富,智能语音鼠标、U盘等各种精品礼品受到了参会人员的喜爱,在展区的咪鼠宣传册也被一抢而空。咪鼠产品使用了科大讯飞核心语音识别技术和科大讯飞AIUI 3.0技术,在现场热闹嘈杂的环境中也能精准地理解体验用户发出的指令,并在电脑自动展示用户所需,同时,在电脑文档中能通过语音准确快速地完成文字的输入,也让在场的用户体会到了更便捷的人机交互方式。

智能化妆镜——变脸机器视觉

智能化妆镜,通过在传统的镜子内嵌入显示屏、传感器与操作系统,为镜子新增了镜面显示以及人镜互动的功能,还搭载特色的“A.I.化妆师”功能,从而成为了电脑、电视、手机之外的“第四屏”。除智能化妆外,还可为厨房、浴室、美妆、健康搭建智慧生态圈。

6440

 

变脸魔镜结合了语音交互、虚拟助手、AR试妆等一系列前沿技术。基于 “智能镜面显示和交互”技术 、“三维人脸识别与重构”技术,以及人工智能语音交互技术,实现科幻般的终端人机交互,为美业、智能家居等行业应用提供了更多更有趣的解决方案。

现场30分钟开发技能——AIUI开放平台

除外部优秀合作伙伴外,AIUI开放平台也设立了展台。众所周知,AIUI是一套人机对话开发平台,全链路能力包括、语音唤醒、识别、语义理解、合成、翻译等。可以被广泛的应用于APP、机器人、智能家居、智能客服等领域。基于讯飞开放平台的生态圈,AIUI开放平台还提供面向各垂直领域的解决方案,助力终端设备快速拥有人机交互能力。

6441

 

现场,AIUI展台还举办了两场现场语音对话技能开发大赛,命题是在30分钟的时间内,完成一款语音技能的开发,并且根据技能的难度、完成度给出分数并评选出前三名。大赛吸引了现场不少通过AIUI进行开发的工程师,选手们在30分钟内都完成了相应技能的开发,并获得了相关礼品。现场的氛围吸引了众多嘉宾驻足观看,参赛的工程师们还分享了身为开发者的乐趣。

一场别开生面的粉丝见面会——AI大学

从1节课到115节课;从专注A.I.基础技术的技术专业课程体系到目前涉及A.I.商业、A.I.创业的6大完整课程体系;从第1位特聘教授到第55位,人工智能商业化专家吴霁虹、讯飞研究院院长胡国平等不同领域的行业大咖聚集在此。这一次的1024,AI大学迎来了一周年庆。

64426443

 

 

我们曾想过无数次一周年的happy ending,有温馨的、有欢笑的、有调皮可爱的,但没有任何一种版本比1024当天中午的更完美更圆满。来自全国各地200多位的同学聚集在【胡郁校长粉丝见面会】现场,他们中有的是胡郁校长万年骨灰级粉丝,有的是进入AI大学后才入坑的萌新……初次相识的同学们因为胡郁校长而变得熟识起来。胡郁校长发表了热情洋溢的讲话,我们也在现场准备了美味的西点,这一刻,我们铭记并且感恩,往后,正如校长所说:“希望我们最终能够一起不忘初心,踏实前行,我们一定能够赢得我们追光者的未来!”

除此之外,还有可以让你在做饭时轻松聊微信的“魔厨”,可以监测血压、血氧的奇智医养手表,一款无线实时AR眼镜……1024现场,各类人工智能产品让大家大开眼界。来自讯飞智能家居、智能硬件、医疗等众多展台纷纷展示A.I.在相关领域的最新应用。还有来自图像识别、公益、大数据、智能营销、智能翻译等多领域的优秀合作伙伴,如极链科技、大坝科技、小牛翻译、SAP、海德瑞丰等更是让生态展区精彩纷呈,加强了大众对A.I.的认知。

6444

 

经脉宝中医辅助诊疗

 

6445开放平台VR体验

针对如此之多的优秀合作伙伴和产品,展区现场还举行了1024你最喜爱的A.I.产品评选活动,在展台参与投票即可获得超级奖品。最终,法眼察科技、追一科技、大坝科技荣膺前三名。下午时分,锦鲤诞生,价值2999元的讯飞翻译机2.0奖品被一位幸运女孩抽中。这场积聚了我们许久努力的追光者之约,带给你的不仅是神奇,更多的,都是惊喜。

 

6446锦鲤大王

今天,9场分论坛继续惊艳绽放,一起解读了A.I.+医疗、客服、家居、车载的更多可能。你可能没机会或错过了这场盛大的1024之约,没关系,全程视频回放送上,点击阅读原文观赏。1024,明年见!

qrcode_for_gh_f97f0eb2c7e8_1280

为什么让A.I.“顶天立地”需要6个多月?

A.I.面向所有人,也应该服务于所有人。只有这样才能真正实现“顶天立地”。

在A.I.的发展中,专注技术or专注应用?

这从来不是一道选择题。

“技术顶天,应用落地,希望全社会的开发者可以和我们一起开放创新、共建A.I.生态。”——2018年3月22日,在科大讯飞主办的「AI大学·未来课栈@上海栈」,科大讯飞研究院院长胡国平如是说。

640

胡国平院长

同时,他还宣布:首届“顶天立地”iFLYTEK AI开发者大赛正式启动。

6401

 

如今,这场汇聚产学研各界力量,面向全球人工智能开发者发起挑战的盛事已进入决赛阶段,在过去的6个月中,赛事的进展可以说热闹非凡——

1万余名世界各地的开发者参加

全球3千多支团队提交参赛作品

走入3个城市:上海、香港、北京

而在以上现象的背后,是科大讯飞通过iFLYTEK AI开发者大赛,践行“技术顶天,应用落地”所倾注的努力。

1、启动两大赛题,技术、应用都有用武之地

人工智能几十年的发展历史中,「技术和产品」一直都是最重要的2个发展方向。

科大讯飞在本届iFLYTEK AI开发者大赛中,创意性地设置了方言种类识别AI挑战赛以及应用开发AI挑战赛,让致力于利用人工智能技术去落地A.I.产品,或者利用已有积累来优化某项A.I.能力的开发者都有机会展示自己的想法。

6402

方言种类识别AI挑战赛

任务为汉语方言语言种类识别,即根据给定语音,判断该语音属于哪个方言。结果评价指标为分类正确率:即分类正确的语音条数/所有语音条数。

科大讯飞全球首次开放覆盖中国六大方言区,总时长约 60 小时的 10 种汉语方言语音数据集,供参加竞赛的科研单位以及开发者免费使用。

详细介绍

应用开发AI挑战赛

讯飞开放平台开放了AIUI人机对话交互、语音识别、合成、评测、图像识别等多项人工智能技术。聚焦人机交互这一核心技术,邀请广大开发者基于讯飞开放平台开放的人工智能技术,开发一款以人机交互为核心的智能产品(形式不限,APP、机器人、可穿戴设备等)。

所有作品从创新性、实用性、A.I.能力结合度、产品商业前景进行评审

详细介绍

2、为选手开放核心技术与数据

本届iFLYTEK AI开发者大赛集合了讯飞研究院、讯飞开放平台、AI大学的优质资源,面向全球首次开放中文方言语音数据集,开放AIUI人机对话交互、语音听写、合成、评测、翻译、人脸识别、声纹识别等近百项人工智能核心技术。让每一位选手都可以用前沿的技术,实现自己的A.I.项目。

正如科大讯飞副总裁于继栋在本届大赛半决赛阶段的一次赛场致辞所说的:“未来3到5年,是人工智能关键格局定义的窗口期。也是我们广大人工智能创业者发展和进步的好时机。我们将秉持“开放”的心态,一起创新、推动人工智能成果转化,让人工智能真正走到我们身边。”

6403

 

科大讯飞副总裁于继栋

3、坚持A.I.推动公益,赋能各行业

A.I.面向所有人,也应该服务于所有人。只有这样才能真正实现“顶天立地”。这也是科大讯飞在本届AI开发者大赛时的赛题设置以及作品评审时所重视的。

支持方言保护公益

联合国教科文组织统计,世界范围内,每两周就有一种语言消失。

方言是中国地域文化的载体,方言背后,蕴含着文化多样性的精髓,保护方言即捍卫文明,刻不容缓。

在2017年,科大讯飞发起“方言保护计划”,而本届AI开发者大赛的方言种类识别AI挑战赛正是基于保护计划,让广大人工智能开发者共同推进关于方言的算法研究和保护传承。

支持各领域A.I.融合可能

应用落地,不只是某个定向的领域。万物互联的愿景,需要AI赋能可以融入的一切。

应用开发AI挑战赛中,场景+A.I.应用,是诸多作品的核心,无论是上千份作品海选的初赛,还是在上海、香港和北京的32支团队角逐的半决赛,评委们在满足创新性、实用性、A.I.能力结合度、商业前景的前提下,选出与不同领域融合的A.I.创意。力求让人们看到更多领域的人工智能创新成果转化。

6404

 

上海站晋级团队,查看详情

 

6405香港站晋级团队,查看详情

 

6406北京站晋级团队,查看详情

4、为选手蓄能助力

基于AI大学人才培养体系,大赛为所有开发者提供全链路培训和辅导,致力于培养AI专业人才,构建AI产业人才生态。

同时,对入选决赛的团队,科大讯飞组织其来公司参与培训,由专业导师给予指导。

6407

 

决赛选手参观科大讯飞公司展厅

 

6408决赛选手接受专家指导

5、10月24日,“顶天立地”终极角逐

目前,应用开发AI挑战赛的9支团队,方言种类识别AI挑战赛的8支团队进入总决赛。

而等待他们的最终舞台,是将于10月24日-25日,在安徽合肥举行的2018届科大讯飞全球1024开发者节。

6409

 

计算机世界中,1024是2的十次方,是二进制计数的基本计量单位之一,是1KB的字节数,由此组成了程序中最基础的基因序列。

每年的10月24日,“1024”已经成为程序员们共有的文化节日,而科大讯飞则将这个节日固定下来,为全球A.I.开发者及相关生态链创业者、爱好者带来人工智能领域的前沿干货。

了解更多,戳文章:1024 | 这场一年一会的A.I.盛宴,我们想为你照亮未来的模样

 

6410“技术顶天,应用立地”的愿景将如何实现,“顶天立地”的荣誉又将属于谁,都将在本届科大讯飞全球1024开发者节揭晓。

专属福利

点击http://1024.iflytek.com/h5/login?type=vip

即可免费购全球1024开发者节嘉宾票

更多票务问题,

可咨询AI小助手微信号:iFLYTEKAI

1024 | 这场一年一会的AI盛宴,我们想为你照亮未来的模样

国内知名的AI开发者生态大会——科大讯飞全球1024开发者节,期待你的参加!

一个特别的日子:10月24日

一个特有的文化符号:1024

带来一段关于AI的未来预言

10月24日-25日,合肥

“AI追光,智缤纷”

国内知名的AI开发者生态大会

科大讯飞全球1024开发者节

期待你的参加!

每年的10月24日,“1024”已经成为程序员们共有的文化节日,而科大讯飞则将这个节日固定下来,为全球AI开发者及相关生态链创业者、爱好者带来人工智能领域的前沿干货。

如果你是第一次知道1024开发者节,正在犹豫是否参加的话,本文将消除你的疑惑。

640

 

首先,我们为你展示改变世界的可能

1、理念篇

关键词:领军人物

AI商业化专家吴霁虹、斯坦福大学教授蒋里、科大讯飞董事长刘庆峰、AI大学校长胡郁、讯飞华南公司总裁杜兰、智慧医疗专家陶晓东、科讯投资部总裁徐景明、MIT35岁以下科技创新青年魏思等AI领袖齐聚本次科大讯飞全球1024开发者节,你将能够与AI大咖们面对面。

关键词:AI、行业、风口

当下,AI与各行业的融合每天都在发生,AI将对我们的生活方式产生了哪些改变?如何在AI+行业的环境下寻找机遇?围绕10多个AI+行业场景,本届1024开发者节将在10月25日举行深度分论坛。业界知名的资深大咖将与大家分享AI时代的见解。

AI+金融无论你是金融工作的从业者,还是关心金融领域的普通人,都不能忽视人工智能将对金融科技带来的巨变。我们将在AI+金融分论坛邀请银行、保险、证券、基金、互联网金融、科技等相关企业领导负责人和金融科技专家、学者出席。探讨金融科技所面临的机遇与挑战。AI+客服你是否想过,在日常生活中当你打电话咨询电话套餐、查询银行业务等时,话筒另一端提供语音服务的是人工智能呢?在AI+客服论坛,你对于AI如何提供客服,如何保证更好体验,以及如何获取和剖析数据等问题都将得到解答。AI+机器人

机器人应用逐渐落实到各个细分领域,智能家居,儿童教育,物流送货等等领域,其发展情况如何?行业痛点在哪?在AI+机器人分论坛上,行业专家,优秀企业共聚一堂,共同探讨产业落地,行业前沿应用。

AI+城市

在AI+城市分论坛,将重点介绍人工智能小镇,构建以人工智能为核心的完整产业链条,形成“AI+”的产业生态簇群,体现规模效应与集聚效应,并结合产业资源优势,落地重点产业。

AI+营销

AI+营销分论坛上,行业大咖将从探讨软硬件、平台和算法等人工智能领域的最新洞见,带来AI营销赋能主题演讲;同时将启动讯飞AI营销云流量生态联盟赋能计划,进行2018科大讯飞AI营销算法大赛颁奖。

AI+医疗

智能问诊、语音电子病历、医疗影像分析……AI将如何赋能医疗行业?改变我们的就医习惯?想紧跟未来的医疗行业趋势,就来AI+医疗分论坛。我们将发布讯飞医疗人工智能辅助诊疗平台,邀请合作伙伴共同展示智慧医疗平台生态战略。

更多分论坛,等你现场探索……

2、技术篇

关键词:前沿无处不在

智能穿戴、身份认证、AI大数据、智能识别……领先的人工智能技术在你进入会场后就如影随形,小到工作人员给你的小礼物,大到你身边的任何一件设备,可能都暗藏玄机。

关键词:1000+黑科技

科大讯飞集结自己的生态合作伙伴,展示超过50个展位的前沿AI落地产品和服务。覆盖企业服务、图像识别、健康医疗、公益、大数据、智能家居、机器人、智能营销、智能招聘……

AIUI、讯飞医疗、AI大学、智慧城市……科大讯飞各产品、平台、事业群将带来最新成果,从大型电信级应用到小型嵌入式应用;从手机到车载;从家电到玩具,你将体验能够满足不同应用环境的各种惊喜。

不仅如此,你还可以为黑科技打分,我们还准备了“评选你最喜爱的AI产品”线上活动,超值福利等你来赢取哦!

同时,我们赋予你向未来冲刺的能量

3、赋能篇

关键词:1024计划

2017届全球1024开发者节,我们推出“1024计划”,从“AI教引”、“AI生态”、“AI公益”三个方面,为开发者的事业提供辅导支持,为公益事业贡献AI的力量。

回顾:重磅 | 科大讯飞发布《1024计划》,AI点亮全球

今年开发者节,我们带来赋能规模更大,扶持力度更强的全新“1024计划”,如果你想为自己的AI梦想注入能量,一定要来到10月24日的现场。

关键词:“智汇世界,声动未来”

2018年,科大讯飞全球1024开发者节,我们将联合“智汇世界,声动未来”首届世界声博会共同举办。进一步推动安徽智能语音及人工智能产业发展,将“中国声谷”打造成全国智能语音领域产业发展高地。

首届世界声博会暨科大讯飞2018全球1024开发者节活动由部省共同推进安徽智能语音产业发展领导小组办公室指导,中国语音产业联盟、中国智能写作产业联盟主办;科大讯飞股份有限公司、安徽省信息产业投资控股有限公司等承办。汇聚智能语音及人工智能行业的最具影响力的专家、学者与企业,展示技术发展与创新创业的成果。

4、扶持篇

关键词:实力派,PK

科大讯飞2018年面向全球正式发起首届“顶天立地”iFLYTEK AI开发者大赛。历时4个月,大赛吸引了1万余名世界各地的优秀开发者踊跃参加,共计收到全球3千多支团队提交的参赛作品。经过层层考验,应用开发AI挑战赛的9支团队,方言种类识别AI挑战赛的8支团队进入总决赛。

1024开发者节当天,在iFLYTEK AI开发者大赛的决赛现场,你不仅可以观看拥有各自领域顶尖实力的大牛们各显神通,还将抢先一步了解科大讯飞对AI开发者们的最新扶持与赋能策略,发现机遇!

关键词:公益明星,献声AI

AI面向所有人,也应该服务于所有人。2017届科大讯飞全球1024开发者节发布了「三声有幸」AI 公益计划,把人工智能和公益相结合,用AI改善公益慈善活动的实施过程和效果。

2018届科大讯飞全球1024开发者节,将继续支持「三声有幸」计划,举办AI公益音乐节,盛邀罗琦、牛奶咖啡、安子与九妹、张晓钰、和平饭店作为公益音乐人亲临,为AI献声!以歌声传达鼓舞人心的力量,用音乐唤醒人们对公益的认知。另外,现场还将有“公益天使”带来的意外惊喜!

多样的世界,需要多样的声音。音乐节还将带来“方言表演秀”——用不同方言所演唱的歌曲串烧节目,以此支持科大讯飞“方言保护计划”,提高民众对方言的关注度和兴趣,体现科大讯飞将借助人工智能技术为民众提供更好的方言使用条件的愿景!

注:本次AI公益音乐节所有门票收入将全部用于讯飞“三声有幸”公益计划。

购票通道现已正式开启!

2018届全球1024开发者节官网已正式上线,票务系统已正式启动,开启贵宾票、嘉宾票、学生票、音乐节票,为你提供丰富选择。

点击此处http://1024.iflytek.com/?ch=kdxf即刻进入购票!

641想了解更多关于票务及优惠方面的信息,可添加AI小助手微信号:iFLYTEKAI,或扫描下方二维码关注【1024开发者节】642

普通话二级甲等? 可我们数学老师明明n、l不分啊

论智能语音技术发展的必要性和紧迫性……

又是一年开学季,莘莘学子们又背着书包,生机勃勃 垂头丧气 地回归校园了。

可爱 逗比 的同学,敬爱 严厉 的老师,还有丰富多彩 苦逼哈哈 的校园生活,哇,想想还有点小期待呢。

q1

话说,自从上学以来,有件事一直很觉得很奇怪——许多老师的普通话水平测试到底是怎么通过的?

因为他们有的是这样:

q2

有的是这样:

q3

还有这样的:

q4

然后后来我知道了一件事,就是:从前的普通话水平测试,是人工测试的,并不是条件严苛的机测,所以出现人为误差的可能性比较大。

q5

也就是说不排除,当年的某个考场里,对话场景是这样的——

考官:请约读下面的文脏段落,zu意语速不要过快。请开死——

考生:绳命,是多么的回晃;绳命,是入刺的井菜······

考官:嗯阔以。下一题······

于是再对照中学数学老师的口音,恍然大悟。

哈哈,开个玩笑。不过人工语音测试的日子确实已经一去不复返了。

随着智能语音技术的出现和发展,机器评测在普通话水平测试、英语四六级等考试中愈发广泛地应用,直到现在的口语考试已基本全面实现机器测试。希望考官手下留情、睁一只眼闭一只眼的考生们,可就再也行不通咯。

q6

普通话水平测试机测考场

相比于人工测试,机器测试的优势非常明显:省时省力、评价标准更加规范统一、避免不必要的重复劳作等等,可以说是人工智能语音技术在教育领域一项非常成功的应用了。

09

果然呐,加班时的脑洞才是最大的!| 1024创意街

来看看大家的脑洞和才华吧~

上周四

班主任向大家征集了一波

加班时的胡思乱想奇思妙想

本来以为

繁忙的学业和工作

会影响大家的发挥

没想到大家的投稿热情异常高涨

一周过去了

投稿的邮箱已经被大家有趣的创意

完全占领了

11

班主任和拾月助教从中挑选了5篇

作为【1024创意街】第一期的征稿展示

同时也欢迎各位同学参与投稿

投稿方式:第一种:邮件投稿

发送邮件到open-media@iflytek.com

邮件主题为【创意街投稿+创意名称+创意内容】

第二种:文章留言投稿

在文章有奖征集 |  加班时,你是不是也会突发奇想!

下留言说出你的AI创意

留言格式为【1024创意街+创意名称+创意内容】

字数随意~主要是创意

12
01

创意名称:【文言文的语音转文字和翻译成外语

创意详解:

王者荣耀和英雄联盟最大的区别在于王者荣耀是用没有键盘的设备去玩,这就导致了与其他玩家沟通时候必须依赖“语音转文字”。

但是目前的语音技术只对白话文有效,这就导致了我不能凭一句“蜀国昏主投降时,衔璧牵羊倒系旗”或“谁陈帝子和番策,我是男儿为国羞”把对面的刘禅和王昭君的心态说崩了。文言文翻译成外语的必要性同理。

拾月助教点评:开始有点担心机器被“之乎者也”气到无限开机关机

122

02

创意名称:【共享云计算

创意详情:

设计一款小手机或电脑应用软件,让每个人的手机、电脑变成一个个提供计算的云终端,在手机或电脑闲置时只占用很小的资源进行云计算。

可以服务大中小企业或科研机构,只需要花很少的钱就可以享受云计算带来的服务。每个手机或电脑的云终端用户,按照完成计算的数据量分红,可以红包或其他方式进行兑现。

拾月助教点评:这看起来比【共享男友】靠谱多了~

1112

03

 创意名称:【“它”的名字

创意详情:

如果丢失身份证、钱包等物品无法找回,有可能面临被他人利用的风险。

如果给这些东西加上人工智能的标志,假设钱包丢了用人工智能助手查询丢失位置,找回岂不是更快了?假设这些东西丢了一时找不到,可以通过发送指令,锁定证件信息,减少损失。

拾月助教点评:简直就是我们丢三落四星人福音呐!!!

1222

04

创意名称:【黄粱美梦1号

创意详情:

如果有个人工智能模拟系统,比如“黄粱美梦1号”,可以让家长看看给孩子做亲子共读和不做亲子共读对孩子一生的影响。

短短三分钟,看完一辈子。这样可以让更多的家长选择做亲子共读。同样可以延伸到各种领域,给各类选择困难症。

拾月助教点评:如果当初在我吃吃吃的时候,我能看到现在这么胖的样子,我一定…还要多吃几串五花肉

12222

05

创意名称:【AI记录官

创意详情:

设计一款产品,可以是手环、手链、项链等等,可以随身携带,用来分类记录每件事情所花费的时间。

比如跟它说:手环,我现在要锻炼了,帮我记下时间;手环就会回答:好的,小主。等结束锻炼的时候,再跟它说:手环,我锻炼完了;手环就会回答:好的,已经帮小主统计好了时间。

这款产品,只需要跟它讲述,就可以自动建立标签,然后每次通过人的讲述,自动在对应的标签下面,对事情的时间数据进行记录。这样,每件事情,在什么时间做,每次做了多久,数据都可以被记录下来。

拾月助教点评:现代“烛龙”,你值得拥有~

09

AI知识科普 | 从无人相信到万人追捧的神经网络

计算机能够像人一样做出判断,用直觉而非规则

天才就是当世上所有人都觉得他疯了的时候,他依然清晰地知道自己不是真的疯了,而是比旁人看的更长远。
——致敬为科学一直坚持的先辈

神经网络的发展可以追溯到二战时期,那时候先辈们正想着如何用人类的方式去存储和处理信息,于是他们开始构建计算系统。

由于当时计算机机器和技术的发展限制,这一技术并没有得到广泛的关注和应用。

几十年来,神经网络之父Hinton始终坚持计算机能够像人类一样思考,用直觉而非规则。

尽管这一观点被无数人质疑过无数次,但随着数据的不断增长和数据挖掘技术的不断进步,神经网络开始在语音和图像等方面超越基于逻辑的人工智能。

几乎是一夜间,神经网络技术从无人相信变成了万人追捧。

微信图片_20180604150453

神经网络之父Hinton

1.人工神经网络是什么?

人工神经网络:是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。

这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的能力。

简单来说,就是通过大量的样本训练神经网络,得到结论。接着就可以输入新的信息,看最后得出怎样的回应。

例如,周杰伦周末在北京开演唱会,班主任会考虑时间、地点、价格、天气、是否有同伴,这些因素然后根据这些判断因素,做出是否去看演唱会的决定。

从班主任接收到演唱会信息,到做出相应判断,这整个过程就是神经网络运行的过程。

2.人工神经网络组成

一个典型的神经网络,由成百上千万的人工神经元构成,他们排列在一系列的层中,每个层之间彼此相连。

基本上由三个相互连接的层组成:输入层、隐藏层和输出层。 

班主任画了一个简单的图来帮助同学们理解:

微信图片_20180604191625

由上图,可以看出,输入层向隐藏层输入信息,隐藏层会向输出层输送数据。下面班主任来介绍人工神经单元的这三个组成部分:

A、输入层

输入层是接收每个观测值的解释属性的值作为输入。一般情况下,输入层从外界接收各种各样的信息,神经网络会用这些信息进行学习、识别或进行其它的处理。

B、隐藏层

隐藏层将给定的转换应用于网络内的输入值。隐藏层的节点数目不定,但隐藏层越多,神经网络越强健。

C、输出层

输出层接收来自隐藏层的连接,它返回一个对应于响应变量预测的输出值,再通过输出层的活动节点结合并改变数据以产生输出值。

人工神经网络,就是通过这三个层面模拟着人类的思考过程。

3.常见的神经网络类型 

A、BP神经网络

BP神经网络,是按误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成,是一种应用最为广泛的神经网络。

先来看一下BP神经网络的流程图:

微信图片_20180604191815

由BP神经网络流程图可以看出,正向传播处理过程和人工神经网络的流程相同。其本质的区别是,增加了误差的反向传播阶段。

当实际输出与期望输出不符时,误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。

简单来说,即通过信息正向传播和误差反向传播,不断地进行学习训练,一直到网络输出的误差减少到可以接受的程度。

B、卷积神经网络

卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元。

换个角度思考,卷积神经网络就是多层的神经网络,前面的层训练出的特征作为下一层的输入,所以越到后面的层,特征越具体。

微信图片_20180604191924

卷积神经网络在大型图像处理方面展示出了非凡的效果。

例如,我们需要在众多图像中鉴别出一只猫,人类可以通过已有的常识判断出特征,比如猫头、猫身、猫尾巴等从而鉴别出一只猫。

而卷积神经网络完全不知道什么是猫头、猫身、猫尾巴,卷积神经网络通过学习物体的抽象特征,这种特征在现实世界有可能都没有特定的名词,但是通过这些自学的的特征组合在一起,计算机就会判定这是一只猫!

微信图片_20180604192014

 

C、递归神经网络

递归神经网络是一种深度神经网络,它将相同的权重递归地应用在神经网络架构上,以拓扑排序的方式遍历给定结构,从而在大小可变的输入结构上可以做出结构化的预测。

递归神经网络可以把一个树/图结构信息编码为一个向量,也就是把信息映射到一个语义向量空间中。

班主任画了一个简单生动的图来帮助同学们理解:

微信图片_20180604192143

由上面的图可以看出,神经网络A,可以查看输入层的X,输出h。一个递归的神经网络可以被认为是同一个神经网络的多个副本,每一个副本都传递一个消息给输出层。

 

D、长短期记忆网络

长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。它能够解决传统的神经网络中的后面的时间节点感知力下降的问题。

值得一提的是,长短期记忆网络在算法中加入了一个处理器,放置了三扇门:输入门、遗忘门、输出门,以此来判断信息是否有用。

只有符合规则的信息才会被留下,不符合的会通过遗忘门被遗忘。

惊艳博鳌亚洲论坛的讯飞翻译技术,你也可以拥有

加入讯飞创业扶持计划,业界领先的智能技术为你开放。

今年的博鳌亚洲论坛,一个突出的亮点就是首次启用了人工智能为与会嘉宾提供精准、专业、及时有效的翻译服务。论坛组织方表示,在调研并体验了市场上的众多智能翻译产品后,讯飞翻译机在语音识别、翻译准确性等方面的表现最为出色。

本次年会中,科大讯飞为与会嘉宾提供的AI翻译机搭载了国际领先的语音识别、语音合成、机器翻译、神经网络、深度学习等人工智能技术,云端数据库涵盖日常情景对话超过4000万条,可实现中文和英语、日语、韩语、法语、西语等多种语言的实时互译。此外,这款翻译机还能准确识别多种口音,并翻译出最符合语境的结果,真正做到了听力和口语日常化表达,中文语音识别准确率高达98%,翻译能力超过大学英语六级水平。

4

△中美CEO圆桌的美方代表美国全国商会常务副会长博迈伦(左)从自己的口袋里掏出了讯飞翻译机,称赞道:“他们做了对人类非常有贡献的成果。”

7

△讯飞翻译机成功通过韩国SK集团董事长兼CEO崔泰源(中)非常流利的英语+韩语双关测试。

法国

△法国“桥”智库主席若埃尔·吕埃(左)与工作人员愉快交流。

当然,除了讯飞翻译机这样的便携产品,在本届论坛上,科大讯飞的另一项“黑科技”——讯飞听见智能会议系统也给小麦留下了深刻印象。在论坛会场里,嘉宾的演讲被实时记录,以中英文对照的形式展示出来,翻译速度之快,准确率之高,实在让人叫绝。

微信图片_20180410142555
△讯飞听见支持“21世纪海上丝绸之路岛屿经济论坛”

微信图片_20180410142602
△讯飞听见支持“中国 – 东盟省市长对话”

讯飞听见可以提供多语种转写及翻译服务,会议结束即可成稿,快捷方便又高效。

需要特别提及的是,创业团队加入讯飞创业扶持计划之后,就能享受到科大讯飞提供的各种人工智能技术,除了这次博鳌论坛上表现出色的语音转写、机器翻译技术,还有语音合成、语音评测、人脸识别、手写文字识别等等超多酷炫黑科技,都会开放给你,用AI为你的产品赋予更多优势。另外,资金、行业资源、市场这些支持全都有,讯飞遍布全国的众创空间、孵化基地也会为创业者提供便利服务。从技术到产业,从资本到场地,真可以说是立体式、全方位的支持。

如何才能加入讯飞创业扶持计划,获得这些资源和服务呢?答案就是“讯飞AI星火营”!

4月26日,讯飞生态平台将联合中国人工智能谷,在杭州市萧山经济技术开发区信息港小镇举办“讯飞AI星火营”项目路演活动,结合自身产业优势及资源,助推人工智能项目更好落地。

报名参加“讯飞AI星火营”项目路演活动,入选团队即可加入讯飞创业扶持计划,接入科大讯飞开放的各种顶尖智能技术,获得讯飞“技术+产业+品牌”全方位创业扶持,为你的产品添加AI新技能。

【点此即可报名】

杭州站海报

300+投资机构对接、AI高管现场交流,这场峰会很有料

4月10日,鲸准人工智能产业价值峰会相约北京。

关注人工智能创业的小伙伴们,福利来啦!

4月10日,鲸准人工智能产业价值峰会与你相约北京。科大讯飞联合创始人徐景明,商汤科技联合创始人汤晓鸥,人工智能专家、中国工程院院士李德毅等众多业内顶级大咖莅临,盛世、经纬等300+投资机构参会,更有TOP10神秘项目路演!这么有料的行业盛会,你敢说不心动?

【点这里报名】

过去的2017年,人工智能备受关注,投融资总规模达到1800亿人民币。各项技术逐渐从概念落地为产业。行业总体处于增长爆发阶段,并逐渐开始向垂直行业渗透。

刚刚过去的2月份,证监会发布了关于人工智能等四行业开通IPO快速通道的通知,无疑将进一步鼓励AI产研投全方位发展。

政策红利悄然而至,资本奋力助推。4月10日,“2018鲸准产业价值峰会·人工智能专场暨人工智能产业价值全名单颁奖典礼”将在北京召开。

KV [已恢复]
这一次,鲸准联合科大讯飞、盛世投资、36氪、第一财经,邀请百余位产学研领军人物,贯通上下游,帮助人工智能优质项目进行全媒体PR、产业链对接。

峰会采用线上产业全名单和6大AI垂直微信群,结合线下沉浸式数据会议的形式。活动包括“线上社群矩阵”“GP/LP高效对接”“产业链联动,AI生态协同”“权威AI榜单”“优质项目路演”等部分。

此次峰会将建立AI垂直领域微信群,包括智能医疗、智能教育、智能零售、智能机器人、智能金融、智能企业服务等,搭建AI领域多维度交流平台。同时将邀请大咖线上分享,帮助创业者接触行业权威 ,了解前沿垂直资讯。

嘉宾01嘉宾02

嘉宾03

如果你对人工智能拥有强烈兴趣,如果你也有自己的创业计划、项目,这一场打通AI产研投的峰会不容错过!

【联系方式】
加群微信:rong36krservice
峰会合作微信:hanwei9026
商务合作微信:wangzeguan99
榜单事宜微信:rong36krservice

【备注】
添加微信请备注“姓名+机构”

(关注讯飞生态平台公众号,创业更有料)

生态平台公众号二维码

2018-04-10 ~ 2018-04-11北京长安街W酒店
科大讯飞胡国平:我们为什么要办AI大学?

“比人类更强大的不是人工智能,而是掌握人工智能的人类。”

上周,科大讯飞『AI大学·未来课栈@上海栈』圆满落幕,十多位AI领域的大咖学者以及创业者带来了精彩的演讲。今天,小编专门梳理了AI大学副校长、科大讯飞研究院院长胡国平的演讲内容,分享给大家,一起来听听关于科大讯飞AI大学的故事。

1.为什么要办AI大学?

各位AI大学的小伙伴们大家好,欢迎大家来到AI大学未来课栈上海栈。

我是AI大学的副校长,科大讯飞研究院的院长胡国平,我做了13年的院级领导干部,因为大家,终于升级为校级领导干部。在准备这个PPT的时候,我就在想作为校长应该去讲些什么。然后我想起了AI大学的荣誉校长刘庆峰刘总,他在做任何一件事情时都会问三个问题: “这件事情为什么要做?这件事情为什么是我们做?以及做这件事情的具体目标和计划。”

因此我下面的课程,也是从这三个问题来展开的。

1-1

我们为什么要做AI大学?

我们正处于人工智能第三次浪潮, 现在的人工智能已经不仅仅局限于机器下围棋这样的难题。

语音合成已经超过了一般自然人说话水平,语音识别达到了百分之九十七八的正确率。自动作诗、语音评测等很多方面,已经进入了人们日常的工作和生活中。

所以,要去做AI大学的第一个原因是AI发展极快,我比较喜欢说这样一句话:人工智能的无成本复制,和持续向前的能力是人类自身所无法比拟的。

一个英语大师的儿子,他的英语单词还是得一个一个自己背,但机器不会。一台的机器的语音识别率达到97%,所有的机器的识别率都可以达到97%,而且明年机器一定可以超过97%,达到98、99%。

第二,人工智能影响之广,去年7月国家发布了《新一代人工智能的发展规划》,规划了22个大的行业中都会有人工智能。

这些应用包括智能软硬件、智能机器人、智能医疗、智能教育等,几乎我们的生活、工作中所涉及到的行业领域都会受到人工智能的影响。

第三,人工智能人才之缺,一方面在人工智能技术的突破和引领下,在讯飞开放平台的支撑下,以及在AI硬件化商业模式的驱动下,人工智能领域百花齐放。

另外一方面,因为深度学习、大数据及云计算等一系列技术的成功,特别是深度学习作为一种通用的、强大的、适用广的人工智能算法,促使了各种人工智能的需求井喷,使得AI人才形成了供不应求的状态。

1-2
这些大家可能从媒体上也能看到,在智能工厂中传出某一个声音是不是预示着危险;以及基于人的一些运动轨迹信息,自动去识别他是在跑步还是在登山,这些都会涉及到人工智能算法和技术。

据专家估计,我国AI人才的缺口每年是100万,这个数据非常大,十年以后我们就有1000万的人工智能的相关人才。要实现服务亿万用户,研究千上万的各种AI技术,我们大概需要三类人才一起来做这件事情。

第一类是顶尖的科学家,他们需要去研究新的算法和理论;其次是更多、更广泛的AI的技术研究工程师,进行 AI技术的持续打磨、迭代优化等相关工作。

此外还需要大量泛AI人才,基于相关的AI技术去实现创新的产品和创新的服务,同时对传统行业升级改造。

根据这样的背景,在首届全球1024开发者节上,科大讯飞正式推出了AI大学——国内首个基于AI的在线学习平台。

2.AI大学的技术底蕴

我们先从AI大学的技术底蕴开始说起,科大讯飞在2017年一共获得了七项世界冠军;医考机器人参加了国家医师资格考试,以456分的高分通过,这是机器人首次通过人类的行业准入考试。

科大讯飞一直走在技术的最前沿,以现在这样的水平和技术实力, AI大学能够给各位学员提供最好的最新的人工智能技术。

另外一方面,科大讯飞很多的技术通过人工智能的开放平台对外开放,同时针对一些具体的场景,比如智能硬件、互联网、媒体娱乐等我们提出一站式的解决方案,使得相关的研发和创新工作更加的简洁、简单。

2018年在核心技术支撑的基础之上,科大讯飞将再开100项AI能力,这些会给各位学员和开发者提供更好的支撑。

1-3
现在,科大讯飞人工智能开放平台上累积终端数达18亿,开发者团队达60万,日均交互次数45亿。我们用这样一个社区让更多的合作伙伴更好地享用技术、更好地做头脑风暴。

3.AI大学的师资力量

对一个大学而言,师资力量是很关键的一部分,下面我来给大家介绍下AI大学的四位联合创始人。

科大讯飞的董事长刘庆峰担任AI大学的荣誉校长;科大讯飞执行总裁胡郁是AI大学的校长;我是AI大学的副校长;消费者BG执行总裁于继栋是AI大学的教导主任。

AI大学整个的师资构成主要有这三方面:特聘教授、技术专家和创业导师。

在特聘教授方面,我们邀请了国内外走在学术前沿的大咖、教授,来给大家分享最先进的技术和理念。

在技术专家方面,我们基于科大讯飞的一些技术团队,聘请相关的专家,构建起整个技术体系。

同时我们的创业导师,包括像吴霁虹老师,也会以后的创新创业过程中为大家提供更多的服务和咨询。

1-5
4.AI大学的课程和学员成长体系

AI大学的课程体系,主要分三个方面:AI前沿殿、AI工程院和AI实战堂。

前沿殿里面,我们会邀请走在AI最前沿的教授来给学员们讲AI的各方面的知识。我们希望用前沿殿的方式,让各位学员能够广泛地去了解AI技术最新的一些进展和变化。

AI工程院是由技术专家,更系统、更详细地去介绍相关技术的原理,以及如何利用讯飞人工智能开放平台的一些服务,来更好地实现创新和创业。

AI实战堂则是用创业辅导的方式,综合分析商业模式的构建、各个行业的态势,给各位学员在创新创业中提供更有效的支撑。

除此之外,AI大学还会用线上免费课程以及线下实战活动的方式,来给各位学员提供相应的课程体系和课程支撑。

对于学员而言,进入AI大学之后,一般会经过四个步骤来实现自己的学习和成长。

首先是学员的遴选、其次是学习和教引、再到结业认证,学员在AI大学毕业之后能拿到官方的认证书,证书能够在就业、创业、吸引投资过程中获得更好的支撑。

如果学员在整个学习过程中,有创新和创业的想法,我们也有相应免费的生态扶持。

5.iFLYTEK AI 开发者大赛正式启动

为了帮助大家进一步学习, 我们决定,从今天开始,正式启动2018首届“顶天立地“ iFLYTEK AI开发者大赛。大赛分两个主要的内容,一方面是培养和塑造AI技术工程师,我们称之为“技术顶天”的挑战赛。

另一个方面是培养相关的应用创新人才,“创意立地”的创意应用开发的AI挑战赛,助力大家去把自己的创意把自己的想法变成更可操作、可实施的方案。

1-7
我们为挑战赛准备了千万量级的数据集,一百万的奖金,免费的AI资源,科大讯飞的offer直通车,以及我们在全国包括苏州、杭州、天津、合肥等一系列创孵支持以及资本对接的直通车。

整个比赛从今天正式开始,4月份会进行专业的评审,6月份是初赛,7月份会进行复赛。主要在深圳、台北、硅谷、苏州和北京等地,进行相应的复赛,在决赛开启之前,9月份会做相应的辅导,10月份在1024开发者节上进行最后的决赛,Top64的团队会参与到决赛,最终决出来前三名。

同时我们还会设立包括市场潜力奖、技术创新奖等独特的一些奖项,最大力度地支持和鼓励大家参加开发者挑战赛。

最后,我想说比人类更强大的不是人工智能,而是掌握人工智能的人类,所以请在座的各位和我一起,欢迎大家加入AI大学,学习AI,走近未来。

(关注讯飞AI大学,收看更多精彩课程)

关注我们,收看更多精彩课程

人工智能创业的风口与机遇,你了解吗?

启迪之星总经理沈全洪带来精彩观点

800

嘉宾:沈全洪,启迪控股股份有限公司孵化业务总监,启迪创业孵化器总经理

主讲内容:人工智能创业的风口与机遇

风口不是用来追的

最近几年人工智能特别活跃,成了新的风口。我本人不太愿意用风口这样的一个词,但不管我们认不认可,它都是实实在在客观存在的,不能回避它,

我们不能说是去迎接风口,说去追风口,那个风是追不上的。那我们能做的是什么?是预见风口。如果我们能预见未来有什么样的机遇,那作为一个创业者的话,就会选择在风口到来之前先准备好。

我们是做创业服务的,对各种风口的迭代轮换特别敏感。三年前我参加过阿里云的一个启动活动,当时提出了云计算的元年。其实云计算这个概念出现很多年,但是真正地走进大家生活,为行业所认可,也就这几年的事情。但它就是这么快,可能你还没注意到,云计算就已经离你很近了,这个时候你再要切入,其实是没有机会的。

人工智能,很远也很近

人工智能这个行业从底层技术上来说,不是谁都能干的,它的门槛非常高,它是有很强的技术驱动和储备的。

所以这就是我们看到的,你在做自己的商业选择的时候,人工智能很远也很近。从底层的研发技术上来,需要大量积累,不是说今天看到风口了,就想进去,那已经来不及了,但是它还是有很多应用场景。

沈全洪

人工智能是什么?它有点像互联网,你可能不需要去编程,但是互联网+融入到一定的行业领域去,就大有可为。加到自行车上面不一样,加到机器上面又不一样,所以我想,人工智能就是一种底层的技术驱动和平台性的技术。

做好技术,抓住市场

关于人工智能,一些非常关键的因素在发挥着支撑作用。

一个就是云计算。云计算、云存储、大数据,给很多的深度学习技术提供了可能,如果说没有这种底层的技术,我们都不可能说在计算机学习上能有这么深、这么快速。我觉得这就是基于大量的学习和底层的数据存储计算能力。

第二个就是它的应用市场。医疗、安防、金融、无人车、智慧城市……大量的应用场景出现了。

应用场景是什么?就是市场,就是有人愿意为这个东西买单。你的产品你的技术有人愿意付钱了,对于投资来说,就有一个回报的预期,这是非常重要的。对于创业者来说,我想市场是非常关键的:我做了很多东西,到底给谁用,卖给谁。

现场截图

对创业者来说,不管你是选择人工智能行业创业,还是别的行业创业,其实创业的规律是一致的,都需要完成一个商业模式的验证。放大到规模化的一个过程,在每一个阶段,你所需要的创业资源都是不一样的。

对于我们每一个创业者来说,脑子里面应该有这样的一个意识:能量守恒。谁能成功,不在于起步,在于你在路上能获得多少的能量。一个好的创业者,一定是有很强的意愿和能力去整合资源,把别人的能量变成你的能量,当然,前提是共赢。

 

创业纷享说》是由讯飞生态平台为创业者悉心打造的创业课堂学习分享板块内容,整合优质资源,邀请精英创业创始人、企业家、投资人提供经验分享,传递创业观点。

关注“讯飞生态平台”公众号,创业更有料

生态平台公众号二维码

人工智能再次写入政府工作报告!未来可期

政府工作报告再提人工智能,一个资源融合、产业衔接的生态呼之欲出。

要评选这两年最火的词语,人工智能一定是其中一个。继2017年之后,今年的两会上,人工智能再次被写入政府工作报告,引发热议。在政策的支持引导下,中国的人工智能产业势必将进入一段高速发展期。

AI的漫长之路

过去的一年,被称为“人工智能应用元年”。AlphaGo风光无二,智能机器人Sophia获得公民资格,各地不断举办与人工智能相关的峰会、论坛、创业大赛,业界也不时爆出融资达上亿美元的案例,AI风口之强劲,令无数创业者和投资人折服。

但回望人工智能六十多年的发展历程,我们仍须看清一点:关于AI,关于人工智能,还有很长的路要走。

001

由于牵涉到数学、神经生理学、心理学、计算机科学甚至哲学等众多学科,人工智能发展所面临的困难,常人很难理解。

2008年经济危机之后,美欧等国希望借机器人实现再工业化,工业机器人由此获得了超越以往的发展速度。但这样的改变,仍属于“弱人工智能”的层面。使机器达到有知觉、有自我意识的“强人工智能”研究,暂时仍处于瓶颈期,还需要科学家们及全社会的不断努力。

面对这样的现实,搭建起一个资源融合、产业衔接的人工智能发展生态,帮助有志于人工智能领域的创业者、投资者更好地对接沟通,就显得尤为重要。风口可能很快就会减弱,甚至消失,但行业的发展、进步,却不是一朝一夕的事,需要大量的投入和持续的探索,需要一个良好的生态环境。

科大讯飞和AI生态

在构建AI领域良好生态的方向,科大讯飞已经迈出了坚实的步伐。

时间拉回到2017年10月24日,在合肥举办的首届“全球1024开发者节”上,科大讯飞正式推出AI教引计划,首批新培养和孵化1024个AI项目,启动10.24亿生态扶持基金,讯飞生态平台由此诞生。

002

在这个生态圈里,最为核心的技术支持,由讯飞开放平台提供。AI领域的开发者、创业团队可以在这里享受到优惠折扣的能力服务,包括AIUI人机交互解决方案、方言识别能力、中英翻译能力、在线语音合成能力等。

市场、客户、渠道,创业团队最常遇到的三大痛点,在这里也能得到妥善解决。讯飞生态平台不仅提供专项经理对接创业团队,提供渠道,还将为其提供融资推荐服务,协助创业团队快速融资。

知名科技媒体联合推广、讯飞全国展会品牌露出、讯飞年度发布会展出等,更是可以让创业团队省去品牌运营推广的后顾之忧。CEO培训营、创业课堂等,也将补齐创业者的知识短板,促进资源共享,一同快速成长。

转变,从每一个场景开始

在这样一个完善的生态体系之下,一批人工智能初创团队快速成长起来,AI技术在相关行业完成落地。

拿最常用的鼠标来说,和AI结合,就能带来不一样的体验。“语鼠”团队开发的智能鼠标,内建了科大讯飞的语音识别模块,轻松实现语音输入、语音翻译等功能。对着鼠标说句话,就能打开相应网页,进行各种操作。

003

语鼠智能鼠标

常人看来,这些可能并不新奇,但对于一些不熟悉互联网操作的老年人朋友,以及一些身体有障碍限制的朋友而言,这样的功能将给他们带来极大的便利。“语鼠”团队发展迅速,目前正布局海外市场,今后必能更加深刻地影响智能硬件行业。

出门旅游,也有新选择。以前出趟远门,都得忙着做攻略、查地图,要是出国,还得恶补外语,做好笔记。现在,这些都可以交给智能管家来帮你打理。逸途科技依托科大讯飞开放的语音技术,推出智能翻译机和相关旅行APP,全新的人机交互带来智能化旅行体验。

004

逸豆智能旅行管家

在虚拟现实的应用上,人工智能同样可以赋予更多能量。如果你走进南京东晋历史文化博物馆,领取设备启用智慧导览系统后,就可通过摄像头在大厅特定地点见到AI虚拟导游小可,她年轻靓丽、声音甜美,可以为你进行轻松有趣的讲解。

005

维睛视空核心技术

这款产品,出自“维睛视空”团队。加入讯飞创孵计划后,维睛视空将其AR产品与讯飞语音技术完美结合,通过讯飞生态平台的整合,充分调动各种资源,专注聚焦产品的打磨,已取得不错的市场效果。

未来,还有更多期待

虽然人工智能技术在大众消费市场仍有很大的拓展空间,但就同这些例子所展现的一样,许多有志于人工智能行业的创业者,已经通过不断的努力和付出,给我们的生活带来了很多有益的改变,同时,他们也在促进人工智能技术逐步落地,推动着整个行业一步一步向前发展。

正如一位加入生态平台创孵计划的团队创始人所说,“我其实没有想怎样去颠覆一个行业,我想的是如何把一个产业优化,能让它升级变好,这才是一个美好的事情。”

而有了讯飞生态平台的支持,这些美好的事情更快更好地来到了我们身边。

关注“讯飞生态平台”公众号,创业更有料

生态平台公众号二维码

超过80%语音开发者的共同选择