为媒体人减负!更懂你的语音转写能力上线

在语音转写产品下,讯飞开放平台对语音转写能力进行了优化, 升级为4.0版本。新版本不仅提供更好的性能支持,同时上线了个性化热词功能。

最近,媒体人的工作真是忙到飞起。

纵观国内外,近来的这几个月真可谓是多事之秋。互联网、医疗、文学、影视等各个行业都接连有重大新闻爆出,成为人们的茶余饭后的话题。

对普通人来说是八卦谈资,对新闻媒体人来说可就是实打实的工作了。

人工智能?人工智障?

“无论是什么行业的热点,我们都要第一时间出街采访。“

小编的记者朋友小D负责一档针对时下热点的街头采访节目,对他来说,今年是格外忙碌的一年。

”比如有IT新闻,我们就去高新产业园采访,娱乐新闻我们就去大学采访。所以几乎每天都在接触到不同行业的术语。”
64011

 

主题多样的街头采访类节目

小D多次都跟我抱怨,说最头疼的部分就是后期制作,因为被访者的术语和口头语太多,原本靠转写软件可以轻松完成的文稿整理和字幕制作工作,现在变得困难重重。

例如早前iphone XR发布时进行的街头采访,有这样的语音素材——

 音频内容是: XR的屏占比确实变高了,但是这个黑边也太夸张了,作为一个颜控,我还是继续用我的8吧。

 转写结果是:  差而凭站笔确实变高了,但是这个黑边也太夸张了,作为一个严控我还是继续用我的巴巴。

小D说,有些时候修改字幕比直接人工输入还麻烦,真不知是人工智能还是人工智障了。

个性化热词——让机器更懂你

小D的经历并非个案,语料的丰富度是影响语音识别技术的重要因素。前期提交的语料越多、越全,语音识别的效果也就越好。

宏观上看,人们说话的规则具有统一性,但同时也具有一定程度的变化性。例如行业的专业用语,一些口头禅、自行创造的暗语、某些特定事件带来的等等。一个人的遣词造句深受他“个性”的影响,因此产生的语音也带有“个性”标签。

这种情况下,单纯使用通用化模型来识别风格各异发语音,显然是不够科学的。唯有做到“去陌生化”,进一步理解特定用户的语言习惯,才能得到更高效精准的结果。

因此,在语音转写产品下,讯飞开放平台对语音转写能力进行了优化, 升级为4.0版本。新版本不仅提供更好的性能支持,同时上线了个性化热词功能。

 使用方法:

用户将一些在转写中会出现的专用词汇上传至识别引擎,形成自己的个性化词库。后期在待转写音频中出现该词汇时,即可将其识别出来。
640

 

添加热词操作示例

 原理:

运用声学激励语言激励两种方式,提高个性化热词的识别度。

以词语“开放平台”为例,语言激励会在热词形成时对“开放平台”一词直接加分,提高识别出这个词的概率。

声学激励的方法会将kai-fang-ping-tai泛化成kai-fan-ping-tai,kai-fang-pin-tai等,音频中出现类似发音时就会对待选词中的“开放平台”加分。

如虎添翼

除了新增个性化热词能力,本次更新的语音转写4.0版本还支持Web API调用形式,为开发者们提供了更多的便利与可能性。有了这些新功能的加入,语言转写能力可谓是如虎添翼。

开放平台语音转写能力最初于2017年7月上线,能力基于科大讯飞独立研究的深度全序列卷积神经网络语音识别框架(DFCNN)建立声学模型和语言模型,将音频数据转换成文本数据,使信息传递更为高效,也为后续的数据检索和数据挖掘提供基础。

更尖端的核心技术

采用的DFCNN技术能更好地表达语音的长时相关性,比目前业界最好的语音识别框架——双向递归神经网络性能更优,遥遥领先于同类竞品。

更可靠的硬件支持
讯飞开放平台在多地进行了机房部署,服务器集群每天可承载30亿的语音交互量。每个IDC机房采用BGP或三网接入,保障接入速率。核心硬件方面采用内存双通道策略,GPU+CPU复合运算组合,提高引擎速度。

更智能的转写能力
运用超大规模的语言模型预测语境,提供中文智能断句和标点预测,并能将结果中的数字、日期、时间等格式化为规整的文本,最大程度地减少人工修改。

更安全的用户数据
转写系统接入讯飞开放平台统一账户体系,采用公钥与私钥结合的认证方式保证账户安全。接口统一采用https加密方式进行数据传输,用户上传的语音文件待转写完成后会彻底删除,不留痕迹。

希望在不断的改进和完善中,开放平台能为大家提供更好的技术和服务,从而更好地落地到实际场景,为各行各业创造更高效的解决方案。

现在就来讯飞开放平台体验吧!【点击体验最新的语音转写4.0版本】

关注我们6407
 

DNN、RNN、CNN.…..一文带你读懂这些绕晕人的名词

在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。
这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。

「撞脸」一直都是娱乐圈一大笑梗。

要是买火车票的时候碰上孙楠、杨臣刚、王大冶……脸盲症患者可以直接放弃回家,原地暴哭了。

640

 

当然,「撞脸」可不是娱乐圈的特有的,在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。

这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。
6401

 

1、三代神经网络的发展

在正式开讲这3者的区别之前,我们先简单做个回顾,第一代和第二代神经网络到底是什么?

第一代神经网络又称为感知器,在1950年左右被提出来,它的算法只有两层,输入层输出层,主要是线性结构。它不能解决线性不可分的问题,对稍微复杂一些的函数都无能为力,如异或操作。

为了解决第一代神经网络的缺陷,在1980年左右Rumelhart、Williams等人提出第二代神经网络多层感知器(MLP)。和第一代神经网络相比,第二代在输入层之间有多个隐含层的感知机,可以引入一些非线性的结构,解决了之前无法模拟异或逻辑的缺陷。

第二代神经网络让科学家们发现神经网络的层数直接决定了它对现实的表达能力,但是随着层数的增加,优化函数愈发容易出现局部最优解的现象,由于存在梯度消失的问题,深层网络往往难以训练,效果还不如浅层网络。

2006年Hinton采取无监督预训练(Pre-Training)的方法解决了梯度消失的问题,使得深度神经网络变得可训练,将隐含层发展到7层,神经网络真正意义上有了“深度”,由此揭开了深度学习的浪潮,第三代神经网络开始正式兴起。
6402

 

2、深度神经网络最常用的三大算法

说完了三代神经网络的大概发展,我们现在来看下第三代神经网络中经常让大家叫苦的3大名词:DNN、RNN、CNN。

DNN:深度神经网络

从结构上来说,DNN和传统意义上的NN(神经网络)并无太大区别,最大的不同是层数增多了,并解决了模型可训练的问题。

简言之,DNN比NN多了一些隐层,但这些隐层的作用是巨大的,带来的效果是非常显著和神奇的。
6403

 

当然第三代神经网络能够带来神奇的效果,并不仅仅是因为它的模型结构和训练方法更为优化、算法更加先进,最重要的是随着移动互联网的普及海量数据的产生和机器计算能力的增强。

DNN中的“deep”意为深度,但深度学习中深度没有固定的定义或者衡量标准,不同问题的解决所需要的隐含层数自然也是不相同的,就大家比较熟识的语音识别来说,解决问题可能4层就够了,但一般图像识别需要达到20多层才能够解决问题。

DNN最大的问题是只能看到预先设定的长度的数据,对于语音和语言等前后相关的时序信号的表达能力还是有限的,基于此提出了RNN模型,即递归神经网络。

RNN:递归神经网络

全连接的DNN存在着一个无法解决的问题:无法对时间序列上的变化进行建模。

为了应对这种需求,业内提出了上文中提到的递归神经网络RNN。

在普通的全连接网络中,DNN的隐层只能够接受到当前时刻上一层的输入,而在RNN中,神经元的输出可以在下一时间段直接作用到本身。换句话说,就是递归神经网络它的隐层不但可以接收到上一层的输入,也可以得到上一时刻当前隐层的输入。

这一个变化的重要意义就在于使得神经网络具备了历史记忆的功能,原则上它可以看到无穷长的历史信息,这非常适合于像语音语言这种具有长时相关性的任务。
6402

 

CNN:卷积神经网络

卷积神经网络主要是模拟人的视觉神经系统提出来的。

以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。
6403

 

卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层和全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核,一个卷积核覆盖的原始图像的范围叫做感受野(权值共享)。

一次卷积运算(哪怕是多个卷积核)提取的特征往往是局部的,难以提取出比较全局的特征,因此需要在一层卷积基础上继续做卷积计算,这就是多层卷积。
6401

 

在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。

通过这种池化的操作,能够一定程度上克服图像的一些旋转和局部的细微变化,从而使得特征的表达更加稳定。
好啦,今晚对DNN、CNN和RNN的简单科普到这里就结束了,关于每种网络的用法大家还需要在实际建模中努力探索。

当然不论是哪种算法,它们往往都会混合在一起使用以达到效果的最优化,同学们要做的便是掌握好理论知识,在实践中找到最灵活的组合方式。

同时「AI大学移动端」已经上线了科大讯飞AI研究院王海坤院长的人工智能系列课程,小伙伴们记得戳菜单栏【AI大学】或点击阅读原文,去学习更多AI知识!
640

 

AI研究院副院长  王海坤博士

w640

 

关注聋哑人,从“手”开始!

你能想象一副手套就能让聋哑人“听到”声音并开口“说话”吗?

发表于2018-11-21 18:47| 来源CSDN| 作者CSDN

你能想象一副手套就能让聋哑人听到声音并开口说话吗?这事儿听起来很神奇,却被来自福州大学的一群在校生实现啦,而且还在科大讯飞AI开发者大赛的决赛现场技压群雄,勇夺冠军。


据了解,这支颇具创新意识的冠军学生团队主要由三名研究生以及多名本科生组成,十几个人通过近半年时间,研发了一款具有社交功能的手套,主要通过手语识别、语音识别、语音合成等多项技术来破除听障人士的沟通障碍。

据了解,“E-chat”聋哑人社交手套外形与普通手套无异,但上面却是机关密布。聋哑人只要佩戴手套后,通过采集相应的手势信息就可将手语表达翻译为语音信息;相反,正常人的语音通过识别之后,又将转化为聋哑人熟悉的手语,并显示在手机屏幕上,双向翻译形成语音和手语之间的沟通闭环,这就有点儿像风靡一时的语音翻译工具。

谈及这款颇具人文情怀的发明,Forever Young团队的初创成员之一林鹏程表示,最初研发的灵感主要来自一场学校组织的手语比赛。当时我们都不懂手语,就想着先做个翻译器,后来觉得如果有一项技术可以将眼前的手语转化成声音,那不是更加方便了?而且对听障朋友会特别有意义!

此外团队成员在本科阶段也确实接触并研发过这种性质的数据手套,又同时捕捉到MEMS传感器在最近几年内迅速发展的态势,所以从最初只是想通过这次实践深入学习一些有关传感器的技术点,结果却演变成通过见证聋哑人的生活并在学校图书馆进行学生手语调查等一系列切身实践后,深刻体会到这项发明的巨大潜力,也就随着时间推移不断完善,并加以推广了。


据了解,就在去年12月,Forever Young团队凭借“Echat”聋哑人社交手套报名参加了与开发者相关的创新赛事,经过4个多月的比拼,从1700多支参赛队伍中脱颖而出,最终勇夺最佳创新项目特等奖。

关于参加这次科大讯飞主办的AI开发者大赛,团队成员表示,之前本身就使用过科大讯飞的产品并对其深入了解过,如今看到这样一个现场学习的好机会,就抱着试一试的想法来了。没想到会有这么大的惊喜,而且能够为不懂手语的朋友与听障人士更便捷准确的交流带来助力,很有成就感。

深入探讨这款酷产品,我们发现,从技术方面,Forever Young团队通过参加各类比赛切磋,带来了技术层面一次又一次的成功、精准的迭代,而且手语算法作为团队的核心竞争力,目前已经申请了国家级专利。历经发展,就在今年4月,团队首次尝试使用智能手机作为平台,并对算法进行提升,经过不断努力手套如今已能识别近300个词汇和短句。

尽管这项创新应用已经获得了很多关注以及鼓励,但研发过程所中所面对的困难还是让人长舒一口气。

硬件方面,我们希望产品完工后足够轻便,所以换了好几十版电路以及许多元器件的封装,最终为了可以更好集成在一块小电路板上。具体来说,我们开始使用的是0805的封装,后来又改用了0603,这样前前后后换了十几版电路,遗憾的是至今还没有达到我们理想中的大小,仍旧需要不断尝试。团队成员说。

除了硬件层面,软件方其实也遇到了一些小问题。Forever Young团队的初创成员之一林鹏程总结道,其实开始从底层的驱动设计入手,就出现了很多bug,经过调试之后才有相对安全的范围以及稳定结果;另外对手势识别的设计方面,挑战是最大的:从最开始的机器学习过渡到深度学习方式,这是一个不断改进的过程,虽然目前已经达到了89%的识别率,但未来进步的空间还很大;此外对手套各项功能的提升,一直面临着不小的资金瓶颈,如果想要实现手套完全脱离手机这种智能化程度,未来还需要找到伯乐一枚共同完善设计。

不过可喜的一点,通过参加比赛,团队成员纷纷从科大讯飞的语音技术上收获启发,将作品中加入讯飞的语音技术后收效明显,未来还将在识别能力以及硬件的外观方面完成更进一步的改进,更好发挥AIUI的能力,通过关键词语义理解技术来弥补词汇量的不足,实践更自然的表达。

谈到对未来智慧时代的畅想,林鹏程觉得,在未来的发展中,即使AI不能完全替代人类枯燥乏味的工作,也至少可以帮助人类减少这类工作的重复执行,提高效率并解放双手根本不在话下;人们最起码的居家生活会不间断涌入AI 产品以及应用,就像如今风靡的智能音箱一样,丰富知识并拓宽信息获取的渠道将变得异常简单,在此背景下,来源于生活并助力生活便捷的手套只是一个开始。

初学者不可错过的分布式机器学习4大知识点 | AI知识科普

分布式机器学习成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

随着“大数据”概念而兴起的分布式机器学习,在人工智能的新时代里解决了大量最具挑战性的问题。

近几年,机器学习在很多领域取得了空前的成功,也因此彻底改变了人工智能的发展方向。大数据时代的到来一方面促进了机器学习的长足发展,另一方面也给机器学习带来了前所未有的新挑战。

在这些发展与挑战中,分布式机器学习应运而生并成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

1、起源:大数据和大模型带来的挑战

在开始聊起源之前,我们先来看张图:
1

 

这张图是展示了ImageNet近几年的错误率,2011年的时候错误率还将近有25%,这样的错误率很难运用到实际应用中。到2015年,ImageNet错误率已经降低到3%左右,比人类的错误率(5%)还要低, 短短的4-5年时间,机器在ImageNet上的识别率便超过了人类。

导致这一结果的原因有2个:一是数据,另一个是模型。

大规模训练数据的出现为训练大模型提供了物质基础,大规模机器学习模型具有超强的表达能力,可以解决很多复杂和高难度的问题。

在解决这些问题的同时,大规模机器学习模型也有着非常明显的弊端:包含参数众多,训练耗时;模型巨大,传统的计算机和工作站难以处理;容易过拟合,在训练数据集上表现良好,在未知测试数据上表现不尽人意。

比较典型的例子是电商网站上的用户行为数据,比如在淘宝上很多用户每天都能看到系统推荐的产品,这些产品是根据用户日常浏览和点击习惯进行推荐的,淘宝的服务器将用户点击的产品行为记录下来,作为分布式机器学习系统的输入。输出是一个数学模型,可以预测一个用户喜欢看到哪些商品,从而在下一次展示推荐商品的时候,多展示那些用户喜欢的商品。

类似的,还有互联网广告系统,根据几亿用户的广告点击行为,为其推荐更容易被点击的广告。
2

 

淘宝推荐系统大致如图所示

由上述案例可以知,现在我们很难用一台计算机去处理工业规模的机器学习模型了,所以说分布式训练已经成为了一个先决条件。

2、流程:了解-探索-设计

分布式机器学习说白了,其实就是把任务发放给许多机器,然后让它们协同去帮忙训练数据和模型。
3

 

如图所示,我们会把任务下发给许多的worker,然后这些worker协同的去训练模型。

通过对分布式机器学习起源的讲解,我们可以将分布式机器学习的使用场景粗分为三类:计算量太大、训练数据太多、训练模型太大太过复杂。

这三种场景都有相对应的解决办法,对于计算量太大可采用共享内存的多机并行运算;对于训练数据太多,可以将数据进行划分,分配到多个工作节点上进行训练;而对于训练模型太大,也可以将模型进行划分,分配到不同的工作节点上进行训练。
4

 

不管是以上场景中的哪一种,还是几种场景混合在一起的情况,分布式机器学习都可以分为三步流程:

第一步是了解机器学习的模型以及优化方法;第二步是要去探索分布式机器学习的范式;第三步是设计系统,无论系统的设计者还是系统的使用者,都要知道系统为什么要这样设计,这样设计对我们选择什么样的机器学习有怎样的帮助。

3、算法:数据并行、模型并行、梯度下降

数据并行

数据并行是指由于训练样本非常多模型非常大,我们需要把训练数据划分到不同的机器上,比如说我们用100台机器同时存储这些数据,如果这些模型有10万个数据样,用100台机器来存储,每台机器存储1000条数据即可。

对于每一台worker来说,训练算法、分布式和在单机上没有什么区别,只是需要在节点之间同步模型参数。

其中参数平均是最简单的一种数据并行化。若采用参数平均法,训练的过程如下所示:

1、基于模型的配置随机初始化网络模型参数

2、将当前这组参数分发到各个工作节点

3、在每个工作节点,用数据集的一部分数据进行训练

4、将各个工作节点的参数的均值作为全局参数值

5、若还有训练数据没有参与训练,则继续从第二步开始

5

模型并行

模型并行将模型拆分成几个分片,由几个训练单元分别持有,共同协作完成训练。

深度学习的计算其实主要是矩阵运算,而在计算时这些矩阵都是保存在内存里的,如果是用GPU卡计算的话就是放在显存里,可是有的时候矩阵会非常大。面对这种超大矩阵便需要将其拆分,分到不同处理器上去计算。6

 

梯度下降

1847年梯度下降被提出来之后,这些年业内提出了各种各样的优化算法,优化算法是一个非常漫长的演变过程。
7

 

大家可以看到图中有一条分界线, 在2010之前的算法主要是Deterministic algorithms,这种算法具有很强确定性。换句话说,就是可以在数学上保证此算法进行的每一步都是精确的,能够指导我们的优化目标。

2010年之后的这些模型被称做stochastic algorithms,不再要求每一步都是精确的梯度下降,或者每一步要做最精确的优化。stochastic algorithms让每一步只进行随机的优化,最终把所有数据优化完以后,还是能够优化到最低点。

随着数据越来越大,Deterministic algorithms规则已经越来变得越来越不适用了。对于大量的计算数据,我们不可能每一次都做梯度下降,随机梯度下降变得越来越有优势,资源利用率也会更高。

4、分布式机器学习三大平台:Spark、PMLS、TensorFlow

在纽约州立大学布法罗分校计算机科学与工程教授、Petuum Inc. 顾问 Murat Demirbas 和他的两位学生一起发表的那篇对比现有分布式机器学习平台的论文中,将分布式机器学习平台归类为了三大基本设计方法:

1.基本数据流(basic dataflow)

2.参数服务器模型(parameter-server model)

3.先进数据流(advanced dataflow)

并根据这三大基本设计方法,使用了业内著名的三大分布式机器学习平台,其中基本数据流方法使用了 Apache Spark、参数服务器模型使用了 PMLS(Petuum)、先进数据流模型使用了 TensorFlow 和 MXNet。

并在测试中得出相应的结论,班主任摘取关键部分出来,供大家参考(论文原文可访问:https://www.cse.buffalo.edu/~demirbas/publications/DistMLplat.pdf,译文参考网络翻译)

Spark

在基本的设置中,Spark 将模型参数存储在驱动器节点,工作器与驱动器通信从而在每次迭代后更新这些参数。对于大规模部署而言,这些模型参数可能并不适合驱动器,并且会作为一个 RDD 而进行维护更新。

这会带来大量额外开销,因为每次迭代都需要创造一个新的 RDD 来保存更新后的模型参数。更新模型涉及到在整个机器/磁盘上重排数据,这就限制了 Spark 的扩展性。

PMLS

PMLS节点会存储和更新模型参数以及响应来自工作器的请求。工作器会请求来自它们的局部 PS 副本的最新模型参数,并在分配给它们的数据集部分上执行计算。

PMLS还采用了 SSP(Stale Synchronous Parallelism)模型,这比 BSP(Bulk Synchronous Parellelism)模型更宽松——其中工作器在每次迭代结束时同步。SSP 为工作器的同步减少了麻烦,确保最快的工作器不能超过最慢的工作器 s 次迭代。

 TensorFlow

 TensorFlow使用节点和边的有向图来表示计算。节点表示计算,状态可变。而边则表示多维数据数组(张量),在节点之间传输。

TensorFlow 需要用户静态声明这种符号计算图,并对该图使用复写和分区(rewrite& partitioning)将其分配到机器上进行分布式执行。(MXNet,尤其是 DyNet 使用了图的动态声明,这改善了编程的难度和灵活性。)
8关注我们,收看更多精彩课程

640

过去活跃在科幻片中的“克隆人”可自提,这事儿好像成真了……

在前不久刚刚结束的科大讯飞1024开发者节上,关于首届“顶天立地”iFLYTEK A.I. 开发者大赛总决赛中,一家名为“奇幻科技”的企业果断get到了如此“妙不可言”的科技点。

发表于2018-11-14 17:23| 来源CSDN| 作者刘晶晶


289_181114172457_1
《邓丽君·传奇》全息演唱会现场

(图片来源:https://item.btime.com/m_9d090cf74ff9f25c7?page=1

看到曾经的华人巨星邓丽君再现舞台,并真实领略了天后的倩影和歌声的经典重现,着实有点儿小鸡冻!

话说,如果好莱坞大片中的“替身小分队”纷纷主动“换角”,动作演员替身要失业,你会怎么想?

据可靠“情报”,如今确实有很多大牌动作明星都选择使用虚拟替身,就连好莱坞自己也并不想再使用真实演员完成高危动作,其中成本是首要被考虑的因素。例如我们熟悉的热门电影《创:战纪》、《复仇者联盟》三、四季以及前段时间霸屏的《头号玩家》等,在拍摄过程中均延用此道。

虽说以上发生的这些事儿在鸡冻之余确实有些麻烦,但以虚拟人技术与MR技术(AR+VR)混合成的“虚拟人全息”技术,的确让“随时随地创建属于自己的阿凡达”这事儿成功突破了科学幻想的边界。

试想一下,过去活跃在科幻片中的“克隆人”可自提?实在有趣!

需要解释说明的一点,这里提到的“克隆人”并非我们通常意义上的以生物学为基础的基因复制,而是来源于美国知名生物制药公司联合治疗公司创始人兼CEO玛蒂娜·罗斯布拉特的争议之作《虚拟人》,书中提出的“思维克隆人、网络人等虚拟人将如何颠覆人类对‘我’的定义”。
289_181114172521_1

图片来源:www.cyzone.cn

说来也巧,就在前不久刚刚结束的科大讯飞1024开发者节上,关于首届“顶天立地”iFLYTEK A.I. 开发者大赛总决赛中,一家名为“奇幻科技”的企业果断get到了如此“妙不可言”的科技点。

通过图像建模、语音识别、语义识别等人工智能技术,搭建了一套数字化人物模型及智能的中心系统,用户使用后可以通过上传自己的照片来快速获得虚拟人形象,这款基于AI技术的智能虚拟人系统被大家称作“Amazing Me”,并荣获了应用开发 AI 挑战赛的亚军圣冠。

奇幻科技方面表示,研发Amazing Me最初的想法,是想让每个人都可以创建与自己长相一样的虚拟人,更重要的是能够让虚拟人成为人类的“陪伴者”,填补精神层面的缺失与空虚。


289_181114172551_1

Amazing Me 虚拟人

(图片来源:http://finance.huanqiu.com/cjrd/2017-08/11068843.html 

据了解,除了长相的高度重合外,奇幻科技的研发团队还通过AI 算法为每个虚拟人在表情、动作、记忆等细节中“生发”个性化的形象特点,更有趣的是,新鲜出炉的虚拟人还能做到自我学习,在外形和思维方面不断趋近于真人,果然如名字般够惊喜!

具体来说,为了让上线的虚拟人形象越来越像“真的你”,Amazing Me采用了一套“AI自适应整容”方案。就是利用照片与视频建立与真人一样的虚拟人模型之后,通过AI 算法,捕捉和学习与真人在形象上的细微变化,不断对虚拟人模型加以调整优化,从而达成虚拟人与真人同步成长。

此外,虚拟人还可以学习真人的表情和动作,通过捕捉建立个人的表情动作数据库;具备的人脸识别和唤醒功能让其在机器学习的技术“影响”下,做到与人真正对话,在交谈中提升技能,值得提出的一点,应用中涉及到的语音能力均是讯飞开放平台所提供。

不同于美国科幻电影《Her》中陪伴男主人公的萨曼莎只有声音,智能虚拟人还有一个逼真的实体。对此奇幻科技表示,未来,高度类同真人的智能虚拟人前景优势巨大,可以融入到很多实际应用中“放光发热”!

“首先,他们真的可以创造一种新的生活场景,例如虚拟人的VR电影!”让每个人走入电影中成为主角,明星的虚拟人甚至可以代替真人表演发挥,是一个驱动电影发展的好办法!奇幻科技方说。
289_181114172614_1

篮球运动员马布里虚拟人首发

(图片来源:http://ent.ifeng.com/a/20181015/43124051_0.shtml

另外就是目前比较常见的应用类型,对故去人物的还原。这方面主要通过历史故事或者相关的数据信息,将历史名人、故去的明星偶像等搬到故居、蜡像馆甚至是舞台上,与游客以及观众实现交互,产生活灵活现的对话。

此外,还可以模拟斯坦福大学虚拟人机界面实验室(VHIL)的虚拟角色,创建一个老师的虚拟镜像。怎么用?系统会根据每个学生的言行举止“创造”出一个与学生相貌以及举止行为类似并更有亲和力的老师形象,从而提高听课的效率。事实证明,让一个学生喜欢的老师来授课,确实会大大提高其学习效率,何乐而不为呢?

现如今市场上在售的、具有陪护功能的智能机器人多不胜数,虚拟人的成熟上线正可打破机器人“第三者”的身份,从“真正亲人”的角度出发,甚至可以在特殊时间代替家庭重要角色进行互动交流,让诸如留守儿童等特殊群体随时得到父母关爱。

更重要的是,智能虚拟人通过自我学习可以不断加深对服务对象的了解,还能够实时记录个人成长,例如在不同的年龄阶段建立档案等,或许未来某一天,人类可以与某个时期的自己对话也说不定呢!

畅聊智能虚拟人之后,我们再来详细聊一聊这家名为“奇幻科技”的企业吧!

“我们是一家以内容为切入点的技术公司。”这是奇幻科技团队上下赋予自己的定位。

创业之初,在VR发展的五大方向(操作系统、硬件、线下体验、应用于内容)中,奇幻科技妥妥选择了从内容出发,寻找与产品和技术的结合点。在这个前提下,加大技术的自研力度,例如语音交互、眼球追踪等,成为团队一直以来的不断追求达成的目标。

技术的高效研发需要一支高精尖的团队,据悉奇幻科技还有一支强大的、来自国内以及美国的人工智能团队,同时包括高校资深的科研任务为其提供技术指导,如此来看内容以及交互技术才有了落地的可能性。

除了“智能虚拟人”的新鲜上线之外,奇幻科技还在线下打造了一种全新模式——“奇幻乐园”,将人工智能与VR技术有机结合,目前已在成都、青岛、厦门、宁波等地陆续落地。

例如在宁波,奇幻科技的线下VR主题乐园已经建立并投入运营,乐园涵盖二十多项VR体验项目,是目前最大的一处VR乐园,主要包括探索宇宙的天文馆、探索太空的虚拟航天飞机、回到侏罗纪时代的恐龙馆等诸多基于虚拟现实的体验项目。

289_181114172727_1

图片来源:http://www.sohu.com/a/168535878_117206 

其中VR教室能够为中小学生提供科学类、自然灾害的安全教学以及红色教育等“真实”内容,这些在传统课堂中都很难实现。“我们在所有VR主题乐园中都设有VR教室,主要面向宁波几十万小学生,让广泛开展的课外实践活动可以具备身临其境的体验。”据小编了解,未来智能虚拟人将成为主题乐园的核心。

关于未来,奇幻科技的规划很清晰,就是把人工智能和VR、AR、全息投影等创新技术结合起来,打造虚拟人的技术体系,并以此建立线上线下的各种应用。更重要的是,做成一家真正关注未来、关心人性且不以盈利为唯一目的企业,是奇幻科技的初心所在。

凭借创新的AI应用,奇幻科技在科大讯飞首届iFLYTEK AI开发者大赛上表现亮眼。

据了解,本次大赛共设置了“方言种类识别AI挑战赛”和“应用开发AI挑战赛”两项赛事,历时6个多月,吸引了1万余名世界各地的优秀开发者踊跃参加,共计收到全球3千多支团队提交参赛作品,经过决赛的选拔,眼前一亮的厉害作品更是层出不穷。

更重要的是,大赛面向全球首次开放中文方言语音数据集以及 AIUI 人机对话交互,语音听写、合成、评测、翻译,人脸识别,声纹识别等十余项人工智能核心技术,极大促进人工智能应用场景的升级。

不但技术上大力支持开发团队,还将为参赛选手们提供百万现金、科技晚宴、就业通道等全方位资源扶持,试想一下,在科大讯飞如此给力的助动下,未来如同奇幻科技一样的出色企业以及醉心语音研究的开发者们,定会迅速崭露头角,大放光彩……

万物智联,从这里开始| iFLYIoT物联网平台正式上线!

为了构建智能物联网的基础设施,实现便捷快速的网络连接,为开发者、消费者提供更强大的设备智能解决方案,科大讯飞iFLYIoT物联网平台现在正式上线!

NEWS
科大讯飞iFLYIoT物联网平台上线!通过建立设备、云端双向通信通道,使设备可以稳定、便捷、高效地连接到物联网云平台。此外,更是与最新推出的iFLYOS结合,真正实现让A.I.轻松触达每个设备。了解详情:iFLYIoT物联网平台

IoT平台(Internet of Things)即物联网平台。从产业分工的角度来看,IoT平台负责连接海量设备并对设备数据进行汇聚、管理与分发,具有影响产业价值分配的能力,是物联网生态中有力的赋能者。
6401

 

物联网平台的重要性毋庸置疑。而在如火如荼的发展过程中,一些问题和痛点也逐渐显露出来:架构僵化、物与物协作效率低下、个人隐私和设备安全问题严峻等等。这些问题无疑是对平台的智能性、高效性提出了更高的要求。

为了构建智能物联网的基础设施,实现便捷快速的网络连接,为开发者、消费者提供更强大的设备智能解决方案,科大讯飞iFLYIoT物联网平台现在正式上线!

 

功能概述

能力强大·可视化控制

iFLYIoT平台通过建立设备、云端双向通信通道,使设备可以稳定高效地连接到物联网云平台。除此之外,更是与讯飞丰富的A.I.能力结合,凭借自身语音识别、语义理解技术优势,快速构建行业智能解决方案。下面将从平台功能、A.I.接入和构建IoT解决方案几个方面进行介绍。

 设备接入 

平台针对不同操作系统、终端类型、联网方式的设备提供设备端SDK,使其可以快速连接至iFLYIoT平台。开发者可基于SDK和XLink协议开发设备端功能,并让设备与云端进行消息通信。同时还可集成多种A.I.能力,实现设备智能化。
6402

 

 平台能力 

iFLYIoT平台提供完善的产品开发、设备管理等基础能力,可快速在云端构建产品及功能,并且提供事件管理、规则引擎等拓展服务,方便开发者拓展产品能力。具备亿级设备的连接能力,安全可靠地实现消息收发及路由,帮助开发者构建自己的IoT应用。

6403

 

 协议互通 

提供第三方设备厂商的通讯协议与Xlink协议的互通,开发者可编写协议转换脚本,将第三方设备的通讯协议与Xlink协议进行适配,iFLYIoT平台通过协议转换脚本解析第三方设备上传的数据信息,下发设备指令。
6404

 

 数据统计 

实时统计基于产品的设备、消息、行为数据,并基于数据进行定时、定性分析,分析结果通过可视化报表进行展示。

 语音交互 

为了让开发者更简单接入和享受到讯飞强大的A.I.能力,我们在云端实现了一键接入IFLYOS控制。

 

平台特点

灵活快速·高效安全

高效易用

简单易用的平台操作,完善的产品、设备管理,强大的数据统计分析功能助力开发者快速、高效的创建自己的IoT方案。
灵活开放

支持Android、RTOS等多种方式接入IoT平台,提供丰富的服务和数据API和规则服务,支持多源数据开发。
安全可靠

支持亿级海量连接,提供多重防护保障设备信息安全,安全、完善的访问权限控制。业务可靠性达到99.9%,为开发者保驾护航。
快速落地提供第三方设备厂商的通讯协议与Xlink协议的互通。面向工业物联网、智慧城市等领域提供行业开发组件,帮助开发者快速孵化行业应用及解决方案。 

突出优势

3小时·万物互联触手可得

 —快速构建解决方案— 

iFLYIoT针对开发者所在的不同行业提供了高效、强大的功能解决方案。

针对智能硬件,iFLYIoT提供语音交互系统+设备管理平台,为厂商提供一站式的设备智能方案,提升设备的用户体验;针对城市物联网,iFLYIoT提供边缘解决方案+云平台的混合组网方案,满足城市物联网私有数据存储、高安全性、低网络依赖的需求。
6405

 

同时iFLYIoT为开发者提供了高效、易用的开发平台,只需3个小时即可完成demo开发,极大地提升了开发效率。

 —结合A.I. 实现万物智联— 

智能硬件是IoT的重要应用领域,但目前面临设备多、交互方式繁琐等问题。为此,讯飞依托在语音交互领域的布局,将iFLYIoT与最新推出的iFLYOS结合,推出语音操作系统+设备连接的解决方案。利用语音识别、语义理解技术优势,实现统一高效的交互方式。

6406

 

 —赋能开发者,共建IoT生态— 

借助讯飞在生态产品上的优势,iFLYIoT物联网平台还为开发者提供了服务市场。企业可将自己生产的产品通过服务市场与需求方进行沟通,达成商业合作。同时还提供功能强大的数据运营功能,助力开发者挖掘数据价值,创建更好的IoT生态。

 

解决方案

典型场景·轻松落地

聚焦家居、生产、办公等典型场景,iFLYIoT提供包括数据、安全、管理等一系列面向IoT场景的云服务,实现在各类场景下的顺利落地。

智能家居

智能家居设备通过使用IoT开发者平台完成与云端连接,使消费者可以随时随地掌握家中智能设备的状态,并实现远程操控。
6407

 

生产监控

通过iFLYIoT平台可将工业设备连接至云端,使企业相关人员可以实时监控工业设备的生产状态,制定更加科学的生产计划。

智慧楼宇

通过跨产品、跨厂商的设备打通,使消费者拥有的智能设备组成一个设备网络,实现设备互通。再借由规则引擎实现设备间的联动,为消费者打造更为便捷舒适的家居、办公环境。
6408

 

优秀案例

MORFEI智能麦克风

目前,IoT的一个重要应用就是智能家居。智能家居作为一个已经发展了几十年的产业,在最近几年终于迎来了大爆发,智能语音也成为继路由器之后的又一智能家居控制中心。

MORFEI智能家居生态则是IoT落地家居领域的优秀案例。

2017年6月,科大讯飞发布了面向智能家居场景的MORFEI智能麦克风1.0。这款麦克风能让开发者经过短暂的调试对接,实现智能交互能力。进一步提高智能家居的集成度,降低了合作伙伴的开发难度。
6409

 

MORFEI麦克风通过分布式拾音,可以实现在整个空间内任何一个角落随意说,MORFEI的云连接能力可以实现和所有的周边的合作伙伴的产品的连接,形成解决方案。

以这款 MORFEI 智能硬件平台为核心,讯飞想要打造一个「标杆性」的语音 IoT 生态。

正如在今年的全球1024开发者节上,胡郁总说的那样:”在不同的用户和场景组合中,你设计的智能产品是多样化的,有感情的。它应该有自己的名字,连接了不同的内容。而通过iFLYOS和iFLYIoT,我们可以将它们连接在一起。“
64010

 

快来体验吧!

登陆讯飞开放平台官网,点击“产品服务”栏目,找到“iFLYIoT物联网平台”入口即可体验
64011

扫描二维码,关注我们——
64012

新能力上线 | 精准识别2万种物体,还能看人脸测颜值!

现在,由科大讯飞能力星云计划的优秀A.I.服务合作伙伴,图普科技提供的人脸特征分析、场景识别、物体识别在讯飞开放平台上线!让你可以开发拥有更多样化智能识别能力的产品。

划重点

科大讯飞能力星云计划的优秀AI服务合作伙伴——图普科技,带来人脸识别、自然场景识别新能力!戳一下了解详情:人脸特征分析场景识别物体识别

如今,打开微信朋友圈,一条条动态几乎没有不配图的。晒风景,晒美食,晒自拍……一天不“晒图”简直浑身难受。

 

全世界每天每分钟会上传超过5亿张图片到互联网,随着高速网络的普及与智能设备的发展,图片已成为用户表达、事件记录中不可或缺的部分。内容审核、照片管理、营销推广等需要处理大量图片的工作对图像识别能力的需求正在不断增强。

对于开发图像智能识别产品的开发者,想让产品脱颖而出,不仅要让识别高效精准,还要能通过独一无二的功能带来全新的玩法,比如可以给好友的自拍评一个颜值指数、从一张晒吃照片中迅速获得美食信息……

现在,由科大讯飞能力星云计划的优秀A.I.服务合作伙伴,图普科技提供的人脸特征分析、场景识别、物体识别在讯飞开放平台上线!让你可以开发拥有更多样化智能识别能力的产品。

 

人脸特征分析

颜值、表情多维度识别,准确度99.5%

基于深度学习算法,可以检测图像中的人脸并进行一系列人脸相关的特征分析,当前支持识别出包括性别、颜值、年龄、表情多维度人脸信息。可用作基础人脸信息的解析,智能分析人群特征。

 

年龄

对上传的图片中人物的年龄段进行判断分类,如婴儿、青年、中年、老年等。

性别

识别出上传的图片中人物的性别。对露出全脸、侧脸的真人或动漫人物进行“男性”、“女性”的分类。图中有多个可辨别面部特征的人或动漫人物时识别为“多人”。对画面无人、面部未显示或无法辨认的图片归为“其它”。

颜值

对上传的图片中人物颜值进行分析,给出对应结果:漂亮、好看、普通、低颜值等。

表情

识别出图片中人物的表情特征:喜悦、愤怒、悲伤、惊恐、厌恶等。

能力优势

1、准确度达99.5% 

对于日常生活中的人脸,准确率高达 99.5%。

2、可适应多种复杂环境

在遮挡、光照不佳、头部姿态变化等复杂场景下均具备高性能表现。

3、处理高效稳定

毫秒级响应速度,在 PC、移动设备上均能迅速处理。

可应用场景

1、客流属性识别 

通过对图像或视频中的人脸特征分析,分析客流的性别、年龄等属性。

2、广告精准投放

通过人脸特征分析,可以实时分析受众人群的性别、年龄等特征和分布状况,精准投放广告。

3、线下营销

基于人脸特征分析,商场、餐厅等场所可展开颜值测试类的互动营销活动,增加与顾客的互动。

自然场景识别

覆盖数十种场景,2万种物体

场景识别

精准识别自然环境下数十种场景,让智能相册管理、照片检索和分类等基于场景的应用展现得更加直观。

对实际应用场景分为室内、室外、自然风景和其他四大分类,每个分类都会按照实际场景细分为多个类别,根据用户上传的图片里对应的实际场景返回结果。

 

物体识别

全球领先的通用物体检测算法,有效检测图像中的动物、交通工具、生活家具等2万多种生活常见物体。可分析图片主要内容,帮助技术团队对图像语义进行自动化解读。

 

能力优势

1、超高准确度

全球领先的智能识别算法,让图片内的场景和物体可以被准确识别。

2、功能强大

支持数十种场景、数万种物体识别,并在持续增加中。

3、适应复杂环境

在模糊、倾斜、光照不均、背景杂乱等情况下均保持高性能表现。

4、处理高效稳定

毫秒级响应速度,并在实际场景中不断优化性能表现。

可应用场景

1、拍照识图

自动识别所拍照片的内容,减少人工录入成本及出错率。

2、图片内容检索

根据图片场景自动分类,建立快速检索系统。

3、智能相册

根据用户上传照片进行主体检测,精准识别照片信息,批量读图实现相册智能分类管理。

4、内容及广告推荐

识别用户经常浏览的网页中的图片信息,推送相关内容或广告。

5、以图搜物

在不知道图片中物体的名称时,自动化检测并展示图片内的物体信息,方便进一步搜索物体的相关内容。

来官网进一步了解吧!
人脸特征分析

场景识别

物体识别

A.I.能力星云

除了自研能力,科大讯飞还与业内优秀的技术厂商进行战略互补形式的合作。带来能力星云计划

讯飞开放平台自2010年成立以来,经过8年的积累,现已开放近百项A.I.能力,赋能88万开发者团队。在能力星云中,A.I.服务合作伙伴通过讯飞开放平台的桥梁,为更多的A.I.开发者和爱好者提供服务,让技术为在更多场景中落地,为各行业赋能。

A.I.服务合作伙伴在能力星云中拥有:

官网专栏产品页

讯飞开放平台上线A.I.能力详情页,产品介绍,接入流程,能力提供方等信息一应俱全!

全渠道推广宣传

线上渠道,线下市场活动,会针对A.I.服务合作伙伴的产品进行全网宣传和推广,扩大影响力,吸引更多开发者使用A.I.能力!

商机即时对接

专业团队负责商机梳理和对接,A.I.新能力商机将会即时处理,定期同步给A.I.服务合作伙伴,带来更多商业资源引流。

共享开放平台开发者

讯飞开放平台丰富的开发者将率先体验A.I.新能力,并应用在产品中,形成更多的合作案例以及解决方案!

未来,能力星云将让厂商的实用级核心技术陆续与讯飞的核心能力一起,汇聚成A.I.能力的星云,释放巨大的组合效应!

科大讯飞魏思:技术在不断发展的同时,也在朝着历史「回归」

技术在不断发展的同时,也在朝着历史「回归」
如何去定义这些问题,并在有限的场景下去部分解决问题,才是我们下一步的发展方向.

在刚刚结束的全球1024开发者节上,科大讯飞研究院魏思就模式识别和人工智能的发展关系和发展历史问题,做了他自己15年来的A.I.追光故事分享。

他在分享中提出如下观点:

技术在不断发展的同时,也在朝着历史「回归」

如何去定义这些问题,并在有限的场景下去部分解决问题,才是我们下一步的发展方向

……

这些观点是非常值得我们去学习和思考的,我们将魏思院长的演讲文稿整理出来,希望对大家未来的研究之路能够有所启发。

以下为演讲稿的文字整理,有部分微调

我叫魏思,来自科大讯飞研究院,我大概有15年的时间一直在从事模式识别方面的工作。

模式识别大概有60、70年的发展历史,最近这十年好像行业技术发展得很好,但实际上我认为它是朝着历史回归了

目前所有研究的方向、模型都回归到了条件相关性或者是条件依赖性的数学模型上,而此模型是在80年代中期由美国科学家Judea Pearl提出来的,后来这套模型演变成了图模型,目前的基于深度学习的模型和图模型在数学上的变化非常小,但是实际效果变化却非常大。

接下来我会从4个方向去讲述这几十年来技术的发展脉络。这4个方向分别是人类或者动物的神经元信号的传递机理和人工神经网络;统计和模式识别;语音和语言方面的研究;图像识别的研究进展

 

点击查看魏思演讲全部视频

从生物神经网络到人工神经网络

18世纪,意大利的科学家伽伐尼发现青蛙的蛙腿放在金属上会引起抽搐,这是人类第一次发现肌肉可以由电刺激而产生动作,于是伽伐尼猜测了生物电的存在。

1920年阿德里安通过实验证明了神经元动作电位的存在。而早在20世纪初的时候,科学家伯恩斯坦提出了静息膜电位的概念,并发现静息膜电位为-70mv,同时他猜测带电物体穿越细胞膜或许是动作电位产生的机理。

1939年霍奇金和赫胥黎通过枪乌贼神经元的系列精细实验证明了神经元的细胞内外确实存在电流,并测量出了动作电位的大小(110mv)。他们发现是钠离子的内流形成了真正的动作电位,钠离子内流之后钾离子外流保持细胞内外的静息膜电位然后他们猜测了两件事情,第一,膜上有离子通道,第二,存在离子转运蛋白保持膜内外离子平衡,这些后来都被分子生物学所证明。静息膜电位,离子内外流动和转运蛋白一起完成了动作电位的产生。
h'y640

 

魏思现场演讲

同期(1920-1930)Loewi,Dale,Katz发现了神经递质乙酰胆碱,乙酰胆碱引起离子通道打开从而在神经元间形成动作电位,完成了信息在不同神经元之间的传递,至此,神经元的信号传递分子机理基本梳理清楚了。

在此基础上,1943年McCulloch和Pitts提出一种非常简单的数学模型(MP模型)去近似神经元的信号处理机制。1958年美国科学家罗森布拉特首次发现可以用MP模型,去完成很简单的模式识别任务,也就是让机器识别物体和数字,这也是第一代神经网络,我们称之为感知机

我们把那个阶段称之为神经网络第一次浪潮,但很快浪潮就过去了,因为当时的感知机的识别性能比较低,在实际中很难发挥作用。

同时在50年代,Kuffler,Hubel和Wiesel发现了视觉神经系统的工作机理,原来视觉不是响应弥散光的照射,而是响应不同形状的光照。他们创造性的提出了感受野的概念,现在我们知道这就是滤波器。

受此研究的影响,贝尔实验室的科学家LeCun在80年代末90年代初想到了利用卷积或者形状响应机理设计一种算法去进行文字的识别,但当时,模式识别界被SVM主导,这个发明并没有引起很大的反响。

640了魏思现场演讲

同时,从80年代到90年代,Hopfield提出了动态神经网络,Schmidhuber和Hochreiter提出带遗忘机制的动态神经网络模型。但那时并不被看好,直到近几年这个模型才逐渐流行开来。2006年以后,Hinton复兴了深度学习,并在语音和图像上取得了突破性进展,深度学习也获得了极大的应用这就是我们说的从神经元的工作机理,到人工神经网络的发展历史。

 

统计和模式识别的发展

统计的雏形是概率和计算而最早的广为人知的统计算法是最小二乘法,它是在1805年由勒让德首先发明的,并在1824年由高斯用误差分析的方式重新阐述以后获得了极大的影响力,是前模式识别时代应用最广泛的算法。

1885年弗朗西斯·高尔顿发明了回归,同时利用数据统计和图形化首次得到了二维正态密度的分布图和相关系数等重要概念,要说现代统计肇始于高尔顿也不为过。

高尔顿赞助卡尔.皮尔逊在伦敦大学学院(UC London)成立了统计实验室,造就了20世纪早期开始的统计学革命。费舍尔(Sir R. A. Fisher)在1936年提出的线性区分性分析(LDA),纽曼,爱根·皮尔逊(卡尔·皮尔逊的儿子)同期提出的似然比检验(Likelihood Ratio Test)则可以称之为现代分类器的雏形。这些概念后来演变成了现代模式识别体系。

1950年美国科学家Abraham Wald系统地将“统计决策理论”阐述清楚。从那时候开始,模式识别慢慢成熟,我们有了很多可用的模型,比如说线性分类器、树分类器,GMM模型,HMM模型等。

这里面特别值得一提的就是条件相关性模型,1985年Judea Pearl提出来贝叶斯网络, 此后,Judea Pearl对图模型的学习、推理等进行了系统性的研究,并解决了一系列数学问题他在科普书(The book of why)中自豪的称自己的工作解决了人类智慧的秘密(寻找事物之间的因果关系),他也因此得了2011年图灵奖。

64045魏思现场演讲

但事实上图模型的学习和推理非常难(数学上的术语是图模型的学习是NP-Hard的),在实际应用中的效果并不是很好。在2006年到2010年期间,以Hinton为代表的人工智能学者发现在用神经网络让模型通过数据和算法自动去获数据之间以及数据和标签之间的条件相关性,可以获得非常好的效果

从上面我们可看到,模式识别也慢慢地发展到了对条件相关性的利用和训练方向上来了。

 

语音和语言的发展

在语音方面我会讲两个方向,语音合成和语音识别。

语音合成在90年代以前都只是实验室的项目,到了90年代后,研究人员发现可以通过预先录制很多的语音,在实际使用的时候把数据拿出来进行拼接来进行语音合成。奇怪的是,这么简单的做法,居然可以获得相当好的效果。但是这样得到的语音连贯度和平滑度不够,所以研究人员设计了很多的启发式的规则和方法,去调整语音合成的连贯度和平滑度。

2000年,日本科学家Tokuda把语音识别中的常用方法HMM用到了语音合成上,提出了新的语音合成方法,虽然在当时它的效果不是很好,但很快人们发现用这种新的方法,在语音合成的效率、平滑度问题上,都有很好的表现。

2016年年Google提出了WaveNet,我们也利用条件自回归模型取得了较大进展。目前,由于利用了长时的相关性,我们的语音合成效果非常棒,语音合成也慢慢收敛到条件相关性上来了。

语音识别历史就更长了,而且更有意思。 1971年JennyBaum发明了HMM,1975年James Baker把HMM用到了语音识别上80年代到90年代,GMM/HMM的EM算法被几个小组(CMU,IBM,Bell lab)重新定义(1977年Dempster就已经从数学上把EM算法做出来了),一批科学家从无到有地将EM算法和HMM语音识别上的整套体系建立起来了。自此语音识别被HMM主导并由于HTK(HMM Toolkit, Cambridge)的出现而得到了大面积的推广。

2010年,Hinton首次提出利用深度网络结合HMM进行语音识别,并和微软研究院俞栋和邓力合作在SWB上获得了相对30%的提升,从此语音识别翻开了新的一页。

综上所述,可以看出语音合成和语音识别也都收敛到条件相关性的数学模型上来了


64088

 

魏思现场演讲

下面,我们来看看语言。

在很早的时候,语言是定性和分析的科学。

到了90年代,随着HMM模型的普及,特别是HMM在机器翻译上的成功应用,语言也进入了统计的时代。

2001年JohnLafferty发明了条件随机场模型,这个模型考虑了特征域和标签域的条件相关性(相比HMM,多考虑了标签域的相关性),由于考虑到了更多的条件相关性,条件随机场的效果好过其他的模型,也获得了大量的应用在2001年之后,条件随机场几乎主导了需要处理动态信息的自然语言处理系统。

2012年,Minklov首次利用(RNN)语言模型取得了语音识别的显著提升,同时他们发现可以利用RNN语言模型生成符合语法规范的句子,而在此之前机器自动生成合乎语法规范的句子几乎是不可能完成的任务。

2015年,Google和Universityof Montreal几乎同时提出了利用编码解码机制去进行机器翻译,再加上注意机制(Attention)的引入,机器翻译在过去的几年间发生了翻天覆地的变化。机器翻译的效果在简单场景下已经达到了人工的水平。而这套模型也是利用了神经网络实现了特征域和标签域的全部条件相关性

由上我们可以看到,语音和语言,也都收敛到了条件相关性模型上了。

 

图像识别的研究进展

图像识别的发展可以分为2个阶段, 2012年之前和2012年之后。

在2012年以前,大部分图像识别类的任务都是在发明非常精巧的算法,或者定义更加复杂有效的滤波器。这些工作虽然比较漂亮,但在实际复杂场景下的推广性不佳,如说人脸识别和物体识别。视觉识别方面(如人脸,物体,物体分割等)的研究也一直没有获得大规模应用。

2012年Krizhevsky和Hinton首次提出了利用多层子卷积神经网络来进行图像识别在2012年的ImageNet比赛上遥遥领先传统方案,以显著优势获得第一名。从2012年以后,深度卷积网络几乎主导了计算机视觉的研究,现在几乎所有的视觉类任务都可以看到深度卷积网络。

为什么会出现这样的现象?实际上所有人工设计的分类器或者特征,都是在试图用人工的方法去找到特征之间的条件相关性,这是非常困难的。

而深度卷积网络让机器通过海量数据自动去提取条件相关性,这样可以发现非常复杂和隐藏的相关性

由此可见,图像识别也收敛到了条件相关性上来了。
64000

 

魏思现场演讲

下一步的发展方向

我讲完了刚才的四个方向,大家会发现在模式识别的各种实际应用领域,模型通通都回归到条件相关性这个数学概念上

唯一的区别是,我们现在找到了非常棒的一个动态模型,它能够比较自然地去描述条件相关性,然后我们再给模型很多训练数据,用基于梯度下降的BP算法去训练此模型,便可以在实际应用中取得很好的效果。

看到这里大家可能要问,这便是人工智能了吗?

不,并不是。

智能和我们现在算法的差距非常远。我们现在的算法是给定了模式、给定输入,通过模型找到模式和输入之间的条件相关性,仅此而已。

64099魏思现场演讲

但是人类的智能是什么?人类的智能并不是在给定的模式下面做分类。人类会新定义模式(发现新模式)、拆解模式(进行模式重组和加工),所有这些都是现在我们模型所不具备的

总结来说,现在的模型可以让我们非常自如地去发现数据中的复杂的条件相关性或者依赖关系。但由于这种关系可能是远距和复杂的,直接利用梯度信号训练,我们需要非常多的训练数据。

现在的模型虽然好,但是它的实现原理和人类机理差别还是很大的。人是通过无监督学习,把所有的结构或者相关性梳理好,然后通过有监督的学习去进行标注和贴标签并不是直接用有监督数据来进行模型训练的(请大家回顾一下小孩子学习语言和进行图像识别和分类时,他得到的有监督数据是非常有限的)。

同时,人类智能更多体现在认知上,也就是从无到有地产生概念和模式,这是机器所更加不具备的。给机器一幅图,让它用有逻辑、有语义的方式来描述这幅图,我们就会发现机器的表现非常糟糕。

这是因为机器只具有模式分类和识别的能力,它不具有概念生成糅合拆解、新概念产生的能力,也就是机器无法深层理解语义并对语义进行加工。

在这些方面我们如何去定义问题?怎么在有限的场景下去部分解决它?我认为这才是我们下一步的方向

来1024生态展区,未来真的触手可及!

为期两天的1024开发者节已圆满结束,除主论坛、分论坛外,生态展区也吸引了很多观众驻足观看、体验。在这里,我们仿佛以最近的距离靠近未来。

为期两天的1024开发者节已圆满结束,除主论坛、分论坛外,生态展区也吸引了很多观众驻足观看、体验。在这里,我们仿佛以最近的距离靠近未来。

除了技术与产品,1024开发者节还准备了多个惊喜。会场外,占地约3000平米的生态展区,汇聚了超过50家优秀合作伙伴和A.I.企业,打造了集中式、场景式、浸入式的A.I.应用体验。同时分设主题展、特色展、创新展,向现场A.I.追光者们展示着想象之中、预料之外的奇幻之约。

6433

 

24号当天上午,在1024开幕式致辞之后,安徽省政府副省长何树山带队前往展区视察,科大讯飞轮值总裁陈涛、科大讯飞高级副总裁胡戈宁陪同,并对展区情况做了相关介绍。

6434

 

安徽省政府副省长何树山视察展区

除莅临现场的领导外,还有大到要家人陪着来看机器人产品的老奶奶、小到被工程师父亲带到现场看热闹的七岁男孩,有来自斯坦福设计联盟的外国友人、谷歌lunchpad合作伙伴,还有很多在校大学生,大家都一起徜徉在这片科技的海洋中。展区1000+ A.I.黑科技产品,以人工智能产业集群内优秀合作伙伴产品展示为主,通过合作伙伴生态长廊的现场体验进行汇聚展示,凸显产品种类多样性与性能前瞻性。

6435

 

科技有情怀——中国声谷

主题展以“中国声谷”为主,展示省内智能语音及人工智能技术和产品;同时征集并邀请优秀国内外企业代表参展。特色展以科大讯飞为主,突出智能语音模拟应用和历史声音再现主题,收集并展示世界伟人、历史名人等“声音”,用技术打造一个有情怀、有互动、有感触的特色展示效果。创新展以“中国声谷”为主,展示第一届国际智能语音及人工智能产品创新大赛涌现出的优秀作品。

6436

 

自带30多个合作伙伴——图灵机器人

作为科大讯飞优质合作伙伴的图灵机器人参与了本次1024,并携带着图灵30多个合作伙伴的儿童智能硬件产品亮相。图灵是以语义对话技术为核心的技术型公司,而其合作伙伴们均是接入了图灵的NLP和讯飞的ASR,彰显出了两家公司的“飞图计划”,产品类型则涉及了智能故事机、绘本机器人、智能音箱、儿童智能手表、儿童机器人等产品。

6437

 

在现场,尤以绘本机器人luka baby, 儿童机器人熊卡,好帅豆乐以及富士康生产的Robohon 引发了众多开发者们的围观。和展区各式形态、功能的机器人各显神通,彰显了科技带给我们的乐趣。

携“网红”而来——苏宁智能

苏宁智能成立未久,主要基于苏宁物联网技术、苏宁内容优势及苏宁智慧零售生态,打造服务于家庭及个人消费者的硬件产品及智能生活解决方案。聚焦产品、内容、技术,构建苏宁智能家居平台,并布局智慧家庭硬件产品,打造苏宁智慧家庭生态。

6438

 

10月22日在苏宁易购开售的苏宁小Biu音箱•极智版,也作为本次苏宁智能的亮点产品出现在科大讯飞1024全球开发者节上。它不仅深得第一代网红苏宁小Biu音箱的”真传”,还进行了全面升级,简约机身,250g超轻巧。同时拥有强大的智能语音交互功能和海量的内容资源,呼唤“小Biu小Biu”,可实现影音娱乐、生活服务、儿童陪伴、语音购物、家居控制、百事大全等600多项智能操作。在智能操控方面,苏宁小Biu极智版可智能控制100+个品牌,5000+款智能家居家电,是家中全能型的“神助手”

宣传册被一抢而空——咪鼠鼠标

节日当天,前往咪鼠展区的人员络绎不绝,咪鼠凭借独具特色的互动演示方式以及用更自然的人机交互产品吸引了众多业内人士以及参会人员的青睐,成为当场人气颇高的展位之一。

6439

 

咪鼠展区的互动参与方式更为丰富,智能语音鼠标、U盘等各种精品礼品受到了参会人员的喜爱,在展区的咪鼠宣传册也被一抢而空。咪鼠产品使用了科大讯飞核心语音识别技术和科大讯飞AIUI 3.0技术,在现场热闹嘈杂的环境中也能精准地理解体验用户发出的指令,并在电脑自动展示用户所需,同时,在电脑文档中能通过语音准确快速地完成文字的输入,也让在场的用户体会到了更便捷的人机交互方式。

智能化妆镜——变脸机器视觉

智能化妆镜,通过在传统的镜子内嵌入显示屏、传感器与操作系统,为镜子新增了镜面显示以及人镜互动的功能,还搭载特色的“A.I.化妆师”功能,从而成为了电脑、电视、手机之外的“第四屏”。除智能化妆外,还可为厨房、浴室、美妆、健康搭建智慧生态圈。

6440

 

变脸魔镜结合了语音交互、虚拟助手、AR试妆等一系列前沿技术。基于 “智能镜面显示和交互”技术 、“三维人脸识别与重构”技术,以及人工智能语音交互技术,实现科幻般的终端人机交互,为美业、智能家居等行业应用提供了更多更有趣的解决方案。

现场30分钟开发技能——AIUI开放平台

除外部优秀合作伙伴外,AIUI开放平台也设立了展台。众所周知,AIUI是一套人机对话开发平台,全链路能力包括、语音唤醒、识别、语义理解、合成、翻译等。可以被广泛的应用于APP、机器人、智能家居、智能客服等领域。基于讯飞开放平台的生态圈,AIUI开放平台还提供面向各垂直领域的解决方案,助力终端设备快速拥有人机交互能力。

6441

 

现场,AIUI展台还举办了两场现场语音对话技能开发大赛,命题是在30分钟的时间内,完成一款语音技能的开发,并且根据技能的难度、完成度给出分数并评选出前三名。大赛吸引了现场不少通过AIUI进行开发的工程师,选手们在30分钟内都完成了相应技能的开发,并获得了相关礼品。现场的氛围吸引了众多嘉宾驻足观看,参赛的工程师们还分享了身为开发者的乐趣。

一场别开生面的粉丝见面会——AI大学

从1节课到115节课;从专注A.I.基础技术的技术专业课程体系到目前涉及A.I.商业、A.I.创业的6大完整课程体系;从第1位特聘教授到第55位,人工智能商业化专家吴霁虹、讯飞研究院院长胡国平等不同领域的行业大咖聚集在此。这一次的1024,AI大学迎来了一周年庆。

64426443

 

 

我们曾想过无数次一周年的happy ending,有温馨的、有欢笑的、有调皮可爱的,但没有任何一种版本比1024当天中午的更完美更圆满。来自全国各地200多位的同学聚集在【胡郁校长粉丝见面会】现场,他们中有的是胡郁校长万年骨灰级粉丝,有的是进入AI大学后才入坑的萌新……初次相识的同学们因为胡郁校长而变得熟识起来。胡郁校长发表了热情洋溢的讲话,我们也在现场准备了美味的西点,这一刻,我们铭记并且感恩,往后,正如校长所说:“希望我们最终能够一起不忘初心,踏实前行,我们一定能够赢得我们追光者的未来!”

除此之外,还有可以让你在做饭时轻松聊微信的“魔厨”,可以监测血压、血氧的奇智医养手表,一款无线实时AR眼镜……1024现场,各类人工智能产品让大家大开眼界。来自讯飞智能家居、智能硬件、医疗等众多展台纷纷展示A.I.在相关领域的最新应用。还有来自图像识别、公益、大数据、智能营销、智能翻译等多领域的优秀合作伙伴,如极链科技、大坝科技、小牛翻译、SAP、海德瑞丰等更是让生态展区精彩纷呈,加强了大众对A.I.的认知。

6444

 

经脉宝中医辅助诊疗

 

6445开放平台VR体验

针对如此之多的优秀合作伙伴和产品,展区现场还举行了1024你最喜爱的A.I.产品评选活动,在展台参与投票即可获得超级奖品。最终,法眼察科技、追一科技、大坝科技荣膺前三名。下午时分,锦鲤诞生,价值2999元的讯飞翻译机2.0奖品被一位幸运女孩抽中。这场积聚了我们许久努力的追光者之约,带给你的不仅是神奇,更多的,都是惊喜。

 

6446锦鲤大王

今天,9场分论坛继续惊艳绽放,一起解读了A.I.+医疗、客服、家居、车载的更多可能。你可能没机会或错过了这场盛大的1024之约,没关系,全程视频回放送上,点击阅读原文观赏。1024,明年见!

qrcode_for_gh_f97f0eb2c7e8_1280

科大讯飞1024开发者节来袭 震响A.I.强音!

A.I.追光,智缤纷,秉持“开放、合作、生态、共享”的理念,1024开发者节全新起航。

 

2017年,属于开发者的共同节日在合肥滨湖拉开大幕:4300多名“尝鲜者”共襄盛举,见证开发者教引、技术实地行、生态建设和A.I.公益四大计划发布,聆听最新A.I.观点、目睹最炫A.I.应用,更有青春洋溢的A.I.公益音乐节点燃全场。

今年,TA再次如约而至——首届世界声博会暨科大讯飞2018全球1024开发者节全面升级:7500多名A.I.追光者到场、全新《1024计划》发声、10+高质量讲演与论坛、讯飞听见M1等多项全新产品发布、眼前一亮的嘉年华活动。A.I.追光,智缤纷,秉持“开放、合作、生态、共享”的理念,1024开发者节全新起航。

64046405

 

 

上午9点30分,首届世界声博会暨科大讯飞2018全球1024开发者节正式拉开序幕。安徽省政府副省长何树山,工信部信息化和软件服务业司副司长任利华,合肥市委常委、副市长韩丁率先致辞。何树山表示,未来安徽将进一步抢占人工智能发展机遇,打造发展先行区。任利华在发言中表示,工信部下一步将着力为企业解决技术积累、行业应用和产业环境等问题。韩丁介绍道,合肥市目前人工智能企业超过350家,已构建了覆盖完整产业链的世界级产业集群。6406

 

安徽省政府副省长何树山致辞

 6407

工信部信息化和软件服务业司副司长任利华致辞

 

 6408合肥市委常委、副市长韩丁致辞

随后,何树山、任利华、韩丁与安徽省政府副秘书长汪春明、安徽省经信委主任牛弩涛、科大讯飞董事长刘庆峰共同点亮声音光波聚集的灯台,正式开启本次活动。

6409

 

共同点亮声音光波聚集的灯台

听观点,追光在路上

 

刘庆峰:人机耦合是应用落地的关键,合作与坚守热爱不可辜负

作为开发者大聚会的东道主,科大讯飞在A.I.发展、为开发者赋能上有什么最新观点?科大讯飞董事长刘庆峰以《顶天立地,共创未来》为题的演讲,给予现场聆听者最有力的强心之音。

6410

 

技术要顶天,这是万千开发者所要坚守的;而“应用才是硬道理”,可以让更多人了解A.I.能给人类生产、生活带来什么变化。面对万物互联和数据驱动的人工智能时代,讯飞在智能语音、机器翻译、机器阅读理解等方面不断拓新。面对人工智能这样一个伟大的历史进程,刘庆峰强调,正在成为全球共识的人机耦合是把人工智能真正推向应用落地的关键;因为比人类更强大的不是A.I.,而是掌握了A.I.的人类。这些掌握了A.I.的人们只有精诚合作、形成生态,才会让人工智能生生不息。

放眼未来,刘庆峰寄语的关键词是“热爱”与“坚守”。“创新就像在黑暗的泥土中撒下鲜花的种子,我相信,你所清楚预见的、热烈渴望的、真诚追求的,都会自然而然地实现。”

6411

 

 

张来武:六次产业视角下的人工智能

原科技部副部长张来武发表了《六次产业视角下的人工智能》的演讲,从摩尔定律说起、提示大家:想要做人工智能创业,决不能用工业化思维,人工智能也将开辟新经济的主战场。张来武特意提出,科大讯飞可以在智慧医疗领域创造第六产业的新契机,成为世界上第六产业无人区的先驱者

6412

 

大咖观点:开发者、智慧零售、商业地图、智能终端,这些元素如何玩转A.I.?

CSDN创始人蒋涛、苏宁科技集团COO荆伟、人工智能商业化专家吴霁虹、华为消费者BG副总裁杨涛亮相生态讲堂,分别带来精彩一课。A.I.时代,开发者要懂得“算法”为先;A.I.大脑,让智慧零售进一步释能;A.I.地图,构建TOP-A新商业;A.I.赋能,让终端体验更智慧、安全和情感化。

6413

CSDN创始人蒋涛分享

 

6415苏宁科技集团COO荆伟分享

 

6416人工智能商业化专家吴霁虹分享

 

6417华为消费者BG副总裁杨涛分享

圆桌探讨:A.I.怎么能?

A.I.赋能已成为共识,A.I.究竟如何赋能?中国科学技术大学信息学院副院长李厚强、哔哩哔哩副总裁刘曜、美国斯坦福全球创新设计课程联盟联席主席蒋里、讯飞创投董事长徐景明、讯飞医疗信息技术有限公司总经理陶晓东,在A.I.圆桌论坛环节从各自熟悉、实践的行业角度展开探讨。虽然维度不同,但嘉宾们达成共识:只有让技术真正渗透行业,才能在应用中不断迭代优化A.I.能力

6418

 

追光者:一个理工技术男的故事

他是讯飞研究院的副院长,也是被《麻省理工科技评论》评为影响全球35岁以下青年科学家之一的追光者。全球青年科学家魏思在现场分享了自己的A.I.故事,开发者的执着与力量在他身上有了最好的诠释。

6419

 

看发布,技术产品齐“上新”

新《1024计划》发布:教引、生态、公益计划升级2.0版

作为1024开发者节最重磅的环节之一,科大讯飞轮值总裁胡郁发布了全新的《1024计划》。去年的《1024计划》将A.I.与教引、生态、公益结合,经过一年时间,A.I.大学现已拥有24万学员;A.I.生态吸引超过600家开发者团队及企业入驻;A.I.公益的方言保护计划吸引500万人参与,共计收集语音20万条。

6420

 

新的《1024计划》带来A.I.教引计划2.0、A.I.生态计划2.0、A.I.公益计划2.0。通过对教引、生态、公益计划的更迭升级,让更多人通过iFLYOS实现A.I.梦想,让A.I.为公益注入更多正能量。其中,A.I.教引计划2.0将更新职业认证课程,开放200项能力;A.I.生态计划2.0将提供专属服务经理,进阶投资计划;A.I.公益计划2.0将扩大方言保护阵容,提供1000万医疗公益基金

《1024计划》将秉持信念,继续为A.I.开发者、创业者和爱好者提供指导与扶持,用科技的力量推动社会公益事业的发展,与开发者一起构建未来商业生态体系。

6421

 

新品惊艳亮相:讯飞首款转写机器人——讯飞听见M1首发

本次开发者节上,科大讯飞首款转写机器人——讯飞听见M1首发,收获无数目光聚焦。讯飞听见M1转写机器人是一款以专业录音及转文字为核心功能的智能转写机器人,可实现360度无死角的高精度拾音,存储近百小时的语音数据1小时音频5分钟出稿,满足会议、采访、课程培训等多种场景下的录音整理需求,快速提升工作效率。讯飞听见事业部总经理王玮在现场表示,这款新硬件基于讯飞听见不断的技术更新及一万多场的会议服务应用基础,相信一定会成为大家所期待的惊喜。

64226423

 

 

生态新品揭开“面纱”:iFLYOS系统与全链路loT开放平台

除了新《1024计划》,科大讯飞轮值总裁胡郁还向与会嘉宾介绍了科大讯飞打造的云端语音操作系统——iFLYOS,全链路IoT开放平台——iFLYIoT。基于这两大平台,科大讯飞持续以A.I.技术赋能家居、机器人、车载、客服、医疗、营销等各行业,打造加智能的应用场景,实现技术、服务、内容、行业全链条的全贯通。

6424

 

科大讯飞的A.I.生态在过去一年中的发展,目前基于讯飞开放平台所提供的底层技术支持,已有86万开发者打造了超过53万个不同应用。基于此,讯飞希望更进一步触达更多智能设备、搭建应用场景、服务每个用户。A.I.联万物,共创新未来,科大讯飞将坚守用人工智能赋能不同行业的愿景。

6425

 

开发者荣耀时刻:领航时代1024颁奖盛典揭晓

开发者们创造了无数的惊喜和奇迹,专属开发者的嘉奖环节——领航时代1024颁奖盛典在10月24日下午揭晓悬念。“A”爱公益项目参与者们用科技融合善意,优秀的合作伙伴们用胆识攻坚克难、用智慧运筹帷幄。2018首届“顶天立地”iFLYTEK A.I. 开发者大赛(应用赛)总决赛也在今天迎来终极比拼,杨国富、Forever Young团队分别获得方言识别挑战赛总决赛、应用开发A.I.挑战赛总决赛头名。

6426

 

1024嗨不停,“潮·玩”嘉年华

除了技术与产品,1024开发者节还有多个惊喜让你嗨起来!

会场之外,占地约3000平米的生态展区汇聚了超过50家优秀合作伙伴和A.I.企业,打造了集中式、场景式、浸入式的A.I.应用体验展示。图灵机器人、苏宁、咪鼠科技等企业均入驻其中,展示了科大讯飞生态合作伙伴及自身产品服务能力。时空漫游、未来基地等体验区吸引了大量参与者,在亲身体验中收获了知识与乐趣。

642964286427

 

 

 

当晚,罗琦、牛奶与咖啡、安子与九妹、和平饭店等知名艺人献唱A.I.公益音乐节,A.I.天使、方言歌曲与表演给音乐节画上完美句号,本次演出全部所得仍与去年一样用于“三声有幸”公益计划。

6430

 

 

10月25日,1024开发者节九场分论坛还将继续,带你一起解读A.I.+医疗、客服、家居、车载的更多可能。

6405

 

A.I.时代是所有人的时代,在通往未来的路上,我们需要广大开发者和从业者无限的创造和开拓,更需要所有人一起拥抱这个时代。科大讯飞在智能语音与人工智能的路上走过十九年,一直致力于和开发者、合作伙伴们一起用A.I.创造美好生活,1024开发者节将成为A.I.时代的新纽带,我们与你一起,共同创造和期待美好未来!

qrcode_for_gh_f97f0eb2c7e8_1280

科大讯飞全新1024:3大计划,200项A.I.能力,全链路驱动应用场景创新!

10月24日,2018届科大讯飞全球1024开发者节在合肥奥林匹克体育中心综合馆如约举行,重磅发布了全新升级的科大讯飞《1024计划》!

 

10月24日,2018届科大讯飞全球1024开发者节在合肥奥林匹克体育中心综合馆如约举行,重磅发布了全新升级的科大讯飞《1024计划》!

640

 

原中国科学技术部副部长张来武、科大讯飞董事长刘庆峰、科大讯飞轮值总裁胡郁、讯飞听见事业部总经理王玮分别发表主题演讲。

6401

科大讯飞董事长刘庆峰发表主题演讲

科大讯飞轮值总裁胡郁回顾了一年以来《1024计划》的成果,并推出在iFLYOS背景下打造的新一代科大讯飞《1024计划》。

6402

科大讯飞轮值总裁胡郁发布新《1024计划》

回首:24万学员,20万条方言语音

一年前,《1024计划》首次发布,将A.I.与教引、生态、公益结合,为A.I.开发者、创业者和爱好者提供指导与扶持,一起用A.I.的力量推动社会公益事业的发展。

A.I.教引:AI大学拥有24万学员,上线100+线上课程,与55位教授签约,联合北京大学、中国科学技术大学、CSDN、大街网等校企共同培养学生和开发者。

A.I.生态:入驻线下创业平台的开发者团队及企业超过600家;AI生态沙龙连接了360+投资机构和400+创业项目;扶持54个AI钻石团队;推出讯飞AI服务市场。

A.I.公益:方言保护计划吸引500万人参与,10万人上传方言语音,共计收集语音20万条;“三声有幸”项目通过资金、技术、市场、生态方面的扶持,帮助音书科技、心智互动等优秀企业更好地改善残障人士生活;AI教育公益计划通过人工智能产品给40多所农村学校的留守儿童带去了关爱与温暖。

3大计划助力iFLYOS赋能

《1024计划》的一年,也是洞察未来趋势的一年。

我们发现——

1.交互方式从图形交互,触摸交互向基于视觉呈现的语音交互发展;

2.单纯软硬件模式向软硬一体的云+端模式变化;

3.面向最终用户的产品从标准化的大C向多样化的小C发展;

4.A.I.时代参与生态链条的物种向多样化和去寡头化发展;

5.中国特色的计划经济与市场经济的融合;

6.商业生态从中心化走向去中心化。

6403

所以在未来,用户获取信息,获取服务的方式不只是通过单一设备,而是拥有更多的选择。

如何应对新的趋势?我们为开发者和合作伙伴推出了iFLYOS,全链路聚合了语音唤醒、声纹识别、语音识别、语义理解、语音合成等单点能力,连接无处不在的终端,驱动家居、医疗、汽车等场景交互创新。通过科大讯飞在语音领域深耕了20年的技术,使得人与机器之间可以通过自然的语音交互方式,进行持续、双向、自然地沟通。

新的《1024计划》带来A.I.教引计划2.0、A.I.生态计划2.0、A.I.公益计划2.0。通过对教引、生态、公益计划的更迭升级,在iFLYOS框架下,让更多人实现A.I.梦想,让A.I.为公益注入更多正能量。

 

1、职业认证课程,开放200项能力

A.I.教引计划2.0

AI大学——新增付费精品课程
作为优秀的人工智能学习平台,AI大学继续从课程、导师、职业认证等方面进行升级,让所有想加入A.I.浪潮中的人们,以更简单的方式学习A.I.,走近未来。

1)课程建设:

在人工智能核心技术的基础课程上,我们为使用讯飞开放平台能力的用户提供更加丰富的服务接入指引课程,提升平台的易用性和用户体验。

2)导师招募计划:

AI大学将继续扩大师资力量,从业内招募优秀导师,持续更新优质课程内容。

3)职业认证课程规划:

AI大学将和招聘、就业方面的三方机构进行合作,为每一位AI大学的学员提供量身定制的讯飞职业认证系统。

4)知识付费商业化探索:

在AI大学目前的发展进程中,商业化探索是很重要的一步。自研商业化进阶型课程、引入三方付费课程资源已经成为下一阶段的重要目标之一。

一站式开发平台——零学习门槛
如何让A.I.开发者们更方便快捷地使用A.I.能力?我们带来了一站式开发平台,具有全平台可用,零学习门槛,快速集成,业务自定义的特点。让开发者可以轻松使用语音唤醒、语音识别、语音合成等技能。

开放200项A.I.能力
A.I.已无处不在,各行业与A.I.融合发展的需求日益增强。我们将合作更多A.I.技术商,优化核心A.I.能力,将技能开放到200项,为广大A.I.开发者、创业者及爱好者提供更好的支持。

2、专属服务经理,进阶助跑计划

A.I.生态计划2.0

A.I.应用专属服务保障
创建应用-集成开发-交付测试-应用发布-版本更新,一个A.I.应用从诞生到落地,我们为其整个生命周期保驾护航:

1)专属服务经理

一对一支持服务,问题反馈24H内解决,快速响应需求。

2)全渠道响应

电话/工单/邮件/IM/BBS全渠道快速响应客户需求。

3)全业务支持

技术/业务/方案/商务/售后,全链路一站式支持服务。

4)服务保障

7*24运维保障,5星顶级服务集群;后台服务99.99%可用。

服务商优先试用A.I.新技术
我们带来讯飞AI服务市场,作为人工智能全产业链综合服务型市场,服务市场为所有上下游企业连接商机,匹配需求。

明年,AI服务市场将迎来重磅升级:

1)服务商业务升级

对于A.I.的新技术,服务商可以优先试用,占领市场先机,服务商使用讯飞的能力和服务,也可以享受专属的优惠。

2)品牌推广升级

明年我们会启动全国的城市论坛,给我们的服务商与企业客户创造更多的交流机会。

3)服务全面升级

服务市场将针对合作伙伴在人才,资金等各方面需求,提供全方位的专属服务。

三段投资助力合作伙伴从0到1
为了帮助生态链合作伙伴高速成长,我们打造三级助跑计划:

1)一级助跑:品牌势能+种子加速营

用讯飞的品牌势能帮助想要成为讯飞生态链伙伴的人打造自身势能,聚集流量,种子加速营会给种子期企业相应的单点突破创业培训和加速资源。

2)二级助跑:渠道能量+天使加速营

讯飞将用精准渠道帮助生态链企业把流量沉淀在场景里,天使加速营是这一阶段的方法论课程,帮助这些生态链企业更有效的利用讯飞提供的平台资源并转化成自己的场景优势。

3)三级助跑:生态养分+星光加速营

我们设立星光加速营,辅助创业者搭建和完善系统能力以获得利润支撑。

通过三级加速,生态链伙伴将跟讯飞一起,把一颗一颗星星放上A.I.历史的天空。

3、扩大方言保护阵容,千万医疗公益基金

A.I.公益计划2.0

完整复制10种方言
据调查数据显示,全世界现存6000多种语言,它们正以每两周消亡一种的速度在减少。

方言保护计划对中国方言进行一次全国范围内的收集和补全,动员全民参与,建立中国方言文库,提高民众对方言的关注度。借助人工智能技术为民众提供更好的方言使用环境。

在2018届全球1024开发者节上,我们将进一步升级方言保护计划,主要包括完整复制10种方言、赋能24省方言保护,招募方言保护计划成员这三项重要内容。

对于在大时代漂泊游走的我们,方言是家乡最深刻的印记,用A.I.留住我们的乡音,便是留住我们对家乡永不熄灭的思念与热爱。

1000万医疗公益基金
AI医疗公益计划首期将投入公益基金1000万,通过提供医疗服务、便民看诊等帮扶行动,让欠发达地区人民享受到高质量、高水平的医疗资源。

与开发者一起追逐A.I.时代光芒

未来我们将继续以智能人机交互为基础,以去中心化商业体系为框架,深度影响人们的生活方式。

在引导人类前进的道路上,人工智能是非常清晰的方向,也是光芒所在。《1024计划》只是一个开始,我们将和所有开发者一起,以光一般的速度去更好地服务社会,实现自我价值。

为什么让A.I.“顶天立地”需要6个多月?

A.I.面向所有人,也应该服务于所有人。只有这样才能真正实现“顶天立地”。

在A.I.的发展中,专注技术or专注应用?

这从来不是一道选择题。

“技术顶天,应用落地,希望全社会的开发者可以和我们一起开放创新、共建A.I.生态。”——2018年3月22日,在科大讯飞主办的「AI大学·未来课栈@上海栈」,科大讯飞研究院院长胡国平如是说。

640

胡国平院长

同时,他还宣布:首届“顶天立地”iFLYTEK AI开发者大赛正式启动。

6401

 

如今,这场汇聚产学研各界力量,面向全球人工智能开发者发起挑战的盛事已进入决赛阶段,在过去的6个月中,赛事的进展可以说热闹非凡——

1万余名世界各地的开发者参加

全球3千多支团队提交参赛作品

走入3个城市:上海、香港、北京

而在以上现象的背后,是科大讯飞通过iFLYTEK AI开发者大赛,践行“技术顶天,应用落地”所倾注的努力。

1、启动两大赛题,技术、应用都有用武之地

人工智能几十年的发展历史中,「技术和产品」一直都是最重要的2个发展方向。

科大讯飞在本届iFLYTEK AI开发者大赛中,创意性地设置了方言种类识别AI挑战赛以及应用开发AI挑战赛,让致力于利用人工智能技术去落地A.I.产品,或者利用已有积累来优化某项A.I.能力的开发者都有机会展示自己的想法。

6402

方言种类识别AI挑战赛

任务为汉语方言语言种类识别,即根据给定语音,判断该语音属于哪个方言。结果评价指标为分类正确率:即分类正确的语音条数/所有语音条数。

科大讯飞全球首次开放覆盖中国六大方言区,总时长约 60 小时的 10 种汉语方言语音数据集,供参加竞赛的科研单位以及开发者免费使用。

详细介绍

应用开发AI挑战赛

讯飞开放平台开放了AIUI人机对话交互、语音识别、合成、评测、图像识别等多项人工智能技术。聚焦人机交互这一核心技术,邀请广大开发者基于讯飞开放平台开放的人工智能技术,开发一款以人机交互为核心的智能产品(形式不限,APP、机器人、可穿戴设备等)。

所有作品从创新性、实用性、A.I.能力结合度、产品商业前景进行评审

详细介绍

2、为选手开放核心技术与数据

本届iFLYTEK AI开发者大赛集合了讯飞研究院、讯飞开放平台、AI大学的优质资源,面向全球首次开放中文方言语音数据集,开放AIUI人机对话交互、语音听写、合成、评测、翻译、人脸识别、声纹识别等近百项人工智能核心技术。让每一位选手都可以用前沿的技术,实现自己的A.I.项目。

正如科大讯飞副总裁于继栋在本届大赛半决赛阶段的一次赛场致辞所说的:“未来3到5年,是人工智能关键格局定义的窗口期。也是我们广大人工智能创业者发展和进步的好时机。我们将秉持“开放”的心态,一起创新、推动人工智能成果转化,让人工智能真正走到我们身边。”

6403

 

科大讯飞副总裁于继栋

3、坚持A.I.推动公益,赋能各行业

A.I.面向所有人,也应该服务于所有人。只有这样才能真正实现“顶天立地”。这也是科大讯飞在本届AI开发者大赛时的赛题设置以及作品评审时所重视的。

支持方言保护公益

联合国教科文组织统计,世界范围内,每两周就有一种语言消失。

方言是中国地域文化的载体,方言背后,蕴含着文化多样性的精髓,保护方言即捍卫文明,刻不容缓。

在2017年,科大讯飞发起“方言保护计划”,而本届AI开发者大赛的方言种类识别AI挑战赛正是基于保护计划,让广大人工智能开发者共同推进关于方言的算法研究和保护传承。

支持各领域A.I.融合可能

应用落地,不只是某个定向的领域。万物互联的愿景,需要AI赋能可以融入的一切。

应用开发AI挑战赛中,场景+A.I.应用,是诸多作品的核心,无论是上千份作品海选的初赛,还是在上海、香港和北京的32支团队角逐的半决赛,评委们在满足创新性、实用性、A.I.能力结合度、商业前景的前提下,选出与不同领域融合的A.I.创意。力求让人们看到更多领域的人工智能创新成果转化。

6404

 

上海站晋级团队,查看详情

 

6405香港站晋级团队,查看详情

 

6406北京站晋级团队,查看详情

4、为选手蓄能助力

基于AI大学人才培养体系,大赛为所有开发者提供全链路培训和辅导,致力于培养AI专业人才,构建AI产业人才生态。

同时,对入选决赛的团队,科大讯飞组织其来公司参与培训,由专业导师给予指导。

6407

 

决赛选手参观科大讯飞公司展厅

 

6408决赛选手接受专家指导

5、10月24日,“顶天立地”终极角逐

目前,应用开发AI挑战赛的9支团队,方言种类识别AI挑战赛的8支团队进入总决赛。

而等待他们的最终舞台,是将于10月24日-25日,在安徽合肥举行的2018届科大讯飞全球1024开发者节。

6409

 

计算机世界中,1024是2的十次方,是二进制计数的基本计量单位之一,是1KB的字节数,由此组成了程序中最基础的基因序列。

每年的10月24日,“1024”已经成为程序员们共有的文化节日,而科大讯飞则将这个节日固定下来,为全球A.I.开发者及相关生态链创业者、爱好者带来人工智能领域的前沿干货。

了解更多,戳文章:1024 | 这场一年一会的A.I.盛宴,我们想为你照亮未来的模样

 

6410“技术顶天,应用立地”的愿景将如何实现,“顶天立地”的荣誉又将属于谁,都将在本届科大讯飞全球1024开发者节揭晓。

专属福利

点击http://1024.iflytek.com/h5/login?type=vip

即可免费购全球1024开发者节嘉宾票

更多票务问题,

可咨询AI小助手微信号:iFLYTEKAI

1024 | 这场一年一会的AI盛宴,我们想为你照亮未来的模样

国内知名的AI开发者生态大会——科大讯飞全球1024开发者节,期待你的参加!

一个特别的日子:10月24日

一个特有的文化符号:1024

带来一段关于AI的未来预言

10月24日-25日,合肥

“AI追光,智缤纷”

国内知名的AI开发者生态大会

科大讯飞全球1024开发者节

期待你的参加!

每年的10月24日,“1024”已经成为程序员们共有的文化节日,而科大讯飞则将这个节日固定下来,为全球AI开发者及相关生态链创业者、爱好者带来人工智能领域的前沿干货。

如果你是第一次知道1024开发者节,正在犹豫是否参加的话,本文将消除你的疑惑。

640

 

首先,我们为你展示改变世界的可能

1、理念篇

关键词:领军人物

AI商业化专家吴霁虹、斯坦福大学教授蒋里、科大讯飞董事长刘庆峰、AI大学校长胡郁、讯飞华南公司总裁杜兰、智慧医疗专家陶晓东、科讯投资部总裁徐景明、MIT35岁以下科技创新青年魏思等AI领袖齐聚本次科大讯飞全球1024开发者节,你将能够与AI大咖们面对面。

关键词:AI、行业、风口

当下,AI与各行业的融合每天都在发生,AI将对我们的生活方式产生了哪些改变?如何在AI+行业的环境下寻找机遇?围绕10多个AI+行业场景,本届1024开发者节将在10月25日举行深度分论坛。业界知名的资深大咖将与大家分享AI时代的见解。

AI+金融无论你是金融工作的从业者,还是关心金融领域的普通人,都不能忽视人工智能将对金融科技带来的巨变。我们将在AI+金融分论坛邀请银行、保险、证券、基金、互联网金融、科技等相关企业领导负责人和金融科技专家、学者出席。探讨金融科技所面临的机遇与挑战。AI+客服你是否想过,在日常生活中当你打电话咨询电话套餐、查询银行业务等时,话筒另一端提供语音服务的是人工智能呢?在AI+客服论坛,你对于AI如何提供客服,如何保证更好体验,以及如何获取和剖析数据等问题都将得到解答。AI+机器人

机器人应用逐渐落实到各个细分领域,智能家居,儿童教育,物流送货等等领域,其发展情况如何?行业痛点在哪?在AI+机器人分论坛上,行业专家,优秀企业共聚一堂,共同探讨产业落地,行业前沿应用。

AI+城市

在AI+城市分论坛,将重点介绍人工智能小镇,构建以人工智能为核心的完整产业链条,形成“AI+”的产业生态簇群,体现规模效应与集聚效应,并结合产业资源优势,落地重点产业。

AI+营销

AI+营销分论坛上,行业大咖将从探讨软硬件、平台和算法等人工智能领域的最新洞见,带来AI营销赋能主题演讲;同时将启动讯飞AI营销云流量生态联盟赋能计划,进行2018科大讯飞AI营销算法大赛颁奖。

AI+医疗

智能问诊、语音电子病历、医疗影像分析……AI将如何赋能医疗行业?改变我们的就医习惯?想紧跟未来的医疗行业趋势,就来AI+医疗分论坛。我们将发布讯飞医疗人工智能辅助诊疗平台,邀请合作伙伴共同展示智慧医疗平台生态战略。

更多分论坛,等你现场探索……

2、技术篇

关键词:前沿无处不在

智能穿戴、身份认证、AI大数据、智能识别……领先的人工智能技术在你进入会场后就如影随形,小到工作人员给你的小礼物,大到你身边的任何一件设备,可能都暗藏玄机。

关键词:1000+黑科技

科大讯飞集结自己的生态合作伙伴,展示超过50个展位的前沿AI落地产品和服务。覆盖企业服务、图像识别、健康医疗、公益、大数据、智能家居、机器人、智能营销、智能招聘……

AIUI、讯飞医疗、AI大学、智慧城市……科大讯飞各产品、平台、事业群将带来最新成果,从大型电信级应用到小型嵌入式应用;从手机到车载;从家电到玩具,你将体验能够满足不同应用环境的各种惊喜。

不仅如此,你还可以为黑科技打分,我们还准备了“评选你最喜爱的AI产品”线上活动,超值福利等你来赢取哦!

同时,我们赋予你向未来冲刺的能量

3、赋能篇

关键词:1024计划

2017届全球1024开发者节,我们推出“1024计划”,从“AI教引”、“AI生态”、“AI公益”三个方面,为开发者的事业提供辅导支持,为公益事业贡献AI的力量。

回顾:重磅 | 科大讯飞发布《1024计划》,AI点亮全球

今年开发者节,我们带来赋能规模更大,扶持力度更强的全新“1024计划”,如果你想为自己的AI梦想注入能量,一定要来到10月24日的现场。

关键词:“智汇世界,声动未来”

2018年,科大讯飞全球1024开发者节,我们将联合“智汇世界,声动未来”首届世界声博会共同举办。进一步推动安徽智能语音及人工智能产业发展,将“中国声谷”打造成全国智能语音领域产业发展高地。

首届世界声博会暨科大讯飞2018全球1024开发者节活动由部省共同推进安徽智能语音产业发展领导小组办公室指导,中国语音产业联盟、中国智能写作产业联盟主办;科大讯飞股份有限公司、安徽省信息产业投资控股有限公司等承办。汇聚智能语音及人工智能行业的最具影响力的专家、学者与企业,展示技术发展与创新创业的成果。

4、扶持篇

关键词:实力派,PK

科大讯飞2018年面向全球正式发起首届“顶天立地”iFLYTEK AI开发者大赛。历时4个月,大赛吸引了1万余名世界各地的优秀开发者踊跃参加,共计收到全球3千多支团队提交的参赛作品。经过层层考验,应用开发AI挑战赛的9支团队,方言种类识别AI挑战赛的8支团队进入总决赛。

1024开发者节当天,在iFLYTEK AI开发者大赛的决赛现场,你不仅可以观看拥有各自领域顶尖实力的大牛们各显神通,还将抢先一步了解科大讯飞对AI开发者们的最新扶持与赋能策略,发现机遇!

关键词:公益明星,献声AI

AI面向所有人,也应该服务于所有人。2017届科大讯飞全球1024开发者节发布了「三声有幸」AI 公益计划,把人工智能和公益相结合,用AI改善公益慈善活动的实施过程和效果。

2018届科大讯飞全球1024开发者节,将继续支持「三声有幸」计划,举办AI公益音乐节,盛邀罗琦、牛奶咖啡、安子与九妹、张晓钰、和平饭店作为公益音乐人亲临,为AI献声!以歌声传达鼓舞人心的力量,用音乐唤醒人们对公益的认知。另外,现场还将有“公益天使”带来的意外惊喜!

多样的世界,需要多样的声音。音乐节还将带来“方言表演秀”——用不同方言所演唱的歌曲串烧节目,以此支持科大讯飞“方言保护计划”,提高民众对方言的关注度和兴趣,体现科大讯飞将借助人工智能技术为民众提供更好的方言使用条件的愿景!

注:本次AI公益音乐节所有门票收入将全部用于讯飞“三声有幸”公益计划。

购票通道现已正式开启!

2018届全球1024开发者节官网已正式上线,票务系统已正式启动,开启贵宾票、嘉宾票、学生票、音乐节票,为你提供丰富选择。

点击此处http://1024.iflytek.com/?ch=kdxf即刻进入购票!

641想了解更多关于票务及优惠方面的信息,可添加AI小助手微信号:iFLYTEKAI,或扫描下方二维码关注【1024开发者节】642

最惊喜 | 千呼万唤的胡郁校长粉丝见面会终终终于来了!

我们悄悄做了个大决定,要圆了大家一直以来想见胡郁校长的梦想!

最美好的陪伴

莫过于你护我童年,我伴你晚年

对于咱们AI大学的胡郁校长来说

最美好的陪伴大概是

叮嘱我们上课,催我们交作业

胡郁校长,科大讯飞执行总裁

中国科学技术大学博士

曾荣获“2017中国科学年度新闻人物”

640

从2017年10月24日起,近1年的时光,300多个日日夜夜,8000多个小时,AI大学从1节课到100节课,再到现在的近200节课——

胡郁校长也从1个学员的校长

变成现在几十万学员的校长

64001

回忆经不起细数

还记得大家刚入学的时候

胡郁校长亲自录了一段欢迎视频给大家

他希望我们在学习AI知识的同时

也能去践行AI的理念,传播AI的价值

👉AI大学校长胡郁欢迎各位新生入学

在未来课栈@北京栈的时候

胡郁校长动情说到:

“基于AI大学

我想最重要的是每个人

都能做出自己一点点的贡献

只有当越来越多的人

愿意做出这种贡献

这种贡献的洪流就会成为

我们这个时代的声音”

2018年农历新年伊始

胡郁校长接受了新华社媒体的采访

他称人工智能教育是“新时代的识字运动”

学习AI,走近未来

从来都不只是挂在嘴边的口号

而是我们一直秉持的信念

让更多人在人工智能时代

用所学到的AI知识

去实现自己追求的梦想

6405

因为这一年走来不容易

也因为这一年有了大家的陪伴

而让时光沾染了幸福的味道

在AI大学正式对外发布一周年的日子

也就是2018年全球1024开发者节当天

我们悄悄做了个大决定

要圆了大家一直以来想见胡郁校长的梦想!

6402

所以

AI大学校长粉丝见面会来啦!

AI大学校长粉丝见面会来啦!

AI大学校长粉丝见面会来啦!

这一次见面,胡郁校长要霸气承包

大家所有的惊喜

6406

粉丝见面会惊喜合辑

惊喜一:价值1024元的1024开发者节门票免费送

凡是最终参加AI大学校长粉丝见面会的同学

都能免费获得2018年全球1024开发者节门票

参加当天的科技盛宴

与近百位AI大咖面对面交流

0

点此处查看1024开发者节更多精彩信息

惊喜二:N多款精美伴手礼

AI大学限量版学习礼包,超精致笔记本+超实用限量笔

妈妈再也不用担心我记笔记啦

6408

定制款帆布袋,超超超超级抢手!

6409

除此之外,现场还将有人工智能热门书籍

可爱的小飞飞U盘等众多神秘好礼~

惊喜三: 玩到停不下来的【奇幻寻宝】游戏

想和胡郁校长玩一把超有梗的寻宝游戏吗?

想在有限的空间里寻找出无限的宝贝吗?

如果想

那就来吧

烧脑与有趣并存的寻宝游戏

等你来!

64011

粉丝见面会参与方式

扫描下方二维码

填写相关信息

填写得越仔细,被选中的概率越大哦~

👇👇👇

64012

报名成功的同学后续会有专人与大家联系

其它事宜

粉丝见面会时间:2018年10月24日

粉丝见面会地点:安徽省合肥市奥林匹克体育中心

Ps:到时候凭1024开发者节票入场

不接受“空降”~

6401

感谢大家这一年的陪伴

也愿之后的2周年、3周年、N周年

都有大家的陪伴

2018-10-24 ~ 2018-10-25安徽省合肥市奥林匹克体育中心
AI+房地产,人工智能这样帮你省钱! | 1024追光者

人工智能时代,猎居科技运用以大数据为基础的人工智能技术,正在房地产智能营销领域做着探索与实践。

喂,您好,这里有临街旺铺出售……
喂,您好,这里有地铁口精装公寓在售……

 

这样的电话你是不是经常接到。特别是在你去过某个售楼处的之后,售房的电话将会接二连三的“轰炸”你。也许你真的有这方面的需求,但电话销售给你的推荐的信息和你想要的并不匹配,只会让人产生反感。

640

 

在这样的环节中暴露出现在房地产销售中的两个突出问题:

  • 第一、依靠人力获客,人力投入成本大;
  • 第二、用户匹配度底,成单率不高。

人工智能时代,这样的销售方式似乎有些落伍了。针对这样的行业痛点,猎居科技运用以大数据为基础的人工智能技术,正在房地产智能营销领域做着探索与实践。

AI+房地产会擦出怎样的火花

猎居科技CEO 王哲告诉你

↓ ↓ ↓

猎居科技CEO王哲专访_腾讯视频 

AI渗透房地产

 房地产经历了“房地产+互联网”、“房地产+移动互联”、“房地产+电商”、“房地产+金融”的不同阶段,在不同的阶段房地产行业的趋势走势是不同的。包括技术层面同样发生变化。猎居科技CEO王哲认为,AI的技术程度越来越高、开放程度也越来越高,接下来AI将在各个行业进行深度的运用。房地产这个场景对人工智能有着很强的应用需求等待着挖掘。房地产+AI已经具备了成熟的条件。

6401

去年,全球房地产服务上市公司高力国际发布《人工智能对房地产业的影响》的报告,报告指出,人工智能的发展对工业、酒店业、零售业、房地产业的影响最大,未来20年,包括房产中介在内的多个职业将有可能会被人工智能取代。

对中介来说,在客户服务以及客户资源开拓过程中,遇到最困难、最复杂的事情就是意向客户的筛选。即便拥有大量的用户注册数据,但是其中却不乏有用户是虚假注册,而置业顾问初期无法判断哪些是有意向、真实的需求客户,因此需要不断的进行信息回访确认。

6402

传统的房地产营销更多的是依靠人力的推销。大量的无效资源、未接号码,不但浪费了时间和精力,没有针对性的重复工作,也大大降低了工作效率。传统的房地产营销在人工智能时代将被改变!

提高营销效率是王道

 目前,房地产行业整个一级市场的资金比较短缺,土地和人力的成本不断上升,开发商对资金的利用率要求也就相应的提高。同时在调控政策下,房企去化日趋困难。也许房企自身存在推广投放不精准、花钱换不来流量和转化、效果难以有效衡量,以及购房客日趋理性等原因,导致销售困难。这样的背景下,只有提高速度与效率才能提高开发商的周转率与资金利用率。

6403

猎居科技,定位为“房地产+AI“智销服务商。基于智能技术整合,以”效率提升“为核心,为开发商提供高效的AI智销解决方案。通过对合作项目典型客户样本分析,基于猎居AIMS智销管理系统进行算法、模型匹配,并进行AI智能筛客,输出至开发商营销团队后续跟进、转化。

6404

通过猎居科技的Databank中的数据标签匹配,寻找到和房产项目最匹配的客户。这样的精准度提高,后期转化的效率也会进一步提升。在采访中,王哲提到山东一个面向全国的房地产项目,原有渠道相对狭窄,营销方式偏本地化,销售的效果不理想。而通过接入猎居的数据和算法后,在一个月内达到了开发商原有一年的销售额。

6405

通过我们算法和智能匹配,降低了房企在营销方面的投入,提高了营销的效率。这对房企和购房者是双赢,王哲这样说道。购房者能够获得更符合自身需求的项目推荐,同时由于房地产企业营销费用的降低,购房者在购房价格上也能享受到一些程度的优惠。

如果说传统的营销获客方式是大海捞针,那么在人工智能的加持下,房企的营销更像是精准吸引。

 

创新不易,不断突破

 猎居科技的创始团队均来自于房多多、房天下、安居客等行业优秀公司高管,专注于房地产营销领域多年。在这个过程中,他们希望做一些真正对行业有价值的事情。所以在2017年,王哲及其团队舍弃了原有的业务,走访各种房地产企业后,决定进行AI+房地产的尝试。

6406

(猎居CEO 王哲)

与一些AI创业团队不同,王哲及其团队更偏地产类而不是技术研发类。落地的时候遇到大量的技术壁垒,同时产品方面也不断的调整优化。这样的考验,对团队的学习能力提出很高的要求。王哲形容自己的团队就像一个钢丝,解决问题的时候很high,遇到一些问题也会很down,就像一个钢丝一样被拧来拧去。

庆幸地是,这一路走来,王哲及猎居都有所收获。今年,猎居科技得到了“科大讯飞”战略入股,并在” 房地产+人工智能” 领域进行更多探索。

6407

你可能还想看

麦克风 | 面对台风,『人工智能』能做什么?

壹周大事件 |  iPhone 贵出新纪录 ,国产机更稳了!

1024追光者 | 『深思考』打造人工智能机器大脑,让AI更懂你!

6408

关注我们,一起变酷

超过80%语音开发者的共同选择