听说,你每周都要“吃”掉一张信用卡?

生活在塑料时代,A.I.都急了!

我们生活的这颗蓝色星球正在逐渐变成白色

让地球变色的,是无数包裹着它的塑料垃圾

继上海市绿化市容局发布了《生活垃圾分类投放指南》,开始国内垃圾分类「最严执法」后,北京也推硬招,试点生活垃圾“不分类则不收运”机制。

全国推行垃圾分类已经进入了倒计时,前段时间还在对上海人民“哈哈哈哈哈哈”的网友们一个也别想跑。

002

但实际上,从 2010 年导演王久良拍出震惊世界的《垃圾围城》,到2017 年底中国开始禁止洋垃圾入境,再到如今各城进入强制垃圾分类时代。

我们所需要面对的垃圾战争,才刚刚开始。

00222

 王久良纪录片《垃圾围城》,黄色标记为北京周边的垃圾场

每周,我们都要“吃掉”一张信用卡

已打响的垃圾战争中,难以降解的塑料废弃物作为水体、土壤和海洋的主要污染源,是垃圾处理领域的头号大敌

目前的污染已经达到了什么程度呢?

过去二十年间,世界上产出的塑料比其他材料加起来更多;同时,人类产生的废弃物超过 75%都是塑料

2019年5月,一组探险团队在马里亚纳海沟潜水至10927米处,打破深潜最深记录的同时,也在海沟的底部发现了一个塑料垃圾。

2

这意味着什么?

澳大利亚纽卡斯尔大学的研究给出了直观的数据——全球范围内,人们每周摄入的塑料达到 5 克,相当于一张信用卡

3

我们,就是塑料漂流的终点站

日常生活废弃物中的塑料在自然界中,会逐渐被分解成粒径小于5mm的塑料颗粒。这些微塑料会进入河流和海洋,被贻贝、浮游动物等低端食物链生物吃掉。

由于微塑料不能被消化,它们会在贝类、浮游动物的胃里一直存在。当食物链中端的鱼类、鸟类吃掉这些动物时,也会将它们体内无法消化的微塑料吃掉,并继续留在体内。

人类作为食物链顶端的存在,也是塑料漂流的终点站

889

 进入陆地和海洋的微塑料,最终会回到我们的餐桌

“塑料不仅污染了我们的河流和海洋,杀死了水中的生物,也进入了我们所有人的体内。”世界自然基金会国际组织总干事马克·兰伯蒂尼说。

美国领先的调查机构Grand View Research预测,到 2025 年,每 3 吨鱼类将平均含有 1 吨塑料

也就是说,未来你吃的生鱼片,可能会变成塑料片

002222_meitu_1

用无人机与AI算法绘制垃圾地图

六月底的 G20 的峰会上,参会各国在宣言中达成「蓝色海洋愿景」,承诺在 2050 年前实现海洋塑料垃圾的「零排放」。

只有意识和决心还远远不够。英国伦敦的一个团队 Plastic Tide,正在使用人工智能技术来解决塑料污染这个复杂的问题。他们选择先从大太平洋垃圾填埋场(GPGP)下手。

大太平洋垃圾填埋场,是世界海洋中五个海上塑料聚集区中最大的一个。

98

 美国纪录片《塑料天堂:大太平洋垃圾带》

据估计,每年有 115 万-241 万吨塑料进入大太平洋垃圾填埋场。它不是垃圾岛,而是一整片漂流在海洋中的塑胶碎片及微粒,面积达 160 万平方公里,与中国面积最大的省份新疆相当。如果单纯依靠人力捕捞,至少需要 7 万 9 千年。

Plastic Tide一直试图利用现代技术衡量海洋垃圾的规模。

他们使用无人机安装相机,拍摄数以千计的航拍照片,然后用这些照片训练 AI 算法识别塑料垃圾并加以区分。

11

 机器学习分析海洋塑料垃圾

项目最终做出一个开源地图,地图上准确标记出了污染最严重的海岸线。

「借助地图,我们可以了解人类、海洋生物和鸟类生活受影响最严重的地区,环保企业可以把注意力集中在最需要的地方。」Plastic Tide的董事Peter Kohler 如是说。

A.I.+垃圾分类也有新招

回到我们的日常生活中,让广大市民头疼的垃圾分类难点,主要就在于归类

比如教你怎么处理一杯没喝完的奶茶,要分四步走:

8766_meitu_1

 好的,我不喝

夏日宵夜必备小龙虾更是把不少网友搞得晕头转向:整只小龙虾是湿垃圾,去黄龙虾头就是干垃圾?龙虾肉、龙虾黄是湿垃圾,龙虾壳又是干垃圾?

不不不,官方已经辟谣了:小龙虾,龙虾壳,龙虾头,龙虾黄,龙虾肉都属于湿垃圾

875

到底如何正确进行垃圾分类?最稳妥的办法就是通过计算机视觉来实现智能投递

目前已经有小区安装了智能回收垃圾站,只需要在垃圾桶前扫描一下,就能自动识别居民投递物的类型,并提示具体的分类。

除此之外,在垃圾分类的后端处理区,A.I.也能助把力。

传统垃圾分拣的工作是由人类来完成的,肮脏、枯燥,而且危险,常常会接触到有害物品,比如针管、碎玻璃等等,也被称为美国最危险的职业之一。

8888

而北美纸箱包装委员会选择用A.I.进行边缘算力、终端芯片、云端处理的综合联动。他们与阿尔卑斯废物循环利用、AMP 机器人这两家公司合作,在旗下的工厂中安装了AMP公司的Cortex分类机器人

Cortex机器人配备了像蜘蛛一样的机械臂,系统中集成了一颗摄像头,可以利用摄像机向电脑传递影像信息,经过训练的机器学习算法识别出传送带上的垃圾,再对其进行分拣。不仅提高了效率,也降低了健康风险。

告别塑料时代:零浪费、零包装

日前,凯度咨询最新发布《从全球到中国——2019零售趋势洞察》。其中,建立可持续零售模式正是全球市场线下零售趋势之一。

可持续性问题正日益影响着零售业的发展。公司可采用多种不同形式,包括供应链管理、可持续性采购、减少包装和浪费等,推进可持续发展计划。

211

中国也正走在可持续性发展道路上。

212

因为海洋的存在,地球被称为蓝色星球。但塑料垃圾的泛滥,正在让地球变成一个白色星球。

人工智能技术的力量能够加速垃圾清理事业的进度,减少我们对环境造成的伤害。

但想告别塑料时代,就要从源头开始,减少产生塑料垃圾。

别让我们的未来,诞生在垃圾堆里。

00

研究所二维码

想买的东西总是没货?可能是谷歌A.I.在搞事

A.I.比卖家更懂买家。

放在购物车里的东西又双叒叕没货了。

小到饮料衣物,大到数码家具,每天都有人在网上买买买

手机一键下单、同城当天送达、七天无理由退换货……有赖于我国电商的发达,买对于我们来说就是分分钟的事。

连明星都拒绝不了网购的快乐。

30

理性购物蔡依林:眼睛酸了就不买了

国家邮政局6月中国快递发展指数也显示,我国6月快递业务量达53亿件,相当于日本2017年全年业务量。

22

大量调查指出,与实体店购物相比,客户更喜欢网上购物的便利性。

但买东西多了,退货也多。各种原因的退货在「7 天无理由退换」规则中,是商家难以避免的问题。据估计,有三分之一的电子商务要面对退换货的问题。

 

Google想做点什么

Google 和印度电子商务公司 Myntra Designs 研究人员尝试解决退货这一难点。

他们使用了一个机器学习模型,对购物者的偏好、体型、产品浏览记录等数据进行训练,设法在客户购买商品之前预测每个顾客的退货概率

之后,他们在Arxiv.org 上发表的一篇新论文中提到,零售行业一直试图预测回报率,但从未通过“实时预测购物车页面,以便可以根据回报概率值采取先发制人的行动”。

212

研究人员对Myntra平台进行了分析,该平台大约有600,000种商品,每周促成数百万份订单。他们发现,在所有产生的退货订单中,当客户购物车中存在与之类似的商品时,会有4%的概率退货。

11

例如网购衣物,人们可能会把支持退货的网购平台当做虚拟更衣室,将几种类似的商品加入购物车,购买后在家中试用,并退回他们不喜欢的那些。

32

某女子网购18件衣服 穿去旅游拍照后退回

 

A.I.比卖家更懂买家

为了进行退货预测A.I.模型的实时预测,研究人员整理了一个“完全连接”的新型深度神经网络

这种网络受到关于产品和客户的众多因素的培训,主要涵盖产品、购物车和用户级功能,包括(但不限于)品牌、产品新旧、购物车内商品数、订单日期和时间、交付城市、订单数、付款方式和购买频率。

然后,研究人员使用了基于 skip-gram 的模型创建了用户的分级向量。再使用这些向量的工程特性提出了一种混合双模型的方法。这样一来,经过训练的A.I.模型将生成客户购物车的即时评估,可以在顾客下单前预测其退货可能性。

44

那模型表现如何呢?首先了解一下用于二分类模型的评价的 AUC 值,它是衡量学习器优劣的一种性能指标。

在实验中,表现最佳的退货预测A.I.系统在观测者操作特性曲线下的AUC值达到了83.2%,精度达到74%

而在对100,000名用户进行的实时测试中,与对照组相比,订单数略微下降,这也是针对退货概率不同的客户采取不同措施的可预见结果。但值得肯定的是,采用A.I.退货预测之后的测试组,退货率下降了3%

她

各模型 ROC 曲线比较,深度神经网络达到曲线下面积最大

 

卖家能做点什么

整个模型的A.I.预测是实时发生的,这也意味电子零售商随时可以根据用户过高的退货概率采取措施。这其中包括:

· 调整运费,拒绝包邮。

· 给用户优惠券以限制退货。

· 更改付款方式,比如货到付款。

· 手动操作,显示产品缺货以阻止下单。

除了恶意退货导致的退货率过高,退货的另一大原因就是尺码不合适。针对这种情况,电子零售商应该学会分析数据,把货物的尺码标准同市面上通用的信息做比对,制订合适的尺寸,以此给出恰当的建议,并在顾客下单后给予一定的售后服务,减少顾客因尺码不合适等原因造成的退货。

退货已经吞噬了电子零售商的大部分利润。而现在,行业正试图解决这个问题。

「7 天无理由退换」规则在保障消费者权益、优化网购体验方面功不可没,而身为消费者的我们也应该遵循网购规则,下单前谨慎考虑,理智剁手,开心买买买~

88

研究所二维码

讯飞大数据 | 进阶的小镇青年

小镇青年图鉴

“小镇放不下梦想,城市容不了灵魂”

作为年轻群体的一股力量

小镇青年近年来时常被“cue”

刻板印象之外

你是否了解变化中的小镇青年?

 讯飞大数据为你解读 

1

2

3

4

5

数据来源:讯飞iScope大数据平台

基于人工智能技术与大数据平台,科大讯飞正在逐步实现A.I.与各产业的深度结合,不断创新产品,探索商业模式,革新行业生态。

面对万物互联时代的全新营销需求,在A.I.+营销领域,讯飞A.I.营销云基于海量数据沉淀,打造出了iScope大数据平台。

讯飞iScope大数据平台通过对用户的深度洞察实现跨场景下的智能识客,还能通过深度学习和数据建模,对消费者价值进行预判,使得原有的数据平台工具,在一定程度上能做到数据顾问的水平,为营销活动提供决策指导。

 今日互动 

如果可以选择

你是想当城市青年还是小镇青年?

留言区见

研究所二维码

学霸怎么养成?2个月,稳得很!

暑假特别课程来啦~

正在暑假已经开始好几天啦~小伙伴们是不是又在家看电视打游戏放飞自我啦?

1

为了让小伙伴们在开心玩玩玩之余,也能开心地学学学,班主任从221节课程中挑选了17节「暑期特别课程」,这组系列课程中既有人工智能基础理论知识学习,也有大数据实践课程,还有大热的区块链相关课程,是2019年暑期AI大学最不可错过系列课程之一。

希望这套课程能够帮助更多的同学在2019年下半年的学业天天都有好成绩!

 

  这么多相似的名词怎么办?

人工智能理论知识课程帮你搞定

每一位入门人工智能的同学,几乎都被一些名词绕晕过,比如最常见的关系三联:

人工智能和深度学习是什么关系?

深度学习和机器学习是什么关系?

机器学习和人工智能又是什么关系?

2

关系三联图谱

好不容易理清了这3者的关系,同学们又会发现相当多“长得”极为相似的概念名词:RNN、CNN、DNN。

它们又是啥关系?

这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。

这些零碎又重要的知识点需要同学们花精力去学习人工智能理论知识,班主任根据人工智能热门知识点,为同学们选择了下列系统课程,希望同学们在这个暑假能够诸多收获~

这套系列课程,共有6节核心课程:

  • 从人工智能到开放知识图谱

  • 基于深度学习的计算机视觉

  • 神经网络常用学习算法介绍

  • 语义理解与机器学习

  • 元学习:深度学习的自我修炼

  • 数据科学“内战”:统计vs机器学习

4

 

  学会了名词之后呢?

人工智能实践课程了解一下

纸上得来终觉浅,绝知此事要躬行。

了解人工智能相关的理论知识,只是开始人工智能学习之路的第一步,这一步走完之后,同学们将迎来更加重要的一步,可以说也是人工智能学习最为核心的一步——实践。

我们所学到的所有知识,如果不能在实践中应用到,那么只是脑海中丰盈的知识,并不会给我们带来任何实际的利益,比如找到一份心仪的AI工作。

所以,班主任在暑期特别专题中为大家准备了6节核心人工智能实践课程:

  • 生成对抗网络代码解析及原理
  • 使用容器做多机深度学习任务训练
  • 机器学习从入门到入职
  • AlphaGo: 从Fan到Zero
  • 爬虫的实际应用
  • Python数据分析——金融欺诈行为检测

这些实践课程都是经过重重筛选出来的,非常适合从初学者开始来练手实践。

6

《爬虫的实际应用》视频课程截图

 

 听说还有吴军老师的课程?

在大数据系列课程中寻找真相吧

大数据一直都是人工智能绕不开的话题,因为大数据的“喂养”,机器在很多方面开始学习人类的推理方式,逐步走向智能化。

在这套大数据核心课程中,班主任想和大家极力推荐吴军老师的系列课程《大数据驱动下的机器智能》,这个系列共有5小节核心课程,吴军老师从机器智能、大数据的重要性及其特点将大数据和机器智能的关系讲解的非常清楚。

建议观看此系列课程的时候,同时阅读吴军老师的《数学之美》和《浪潮之巅》,一定会大数据和人工智能的发展有更深刻的了解。

7
这本书很值得一看

这套课程一共有3节核心课程:

  • 吴军:大数据驱动下的机器智能(1-5)
  • 从Hadoop到Spark的入门及应用
  • 基于Spark构建企业级流式处理系统

8

吴军老师视频课程截图

 

  2019又一次暴富的机会

区块链系列课程呼唤你

2018年,货币领域因为比特币的价格暴涨而被捧为“下一代互联网”、“一切皆可+区块链”,但随后价格快速回落又使行业陷入低谷。回溯这场泡沫的破灭,很大原因在于区块链被给予了过多的热情,却尚未找到正确的应用方向。

虽然目前区块链的发展方向任然存在着大量的争议,但这并不表示我们可以忽视或者漠视这一货币领域的变化,相反在人工智能时代,我们更应该积极地了解区块链,更密切地区关注它。

这套课程一共有2节核心课程:

  • 以太坊黄皮书精简教程

  • 区块链技术与价值转移

9

区块链视频课程截图

2019年的暑期特别专题到这里就结束了,上面提到的所有系列课程都可以在AI大学移动端找到相关的学习视频,下半年已然开始,让我们一起继续努力奔跑。

最后,「暑期特别课程」均来自于小象学院,掌握前沿科技,尽在小象学院。

研究所二维码

你以为你喜欢的人就是你喜欢的人吗?

不说破不代表是瞎子。

微博上,你经常看到一个话题:

某日,我又对某某一见钟情。

然而,一见钟情哪有那么容易。

研究显示:一见钟情的概率为十万分之一。

你以为你是那幸运的十万分之一。

醒醒,你以为你喜欢的人就是你喜欢的人吗?

1.喜欢从来都是误会

蔡康永曾在『奇葩说』分享了这么一句话:你以为你喜欢的人就是你喜欢的人吗?喜欢从来都是误会。

爱情就是由无数个不清不楚不愿戳破却让人心动的误会组成,当误会看开了解除了认清了,有些人也就散了。

经历过大风大浪的微博,在”双宋”突然宣布离婚的时候,还是瘫痪了许久。

1

见惯了娱乐圈的分分合合,我们还是会因为柳军官和姜医生的童话爱情而感动。

那些大呼“我们又相信爱情了”的少男少女,在双宋宣布离婚那夜,估计无眠。

范女士和李先生“我们不再是我们,我们依然是我们”的拗口(jiao qing)声明,让本以为能喘口气的微博程序er们再一次投入到维护系统的战斗中。

2

在每一段爱情中,决定在一起不是一时兴起,分道扬镳多半也是蓄谋已久。

民政局相关数据显示,2018年全国结婚率为0.72%,而离婚率为38%。简单来说,平均每天有超过1万对夫妻离婚。

3

社会学家惊叹:“中国家庭在飞速崩溃,中国婚姻在火速终结”。

2.爱情复杂,友情亦然

2017年,中国青年报社会调查中心曾就“你身边是否有真正的朋友”做了一项调查:

77.9%的受访者坦言自己身边真正的朋友很少,6.7%的人表示自己几乎没有真正的朋友。

友情到最后莫过于一句“时至今日,我还是不后悔某年某刻遇见了你”。

4

那些友情的瞬间或许让你感叹:人类的记忆如此绵长,虽然我们终究错过了彼此,但过往的片刻已成永恒。

『奇葩说』金句女王马薇薇说:人间三情(亲情,友情,爱情),无一不傻。

人傻多福,但不说破不代表是瞎子。

3.不是所有的离别都值得纪念

那些塑料姐妹、豆腐渣兄弟,他们的存在仿佛是人生污点,离开后才发觉阳光美好。

我们找了两位朋友,聊了聊她们的塑料友情故事,读完你或许会感叹:

和有些人相处,装傻不行,估计得真傻才能做到喜怒不惊。

@兔子不喝辣椒水

女生之间的友情很神奇。你会因为对方愿意和你分享口红色号或者有共同的爱豆甚至一起去了趟洗手间,就成为了好朋友。

和Y相识是因为高中开学坐了同桌,简单交流后发现竟然粉同一个爱豆,这种仿佛见到亲人的感觉只有追星女孩才能理解。

高中毕业后,虽然大学不在一个城市,每次放假回家都必须要在一起腻着几天,交换着彼此不在的时间空间里发生的有趣或闹心的事情。

5

感觉到变化是在Y交了男朋友之后,Y每次都略带调侃地催我找男朋友,说两对情侣一起出游多浪漫有趣,也向我表示她男朋友身边有很多优质男生,可以介绍给我。

某天,当我认真地告诉她给我介绍一个男朋友时,她先是一怔,然后哈哈大笑着说:“你还真着急,怕嫁不出啊。”

此后,她再也没有主动提过给我介绍男朋友的事情。我也不再提起。

后来,从另一个哥们口中得知,有个不错的男生在Y发的我俩合照的朋友圈下面留言,表示希望认识我,结果,Y私信那个男生,发了一张我的纯素颜苹果后置照给他,问他还想要联系方式吗?结果可想而知……

我想不明白原因,也不想弄清楚原因,就这样吧。(因为这个哥们和那个男生是共同好友,看到那个男生的留言后以为会有进展,发现我这边不知情后,问了那个男生原因)

@西瓜酱

我和Z的故事没有关于爱情的冲突也没有升职加薪的算计,但一些细节把我们8年的友情打败了。

6

我毕业后继续读研,Z去了广州工作,不知道是上班实现了财富自由还是什么其他原因,原本一起逛优衣库、HM的闺蜜,却渐渐出现了阶层划分。

过年聚会,Z背着LV的大花包,看着背帆布包的我说:我觉得女孩子20多岁就是要有一件像样的包包。看到我脖子上带着男朋友送的手工小挂件也露出了嫌弃的表情。

我也没想太多,或许真的彼此经济水平差距太大,阶层不同了呢,毕竟广州和我们家乡这种四五线城市差距太大。

后来,有一些事情总是发生就觉得不是自己想多了。

每次和Z一起吃饭,麻辣烫、炸串人均不超过20的,她总是抢着买单,吃大餐人均150+的,一到付款,Z不是去厕所就是玩手机。

因为上次的麻辣烫是她请的,我当时也觉得这顿理所应当是我付钱。可久而久之,似乎有那么一点不对劲。

君子之交淡如水,真正的朋友,永远没有阶层感。

4.做人呐,最重要的就是开心

一开播豆瓣评分就高达9分的『我们是真正的朋友』,光从名字就够啪啪打脸各类塑料姐妹情、豆腐渣兄弟情。

7

大S,小S,范晓萱,阿雅(柳翰雅),堪称神仙姐妹的四人,有着长达20年的闺蜜情。

这次相聚,第一站便选在了东南亚最神秘的目的地之一:缅甸

8

佛光普照,美丽纯净,缅甸别样的风土人情,让许多人沉醉。

有人说:如果你厌倦了都市的繁华,如果你想忘却烦恼,不如去一次缅甸。在那里,你将会感受到内心平和,忘记时间,忘却仓促与忙乱。

如果你也打算去那里,不妨参考这条路线:

仰光→茵莱湖→蒲甘→曼德勒

9

感谢你看到这里,以下是赠品

塑料友情鉴别指南

1.对你当面一套背后一套,喜欢暗地里使坏。

2.你混得好时,她对你嫉妒和恨,你混得不如她时,她一副小人得志的嘴脸。

3.总想在你身上占到便宜,一直在索取却不付出。

4.你的男朋友或老公如果多金又帅,记得要防火防盗防闺蜜。

5.总而言之,你过得不好,她就放心了,你过得好,她会想办法搞垮你。

5.陪伴是最长情的告白

文末,分享几位热心网友的神仙友情。

人间美好,人间还值得。

@大力

我们在妈妈肚子里就认识,认识24年。

我们陪你长大,看你出嫁。

10

@包星星

2000年相识,今年第19年了。

我们成长的过程中都有彼此。

11

@七忘

我们2009相识,今年是第十年。

希望下一个十年我们越来越好!

12

@Aneel:

我们1999年相识,已经20年啦!

感谢遇见你!

13

@肥楼仔

我们2007年认识,今年第12年了。

你是黑暗之光,笑容女王,没你活不下去!

14

@Cindy許

认识23年啦!亦堂姐弟亦校友。

希望下个23年,我们的发际线还在…

15

研究所二维码

你会扔垃圾吗?iFLYOS教你2步搞定垃圾分类!

路遥知马力,AI识垃圾,专治噢!

《上海市生活垃圾管理条例》已开始实施!条例规定:如果混合投放垃圾、拒不整改,个人最高罚款200元企业单位最高罚款5万元。

如何拯救大家的荷包?听听小智教你一招解决——

素以“金融中心”著称的上海,最近的状态有点反常

1

有市民亲身cos分类垃圾桶:

2

某宝推出的“垃圾桶”包,也成为南京路上一道亮丽风景线。

3

阁下莫非就是电竞圈榜上有名的“垃圾侠”:

4

这年头没点搜索技能都不敢填饱肚子

5

程序员小哥也在编程之余苦练分类技能——

6

当然啦,垃圾分类还要从娃娃抓起——

7

小智在上海的侄子刚刚入手了一套学前小卡片从此沉迷垃圾分类一发不可收拾。

以下是他和妈妈的日常对话——

8

小智看完后心想:说不定以后大侄子会以“垃圾分类”教父C位出道。

9

究竟是什么让上海人民如此沉迷“垃圾分类”,或许我们可以从官方找到答案——

“看不懂”的官方指南

上海出台了官方投放指南——

10

看完这么详细的垃圾分类指南,小智有种重回学生时代,考场上作阅读理解的真实感:这也不会,那也不会…

不过这些难不倒智慧的中国网友,有人给出更接地气的解读方式!

11

当然这种开玩笑的图解没有办法解决实际咱们的实际问题,对于小智这种上班族,垃圾分类的难点主要在于以下两点:

容易错过投放时间

垃圾投放时间设定在早晨和傍晚两个时间段,早晨时间紧任务重,晚上稍微加会班就赶不上。

垃圾要求破袋分类,类目多记不住

作为一名996的“社会汪”,平时工作的压力、社交和聚会等已经占据了大部分的时间。而《条例》中明确要求按照“干垃圾”和“湿垃圾”、可回收物和有害物四大品类投放垃圾。复杂程度无异于重新学习一门专业知识,让无数群众望“图”兴叹。

但是作为环境净化的必经之路,小智绝对拥护垃圾分类条例的实施!就算一开始适应起来会有些麻烦,等到养成良好投放垃圾的习惯后,好处一定大于阵痛。

垃圾分类谁是“头号玩家”

就在大家同情被垃圾分类知识“逼疯”的上海群众时,国家住建部发布最新要求

12

很快各大城市《生活垃圾管理条例》就会来到你我身边,请大家整理好心情,拿起小本本学习一些先进的垃圾分类方法。

13

澳大利亚:垃圾日历APP

澳大利亚居民有一个人人习以为常的垃圾日历APP,通过这款手机软件每天提醒人们把垃圾桶拖到固定的位置,然后会有垃圾回收员进行统一收取,如果有垃圾溢出的部分,管理员不会进行处理,提醒民众时刻遵守垃圾分类原则。

14

德国:建立垃圾分类回收体系

德国家家户户都在厨房的水池下或抽屉中放置不同的垃圾收纳容器,分别收集玻璃瓶、金属、纸张、塑料和厨房垃圾等。然后由专业人员上门收集,并加以循环利用。目前德国的垃圾循环利用率保持在65%以上,居世界前列。

15

垃圾分类见成效。中国如何在这一问题上规避风险,早日实现弯道超车?小智认为除了养成垃圾分类意识,借助人工智能技术帮助人们识别垃圾品类格外重要!

1秒识别,简单便捷小助手

科大讯飞iFLYOS已经最新上线了“生活垃圾分类查询”技能,并且第一时间接入到了讯飞开放平台AI体验栈中。

主要应用到:语音识别技术和语义理解技术,以及iFLYOS开放平台的自定义交互技能功能。

语音识别技术:语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别可以理解为“机器的听觉系统”。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

语义理解:是使用自然语言同计算机进行通讯的技术, 因为处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解。也称为计算语言学一方面它是语言信息处理的一个分支 , 另一方面它是人工智能的核心课题之一 。

iFLYOS自定义技能:iFLYOS技能工作室(Skill Studio) 是一套可视化的人机对话开发平台,是所有搭载了 iFLYOS 或 AIUI 的设备的大脑。讯飞技能工作室为开发者提供了技能设计、开发、测试、发布、优化的工具,开发者可以通过可视化的界面,快速高效地将自己的创意、产品或服务,通过语音技能传达给智能硬件的用户。

AI+垃圾分类助你1秒识别垃圾,操作便捷易上手。下面小智就教大家如何使用:长按二维码进入小程序,语音输入“我要扔垃圾”

16

↑↑↑戳我戳我戳我↑↑↑

好啦,关于这款垃圾分类小程序我们就介绍到这里啦。垃圾分类,绿色生活,从我们大家做起。

研究所二维码

一张照片就能生成视频?连口型和声音都能对上!

《哈利波特》诚不欺我也。

你还记得《哈利·波特》电影里,那些会动的的照片吗?

比如守卫着格兰芬多学院休息室的胖夫人——

1

脾气不太好的胖夫人

当年看电影的时候,小智就对这些细节印象深刻。没想到这些魔法现在居然成真了!

现在,只要提供一张照片,利用神经网络技术就能实现让静止的人像动起来,甚至开口说话。

而且是有情绪、有表情,口型跟声音完全一致的那种!

比如玛丽莲·梦露

▼原图

3

▼处理后的动效

4

你可能会说“梦露的影像资料那么多,这gif有什么好稀罕的。” 好吧,那这个怎么样呢——

▼原图

5

▼处理后的动效

6

仅凭蒙娜丽莎的一张平面图片就塑造出了立体动态的人物,这到底是如何实现的呢?

先让照片动起来

研究人员从YouTube上收集了7000张名人照片以及人脸说话视频,对机器进行训练,使其学会识别人脸上的显著特征,如眼睛、嘴巴形状、鼻梁形状等。并使用卷积神经网络创造出动态头部模型

之后,再给这个训练好的模型“贴”上我们想要让它动起来的那张照片。此时,系统能够自己找到对应的五官部分,然后针对新面部里各个的关键点进行调整,最后达到自然的动态效果。

7

此时,即使只有一张目标照片,也能进行人脸模拟。当然,照片的数量越多,最终视频也会越加精致和逼真。

8

1张、8张、32张目标人物的照片的训练结果

研究人员表示“尽管需要调整数千万的参数,该系统能够因人而异地初始化生成器和判别器参数。因此,训练可以在仅借助几幅图像的情况下快速完成”。

加上声音对口型

OK,让静态照片动起来的操作已经完成了,现在再配上音频就能完成了。

不过这“配音”的步骤可没有那么简单。

如果只是简单粗暴地把音频加到做好的视频上,结果就会变成咱们小时候看的粗糙动画片:卡通人物不管在说啥,嘴巴永远只有“开”“合”这两个动作——

9

光看口型,你知道海绵宝宝说了什么吗?

小时候从来都没质疑过人物口型为啥跟台词对不上的朋友,请到这里集合······

10

成年人的视觉对脸部细节的敏感程度比小孩子要高得多,要不然也不会出现明星因为口型对不上被观众逮到假唱的糗事了。

因此,在不久前举办的计算机视觉顶会CVPR 2019 上,这项新研究提出了一个端到端系统。在之前研究的基础上,不仅实现了人物口型和音频的同步,还实现了更为自然的人物面部表情,比如眨眼和眉毛动作等。

11

12

13

新合成视频中人物的情绪饱满

这才是“jpg→gif→mp4”的全过程。

仍有些粗糙

虽然以上的实验成果已经非常惊艳了,但细看之下,仍可以发现不少bug。

例如,正常人说话时会有轻微的头部运动。但实验合成的一些人物头部转动时,五官和脸型会发生变形,有种说不出的怪异感。

14

又比如一些人物背景会发生扭曲

15

而图灵测试的结果也反应,大众并没有那么容易被合成的假视频欺骗。

【什么是图灵测试?】

图灵测试是由“计算机科学之父”艾伦·麦席森·图灵提出的关于机器人的著名判断原则

如果说现在有一台机器人,其运算速度非常快,可以进行听说读写,还能回答许多问题。那么,我们是否就能说这台机器人具有思维能力了呢?

我们可以进行这样的测试:将测试者与被测试的机器人隔开的,测试者通过一些装置(如键盘)向被测试者提出一些问题。几轮问答后,如果测试者能正确分辨出被测试对象中哪些是真人、哪些是机器人,那机器就没有通过图灵测试;反之,若测试者没能判断出来,那这个机器就可以被认为是有人类智能的。

在对本项目进行的图灵测试中,66名测试志愿者需要观看 24 个视频(12 个真实视频,12 个合成视频),并且将每个视频标注为“真”或“假”。测试结果表明,平均用户标注的正确率为 52%。

16

总的来说,模型的动作幅度越大、速度越快,目标照片的背景元素越复杂,产生的怪异感和形变就会越严重;而视频时间越长,观众容易发现漏洞的概率也会越大。

技术应用

单张或少量照片就能完成动态人像,这样的速度和效率让该模型更利于推广。可以预测,未来这一系统将会被应用在游戏、电视、电影特效行业中。

例如好莱坞的许多大型数字特效公司,利用现有技术将一位演员的面容“移植”到另一个身体上,需要花费几个月的时间。而使用这样的技术,可以大大缩短制作时间,节省成本。

17

特效电影《阿凡达》就花费了大量的后期制作时间

当然,也有不少网友表示,一些演技堪忧的流量明星这下可有救了。

18

此外,这一技术还可应用于特殊人物的“复活”。例如,在佛罗里达州的圣彼得堡,达利博物馆就将著名的超现实主义画家达利“复活”了。

在这场名为《Dalí Lives》的展览上,展品是一个显示屏,上面有一个按钮,当你摁下按钮时,屏幕里的达利仿佛听到了门铃声,会走过来和你说话,让人感觉非常真实。

19

而这一展览使用的,就是机器学习驱动的视频编辑技术。

预测将来,这一技术还可以成为私人化定制服务,满足客户将名人或过世的亲人“复活”的需求。

而此刻正在B站刷视频的小智,产生了一个大胆的想法——是时候用AI技术为鬼畜区添砖加瓦了。

20

B站全明星阵容,敬请期待

而点开微信表情包,我又产生了一车大胆的想法——

21

让你的照片动起来 !
想让你的照片动起来吗?jpg秒变gif,甚至可以配上声音变成视频哦。这里有一款简易的小程序可供大家体验!

22

作品示例

获取步骤:

1.微信搜索关注公众号AI研究所

2.转发原文到朋友圈并将截图发送到AI研究所后台;

3.再发送关键词“动态”到后台。

我们确认过后,就会将小程序推送给你!

研究所二维码

百万奖金,无限可能,科大讯飞iFLYTEK A.I.开发者大赛重磅开启!

报名开始,战火重燃,夺冠路上的开发者们速速点进来!

科大讯飞2019届iFLYTEK A.I.开发者大赛报名通道正式开启!

自科大讯飞5月21日新品发布会上由执行总裁胡郁宣布大赛正式启动至今,已收到国内20多个省份及美国、加拿大等海外赛区共1000多支团队预约报名!席位有限,欲报从速!

大赛优胜者专享:创孵空间,资本对接!还有百万奖金等你来瓜分!参与报名,就能为自己赢得一份机遇!

1

每一次出发

都将见证更加美好繁荣的世界

每一次创造

都将成就更加智慧缤纷的未来

科大讯飞2019届iFLYTEK A.I.开发者大赛

报名通道,正式开启! 

9大赛题,激发A.I.创造力;

百万奖池,奖励最优秀的你;

5大赛程, 助你夺冠抢占先机;

专业解答,为你的比赛如虎添翼!

这是一场怎样的大赛?

“iFLYTEK A.I. 开发者大赛”是由科大讯飞发起的顶尖人工智能竞赛平台。汇聚产学研各界力量,面向全球开发者发起数据算法及创新应用类挑战,推动人工智能前沿科学研究和创新成果转化,培育人工智能产业人才,助力人工智能生态建设。

2018年首届开发者大赛历时七个多月,收到全球3千多支团队提交的参赛作品,吸引1万余名世界各地的优秀开发者参加。2019届iFLYTEK A.I. 开发者大赛将继续开放科大讯飞优质大数据资源及人工智能核心技术,面向全球开发者发起数据算法及创新应用类挑战。

9大赛题,挑战A.I.最强大脑

2019届iFLYTEK A.I.开发者大赛延续“技术顶天、应用立地”理念,设置A.I.算法挑战赛、A.I.创新应用赛两大赛事,立足医疗、营销、车载、教育、硬件、家庭等领域设置9大赛题。其中:

2

A.I.算法挑战赛包含4个赛题:

阿尔茨海默综合症预测挑战赛

移动广告反欺诈算法挑战赛

大数据应用分类标注挑战赛

工程机械核心部件寿命预测挑战赛

3

A.I.创新应用赛包含5个赛题:

通用开发赛道

智能汽车赛道

智慧教育赛道

智能硬件赛道

智慧家庭赛道

百万奖金领跑五大奖项

4

抢占先机,赛程时间选手须知

选手从6月21日即可报名并提交初赛作品,复赛阶段我们会前往北京、广州、合肥、长春、重庆、济南、武汉、杭州8座城市进行线下路演。强强相遇,角逐决赛入场券。最终在科大讯飞全球1024开发者节期间决出冠军!

5

你问我答,专家助力选手解题

自从预约报名通道开启,为了更好的为参赛者服务,小编总结了选手常见问题,并邀请到大赛规则的制定者参与解答,下面请大家集中精神,听听专家怎么说。

Q:
大赛提交作品的时间?

A:
参赛选⼿6月21日可在⼤赛官网进⾏报名并提交参赛作品。

Q:
初赛阶段提交作品的截止时间?

A:
注意!所有带有数字的日期都是成败的关键。

8⽉12⽇17点关闭应用赛初赛结果上传通道

8⽉20⽇17点关闭算法赛初赛结果上传通道

8⽉21⽇上午10点我们会公布这两个赛事的排名情况和复赛名单。

Q:
复赛进入决赛的赛制是如何安排的?

A:
9⽉21⽇上午10点公布算法赛复赛跑分排名

前10选手获奖,前3名进⼊决赛进⾏现场答辩。

应⽤赛的复赛阶段会分赛题在全国8个城市进⾏线下路演,专家评选出每个城市的线下路演前3名,获得复赛奖⾦并进⼊决赛。

Q:
大赛决赛时间?

A:
决赛在1024开发者节期间举行

 

看在飞飞为大家认真备战的份上

报名参赛找我玩啊!

你以为这样就足够了?

 更多信息

搜索讯飞开放平台(Voice-Cloud)

收看神秘嘉宾解读大赛“评分标准”

更多大赛相关问题

微信搜索iFLYTEKAI,添加AI小助手

咨询了解一手信息!

研究所二维码
程序员们618买了啥?大数据告诉你

我以为会是手机和电脑,结果却是……

618购物狂欢节终于进入了尾声,各电商平台收获颇丰。

2019年6月1日0点到6月18日24点,京东平台的累计下单金额已达2015亿元。讯飞的全线产品在京东、天猫双平台也拿下了五大品类的六个第一。

1

京东618战报截取

在这一战绩里,程序员们做出的贡献可不小。要知道,程序员们的京东618,就相当于姑娘们的天猫双11——剁手就完事儿了。

那么,大家口中月入5W却过着5K的生活的程序员们,在618这样的节日里到底买了些什么,又有着什么样的消费特点呢?

程序员们买了啥

 01  洗发水

小智一直觉得,洗发水应该加入“3C数码周边”这个类目。

好吧,开个玩笑。但“脱发”这个话题,真的不只是个玩笑······各位程序员看着我的眼睛,你敢说自己的头发还跟十年前一样多?

2

这次618期间的数据也印证了这一点。

京东大数据显示,618期间程序员购买防脱发产品的比例达全站用户的1.48倍。其中,进口产品更受程序员青睐。

3

PS.虽然脱发,但这并不会影响程序员们的工作实力。甚至越秃越强,毕竟——

4

 02  编程书籍

什么是程序员眼里最好的语言?

京东大数据给出了自己的答案。618期间,C语言位列编程书籍销量排行榜第一,第2~5名依次是Python、Java、C++、PHP

此数据一出,我仿佛已经看到Python程序员撸起了袖子,Java程序员拿起了铁锹,C++程序员在厨房寻找菜刀······

5

而在这里,小智要主持一下公道!

最好的语言是什么?那当然只能是——

6

7

 03  数码周边

因为要长时间跟电子产品打交道,程序员购买装备时会更加注重产品的专业性与性价比。

618期间,IKBCcherry红轴机械键盘凭借高颜值与舒适感,成为程序员购买键盘的首选;而罗技G402有线鼠标的销量比5月日均增长100%。

在游戏装备上,游戏耳机成交额比5月日均增长7倍。其中,雷蛇北海巨妖和金士顿飓风黑红成交额增长最为明显。

8

 04  衣帽服饰

作为一个程序员,你要是穿着整套西装打着领带进公司,很可能会被当成推销员,在门口就被拦下。

要知道,随意舒适才是程序员时尚的关键词。

除了广为人知的格子衬衫和冲锋衣,数据显示,阿迪达斯、耐克、全棉时代、李宁、海澜之家成为618大促服装品类中搜索量最高的前五位。

运动+休闲,这才是最好的程序员们啊~

9

腾讯用户爱零食,知乎用户狂购游戏本

这次的618大促,京东除了自家APP和官网的“主战场”,还将兵力铺向了各大非电商类的平台,例如知乎、今日头条、新浪等等。

用户在浏览新闻、刷视频、看帖子的同时,可以点击京东618投放的相关链接选购商品,并一键完成购物。

有趣的是,因为各平台的原始用户群体不同,展现出的消费特点也是千姿百态。

 腾讯用户:爱进口零食 

大数据显示,618期间来自腾讯的用户最爱购买马来西亚进口薯片和进口饼干。

10

从用户结构上看,36-45岁的消费群体占比最高,其中,又以上海地区占比最高。

果然是注重生活品质的上海人啊~

 今日头条用户:爱大屏电视 

35岁及以下的中青年用户是今日头条用户里最爱上京东购物的,他们最爱购买65英寸以上的大屏电视。从用户结构上看,26-35岁的中青年群体占比达41%,而陕西用户占比高于全站平均。

11

小智琢磨着,要装大屏电视,那就一定得有大房子吧。这么一想,来自陕西的中青年们物质条件挺优秀呀~

 爱奇艺用户:最爱拍照 

618期间,来自爱奇艺的用户最爱购买GoPro运动相机和INSTAX拍立得mini90,其中男女用户各占一半。

12

 新浪用户:关注饮水健康 

来自新浪的用户最爱购买3M净水器,北京用户占比高于全站平均。

13

这让人想起了在北京广为流传的一句话——北京有三硬:城墙砖,电线杆,自来水。不硬不要钱!

而除了硬,不少人还反应水的味道会发苦。大概就是由于这些原因,北京的住户才大部分都安装了净水器。

88

 网易用户:奶爸气质十足 

来自网易平台的用户最爱购买儿童玩具,尤其是数码小单反玩具。其中男性消费者较全站高出39.4%,浙江用户占比高于全站平均。

14

想象一下:在某个晴好的早晨,爸爸带着小朋友去公园玩耍,温柔地教他用小单反拍摄风景。哇,这个画面光是想想就觉得很有爱呀!

99

 知乎用户:游戏壕 

618期间,来自知乎平台的用户最爱购买机械革命游戏本,其中18-25岁的年轻用户占43%。

15

由此可见,原来知乎er们不仅有趣,而且有钱。

 搜狐用户:爆款口红 

搜狐用户最爱购买的是YSL小金条口红,其中女性消费者占比较全站高出30%,江西用户占比高出全站平均。

16

巨头混战618  

虽然618是由京东发起的,不过时至今日,各式各样的购物狂欢节早已从某个平台的年中/终大促,变成了全网电商的业务火拼。

今年的618天猫下重注,京东严防死守,拼多多等后起之秀纷纷加入战局。这届618俨然成为了观测各家电商平台战略的最佳窗口。

 京东:主场迎战 

为了让消费者记住“京东618”这个符号,京东选择了差异化打法:不同于天猫将折扣促销集中于一天,京东主打“促销可以做20天”。

而在今年的核心战略上,京东副总裁韩瑞表示:”获取新用户是京东618的第一目标”。

这不难理解。过去的两年,拼多多从下沉市场迅速起量,天猫快速反应后,也在2018年获得了大幅用户增长。这些现象都意味着:即便是电商这样成熟的业务,也依旧还有大片增量市场尚未攻下。

在此背景下,京东开始推出拼购业务,开垦三四线城市。此外,还与抖音、快手、微博达成合作,不放过任何社交流量。

后知后觉的京东新招频出,但效果如何,还要看接下来的表现。

 天猫:定位上半年“双11” 

在今年的“2019中国品质惠经济盛典”上,天猫总裁蒋凡宣布重启聚划算,将“品质惠生活方式”注入到200个下沉城市。

17

6.18天猫页面的聚划算Banner

聚划算曾是阿里旗下与淘宝、天猫并驾齐驱的重要平台。现在重返舞台,瞄准下沉市场的定位不言自明。

阿里对下沉市场的强需求是有目共睹的。去年阿里Q4财报显示,2018年新增用户超1亿,有77%来自下沉市场。

聚划算成为了阿里系的“拼多多”。而这次的618,也将成为聚划算回归后的第一个重要战役。

另外,淘宝直播也是一股不容忽视的力量。2018年淘宝直播开播商家数量数倍增长,打造出了以李佳琦为代表的一批直播红人,完成了带货千亿的成绩。今年的天猫618,淘宝直播也计划配合聚划算达成百亿成交额。

18

李佳琦被称为“淘宝口红一哥”

 拼多多:坚守下沉市场 

京东和天猫的战略,多少都能看到效仿和压制拼多多的影子。

对此,拼多多的应对也十分直接:砸钱

19

6月1日开始,拼多多618大促高调官宣“百亿现金补贴”,表示要“打造全网最热10000款商品的全渠道历史最低价”。

在具体操作上,拼多多安排了专门的“百亿补贴”小组24小时待命,比对线上线下所有渠道的价格,实时更新,确保用户能在拼多多上得到最低的价格。这种截杀式的“人盯人”防守,可以说是非常拼了。

总的来说,在经历了10年双11、9年618之后,电商市场终于开始冷静下来。曾经层出不穷的各种花哨概念开始褪去,一切都在向商品的本质回归。

至于商家,这样的局势则是对他们捕捉需求的能力,以及把控选品、供应链、价格的能力,提出了更高的要求。

最后,对广大消费者——尤其是小智这样钢铁耿直的消费者来说,其实过什么节不重要,炒什么概念也不重要。

少一点的套路,多一点的优惠,高一点的品质,这些才是永恒的诉求。

研究所二维码

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

每一本书,都很好~

前两天在toward science上看到有个作者推荐了关于数据科学学习的10本书籍,于是我特地去搜索了一下,发现确实还不错,于是想着给大家推荐过来。话不多说,直奔主题~

No. 1 Weapons of Math Destruction算法霸权:数学杀伤性武器的威胁

作者:凯西•奥尼尔

1111

我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。

但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。

读完本书,你会发现,大数据的武器化是无处不在的。也许,当你看到世界上最强大的数据系统做的这些事,你会产生一些焦虑,但是,对于那些我们未能认识到的问题,我们谁都无法解决。

如果你想从事数据科学相关的工作,这本书绝对是必读之作。

No.2 Everybody Lies 人人都在说谎:赤裸裸的数据真相

作者:赛思·斯蒂芬斯·达维多维茨

2222

赛思·斯蒂芬斯·达维多维茨是前谷歌数据科学家和专栏作家。他的研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于以上以及类似的很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。

但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。

读完这本书,你将收获:1)找到筛选正确数据的方法,了解人们实际在做什么;2)拓展认知思维,正确认识世界运转的方式;3)掌握未来的发展趋势,让你的规划更有远见。

No.3 Big Data大数据时代:生活、工作与思维的大变革

作者:维克托·迈尔-舍恩伯格

3333

本书作者维克托·迈尔·舍恩伯格现任牛津大学网络学院互联网研究所治理与监管专业教授,系国际资深大数据专家。他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。

他明确指出了大数据时代处理数据理念上的三大转变:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。这些都颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。本书认为大数据的核心就是预测。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。

No. 4 Algorithms to Live By: The Computer Science of Human Decisions 算法之美:指导工作与生活的算法

作者:布莱恩·克里斯汀&汤姆·格里菲思

4444

“我们所有人的生活都受到有限空间和有限时间的限制,因此常常面临一系列难以抉择的问题。

在一天或者一生的时光里,哪些事是我们应该做的,哪些是应该放弃的?我们对杂乱无序的容忍底线是什么?新的活动与熟悉并喜爱的活动之间如何平衡,才能取得令人愉快的结果?

这些看似是人类的难题,其实不然,因为计算机也面临同样的问题,计算机科学家几十年来也一直在努力解决这些问题,而他们找到的解决方案可以给我们很多启发。

通过丰富的跨学科研究,作者指出,计算机算法也可以用来解答人类面临的这些问题。这本书告诉我们如何更地利用直觉、什么时候应该把选择权交给命运、无所适从的时候应该如何做出选择,以及如何地与他人保持联系。从找配偶到找停车位,从组织管理个人邮箱的收件箱到理解人类记忆的作用原理,这本书把计算机科学的智慧转化为人类生活的策略,引导我们做出明智的选择。

No.5 The Signal and the Noise 信号与噪声

作者:西尔弗

5555

本书可能是世界上最受欢迎的统计相关的书籍之一。信号与噪声是常用在数据科学中的一种比喻手法。“信号”指的是我们想要和需要的事实,比如能帮助我们侦破早期鞋子案的信号。“噪声”则是另一回事,通常指的是不相干的信息,它阻碍或误导我们搜索信号。

在信息爆炸的大数据时代,随着我们的生活节奏变得越来越快,我们所要做出的预测的速度和数量都在不断增加。

一个不容忽视的事实是,现实世界中的很多预测都失败了,由此付出了巨大的社会代价。本书检视了从飓风到地震、从经济到股市、从NBA到政治选举在内的众多领域的预测事例,旨在回答一个问题:如何才能从繁杂的海量数据中筛选出真正的信号,摒弃噪声的干扰,从而做出接近的预测。

真正的预测者会用概率的方法思考问题,他们谦虚而且勤恳,他们能清楚地区分什么是不可预测的、什么是可预测的,他们注重能带领他们接近的成千上百个小细节,他们能辨识出什么是噪声、什么是信号。

从全球经济的健康到战胜恐怖主义,都依靠预测的质量。《信号与噪声》可以给你想要的答案。


另外还有几本书,目前我还没看到有中文版本,如果你英文也很ok的话,也建议看看:

1)The Information: A History, a Theory, a Flood by James Gleick

2) Dataclysm: Love, Sex, Race, and Identity-What our online Lives Tell Us About Our Offline Selves. by Christian Rudder

本周就到这里了~以后发现好的书籍再推荐过来~

来源 | AI搬运工知乎号

研究所二维码

让你早2小时下班的秘密,都在这节课里 | 新课来了

让你早2小时下班的秘密,都在这节课里

加班加点,已然成为很多职场同学的生活日常。尤其是遇到几个小时候的会议,光是整理会议记录就能让人加班到零点,1个小时的讲话内容整理起来却能耗费3-4小时的时间,然后很多会议都是3小时起步的……

1

今天班主任就要给大家介绍一项重要的智能语音能力——语音转写,能够实现语音内容的识别,展现对应文字内容,会议3小时,出稿30分钟,让同学们每天早2小时下班~(毕竟我们的愿望是可以和东山结衣一样,到!点!就!下!班!)

2

温馨提示:本节课程文字内容较多,阅读需要12分钟~

👇👇👇

3

一、语音转写的本质

语音转写本质上是统计模式识别,对于给定的观察序列O ={o1, o2, · · · , oT },可以采用贝叶斯决策的最大后验概率(MAP)判决来得到最可能的输出序列W∗,其公式表达如下:

4

通过贝斯公式可以把上述公式转变为下列公式:

5

语音转写技术栈里包含了多种技术,比如神经网络这一块,有Bilstm双向神经网络以及dnn模型,LSTM模型cnn模型,还有wfst以及decoder解码器等。

6

语音转写流程大概有以下几个步骤:

  • 首先输入语音信号进来,然后经过降噪、端点检测、特征提取,这些部分可以认为是前端处理模块;
  • 经过前端处理,得到特征之后,就可以进入识别过程,识别过程中用到了两个模型,一是声学模型,一是语言模型;
  • 结合声学模型语言模型,在解码器中进行识别解码的过程,得到相应的识别结果;
  • 然后将识别结果经过一些文本处理相关操作,最终得到识别结果。

这其中还包含了一个训练过程,离线训练的时候,将提取到的语音特征,送到模型训练模块去进行离线训练,得到声学模型以及语言模型。

二、语音转写相关技术

下面我们来看一下前端处理、识别过程、后处理这几大块的相关技术。

前端处理

前端处理模块主要是将接收到语音信号进行预处理,增强或降噪等。

加窗分帧

对于预处理后的语音波形信号,首先需要进行加窗和分帧操作。 通常采用 25ms 的汉明窗,窗移为 10ms。这样整段的语音波形就会被分割成很多带有重叠的 25ms 的小语音片段,然后再使用合适的声学特征提取算法从 25ms 的语音片段中提取相应的声学特征。

7

声学特征

好的声学特征不仅需要具有很强的区分特性,可以很好地表达不同音素之间的差异性,而且还需要具有很好的鲁棒性,不受噪音环境的干扰。

通过分析人类听觉系统的时频分析特征和听觉掩蔽效应,研究人员提出了多种不同的声学特征。

下列表格列了一些常见的声学特征,以及它们相关的应用场景。

8

VAD

VAD是Voice Activity Detection 的简称,语音活动检测,又称端点检测。是在一段音频信号中对语音信号和非语音信号(包括无声段或背景噪声)进行划分,提取语音信号部分的一个过程。

它主要作用是要提把已接收到一段语音信号提取有效的音频段,减少噪音的干扰。其实它既减少了噪音的干扰,也减少了语音识别过程中的计算量。

目前VAD常用的都是一些模型方案,比如DNN模型,输入每一帧音频的特征,预测这一帧到底是有效语音还是非有效语音。

三、声学模型计算

下面我们讲一下声学模型的计算。首先同学们想一想声学模型计算到底是在计算什么?

对于每一个可能的词序W,计算出条件概率P(O|W),即我们通常所说的AC score。

O可以认为是一个发音信息,在输入W条件下输出O的一个概念,也就是说每一帧的语音对应的是到底是什么音素。

常见的有单音素模型,单音素模型没有考虑本音素前后音素对本音素的影响;还有三音素素模型,它考虑到上下文的因素,是现在最常用的一个声学建模单元式。

9

声学模型计算的主要任务是判断每一帧语音属于什么音素,以上面图谱为例,声学模型其实要判断哪一帧是静音sil,哪些帧是声母zh,哪些帧是韵母ong等。

按模式识别的套路,先提取出特征,再建立分类模型。

FFT将时域转换到频域,因为频域对音素具有更好的区分能力,接下来我们将频域特征经过mel滤波器,主要是模拟人耳听音,这样就得到了代表一帧语音的特征向量。

接下来可以使用前馈神经网络,输入为mel filterbank特征,输出可以为音素或其它建模单元。

按这个框架是不是就解决了语音识别中的声学建模问题呢?显然不是,因为语音是典型的时序序列信号,不同的人说同样的音,或同样的音在不同的上下文中时长是不一样的。每一帧都得到一个音素,但相邻帧可能是不同的音素,这样最后会得到一堆乱七八糟的音素序列,很难形成自然的文字序列。

基于HMM-GMM框架

怎么解决这个问题呢,第一代语音识别使用HMM-GMM技术框架

首先,将建模单元从音素退化到状态,即一个音素有3-5个状态构成;对一个音素而言,只有从起始状态跳转到结束状态,一个音素才算识别结束。

其次,我们用HMM模型来建模状态跳转概率,可以看这幅图中是ue2这个音素的HMM单元;我们将音素的中间状态设计成可以自跳转,从而解决了同一个音素在不同的上下文时长不同的问题。

10

最后,我们用GMM建模状态输出概率,HMM-GMM模型在语音识别历史上起到了重要作用,对语音识别的实用化至关重要。

基于HMM-DNN框架

第二代框架仍使用HMM建模状态转移概率,但使用DNN替换GMM模型。在GMM模型框架下,不同的状态采用不同的模型来建模,在DNN框架下,所有的状态采用同一个模型来建模,也就是所有的状态共享一个输出层。

11

这样做有3个好处:

  • GMM是local的表达,DNN是分布式表达;意思是当训练音素A时,使用GMM只能用A的所有数据,使用DNN既可以用A的数据,也可以用A的反例数据;这么做使得DNN模型的区分能力更强;
  • GMM模型因为计算复杂度的原因需要帧独立性假设,这显然是不符合语音的属性的;但DNN是不需要的;
  • DNN同时具有特征取的能力,DNN的底层可以看成特征提取层,所以我们可以输入更原始的特征,让模型自动通过数据进行学习。这一点对于效果的提升很有好处。

语音识别需要对波形进行加窗、分帧、提取特征等预处理。训练GMM时候,输入特征一般只能是单帧的信号,而对于DNN可以采用拼接帧作为输入,这些是DNN相比GMM可以获得很大性能提升的关键因素。

基于HMM-RNN框架

然而,语音是一种各帧之间具有很强相关性的复杂时变信号,这种相关性主要体现在说话时的协同发音现象上,往往前后好几个字对我们正要说的字都有影响,也就是语音的各帧之间具有长时相关性。采用拼接帧的方式可以学到一定程度的上下文信息。但是由于DNN输入的窗长是固定的,从而导致DNN对于时序信息的长时相关性的建模是较弱的。

考虑到语音信号的长时相关性,一个自然而然的想法是选用具有更强长时建模能力的神经网络模型。于是,循环神经网络(RecurrentNeural Network,RNN)出现了。

12

如图,相比前馈型神经网络DNN,循环神经网络在隐层上增加了一个反馈连接,也就是说,RNN隐层当前时刻的输入有一部分是前一时刻的隐层输出,这使得RNN可以通过循环反馈连接看到前面所有时刻的信息,这赋予了RNN记忆功能。这些特点使得RNN非常适合用于对时序信号的建模。

基于HMM-LSTM框架

而长短时记忆模块(Long-Short Term Memory,LSTM)的引入解决了传统简单RNN梯度消失等问题,使得lstm框架可以在语音识别领域实用化并获得了超越DNN的效果。

13

主流RNN声学模型框架都是基于lstm结构的,主要包含两部分:深层双向lstm和序列短时分类(Connectionist TemporalClassification,CTC)输出层。

其中双向RNN对当前语音帧进行判断时,不仅可以利用历史的语音信息,还可以利用未来的语音信息,从而进行更加准确的决策;CTC使得训练过程无需帧级别的标注,实现有效的“端对端”训练。

基于HMM-CNN框架

CNN早在2012年就被用于语音识别系统,并且一直以来都有很多研究人员积极投身于基于CNN的语音识别系统的研究,但始终没有大的突破。

最主要的原因是他们没有突破传统前馈神经网络采用固定长度的帧拼接作为输入的思维定式,从而无法看到足够长的语音上下文信息。另外一个缺陷是他们只是将CNN视作一种特征提取器,因此所用的卷积层数很少,一般只有一到二层,这样的卷积网络表达能力十分有限。

14

针对这些问题,我们研发了一种名为深度全序列卷积神经网络(Deep Fully ConvolutionalNeural Network,DFCNN)的语音识别框架,使用大量的卷积层直接对整句语音信号进行建模,更好地表达了语音的长时相关性。

DFCNN的结构,它直接将一句语音转化成一张图像作为输入,通过累积非常多的这种卷积池化层对,DFCNN可以看到非常长的历史和未来信息,这就保证了DFCNN可以出色地表达语音的长时相关性,相比RNN网络结构在鲁棒性上更加出色。

基于Enc-Dec框架

基于HMM-GMM框架的语音识别系统可以认为是第一代语音识别系统,基于HMM-DNN、HMM-RNN、HMM-CNN框架的系统可以认为是第二代语音识别系统。

这些语音识别系统都是由声学模型和语言模型两部分组成,由于两个部分在训练时相互独立,因此在实际应用中经常会出现由两个模型的协同不好引起的识别错误。而ED方案最大优点是声学和语言的联合训练,训练方式更为简单,并且在大数据时代,这个优点会更加的突出。

15

同时,由于传统语音识别的方案采用音素状态建模的方式,中英文混合建模容易带来相互之间串扰的问题,实际使用中一般采用中文和英文分别建模的方案。

而对于编解码识别框架,建模单元可以选用对中文的单字和英文联合建模的方式,而中文的单字和英文的单词基本上不会出现发音相近的情况,避免了传统方案中的中英文相互串扰的问题。为了减少建模单元的数量同时又保证英文单词对于罕见词的覆盖度,英文建模单元拟根据双字节编码(BPE)的方式构建英文子词。

因此,基于注意力机制的中英文混合建模的编解码语音识别系统的建模单元采用中文的单字和英文的子词的混合建模方式

基于Enc-Dec的语音识别系统可以称为第三代语音识别系统,也是最新一代的识别系统,可以同时支持多个语种,例如现在讯飞输入法上线的中英随心说功能就是使用的ED模型,可以同时支持中英文。

看到这里的小伙伴~都是学习力max的好童鞋~关于语音转写的技术课程,其实并没有完全讲完,因为阅读时长缘故,语言模型和解码部分的内容就都放在视频课程中了,希望感兴趣的小伙伴能够认真学完~

研究所二维码

AI服务市场618 | 亿万服务,钜惠来袭!

AI有玩,优惠没完!

号外!号外!618全球年中购物节开始啦!此刻的你,是不是推着堆得满满的购物车正准备下单结账呢?

1

且慢!

大家不要忘了还有一个重量级的会场,那就是讯飞开放平台618钜惠大放送!

7折明星产品、海量大额优惠券、精品解决方案、服务市场周年惠……超多AI能力优惠大放送!

下面,就让我来为大家解读这份讯飞开放平台最全最省的618抢购攻略!

2000¥无门槛优惠券

为开发者和企业谋福利,我们是认真的!

总价值2000元的无门槛优惠券大礼包双手奉上,100元、200元、300元任你组合,多买多划算。还不快揣进口袋!

1.  优惠券产品,肆意折上折222

2.  领取方法

关注“讯飞开放平台”微信公众号,在后台输入:618#您的11位手机号,即可领取2000元粉丝专属无门槛优惠券,享折上折优惠,下单即减。

3.使用说明+有效期

  1. 优惠券自动发放至用户账户,用户可在控制台—财务中心—优惠券查看。使用时,需用领券的手机号登录讯飞开放平台官网;
  2. 优惠券在提交订单时抵减相应金额,每张券仅可使用一次,不可提现、转赠;
  3. 若发生订单退款,仅退还实际支付部分,优惠券抵扣金额不予退款;
  4. 活动时间:2019年6月14日-7月15日
  5. 本活动最终解释权归讯飞开放平台所有。

AI能力狂欢购

 1. AI明星产品 

语音转写识别准确率98%,机器翻译2.0支持含英、日、韩、法、西、俄等100多种语言翻译,语音听写输入速度达180字/分……

长期以来,这些能力都是开放平台备受欢迎的明星产品,当然也是本次大促的重头戏——

333

 2. 图像处理专场 

除了备受青睐的语音产品,为了满足大家在不同场景下的多样需求,本次开放平台618还开辟了图像处理专区——

444 3. AI离线+硬件专场 

智能硬件将软硬件结合,对传统设备进行改造,拥有智能化的功能和 “云+端”的典型架构。而这一次,我们也将在“AI离线+硬件专场”中进行优惠放送——

555

精品解决方案优惠放送

除了单点能力以外,本次还有一大波精品解决方案的优惠放送。针对项目中的出现的需求、不足、缺陷等,提出一个解决整体问题的方案,帮助企业快速有效地实施操作。

666

AI生态扶持大礼包

除了单点能力和解决方案,本次的开放平台618还有生态扶持的加码,以诚挚回馈辛勤工作的开发者们!

我们为全体开发者提供AI生态扶持大礼包,服务量免费赠送,接入即可获取免费服务。

777

服务市场周年钜惠

讯飞AI服务市场是国内首个人工智能全产业链综合服务平台,旨在整合AI产业上下游链路,构建以人工智能为核心的产业生态圈。9年来,讯飞开放平台不断开放和迭代近90项核心技术,2019年平台对外开放的服务能力将达到200项。本次开放平台618,服务市场也为用户提供了许多直接可用的AI产品,有需求的用户可直接在官网进行咨询。也欢迎购买了开放平台能力的开发者加入我们,入驻成为服务商。

好啦,介绍了这么多,事不宜迟,现在扫描下方二维码,开始买买买吧!

8


研究所二维码

我爸说,二十年前他帅爆整条街?AI修复照真相了!

父亲节感悟:帅爹面前无idol。

前段时间,网上掀起了一阵“AI修复老照片”的热潮。老照片上的明星们,原本轮廓朦胧、只能依稀辨认出俊俏的面庞,经过AI画质修复后,眉目越发明朗,五官细节也清晰显现,整体颜值double!

王祖贤和张国荣▼

1

林青霞▼

2

胡歌▼

3

网友们纷纷感慨:原来都是被画质耽误了颜值啊!

这让小智想起来早前网上热议的一个话题——“有一个长得很帅的爸爸是种怎样的体验?”

话题下有不少网友翻出了各自家庭中关于父亲的珍贵老照片。照片中父亲们年轻时的面容帅气惊艳,丝毫不输现在的小鲜肉。

在父亲节来临之际,我们特别准备了这期文章,将这些帅气的照片进行了AI修复!

原本就是“神颜”的爸爸们的旧照,再经过现代科技修复后,会有怎样惊艳的效果呢?

4

·

  !

@小甜甜i:

当年的盛世美颜 ▼

5

@匿名网友:

这是我的father in law(岳父)Ps.托他的福,我女朋友很漂亮▼

6

@全世界最帅的酒酒:

#论别人都以为那是男朋友其实是我爹#
#学姐来要我爹QQ号是什么体验#▼

7

@ClaireCeltics:

体验大概就是,大家都觉得我应该找不到比爸爸帅的男朋友。▼

8

@酱男嗷:

有人说像白敬亭?

希望爸妈永远年轻,洋溢青春和历经岁月的脸,都很动人▼

9

10

@李拜天:

我奶奶说,我爸年轻的时候村里人都说他靓仔,简直是村草。真不愧是我上辈子的情人! ▼

11

@Lynn:

我爸爸,很帅▼

12

13

@喵酱:

我要让我爸火起来!▼

14

@老王同学:

都闪开!让我来回答

上中学的时候每次来学校送饭都被一群女同学追着问:这是你爸??▼

15

16

@a Fan:

我爸的18岁,像不像苏有朋!!▼

17

@匿名用户:

我爸二十多那时候,简直了~

我房间贴男星海报,他都不理解,说什么“还没我当年好看呢”吧啦吧啦~~▼

18

@匿名用户:

体验就是,大家都觉得他比我帅▼

19

@Jackson每晚十点睡:

穿制服的爸爸真的很帅▼

20

真的是一波又一波的颜值暴击啊~原本模糊的老照片就能看出来帅了,修复后的爸爸们,更是大写加粗让人扯着嗓子喊的帅啊!

小智真的感到有点酸溜溜了······

21

大家的爸爸都又高又帅,而我的爸爸········除了钱以外,一无所有

22

 AI修复术是怎样炼成的

好了,大家擦擦口水,小智要讲重点了——AI照片修复技术到底是什么原理呢?

可能会有人认为,这种AI修复术和我们常见的PS、磨皮使用的是同样的技术。其实并不是这样。

修复照片是利用AI算法增加图片的像素值,而磨皮则是对人像的皮肤部分进行模糊处理。简单点说就是:磨皮减少了细节,AI修复增加了细节。

23

磨皮后会产生面部细节的丢失

删除东西很简单,但增加内容就需要创造了,因此修复的技术难度会更大。

首先,研究人员会先对图片数据集A进行“增噪”处理,得到高糊的数据集B,再将A和B都输入神经网络的模型中训练,告诉机器:B降噪后应该是A。而如何实现中间的降噪过程,就交给AI自己去“琢磨”了。

等到AI自己“琢磨”透了实现过程,它就能实现给任何人脸图片降噪了。

 破损照片也能修

除了让模糊的照片变清晰,AI技术还能将照片中的破损部分补齐。

24

一些老照片不仅是模糊,还存在一定的破损问题

通过使用对抗网络的机器学习方法,从海量数据中学习识别人脸,掌握脸型、肤色、五官等面部各个维度的信息。然后“阅人无数”的AI就可以根据照片的剩余内容“想象”出缺失的部分。

 修完不像本人?

照理来说,处理之后的图像应该与本人更接近了。不过最近,民国才女林徽因的一张修复照引发了网友们不小的争议,因为修复后的林徽因看起来变成了另一个人

25

林徽因修复照

修复后的照片中,林徽因虽然依旧漂亮,风格却似乎过于现代化:浓眉毛、高鼻梁、欧式大眼睛。不少网友看完后纷纷吐槽“这不是网红吗”“跟原来的气质一点都不像”。

26

林徽因的原生长相,气质温婉而坚毅

实际上,结合上面小智给大家科普的内容,大家应该就可以猜到其中缘由。

因为修复老照片的过程,更准确地说是一种具有“创造力”的绘画过程,AI会根据已学习过的人脸图片形成自己的“经验性审美”。

如果原始照片残缺过多,给AI留下了很大的“创作空间”,而训练所用数据中现代女性照片又非常多,那修复结果自然就会更像现代人。

所以,并不是AI只能修出现代脸、网红脸,在使用了合理训练数据的情况下,即使是年代久远的旧照,也还是会有很高的还原度的。例如小智最喜欢的这一组!

周总理旧照修复▼

27

谦谦君子,温润如玉。这个男人真的不是一般的帅▼

28

29

“他那张脸严肃而又透出聪颖,富有男子汉气概。” ▼

30

除了个人魅力,周总理和邓颖超相互扶持的爱情也十分让人羡慕

在周总理回给邓颖超的信件中,柔情满溢:“你的信太过官方,都不说想我。”

31

“我这一生都是坚定不移的唯物主义者,唯有你,我希望有来生。望你珍摄,吻你万千。”

32

可以说,总理的魅力,不只是来自于外貌和气质,更来自于他温和的性情、坚定的信仰,以及强大的内心。是小智最喜欢的人没错了!

随着社会的发展,现代拍照技术越来越先进,更多的色彩、更精致的细节都能被轻松地拍摄保存。而老照片这种像素低、保存又困难的存在,则逐渐退出了时代舞台。

不过,仍然有不少人守护着这样一份情怀,就像珍惜昔日时光一样珍惜着这些老照片。

而在现代技术的加持下,不仅模糊的相片变得更加清晰,那些沉淀在时光中的情感与故事,也仿佛被再次唤醒。

更多精彩,请关注微信公众号“AI研究所”。

研究所二维码

智能语音的未来,从这里开始

1877年,爱迪生在笔记本上写下:“要让机器会说话,会唱歌,会哭闹。”

Hello~研究所的小伙伴们大家好,今天小智要给大家推荐一本书——《智能语音时代》。书中对苹果、谷歌、微软、亚马逊、facebook等行业巨头的智能语音技术布局和商业角逐进行了深度分析,非常值得一看哦!

下面我们就来看一看关于本书的详细介绍吧~

1

作者:[美] 詹姆斯· 弗拉霍斯(James Vlahos),是《纽约时报》《连线》《大众科学》《科学美国人》《大西洋》《智族GQ》和《国家地理》等杂志著名记者,美国鬼才科普作家

出版社:电子工业出版社

出版时间:2019年5月

20世纪90年代,互联网还比较封闭,许多用户依赖美国在线来组织管理网站,他们在一个网站收集信息的同时也要列出其他可能包含有用信息的外部网站。如有体育或金融信息的网站,用户的浏览范围极大地受到限制,这就好像是“被围墙包围的花园”,随后谷歌公司用一把“大锤”敲开了这些“围墙”:通过谷歌搜索引擎,人们可以轻松访问各种网站、自由浏览网页。

但是这几年,谷歌公司和亚马逊似乎打算重建“花园围墙”。

谷歌公司的即时回答功能减少了人们从搜索结果页面导航到其他网站的需求;谷歌和亚马逊分别推出了各自的语音助理,正如数字营销机构胡歌的创意总监索菲·克莱伯所说,“亚历克莎就是语音版的美国在线。”

谷歌助理和亚历克莎应用程序都是由谷歌公司和亚马逊公司自己开发的,用户要访问任何第三方应用程序,必须首先使用谷歌助理或亚历克莎。例如,如果用户想使用亚历克莎的语音调用功能,可以说:“亚历克莎,看下《华盛顿邮报》头条”或“亚历克莎,玩下《危险边缘》游戏。”同样地,用户也可以说:“打开点评网站Yelp”或“娱乐与体育节目电视网上有什么新闻?”

如果用户确切地知道想要的应用程序,这种语音调用可以很好地工作,否则,这就像在没有搜索引擎帮助的情况下寻找新网站。因此,当在没有指定应用程序的情况下提出问题或请求时,亚历克莎或谷歌助理将可以决定如何实现它。这给了谷歌公司和亚马逊公司很大的控制权来决定语音流量的去向。

整个安排看起来很像过去那些“被围墙包围的花园”。这并不一定是那些公司(以亚马逊公司或谷歌公司为代表)为获得控制权而有意为之的,尽管它们当然非常乐意从中获益。语音调用适合由一个单一的数字实体来进行,Siri的开发者们当然也认同这一观点。

在没有主导性的语音助理的情况下,每个语音应用程序都是被独立开发的,每个语音应用程序都有自己的名字、特定的能力和专门的命令的标识。“我觉得人们记不住1万个不同的名字和命令集,”切耶尔说,“因此,这个模式不能一直扩大。”

离开苹果公司后,切耶尔和吉特劳斯开发了语音助理Viv,他们希望打造一个单一的、全能的语音助理。谷歌公司和亚马逊公司虽然不希望被人视为“有围墙的花园的守门人”,但它们一直在往这个方向走。与它们不同的是,Viv团队已经公开宣布它的目标是成为人们需要的最后一台,也是最好的一台计算机。

“这是一场竞赛,”吉特劳斯说,“一场为用户设计单一界面的竞赛。”

一.

Viv团队拥有由智能语音领域开拓者所开发的强大技术。虽然它的面世较晚,但该团队已成为这场界面竞赛中的一匹“黑马”。几年前似乎还是“万马奔腾”的竞争场面,但现在胜负已经非常明显了。

让我们从苹果公司开始,一个公司接一个公司地分析。Siri是世界上被使用最广泛的语音助理,它每月处理100亿次请求,会说20多种语言,这是个好消息。

坏消息是,苹果公司没有按照Siri开发者的设想来推进Siri的发展,这使它的能力没有预想的那么好。许多科技评论家都把焦点放在Siri身上,不管公平与否,Siri已经成为语音人工智能的“出气筒”。Siri“笨手笨脚”“令人尴尬”(《华盛顿邮报》);“Siri是苹果公司错失的最大机会”(《休斯敦纪事报》);“Siri有令人尴尬的不足之处”(《纽约时报》)。技术分析师杰瑞米·欧阳告诉《今日美国》:“这就好像苹果公司已经完全放弃了Siri。”

虽然这有点言过其实,但苹果公司被批评并不冤枉,它最初是语音人工智能的领导者,但现在已经落到后边了。直到2018年2月,苹果公司才发布了智能音箱HomePod。这已是在谷歌公司推出智能家居设备谷歌家庭近一年半之后,也是在亚马逊回声音箱推出三年半之后的事了。

评论家称赞了智能音箱HomePod的音质,但也指出人们需要为它支付更高的费用——发布时的售价是349美元,而亚马逊回声音箱发布时的价格是99美元。很多人指责Siri在这款设备上的表现不佳。截至2018年6月,智能音箱HomePod在美国智能音箱市场的份额仅为4%。

苹果公司在智能语音领域的做法,似乎与它的设备制造商的背景有关。因此,苹果公司将Siri定位为基于设备的一项重要的特色功能,而不是被销售的产品。然而,如果像谷歌公司和亚马逊公司预测的那样,这种技术将成为一种环境性的存在,那么语音助理将至少会给苹果公司带来一些风险。

在未来的这种人工智能机器人“生活”在云端、通过廉价商品“发声”的世界里,销售高价电子产品的苹果公司,与现在相比,可能会变弱很多。

二.

接下来分析微软公司,微软公司拥有世界一流的人工智能部门,员工有8000多人。它拥有强大的必应搜索引擎,可以增强其语音助理回答问题的智能水平。它还有一个成熟的语音助理——微软小娜。

但微软公司很难让它的语音技术得到用户的青睐。它在必应和Skype上都有聊天机器人,但这两个平台都远不如谷歌公司或脸书公司的Messenger这种平台那么受欢迎。用户可以在手机操作系统Windows Phone上使用微软小娜,但由于该系统的市场占有率从未突破个位数,装有该系统的手机已于2017年停售。

在智能音箱方面,配备微软小娜的哈曼卡顿智能音箱的市场份额非常小,开发人员不愿意开发语音应用程序,不愿意眼睁睁地看着它们在一个不受欢迎的平台上慢慢被大众遗忘,所以,他们大多都避开了微软小娜。

尽管面临这些挑战,但微软公司并没有放弃。用户可以通过Windows操作系统访问微软小娜,微软小娜每月约有1.45亿活跃用户。微软公司并没有把微软小娜作为一款全能型助理来销售,而是将它定位为一名职场助理,这符合微软小娜近来的整体战略:向公司提供软件和基于云的商业服务,其中包括人工智能支持的语音技术。

因此,微软小娜在智能语音领域不是一个全面的领先者,但微软公司在公司领域的竞争中还处于稳固的有利位置。

脸书公司未来的发展也是个未知数。如果它效仿微信的模式——微信实际上是有10亿用户的即时通信平台——那么脸书公司的状况会很好,因为他们在Messenger上布置了强大的机器人。但是否会这样发展,形势还不明朗。

除了即时通信平台,脸书公司还进行了广泛的语音人工智能研究,但在落地过程中,进展不是很顺利。据报道,脸书公司开发了一款智能音箱,但在剑桥分析公司的丑闻引发人们对隐私的担忧后,该产品的发布被搁置。所以,脸书公司现在在智能语音领域发力还不够。

三.

无论以何种标准衡量,谷歌公司和亚马逊公司都是这场竞争中最受欢迎的赢家。

2018年,只有39款设备支持与微软小娜集成,194款设备支持与Siri集成,而5000多款设备支持与谷歌助理集成, 2万款设备支持与亚历克莎集成。在全球范围内,为谷歌助理开发的应用小程序有1700多个,为亚历克莎开发的应用小程序有5万个。亚马逊公司占据了美国智能音箱市场65%的份额,谷歌公司占据了20%的份额。

谷歌公司和亚马逊公司是美国智能语音领域很受欢迎的公司,判断它们前景的最佳方式是看它们选择如何从语音业务中盈利。当你直接向这两家公司的高管提出盈利方面的问题时,他们会感到窘迫,会老生常谈地说语音技术还处于早期阶段。

他们可能会表示,他们仍在努力为用户寻找最佳体验,一旦解决了这个问题,回报就会随之而来。这个回答虽然含糊其词,但也并非假话。到目前为止,两家公司都在抢占地盘,在努力吸引尽可能多的用户,因为它们知道,领先的平台最终会有多种方式获得巨额利润。

不过,即便是现在,两家公司的高管们肯定也在考虑各种盈利途径。最简单的盈利模式是直接从来马逊回声音箱和谷歌家庭等设备的销售中获利。但与苹果公司不同的是,这两家公司似乎都对这一模式不感兴趣,因为它们都在压低价格以扩大市场份额。

一家独立研究公司拆解了一台亚马逊回声音箱,并估计其组件的成本约为35美元。算上管理费用和运输成本,它的实际成本会更高,而亚马逊网站却以29.95美元的低价出售它。亚历克莎开发和发布的负责人格雷格·哈特表示:“我们通过让人们使用我们的服务来盈利,而不是靠用户购买设备来盈利。”

下一个可考虑的盈利模式是做广告。其他公司可以通过付费的方式在语音助理说话之前或之后植入广告。但到目前为止,谷歌公司和亚马逊公司都还不允许这样操作,但在未来的某个时刻,它们肯定会这么做,问题是哪家公司会第一个开始。

“它们都不想成为第一个这样做的公司,因为另一个公司会说,‘嘿,我们公司不做广告,他们公司做广告。’”语音人工智能领域的企业家亚当·马奇克说。

不过,语音广告似乎不太可能产生与在线广告和移动广告相当的收入,因为适合播放语音广告的平台比较少。如果你使用传统的谷歌搜索引擎,如搜索廉价航班,那么谷歌公司可以在链接列表的顶端投放四个付费搜索广告,但如果消费者在听到一个答案之前必须听四个广告,他们就不会进行太多的语音搜索。

这对于谷歌公司来说是有问题的。谷歌公司基于广告的模式——谷歌公司以这种模式创造惊人的巨额收入——是以人们愿意花大量时间来翻阅搜索结果为前提的。

随着人们使用手机的时间增加,他们浏览搜索结果页面所花的时间已经减少了,页面广告曝光率的下降趋势伴随着语音搜索的出现而加剧。“谷歌公司会想,‘哎呀’,”弗雷斯特研究公司的市场分析师詹姆斯·麦奎维说,“当人们开始喜欢语音搜索时,我们的传统商业模式就彻底消失了,因为真的不会有太多的广告模式存在。”

利用语音服务盈利的最大机会可能出现在电商领域,这显然对亚马逊公司有利。在家里的任何地方,用户都可以通过语音订购东西——纸巾、薯片、新的烤面包机等。一项市场研究预测,到2022年语音购物的规模将从目前每年20亿美元增加到每年400亿美元。另一项研究发现,拥有亚历克莎设备的家庭每年花在亚马逊网站购物的钱比普通家庭多66%。

亚马逊公司的“糖果罐”变得更甜了。无论何时,只要有人通过语音搜索或订购产品但没有指定品牌,亚马逊网站都会第一个推荐做广告的品牌。当消费者通过语音购物时,如果他们不喜欢听到的第一个品牌,就可能会要求提供更多的品牌选择但也可能不会,这会让出售商品的公司感到压力,但增强了亚马逊公司的影响力。马奇克说:“突然之间你不再买原来的品牌了,你会买亚马逊网站告诉你的品牌。”

如果一个公司的产品在搜索结果中靠前,或最先被提及,那么它的销售额很可能远远高于在搜索结果中排名靠后的产品。因此,公司会乐于向亚马逊公司付广告费。更重要的是,亚马逊公司有自有品牌,从童装到狗粮,有上百个品牌,而且品牌数量还在不断增加,亚马逊公司肯定会在语音搜索中优先推送这些品牌。

亚马逊公司尚未公开表示是否会允许其他公司付费以获得语音搜索排名优先权。它需要以一种足够透明的方式做到这一点,以免让客户觉得自己受骗了。对于付费排名有一个先例:在基于屏幕的亚马逊网站上,公司付费获得的产品特色展示信息显示在其他产品信息之前。

谷歌公司并非没有意识到电子商务可能是从语音业务中盈利的最佳方式。谷歌公司与沃尔玛公司、塔吉特公司、好市多公司、科尔士百货公司、史泰博公司等零售商结成了联盟,这些公司受到共同敌人亚马逊公司的威胁。

谷歌公司计划扩大其购物平台,要成为亚马逊公司更有力的竞争对手。只要谷歌公司在用户语音搜索后将其引导到联盟公司的网站,谷歌公司就可以通过这一领先的商业模式收取这些零售商的少量广告费。

总而言之,在美国智能语音领域实力强大的谷歌公司正在快速成长。

亚历克莎在市场份额和盈利模式方面都相当有优势,亚马逊公司在目前的竞争中领先一步。麦奎维说:“地球上每一家想用语音人工智能做点事的公司都在联系亚马逊公司,每个想在语音人工智能方面有所成就的研究生都在联系亚马逊公司……亚马逊公司在智能语音领域积累了如此多的优势,这真的只剩一个问题,即它会在什么时候选择大干一场。”

四.

时间是2036年4月,地点是Hip 4872——这是位于仙后座星群里的一颗恒星。从地球发出的无线电信号经过近33年的“长途跋涉”后到达这里。无线电信号包括关于智人的基本信息及关于人类的数学、物理、化学和地理的浓缩版知识。里面还有国旗画面、宇航员莎莉·莱德发来的信息及大卫·鲍伊的歌曲《星侠》的编码。

上面所有这些都是在一个名为Cosmic Call的外星人探索项目的支持下,通过射电望远镜发射的。如果任何有智慧的生物接收并解读出这些信号,它们将会收到创建计算机程序的指引,当然,这种可能性是微乎其微的。一旦实现,外星人就可以与人类的代表——机器人艾拉交流。

作为勒布纳奖得主的聊天机器人,艾拉会聊天和讲笑话。它对美食和名人都有自己的看法,它会喋喋不休地谈论在拉斯维加斯和温哥华等地旅行的事。由于它喜欢瞎猜,总是不按常理出牌,因此它无疑是一个不完美的“地球大使”。但是,它对语言的巧妙运用和显而易见的交谈欲望,使它成为整个Cosmic Call项目中最具人类特色的元素。

当我们在语音技术的推动下向前迈进时,世界应该拥抱它所创造的充满希望的人文精神。从鱼钩到火星探测器,我们一直在制造工具。虽然我们制造出了很多对我们有用的东西,但它们在更深层次上都不像我们。即使是类人机器人,它们能做的也只是笨拙地移动,使用语言是人类这个物种真正与众不同的地方。

语言把我们连接起来,因此,教机器掌握语言不同于通过编程让它们学会进行衍生品交易、做手术、进行海底航行或其他事情。我们正在“共享”人类的核心特征。

这份“礼物”不应该随便“赠送”。语音技术为世界带来了新的力量和便利性,但我们不用对其如此敬畏以至于忘记评估其中的许多风险。如果应对得当,语音技术有可能成为我们发明的、最有感情的技术。认为人工智能只能是冷冰冰的算法的观点是错误的,我们可以将最好的价值观和同理心注入其中。

我们可以让它变得聪明、令人愉快、精灵古怪并且善解人意。有了语音技术,我们最终可以制造出不那么陌生、更像人类的机器。

2

想了解更多关于《智能语音时代》吗?

当当网京东均在售,现在购买正版书籍,还随书赠送200元科大讯飞智能办公本优惠券哦!

研究所二维码

AI预测世界杯?算了,足球比我女朋友都难猜

欧冠的结果,你押对了吗?

火热的欧洲冠军联赛刚刚落下帷幕。在最终的决赛中,萨拉赫罚入点球,替补奇兵奥里吉再进一球。最终利物浦以2-0战胜热刺,时隔14年再度登上冠军王座。当地的利物浦球迷欢呼雀跃,马德里成了一片红色的海洋。

而正如鲁迅先生所说,有比赛就有输赢,有输赢就有赌输赢的群众。

11这些群众包括小智这样的普通球迷,还有足球博彩机构,甚至谷歌、微软等互联网巨头也曾来凑过热闹。

而为了预测赛事的结果,大家又可谓是“各显神通”:有的追随专家分析,有的靠自己做梦,还有的相信章鱼玄学······
2

章鱼保罗在2008欧洲杯和2010世界杯中,预测14次猜对13次,成功率达93%

作为一名优秀的社会主义接班人,那些歪门邪道小智我当然是一个都不信的。唯有科学的数据分析和模拟,才算得上严谨的预测。

其实,早在前几届世界杯期间,各路Geeker就已经采用过各不相同的AI算法和特征数据,做过这样的预测尝试。甚至,著名物理学家霍金生前也曾研究过世界杯夺冠公式!(公式将在文章后半段解读)

那么,各家预测的结果准确度如何呢?谁又是能够一语言中的“神算子”?

AI预测输赢

我们先来看看一项在算法和数据方面都颇有代表性的实验,它是由来自德国和比利时的四位研究人员在2018年进行的。

实验中,他们使用自过去四届FIFA 世界杯(2002-2014)的所有比赛结果作为数据集,希望以此来预测2018年的冠军。

此外,他们还考虑了许多相关的特征,比如

经济因素(国家人均GDP、人口数量等)运动因素(ODDSET 概率,FIFA 排名等)

主场优势(主办方、大陆、联邦等)

团队结构(队伍中同一俱乐部队友的人数、队员平均年龄、参加冠军联赛的球员数量等)

教练因素(教练的年龄、任期、国籍)等等。

研究人员认为,这些因素看似没有直接决定赛事的结果,但很容易影响球员和队伍的整体状态,因此很有必要纳入考虑。

在算法上,他们采用了随机森林算法(Random Forest)。这一基于决策树的算法是机器学习的一个重要分支,并且具有很高的准确率,在许多数据分类任务中都曾表现出优异的性能。

最后,经过10万次赛事模拟,研究团队预测出了夺冠可能性最高的前三名,分别是西班牙队( 28.9%)、德国队(26.3%)和巴西队(21.9%)。

打脸来得太快就像龙卷风

万事俱备,就只等最终的结果验证了。

不久之后,激动人心的时刻到了——2018年俄罗斯当地时间7月15日,在最终的世界杯决赛中,法国队夺冠。

3

2018年俄罗斯世界杯法国队夺冠

而回过头来看研究人员先前的预测结果,可以说是错到离谱了——他们押宝的西班牙队和德国队在实际比赛中甚至都未能进入四分之一决赛,最后夺冠的法国队在他们之前的预测中也仅排名第4。

4

预测名次&实际名次

再看赛前积极预测的各家机构,最终结果也基本是不同程度的打脸,准确率稍高一些的,也并没有超过章鱼保罗的。

这样的结果让人倍感困惑:尽管拥有适当的数据类型、数据体量,使用了参数正确的优秀算法,那为何这些训练有素的模型最终仍会失败呢?

为什么不灵?

其实,失败的原因就在于我们所预测的对象——足球比赛,在各要素的维度上都并不是一个有规律的事件。

和其它以人为重点的事件一样,足球比赛在赛前和赛中都有太多让人无法判断是否确实相关的影响因素,也就是所谓的混淆变量

而场上每分钟(甚至每秒钟)的状态,都取决前一分钟(前一秒钟)的状态。这种马尔可夫链过程又意味着,要把数据集中每场比赛的每一分钟都模拟出来,才能得到相对准确的模型。

5

马尔科夫链的定义:事件某一时刻的状态只取决于它在上一时刻的状态。图为应用了马尔科夫链的天气预测过程。

除此之外,比赛结果还可能受到一些外部因素影响,例如天气、政治情况、地理因素,甚至某个球员前一晚没睡好都可能会影响整场比赛的结果走向。而这些重要特征通常都很难被收集和衡量。

更何况,还存在意外发生的可能性,例如一个致命失误或意外进球,都是无法预测的。

6

简而言之,像足球比赛这样以人为主的活动,是当下的AI技术还无法很好驾驭的领域。

这也是为什么小智说,足球比我女朋友都难猜——足球的结果跟一大票人有关,而我女朋友的心思只跟她一个人······咦,我女朋友呢?

7

霍金“完美点球公式”

对于足球比赛结果的不可预见性,著名物理学家霍金似乎比我们更早地发现了。不过,这并没有妨碍他对足球运动的热爱。

8

公式发布现场

这位著名的物理学家曾在公开场合多次参与世界杯冠军的预测,甚至还娱乐性地自创过一套“完美点球公式”

其中,X0是一个已知变量

罚球队员是前锋,则α1=1;是后卫,则α2=1

罚球队员瞄准球门左边,则β1=1;瞄准右边,则β2=1

罚球队员的头发颜色为淡黄色,则δ=1

罚球队员瞄准球门上1/3,则θ1=1;瞄准球门下1/3,则θ2=1

罚球队员用脚的侧面踢球,则ε=1

罚球队员不助跑就直接踢球,则η=1

除此之外,霍金还配合着这个公式做了一些数据解读:

“我研究了1978年世界杯以来的所有点球,得出了‘完美点球公式’。主要是因为英格兰球员准头太差了,他们用铲子都打不到牛屁股······(这也就是他搞出这个公式的原因:被英格兰历史上的那些失败点球蠢哭)首先,速率是关键,必须跑三步以上,把速度提起来。只跑三步或者更少步数的球员,他们的点球命中率只有58%,远低于平均水平的87%。

使用脚侧比正脚背能高出10%的命中率。

把球踢向左右两个上角更容易罚进点球,成功率高达84%。

用左脚还是右脚对结果没有什么影响。

前锋比后卫和中场球员更容易进球。

金发球员和秃顶球员的命中率更高,金发球员的命中率高达84%,秃顶球员71%的命中率也高于深色头发球员的69%,但我不清楚原因是什么。

9

对于守门员,跳来跳去分散主罚者的注意力,将会提高18%的扑救成功率。”

看完以上信息,你是不是和小智一样觉得一脸懵逼?这个公式连带公式的解释,无论怎么看都让人觉得槽点满满。

不过,这本来也不是真正的科学研究,霍金曾表示“和足球相比,我认为量子物理相对而言更直接一些。”

而所谓的“完美点球公式”,也只是老顽童跟大家开的一个玩笑,顺便怒其不争地调戏一下自己祖国的英格兰队,毕竟“爱到深处自然黑”。

10

缅怀这位可爱的伟人

当然,在足球赛结果预测中的失败并不意味着AI在“预测”这件事上毫无用处。例如对单个球员的跑步距离、速度、加速度、减速度、负荷和心率等等数据来进行研究,以预测运动员在某场比赛中的场上表现,这样得出的结果就比较具有参考价值。

毕竟AI只是一种工具,我们如何使用、在怎样的前提条件下使用的这种工具,才是决定其价值的关键所在。

皮一下
其实我挺信“霍金点球公式”的,它的大概含义就是:英格兰靠点球夺冠的概率约等于0·······研究所二维码

超过80%语音开发者的共同选择