• 程序员们618买了啥?大数据告诉你

    我以为会是手机和电脑,结果却是……

    618购物狂欢节终于进入了尾声,各电商平台收获颇丰。

    2019年6月1日0点到6月18日24点,京东平台的累计下单金额已达2015亿元。讯飞的全线产品在京东、天猫双平台也拿下了五大品类的六个第一。

    1

    京东618战报截取

    在这一战绩里,程序员们做出的贡献可不小。要知道,程序员们的京东618,就相当于姑娘们的天猫双11——剁手就完事儿了。

    那么,大家口中月入5W却过着5K的生活的程序员们,在618这样的节日里到底买了些什么,又有着什么样的消费特点呢?

    程序员们买了啥

     01  洗发水

    小智一直觉得,洗发水应该加入“3C数码周边”这个类目。

    好吧,开个玩笑。但“脱发”这个话题,真的不只是个玩笑······各位程序员看着我的眼睛,你敢说自己的头发还跟十年前一样多?

    2

    这次618期间的数据也印证了这一点。

    京东大数据显示,618期间程序员购买防脱发产品的比例达全站用户的1.48倍。其中,进口产品更受程序员青睐。

    3

    PS.虽然脱发,但这并不会影响程序员们的工作实力。甚至越秃越强,毕竟——

    4

     02  编程书籍

    什么是程序员眼里最好的语言?

    京东大数据给出了自己的答案。618期间,C语言位列编程书籍销量排行榜第一,第2~5名依次是Python、Java、C++、PHP

    此数据一出,我仿佛已经看到Python程序员撸起了袖子,Java程序员拿起了铁锹,C++程序员在厨房寻找菜刀······

    5

    而在这里,小智要主持一下公道!

    最好的语言是什么?那当然只能是——

    6

    7

     03  数码周边

    因为要长时间跟电子产品打交道,程序员购买装备时会更加注重产品的专业性与性价比。

    618期间,IKBCcherry红轴机械键盘凭借高颜值与舒适感,成为程序员购买键盘的首选;而罗技G402有线鼠标的销量比5月日均增长100%。

    在游戏装备上,游戏耳机成交额比5月日均增长7倍。其中,雷蛇北海巨妖和金士顿飓风黑红成交额增长最为明显。

    8

     04  衣帽服饰

    作为一个程序员,你要是穿着整套西装打着领带进公司,很可能会被当成推销员,在门口就被拦下。

    要知道,随意舒适才是程序员时尚的关键词。

    除了广为人知的格子衬衫和冲锋衣,数据显示,阿迪达斯、耐克、全棉时代、李宁、海澜之家成为618大促服装品类中搜索量最高的前五位。

    运动+休闲,这才是最好的程序员们啊~

    9

    腾讯用户爱零食,知乎用户狂购游戏本

    这次的618大促,京东除了自家APP和官网的“主战场”,还将兵力铺向了各大非电商类的平台,例如知乎、今日头条、新浪等等。

    用户在浏览新闻、刷视频、看帖子的同时,可以点击京东618投放的相关链接选购商品,并一键完成购物。

    有趣的是,因为各平台的原始用户群体不同,展现出的消费特点也是千姿百态。

     腾讯用户:爱进口零食 

    大数据显示,618期间来自腾讯的用户最爱购买马来西亚进口薯片和进口饼干。

    10

    从用户结构上看,36-45岁的消费群体占比最高,其中,又以上海地区占比最高。

    果然是注重生活品质的上海人啊~

     今日头条用户:爱大屏电视 

    35岁及以下的中青年用户是今日头条用户里最爱上京东购物的,他们最爱购买65英寸以上的大屏电视。从用户结构上看,26-35岁的中青年群体占比达41%,而陕西用户占比高于全站平均。

    11

    小智琢磨着,要装大屏电视,那就一定得有大房子吧。这么一想,来自陕西的中青年们物质条件挺优秀呀~

     爱奇艺用户:最爱拍照 

    618期间,来自爱奇艺的用户最爱购买GoPro运动相机和INSTAX拍立得mini90,其中男女用户各占一半。

    12

     新浪用户:关注饮水健康 

    来自新浪的用户最爱购买3M净水器,北京用户占比高于全站平均。

    13

    这让人想起了在北京广为流传的一句话——北京有三硬:城墙砖,电线杆,自来水。不硬不要钱!

    而除了硬,不少人还反应水的味道会发苦。大概就是由于这些原因,北京的住户才大部分都安装了净水器。

    88

     网易用户:奶爸气质十足 

    来自网易平台的用户最爱购买儿童玩具,尤其是数码小单反玩具。其中男性消费者较全站高出39.4%,浙江用户占比高于全站平均。

    14

    想象一下:在某个晴好的早晨,爸爸带着小朋友去公园玩耍,温柔地教他用小单反拍摄风景。哇,这个画面光是想想就觉得很有爱呀!

    99

     知乎用户:游戏壕 

    618期间,来自知乎平台的用户最爱购买机械革命游戏本,其中18-25岁的年轻用户占43%。

    15

    由此可见,原来知乎er们不仅有趣,而且有钱。

     搜狐用户:爆款口红 

    搜狐用户最爱购买的是YSL小金条口红,其中女性消费者占比较全站高出30%,江西用户占比高出全站平均。

    16

    巨头混战618  

    虽然618是由京东发起的,不过时至今日,各式各样的购物狂欢节早已从某个平台的年中/终大促,变成了全网电商的业务火拼。

    今年的618天猫下重注,京东严防死守,拼多多等后起之秀纷纷加入战局。这届618俨然成为了观测各家电商平台战略的最佳窗口。

     京东:主场迎战 

    为了让消费者记住“京东618”这个符号,京东选择了差异化打法:不同于天猫将折扣促销集中于一天,京东主打“促销可以做20天”。

    而在今年的核心战略上,京东副总裁韩瑞表示:”获取新用户是京东618的第一目标”。

    这不难理解。过去的两年,拼多多从下沉市场迅速起量,天猫快速反应后,也在2018年获得了大幅用户增长。这些现象都意味着:即便是电商这样成熟的业务,也依旧还有大片增量市场尚未攻下。

    在此背景下,京东开始推出拼购业务,开垦三四线城市。此外,还与抖音、快手、微博达成合作,不放过任何社交流量。

    后知后觉的京东新招频出,但效果如何,还要看接下来的表现。

     天猫:定位上半年“双11” 

    在今年的“2019中国品质惠经济盛典”上,天猫总裁蒋凡宣布重启聚划算,将“品质惠生活方式”注入到200个下沉城市。

    17

    6.18天猫页面的聚划算Banner

    聚划算曾是阿里旗下与淘宝、天猫并驾齐驱的重要平台。现在重返舞台,瞄准下沉市场的定位不言自明。

    阿里对下沉市场的强需求是有目共睹的。去年阿里Q4财报显示,2018年新增用户超1亿,有77%来自下沉市场。

    聚划算成为了阿里系的“拼多多”。而这次的618,也将成为聚划算回归后的第一个重要战役。

    另外,淘宝直播也是一股不容忽视的力量。2018年淘宝直播开播商家数量数倍增长,打造出了以李佳琦为代表的一批直播红人,完成了带货千亿的成绩。今年的天猫618,淘宝直播也计划配合聚划算达成百亿成交额。

    18

    李佳琦被称为“淘宝口红一哥”

     拼多多:坚守下沉市场 

    京东和天猫的战略,多少都能看到效仿和压制拼多多的影子。

    对此,拼多多的应对也十分直接:砸钱

    19

    6月1日开始,拼多多618大促高调官宣“百亿现金补贴”,表示要“打造全网最热10000款商品的全渠道历史最低价”。

    在具体操作上,拼多多安排了专门的“百亿补贴”小组24小时待命,比对线上线下所有渠道的价格,实时更新,确保用户能在拼多多上得到最低的价格。这种截杀式的“人盯人”防守,可以说是非常拼了。

    总的来说,在经历了10年双11、9年618之后,电商市场终于开始冷静下来。曾经层出不穷的各种花哨概念开始褪去,一切都在向商品的本质回归。

    至于商家,这样的局势则是对他们捕捉需求的能力,以及把控选品、供应链、价格的能力,提出了更高的要求。

    最后,对广大消费者——尤其是小智这样钢铁耿直的消费者来说,其实过什么节不重要,炒什么概念也不重要。

    少一点的套路,多一点的优惠,高一点的品质,这些才是永恒的诉求。

    研究所二维码

    「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

    每一本书,都很好~

    前两天在toward science上看到有个作者推荐了关于数据科学学习的10本书籍,于是我特地去搜索了一下,发现确实还不错,于是想着给大家推荐过来。话不多说,直奔主题~

    No. 1 Weapons of Math Destruction算法霸权:数学杀伤性武器的威胁

    作者:凯西•奥尼尔

    1111

    我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。

    但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。

    读完本书,你会发现,大数据的武器化是无处不在的。也许,当你看到世界上最强大的数据系统做的这些事,你会产生一些焦虑,但是,对于那些我们未能认识到的问题,我们谁都无法解决。

    如果你想从事数据科学相关的工作,这本书绝对是必读之作。

    No.2 Everybody Lies 人人都在说谎:赤裸裸的数据真相

    作者:赛思·斯蒂芬斯·达维多维茨

    2222

    赛思·斯蒂芬斯·达维多维茨是前谷歌数据科学家和专栏作家。他的研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于以上以及类似的很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。

    但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。

    读完这本书,你将收获:1)找到筛选正确数据的方法,了解人们实际在做什么;2)拓展认知思维,正确认识世界运转的方式;3)掌握未来的发展趋势,让你的规划更有远见。

    No.3 Big Data大数据时代:生活、工作与思维的大变革

    作者:维克托·迈尔-舍恩伯格

    3333

    本书作者维克托·迈尔·舍恩伯格现任牛津大学网络学院互联网研究所治理与监管专业教授,系国际资深大数据专家。他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。

    他明确指出了大数据时代处理数据理念上的三大转变:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。这些都颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。本书认为大数据的核心就是预测。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。

    No. 4 Algorithms to Live By: The Computer Science of Human Decisions 算法之美:指导工作与生活的算法

    作者:布莱恩·克里斯汀&汤姆·格里菲思

    4444

    “我们所有人的生活都受到有限空间和有限时间的限制,因此常常面临一系列难以抉择的问题。

    在一天或者一生的时光里,哪些事是我们应该做的,哪些是应该放弃的?我们对杂乱无序的容忍底线是什么?新的活动与熟悉并喜爱的活动之间如何平衡,才能取得令人愉快的结果?

    这些看似是人类的难题,其实不然,因为计算机也面临同样的问题,计算机科学家几十年来也一直在努力解决这些问题,而他们找到的解决方案可以给我们很多启发。

    通过丰富的跨学科研究,作者指出,计算机算法也可以用来解答人类面临的这些问题。这本书告诉我们如何更地利用直觉、什么时候应该把选择权交给命运、无所适从的时候应该如何做出选择,以及如何地与他人保持联系。从找配偶到找停车位,从组织管理个人邮箱的收件箱到理解人类记忆的作用原理,这本书把计算机科学的智慧转化为人类生活的策略,引导我们做出明智的选择。

    No.5 The Signal and the Noise 信号与噪声

    作者:西尔弗

    5555

    本书可能是世界上最受欢迎的统计相关的书籍之一。信号与噪声是常用在数据科学中的一种比喻手法。“信号”指的是我们想要和需要的事实,比如能帮助我们侦破早期鞋子案的信号。“噪声”则是另一回事,通常指的是不相干的信息,它阻碍或误导我们搜索信号。

    在信息爆炸的大数据时代,随着我们的生活节奏变得越来越快,我们所要做出的预测的速度和数量都在不断增加。

    一个不容忽视的事实是,现实世界中的很多预测都失败了,由此付出了巨大的社会代价。本书检视了从飓风到地震、从经济到股市、从NBA到政治选举在内的众多领域的预测事例,旨在回答一个问题:如何才能从繁杂的海量数据中筛选出真正的信号,摒弃噪声的干扰,从而做出接近的预测。

    真正的预测者会用概率的方法思考问题,他们谦虚而且勤恳,他们能清楚地区分什么是不可预测的、什么是可预测的,他们注重能带领他们接近的成千上百个小细节,他们能辨识出什么是噪声、什么是信号。

    从全球经济的健康到战胜恐怖主义,都依靠预测的质量。《信号与噪声》可以给你想要的答案。


    另外还有几本书,目前我还没看到有中文版本,如果你英文也很ok的话,也建议看看:

    1)The Information: A History, a Theory, a Flood by James Gleick

    2) Dataclysm: Love, Sex, Race, and Identity-What our online Lives Tell Us About Our Offline Selves. by Christian Rudder

    本周就到这里了~以后发现好的书籍再推荐过来~

    来源 | AI搬运工知乎号

    研究所二维码

    让你早2小时下班的秘密,都在这节课里 | 新课来了

    让你早2小时下班的秘密,都在这节课里

    加班加点,已然成为很多职场同学的生活日常。尤其是遇到几个小时候的会议,光是整理会议记录就能让人加班到零点,1个小时的讲话内容整理起来却能耗费3-4小时的时间,然后很多会议都是3小时起步的……

    1

    今天班主任就要给大家介绍一项重要的智能语音能力——语音转写,能够实现语音内容的识别,展现对应文字内容,会议3小时,出稿30分钟,让同学们每天早2小时下班~(毕竟我们的愿望是可以和东山结衣一样,到!点!就!下!班!)

    2

    温馨提示:本节课程文字内容较多,阅读需要12分钟~

    👇👇👇

    3

    一、语音转写的本质

    语音转写本质上是统计模式识别,对于给定的观察序列O ={o1, o2, · · · , oT },可以采用贝叶斯决策的最大后验概率(MAP)判决来得到最可能的输出序列W∗,其公式表达如下:

    4

    通过贝斯公式可以把上述公式转变为下列公式:

    5

    语音转写技术栈里包含了多种技术,比如神经网络这一块,有Bilstm双向神经网络以及dnn模型,LSTM模型cnn模型,还有wfst以及decoder解码器等。

    6

    语音转写流程大概有以下几个步骤:

    • 首先输入语音信号进来,然后经过降噪、端点检测、特征提取,这些部分可以认为是前端处理模块;
    • 经过前端处理,得到特征之后,就可以进入识别过程,识别过程中用到了两个模型,一是声学模型,一是语言模型;
    • 结合声学模型语言模型,在解码器中进行识别解码的过程,得到相应的识别结果;
    • 然后将识别结果经过一些文本处理相关操作,最终得到识别结果。

    这其中还包含了一个训练过程,离线训练的时候,将提取到的语音特征,送到模型训练模块去进行离线训练,得到声学模型以及语言模型。

    二、语音转写相关技术

    下面我们来看一下前端处理、识别过程、后处理这几大块的相关技术。

    前端处理

    前端处理模块主要是将接收到语音信号进行预处理,增强或降噪等。

    加窗分帧

    对于预处理后的语音波形信号,首先需要进行加窗和分帧操作。 通常采用 25ms 的汉明窗,窗移为 10ms。这样整段的语音波形就会被分割成很多带有重叠的 25ms 的小语音片段,然后再使用合适的声学特征提取算法从 25ms 的语音片段中提取相应的声学特征。

    7

    声学特征

    好的声学特征不仅需要具有很强的区分特性,可以很好地表达不同音素之间的差异性,而且还需要具有很好的鲁棒性,不受噪音环境的干扰。

    通过分析人类听觉系统的时频分析特征和听觉掩蔽效应,研究人员提出了多种不同的声学特征。

    下列表格列了一些常见的声学特征,以及它们相关的应用场景。

    8

    VAD

    VAD是Voice Activity Detection 的简称,语音活动检测,又称端点检测。是在一段音频信号中对语音信号和非语音信号(包括无声段或背景噪声)进行划分,提取语音信号部分的一个过程。

    它主要作用是要提把已接收到一段语音信号提取有效的音频段,减少噪音的干扰。其实它既减少了噪音的干扰,也减少了语音识别过程中的计算量。

    目前VAD常用的都是一些模型方案,比如DNN模型,输入每一帧音频的特征,预测这一帧到底是有效语音还是非有效语音。

    三、声学模型计算

    下面我们讲一下声学模型的计算。首先同学们想一想声学模型计算到底是在计算什么?

    对于每一个可能的词序W,计算出条件概率P(O|W),即我们通常所说的AC score。

    O可以认为是一个发音信息,在输入W条件下输出O的一个概念,也就是说每一帧的语音对应的是到底是什么音素。

    常见的有单音素模型,单音素模型没有考虑本音素前后音素对本音素的影响;还有三音素素模型,它考虑到上下文的因素,是现在最常用的一个声学建模单元式。

    9

    声学模型计算的主要任务是判断每一帧语音属于什么音素,以上面图谱为例,声学模型其实要判断哪一帧是静音sil,哪些帧是声母zh,哪些帧是韵母ong等。

    按模式识别的套路,先提取出特征,再建立分类模型。

    FFT将时域转换到频域,因为频域对音素具有更好的区分能力,接下来我们将频域特征经过mel滤波器,主要是模拟人耳听音,这样就得到了代表一帧语音的特征向量。

    接下来可以使用前馈神经网络,输入为mel filterbank特征,输出可以为音素或其它建模单元。

    按这个框架是不是就解决了语音识别中的声学建模问题呢?显然不是,因为语音是典型的时序序列信号,不同的人说同样的音,或同样的音在不同的上下文中时长是不一样的。每一帧都得到一个音素,但相邻帧可能是不同的音素,这样最后会得到一堆乱七八糟的音素序列,很难形成自然的文字序列。

    基于HMM-GMM框架

    怎么解决这个问题呢,第一代语音识别使用HMM-GMM技术框架

    首先,将建模单元从音素退化到状态,即一个音素有3-5个状态构成;对一个音素而言,只有从起始状态跳转到结束状态,一个音素才算识别结束。

    其次,我们用HMM模型来建模状态跳转概率,可以看这幅图中是ue2这个音素的HMM单元;我们将音素的中间状态设计成可以自跳转,从而解决了同一个音素在不同的上下文时长不同的问题。

    10

    最后,我们用GMM建模状态输出概率,HMM-GMM模型在语音识别历史上起到了重要作用,对语音识别的实用化至关重要。

    基于HMM-DNN框架

    第二代框架仍使用HMM建模状态转移概率,但使用DNN替换GMM模型。在GMM模型框架下,不同的状态采用不同的模型来建模,在DNN框架下,所有的状态采用同一个模型来建模,也就是所有的状态共享一个输出层。

    11

    这样做有3个好处:

    • GMM是local的表达,DNN是分布式表达;意思是当训练音素A时,使用GMM只能用A的所有数据,使用DNN既可以用A的数据,也可以用A的反例数据;这么做使得DNN模型的区分能力更强;
    • GMM模型因为计算复杂度的原因需要帧独立性假设,这显然是不符合语音的属性的;但DNN是不需要的;
    • DNN同时具有特征取的能力,DNN的底层可以看成特征提取层,所以我们可以输入更原始的特征,让模型自动通过数据进行学习。这一点对于效果的提升很有好处。

    语音识别需要对波形进行加窗、分帧、提取特征等预处理。训练GMM时候,输入特征一般只能是单帧的信号,而对于DNN可以采用拼接帧作为输入,这些是DNN相比GMM可以获得很大性能提升的关键因素。

    基于HMM-RNN框架

    然而,语音是一种各帧之间具有很强相关性的复杂时变信号,这种相关性主要体现在说话时的协同发音现象上,往往前后好几个字对我们正要说的字都有影响,也就是语音的各帧之间具有长时相关性。采用拼接帧的方式可以学到一定程度的上下文信息。但是由于DNN输入的窗长是固定的,从而导致DNN对于时序信息的长时相关性的建模是较弱的。

    考虑到语音信号的长时相关性,一个自然而然的想法是选用具有更强长时建模能力的神经网络模型。于是,循环神经网络(RecurrentNeural Network,RNN)出现了。

    12

    如图,相比前馈型神经网络DNN,循环神经网络在隐层上增加了一个反馈连接,也就是说,RNN隐层当前时刻的输入有一部分是前一时刻的隐层输出,这使得RNN可以通过循环反馈连接看到前面所有时刻的信息,这赋予了RNN记忆功能。这些特点使得RNN非常适合用于对时序信号的建模。

    基于HMM-LSTM框架

    而长短时记忆模块(Long-Short Term Memory,LSTM)的引入解决了传统简单RNN梯度消失等问题,使得lstm框架可以在语音识别领域实用化并获得了超越DNN的效果。

    13

    主流RNN声学模型框架都是基于lstm结构的,主要包含两部分:深层双向lstm和序列短时分类(Connectionist TemporalClassification,CTC)输出层。

    其中双向RNN对当前语音帧进行判断时,不仅可以利用历史的语音信息,还可以利用未来的语音信息,从而进行更加准确的决策;CTC使得训练过程无需帧级别的标注,实现有效的“端对端”训练。

    基于HMM-CNN框架

    CNN早在2012年就被用于语音识别系统,并且一直以来都有很多研究人员积极投身于基于CNN的语音识别系统的研究,但始终没有大的突破。

    最主要的原因是他们没有突破传统前馈神经网络采用固定长度的帧拼接作为输入的思维定式,从而无法看到足够长的语音上下文信息。另外一个缺陷是他们只是将CNN视作一种特征提取器,因此所用的卷积层数很少,一般只有一到二层,这样的卷积网络表达能力十分有限。

    14

    针对这些问题,我们研发了一种名为深度全序列卷积神经网络(Deep Fully ConvolutionalNeural Network,DFCNN)的语音识别框架,使用大量的卷积层直接对整句语音信号进行建模,更好地表达了语音的长时相关性。

    DFCNN的结构,它直接将一句语音转化成一张图像作为输入,通过累积非常多的这种卷积池化层对,DFCNN可以看到非常长的历史和未来信息,这就保证了DFCNN可以出色地表达语音的长时相关性,相比RNN网络结构在鲁棒性上更加出色。

    基于Enc-Dec框架

    基于HMM-GMM框架的语音识别系统可以认为是第一代语音识别系统,基于HMM-DNN、HMM-RNN、HMM-CNN框架的系统可以认为是第二代语音识别系统。

    这些语音识别系统都是由声学模型和语言模型两部分组成,由于两个部分在训练时相互独立,因此在实际应用中经常会出现由两个模型的协同不好引起的识别错误。而ED方案最大优点是声学和语言的联合训练,训练方式更为简单,并且在大数据时代,这个优点会更加的突出。

    15

    同时,由于传统语音识别的方案采用音素状态建模的方式,中英文混合建模容易带来相互之间串扰的问题,实际使用中一般采用中文和英文分别建模的方案。

    而对于编解码识别框架,建模单元可以选用对中文的单字和英文联合建模的方式,而中文的单字和英文的单词基本上不会出现发音相近的情况,避免了传统方案中的中英文相互串扰的问题。为了减少建模单元的数量同时又保证英文单词对于罕见词的覆盖度,英文建模单元拟根据双字节编码(BPE)的方式构建英文子词。

    因此,基于注意力机制的中英文混合建模的编解码语音识别系统的建模单元采用中文的单字和英文的子词的混合建模方式

    基于Enc-Dec的语音识别系统可以称为第三代语音识别系统,也是最新一代的识别系统,可以同时支持多个语种,例如现在讯飞输入法上线的中英随心说功能就是使用的ED模型,可以同时支持中英文。

    看到这里的小伙伴~都是学习力max的好童鞋~关于语音转写的技术课程,其实并没有完全讲完,因为阅读时长缘故,语言模型和解码部分的内容就都放在视频课程中了,希望感兴趣的小伙伴能够认真学完~

    研究所二维码

    AI服务市场618 | 亿万服务,钜惠来袭!

    AI有玩,优惠没完!

    号外!号外!618全球年中购物节开始啦!此刻的你,是不是推着堆得满满的购物车正准备下单结账呢?

    1

    且慢!

    大家不要忘了还有一个重量级的会场,那就是讯飞开放平台618钜惠大放送!

    7折明星产品、海量大额优惠券、精品解决方案、服务市场周年惠……超多AI能力优惠大放送!

    下面,就让我来为大家解读这份讯飞开放平台最全最省的618抢购攻略!

    2000¥无门槛优惠券

    为开发者和企业谋福利,我们是认真的!

    总价值2000元的无门槛优惠券大礼包双手奉上,100元、200元、300元任你组合,多买多划算。还不快揣进口袋!

    1.  优惠券产品,肆意折上折222

    2.  领取方法

    关注“讯飞开放平台”微信公众号,在后台输入:618#您的11位手机号,即可领取2000元粉丝专属无门槛优惠券,享折上折优惠,下单即减。

    3.使用说明+有效期

    1. 优惠券自动发放至用户账户,用户可在控制台—财务中心—优惠券查看。使用时,需用领券的手机号登录讯飞开放平台官网;
    2. 优惠券在提交订单时抵减相应金额,每张券仅可使用一次,不可提现、转赠;
    3. 若发生订单退款,仅退还实际支付部分,优惠券抵扣金额不予退款;
    4. 活动时间:2019年6月14日-7月15日
    5. 本活动最终解释权归讯飞开放平台所有。

    AI能力狂欢购

     1. AI明星产品 

    语音转写识别准确率98%,机器翻译2.0支持含英、日、韩、法、西、俄等100多种语言翻译,语音听写输入速度达180字/分……

    长期以来,这些能力都是开放平台备受欢迎的明星产品,当然也是本次大促的重头戏——

    333

     2. 图像处理专场 

    除了备受青睐的语音产品,为了满足大家在不同场景下的多样需求,本次开放平台618还开辟了图像处理专区——

    444 3. AI离线+硬件专场 

    智能硬件将软硬件结合,对传统设备进行改造,拥有智能化的功能和 “云+端”的典型架构。而这一次,我们也将在“AI离线+硬件专场”中进行优惠放送——

    555

    精品解决方案优惠放送

    除了单点能力以外,本次还有一大波精品解决方案的优惠放送。针对项目中的出现的需求、不足、缺陷等,提出一个解决整体问题的方案,帮助企业快速有效地实施操作。

    666

    AI生态扶持大礼包

    除了单点能力和解决方案,本次的开放平台618还有生态扶持的加码,以诚挚回馈辛勤工作的开发者们!

    我们为全体开发者提供AI生态扶持大礼包,服务量免费赠送,接入即可获取免费服务。

    777

    服务市场周年钜惠

    讯飞AI服务市场是国内首个人工智能全产业链综合服务平台,旨在整合AI产业上下游链路,构建以人工智能为核心的产业生态圈。9年来,讯飞开放平台不断开放和迭代近90项核心技术,2019年平台对外开放的服务能力将达到200项。本次开放平台618,服务市场也为用户提供了许多直接可用的AI产品,有需求的用户可直接在官网进行咨询。也欢迎购买了开放平台能力的开发者加入我们,入驻成为服务商。

    好啦,介绍了这么多,事不宜迟,现在扫描下方二维码,开始买买买吧!

    8


    研究所二维码

    8强出炉!AI星火营上海营强势来袭!

    6月20日,上海见分晓!

    公众号封面图

    讯飞AI星火营·上海营将于6月20日在晨晖创业空间拉开帷幕。在专家评审团的层层筛选下,入围路演的项目正式出炉!同时,本期活动也邀请了达晨创投、中南资本、Plug and Play、戈壁创投等知名机构参与现场评审环节,敬请期待~

    经过前期的征集评选,共有八支团队入围,分别是:芯视界、燧方智能、衍视科技、庄生晓梦、睿佳科技、仪酷智能、亮啦、华芯邦。项目涵盖AI+(医疗、交通、教育等领域),他们有针对行业痛点,提供自己的解决方案;有放眼未来,创造性的研发应用和产品。个个都是实力非凡!

    下面,我们一起来认识一下这些团队以及他们的项目:

    芯视界logo

     

    南京芯 视界微电子科技有限公司

    • 项目:大数据中心超高速光电互联芯片及系统解决方案
    • 简介:南京芯视界微电子科技有限公司成立于2018年,公司拥有领先世界的光电转换器件设计和单光子检测成像技术,主营固态激光雷达芯片、大数据中心超高速光电互联芯片及系统解决方案。2018年6月,南京芯视界获得峰瑞资本、江北智能制造产业基金领投的数千万元Pre-A轮战略投资,并全资收购硅谷芯片设计公司(visionICs LLC),从而开启公司发展新阶段。
    • 所属行业:光电
    • 融资轮次:Pre A
    • 此轮估值:2亿 

     

    上海燧方智能科技有限公司

    • 项目:智能区域移动项目
    • 简介:上海燧方智能科技有限公司,致力于智能移动领域的技术研发、终端产品和服务的提供。针对封闭场景的路况条件,通过对车体、软件、运营的一体化设计,实现车辆自动驾驶、乘客定制化移动、信息化平台等功能,并优化区域内的交通和信息管理。
    • 所属行业:交通
    • 融资轮次:天使轮
    • 此轮估值:1亿

    衍视logo 

    衍视电子科技(上海)有限公司

    • 项目:无介质空气全息显示智能终端
    • 简介:衍视是国内乃至全球第一个开发车载全息透明显示应用的车联网创新型公司。创始人在跨国汽车行业20年的工作经验,分别在FORD, VISTEON, VALEO等公司工作过。历任中国区、亚太区高管。衍视科技的主营业务是AR-HUD,无介质空气全息显示智能终端,以及V2X车窗多媒体系统。
    • 所属行业:车载
    • 融资轮次:A
    • 此轮估值:3亿

    睿佳Logo

    睿仁佳心(上海)科技有限公司

    • 项目:智能术前规划与影像云服务
    • 简介:睿佳科技是“AI+手术规划”领域的先行者和破局者,是一家智能术前规划与影像云服务提供商。主要面向放射科、普外科、肝胆外科、胰腺外科、微创介入科等临床科室,提供基于人工智能的器官/病灶自动识别、血管识别、术前建模与手术质控等技术工具和服务。同时,基于互联网和云服务平台,为影像相关医生和患者提供专业远程协作和运营网络服务
    • 所属行业:医疗健康
    • 融资轮次:天使轮
    • 此轮估值:2000万

     庄生晓梦logo

    上海庄生晓梦信息科技有限公司

    项目:全向感知交互技术解决方案

    • 简介:上海庄生晓梦信息科技有限公司专注于全向交互感知技术,提供围绕手机和办公会议场景的边缘计算感知交互解决方案,海康威视萤石生态企业。
    • 所属行业:视频物联网
    • 融资轮次:Pre A
    • 此轮估值:8000万人民币

     仪酷智能

    上海仪酷智能科技有限公司

    • 项目:人工智能教育开发平台(com)
    • 简介:上海仪酷智能科技有限公司(VIRobotics),是国内领先的人形机器人软件开发商和人工智能教育产品供应商,相继获得“NAO 机器人创客马拉松赛”亚军、“软银Aldebaran 最佳技术创新奖”、”软银谷歌机器人开发技术创新奖”。致力于人形机器人基于图形化 NI LabVIEW 的编程环境的研发,目前软件已通过美国国家仪器的官方认证,向全球发布,搭建人工智能教育开发平台(com)专为中小学人工智能课程设计、高校编程语言学习以及人工智能产品的研发
    • 所属行业:智慧教育
    • 融资轮次:Pre-A
    • 此轮估值:6000万

     亮啦logo

    亮啦(上海)数据科技有限公司

    • 项目:人脸识别解决方案
    • 简介:亮啦是A股上市公司中国闸机龙头企业华铭智能、中国互联网安全龙头企业三六零联合投资的基于智慧交通的移动互联网、大数据科技企业亮啦数据致力于智慧交通智慧出行,拥有扫码乘公交、扫码过闸机乘地铁,人脸识别乘公交、人脸识别过闸机乘地铁的自有知识产权的核心产品和技术;亮啦交通云平台,以云计算、AI人工智能为核心,可实现城市公共交通的智能产品布局、智慧化解决方案和城市场景支付入口的互联互通及多城市移动支付乘车互联互通;
    • 所属行业:智慧交通
    • 融资轮次:B轮
    • 此轮估值:15亿

     华芯邦logo

    深圳市华芯邦科技有限公司

    • 项目:AMOLED芯片
    • 简介:华芯邦集团自2008年成立迄今一直致力于发展中国的集成电路设计事业,提供高性能,低功耗的集成电路芯片,通过产业链的垂直整合,不断提高公司的核心竞争力,突破国外公司的技术壁垒和垄断,在先进晶圆制造工艺、独特封装技术和超大规模集成电路设计方面三位一体均衡发展,不仅有效保证了产品品质,产品的价值也得以体现,为客户提供最优质的解决方案,近年公司大力投资于AMOLED 供电芯片,实现国产AMOLED屏商业化后对芯片的客制化需求。
    • 所属行业:芯片
    • 融资轮次:B轮
    • 此轮估值:5亿

     

    入围项目团队将获得

    1、现场直面上百家投资机构,项目BP推送合作投资机构,更有讯飞创投基金直投机会

    2、讯飞创孵计划:获得讯飞“技术+产业+品牌”的全方位创业扶持

    3、“1024全球开发者节”线下参展及演讲名额,全球顶级开发者盛会,2千万+曝光量

    4、产业直通车:与产业导师深度交流,促进双方业务合作

     

    没有入围此次路演的小伙伴也不要灰心,接下来讯飞AI星火营还将在全国核心创业城市陆续开营!只要你有创意、有想法,坚定了创业的打算,想要在智能领域开辟自己的天地,我们都竭诚欢迎你的加入!

    讯飞生态平台将汇聚讯飞内外部优质创业资源,为你提供技术支持、资本对接、创业指导、产业扶持、品牌背书等优质创业生态资源,帮助你的团队快速成长!


    主办方:讯飞生态平台

    联合承办:晨晖创业空间  浦软孵化器  盛大创业苗圃 功夫国际孵化器

    合作媒体:亿欧  镁客网  张江头条

     

     

    2019-06-20 ~ 2019-06-20上海
    我爸说,二十年前他帅爆整条街?AI修复照真相了!

    父亲节感悟:帅爹面前无idol。

    前段时间,网上掀起了一阵“AI修复老照片”的热潮。老照片上的明星们,原本轮廓朦胧、只能依稀辨认出俊俏的面庞,经过AI画质修复后,眉目越发明朗,五官细节也清晰显现,整体颜值double!

    王祖贤和张国荣▼

    1

    林青霞▼

    2

    胡歌▼

    3

    网友们纷纷感慨:原来都是被画质耽误了颜值啊!

    这让小智想起来早前网上热议的一个话题——“有一个长得很帅的爸爸是种怎样的体验?”

    话题下有不少网友翻出了各自家庭中关于父亲的珍贵老照片。照片中父亲们年轻时的面容帅气惊艳,丝毫不输现在的小鲜肉。

    在父亲节来临之际,我们特别准备了这期文章,将这些帅气的照片进行了AI修复!

    原本就是“神颜”的爸爸们的旧照,再经过现代科技修复后,会有怎样惊艳的效果呢?

    4

    ·

      !

    @小甜甜i:

    当年的盛世美颜 ▼

    5

    @匿名网友:

    这是我的father in law(岳父)Ps.托他的福,我女朋友很漂亮▼

    6

    @全世界最帅的酒酒:

    #论别人都以为那是男朋友其实是我爹#
    #学姐来要我爹QQ号是什么体验#▼

    7

    @ClaireCeltics:

    体验大概就是,大家都觉得我应该找不到比爸爸帅的男朋友。▼

    8

    @酱男嗷:

    有人说像白敬亭?

    希望爸妈永远年轻,洋溢青春和历经岁月的脸,都很动人▼

    9

    10

    @李拜天:

    我奶奶说,我爸年轻的时候村里人都说他靓仔,简直是村草。真不愧是我上辈子的情人! ▼

    11

    @Lynn:

    我爸爸,很帅▼

    12

    13

    @喵酱:

    我要让我爸火起来!▼

    14

    @老王同学:

    都闪开!让我来回答

    上中学的时候每次来学校送饭都被一群女同学追着问:这是你爸??▼

    15

    16

    @a Fan:

    我爸的18岁,像不像苏有朋!!▼

    17

    @匿名用户:

    我爸二十多那时候,简直了~

    我房间贴男星海报,他都不理解,说什么“还没我当年好看呢”吧啦吧啦~~▼

    18

    @匿名用户:

    体验就是,大家都觉得他比我帅▼

    19

    @Jackson每晚十点睡:

    穿制服的爸爸真的很帅▼

    20

    真的是一波又一波的颜值暴击啊~原本模糊的老照片就能看出来帅了,修复后的爸爸们,更是大写加粗让人扯着嗓子喊的帅啊!

    小智真的感到有点酸溜溜了······

    21

    大家的爸爸都又高又帅,而我的爸爸········除了钱以外,一无所有

    22

     AI修复术是怎样炼成的

    好了,大家擦擦口水,小智要讲重点了——AI照片修复技术到底是什么原理呢?

    可能会有人认为,这种AI修复术和我们常见的PS、磨皮使用的是同样的技术。其实并不是这样。

    修复照片是利用AI算法增加图片的像素值,而磨皮则是对人像的皮肤部分进行模糊处理。简单点说就是:磨皮减少了细节,AI修复增加了细节。

    23

    磨皮后会产生面部细节的丢失

    删除东西很简单,但增加内容就需要创造了,因此修复的技术难度会更大。

    首先,研究人员会先对图片数据集A进行“增噪”处理,得到高糊的数据集B,再将A和B都输入神经网络的模型中训练,告诉机器:B降噪后应该是A。而如何实现中间的降噪过程,就交给AI自己去“琢磨”了。

    等到AI自己“琢磨”透了实现过程,它就能实现给任何人脸图片降噪了。

     破损照片也能修

    除了让模糊的照片变清晰,AI技术还能将照片中的破损部分补齐。

    24

    一些老照片不仅是模糊,还存在一定的破损问题

    通过使用对抗网络的机器学习方法,从海量数据中学习识别人脸,掌握脸型、肤色、五官等面部各个维度的信息。然后“阅人无数”的AI就可以根据照片的剩余内容“想象”出缺失的部分。

     修完不像本人?

    照理来说,处理之后的图像应该与本人更接近了。不过最近,民国才女林徽因的一张修复照引发了网友们不小的争议,因为修复后的林徽因看起来变成了另一个人

    25

    林徽因修复照

    修复后的照片中,林徽因虽然依旧漂亮,风格却似乎过于现代化:浓眉毛、高鼻梁、欧式大眼睛。不少网友看完后纷纷吐槽“这不是网红吗”“跟原来的气质一点都不像”。

    26

    林徽因的原生长相,气质温婉而坚毅

    实际上,结合上面小智给大家科普的内容,大家应该就可以猜到其中缘由。

    因为修复老照片的过程,更准确地说是一种具有“创造力”的绘画过程,AI会根据已学习过的人脸图片形成自己的“经验性审美”。

    如果原始照片残缺过多,给AI留下了很大的“创作空间”,而训练所用数据中现代女性照片又非常多,那修复结果自然就会更像现代人。

    所以,并不是AI只能修出现代脸、网红脸,在使用了合理训练数据的情况下,即使是年代久远的旧照,也还是会有很高的还原度的。例如小智最喜欢的这一组!

    周总理旧照修复▼

    27

    谦谦君子,温润如玉。这个男人真的不是一般的帅▼

    28

    29

    “他那张脸严肃而又透出聪颖,富有男子汉气概。” ▼

    30

    除了个人魅力,周总理和邓颖超相互扶持的爱情也十分让人羡慕

    在周总理回给邓颖超的信件中,柔情满溢:“你的信太过官方,都不说想我。”

    31

    “我这一生都是坚定不移的唯物主义者,唯有你,我希望有来生。望你珍摄,吻你万千。”

    32

    可以说,总理的魅力,不只是来自于外貌和气质,更来自于他温和的性情、坚定的信仰,以及强大的内心。是小智最喜欢的人没错了!

    随着社会的发展,现代拍照技术越来越先进,更多的色彩、更精致的细节都能被轻松地拍摄保存。而老照片这种像素低、保存又困难的存在,则逐渐退出了时代舞台。

    不过,仍然有不少人守护着这样一份情怀,就像珍惜昔日时光一样珍惜着这些老照片。

    而在现代技术的加持下,不仅模糊的相片变得更加清晰,那些沉淀在时光中的情感与故事,也仿佛被再次唤醒。

    更多精彩,请关注微信公众号“AI研究所”。

    研究所二维码

    智能语音的未来,从这里开始

    1877年,爱迪生在笔记本上写下:“要让机器会说话,会唱歌,会哭闹。”

    Hello~研究所的小伙伴们大家好,今天小智要给大家推荐一本书——《智能语音时代》。书中对苹果、谷歌、微软、亚马逊、facebook等行业巨头的智能语音技术布局和商业角逐进行了深度分析,非常值得一看哦!

    下面我们就来看一看关于本书的详细介绍吧~

    1

    作者:[美] 詹姆斯· 弗拉霍斯(James Vlahos),是《纽约时报》《连线》《大众科学》《科学美国人》《大西洋》《智族GQ》和《国家地理》等杂志著名记者,美国鬼才科普作家

    出版社:电子工业出版社

    出版时间:2019年5月

    20世纪90年代,互联网还比较封闭,许多用户依赖美国在线来组织管理网站,他们在一个网站收集信息的同时也要列出其他可能包含有用信息的外部网站。如有体育或金融信息的网站,用户的浏览范围极大地受到限制,这就好像是“被围墙包围的花园”,随后谷歌公司用一把“大锤”敲开了这些“围墙”:通过谷歌搜索引擎,人们可以轻松访问各种网站、自由浏览网页。

    但是这几年,谷歌公司和亚马逊似乎打算重建“花园围墙”。

    谷歌公司的即时回答功能减少了人们从搜索结果页面导航到其他网站的需求;谷歌和亚马逊分别推出了各自的语音助理,正如数字营销机构胡歌的创意总监索菲·克莱伯所说,“亚历克莎就是语音版的美国在线。”

    谷歌助理和亚历克莎应用程序都是由谷歌公司和亚马逊公司自己开发的,用户要访问任何第三方应用程序,必须首先使用谷歌助理或亚历克莎。例如,如果用户想使用亚历克莎的语音调用功能,可以说:“亚历克莎,看下《华盛顿邮报》头条”或“亚历克莎,玩下《危险边缘》游戏。”同样地,用户也可以说:“打开点评网站Yelp”或“娱乐与体育节目电视网上有什么新闻?”

    如果用户确切地知道想要的应用程序,这种语音调用可以很好地工作,否则,这就像在没有搜索引擎帮助的情况下寻找新网站。因此,当在没有指定应用程序的情况下提出问题或请求时,亚历克莎或谷歌助理将可以决定如何实现它。这给了谷歌公司和亚马逊公司很大的控制权来决定语音流量的去向。

    整个安排看起来很像过去那些“被围墙包围的花园”。这并不一定是那些公司(以亚马逊公司或谷歌公司为代表)为获得控制权而有意为之的,尽管它们当然非常乐意从中获益。语音调用适合由一个单一的数字实体来进行,Siri的开发者们当然也认同这一观点。

    在没有主导性的语音助理的情况下,每个语音应用程序都是被独立开发的,每个语音应用程序都有自己的名字、特定的能力和专门的命令的标识。“我觉得人们记不住1万个不同的名字和命令集,”切耶尔说,“因此,这个模式不能一直扩大。”

    离开苹果公司后,切耶尔和吉特劳斯开发了语音助理Viv,他们希望打造一个单一的、全能的语音助理。谷歌公司和亚马逊公司虽然不希望被人视为“有围墙的花园的守门人”,但它们一直在往这个方向走。与它们不同的是,Viv团队已经公开宣布它的目标是成为人们需要的最后一台,也是最好的一台计算机。

    “这是一场竞赛,”吉特劳斯说,“一场为用户设计单一界面的竞赛。”

    一.

    Viv团队拥有由智能语音领域开拓者所开发的强大技术。虽然它的面世较晚,但该团队已成为这场界面竞赛中的一匹“黑马”。几年前似乎还是“万马奔腾”的竞争场面,但现在胜负已经非常明显了。

    让我们从苹果公司开始,一个公司接一个公司地分析。Siri是世界上被使用最广泛的语音助理,它每月处理100亿次请求,会说20多种语言,这是个好消息。

    坏消息是,苹果公司没有按照Siri开发者的设想来推进Siri的发展,这使它的能力没有预想的那么好。许多科技评论家都把焦点放在Siri身上,不管公平与否,Siri已经成为语音人工智能的“出气筒”。Siri“笨手笨脚”“令人尴尬”(《华盛顿邮报》);“Siri是苹果公司错失的最大机会”(《休斯敦纪事报》);“Siri有令人尴尬的不足之处”(《纽约时报》)。技术分析师杰瑞米·欧阳告诉《今日美国》:“这就好像苹果公司已经完全放弃了Siri。”

    虽然这有点言过其实,但苹果公司被批评并不冤枉,它最初是语音人工智能的领导者,但现在已经落到后边了。直到2018年2月,苹果公司才发布了智能音箱HomePod。这已是在谷歌公司推出智能家居设备谷歌家庭近一年半之后,也是在亚马逊回声音箱推出三年半之后的事了。

    评论家称赞了智能音箱HomePod的音质,但也指出人们需要为它支付更高的费用——发布时的售价是349美元,而亚马逊回声音箱发布时的价格是99美元。很多人指责Siri在这款设备上的表现不佳。截至2018年6月,智能音箱HomePod在美国智能音箱市场的份额仅为4%。

    苹果公司在智能语音领域的做法,似乎与它的设备制造商的背景有关。因此,苹果公司将Siri定位为基于设备的一项重要的特色功能,而不是被销售的产品。然而,如果像谷歌公司和亚马逊公司预测的那样,这种技术将成为一种环境性的存在,那么语音助理将至少会给苹果公司带来一些风险。

    在未来的这种人工智能机器人“生活”在云端、通过廉价商品“发声”的世界里,销售高价电子产品的苹果公司,与现在相比,可能会变弱很多。

    二.

    接下来分析微软公司,微软公司拥有世界一流的人工智能部门,员工有8000多人。它拥有强大的必应搜索引擎,可以增强其语音助理回答问题的智能水平。它还有一个成熟的语音助理——微软小娜。

    但微软公司很难让它的语音技术得到用户的青睐。它在必应和Skype上都有聊天机器人,但这两个平台都远不如谷歌公司或脸书公司的Messenger这种平台那么受欢迎。用户可以在手机操作系统Windows Phone上使用微软小娜,但由于该系统的市场占有率从未突破个位数,装有该系统的手机已于2017年停售。

    在智能音箱方面,配备微软小娜的哈曼卡顿智能音箱的市场份额非常小,开发人员不愿意开发语音应用程序,不愿意眼睁睁地看着它们在一个不受欢迎的平台上慢慢被大众遗忘,所以,他们大多都避开了微软小娜。

    尽管面临这些挑战,但微软公司并没有放弃。用户可以通过Windows操作系统访问微软小娜,微软小娜每月约有1.45亿活跃用户。微软公司并没有把微软小娜作为一款全能型助理来销售,而是将它定位为一名职场助理,这符合微软小娜近来的整体战略:向公司提供软件和基于云的商业服务,其中包括人工智能支持的语音技术。

    因此,微软小娜在智能语音领域不是一个全面的领先者,但微软公司在公司领域的竞争中还处于稳固的有利位置。

    脸书公司未来的发展也是个未知数。如果它效仿微信的模式——微信实际上是有10亿用户的即时通信平台——那么脸书公司的状况会很好,因为他们在Messenger上布置了强大的机器人。但是否会这样发展,形势还不明朗。

    除了即时通信平台,脸书公司还进行了广泛的语音人工智能研究,但在落地过程中,进展不是很顺利。据报道,脸书公司开发了一款智能音箱,但在剑桥分析公司的丑闻引发人们对隐私的担忧后,该产品的发布被搁置。所以,脸书公司现在在智能语音领域发力还不够。

    三.

    无论以何种标准衡量,谷歌公司和亚马逊公司都是这场竞争中最受欢迎的赢家。

    2018年,只有39款设备支持与微软小娜集成,194款设备支持与Siri集成,而5000多款设备支持与谷歌助理集成, 2万款设备支持与亚历克莎集成。在全球范围内,为谷歌助理开发的应用小程序有1700多个,为亚历克莎开发的应用小程序有5万个。亚马逊公司占据了美国智能音箱市场65%的份额,谷歌公司占据了20%的份额。

    谷歌公司和亚马逊公司是美国智能语音领域很受欢迎的公司,判断它们前景的最佳方式是看它们选择如何从语音业务中盈利。当你直接向这两家公司的高管提出盈利方面的问题时,他们会感到窘迫,会老生常谈地说语音技术还处于早期阶段。

    他们可能会表示,他们仍在努力为用户寻找最佳体验,一旦解决了这个问题,回报就会随之而来。这个回答虽然含糊其词,但也并非假话。到目前为止,两家公司都在抢占地盘,在努力吸引尽可能多的用户,因为它们知道,领先的平台最终会有多种方式获得巨额利润。

    不过,即便是现在,两家公司的高管们肯定也在考虑各种盈利途径。最简单的盈利模式是直接从来马逊回声音箱和谷歌家庭等设备的销售中获利。但与苹果公司不同的是,这两家公司似乎都对这一模式不感兴趣,因为它们都在压低价格以扩大市场份额。

    一家独立研究公司拆解了一台亚马逊回声音箱,并估计其组件的成本约为35美元。算上管理费用和运输成本,它的实际成本会更高,而亚马逊网站却以29.95美元的低价出售它。亚历克莎开发和发布的负责人格雷格·哈特表示:“我们通过让人们使用我们的服务来盈利,而不是靠用户购买设备来盈利。”

    下一个可考虑的盈利模式是做广告。其他公司可以通过付费的方式在语音助理说话之前或之后植入广告。但到目前为止,谷歌公司和亚马逊公司都还不允许这样操作,但在未来的某个时刻,它们肯定会这么做,问题是哪家公司会第一个开始。

    “它们都不想成为第一个这样做的公司,因为另一个公司会说,‘嘿,我们公司不做广告,他们公司做广告。’”语音人工智能领域的企业家亚当·马奇克说。

    不过,语音广告似乎不太可能产生与在线广告和移动广告相当的收入,因为适合播放语音广告的平台比较少。如果你使用传统的谷歌搜索引擎,如搜索廉价航班,那么谷歌公司可以在链接列表的顶端投放四个付费搜索广告,但如果消费者在听到一个答案之前必须听四个广告,他们就不会进行太多的语音搜索。

    这对于谷歌公司来说是有问题的。谷歌公司基于广告的模式——谷歌公司以这种模式创造惊人的巨额收入——是以人们愿意花大量时间来翻阅搜索结果为前提的。

    随着人们使用手机的时间增加,他们浏览搜索结果页面所花的时间已经减少了,页面广告曝光率的下降趋势伴随着语音搜索的出现而加剧。“谷歌公司会想,‘哎呀’,”弗雷斯特研究公司的市场分析师詹姆斯·麦奎维说,“当人们开始喜欢语音搜索时,我们的传统商业模式就彻底消失了,因为真的不会有太多的广告模式存在。”

    利用语音服务盈利的最大机会可能出现在电商领域,这显然对亚马逊公司有利。在家里的任何地方,用户都可以通过语音订购东西——纸巾、薯片、新的烤面包机等。一项市场研究预测,到2022年语音购物的规模将从目前每年20亿美元增加到每年400亿美元。另一项研究发现,拥有亚历克莎设备的家庭每年花在亚马逊网站购物的钱比普通家庭多66%。

    亚马逊公司的“糖果罐”变得更甜了。无论何时,只要有人通过语音搜索或订购产品但没有指定品牌,亚马逊网站都会第一个推荐做广告的品牌。当消费者通过语音购物时,如果他们不喜欢听到的第一个品牌,就可能会要求提供更多的品牌选择但也可能不会,这会让出售商品的公司感到压力,但增强了亚马逊公司的影响力。马奇克说:“突然之间你不再买原来的品牌了,你会买亚马逊网站告诉你的品牌。”

    如果一个公司的产品在搜索结果中靠前,或最先被提及,那么它的销售额很可能远远高于在搜索结果中排名靠后的产品。因此,公司会乐于向亚马逊公司付广告费。更重要的是,亚马逊公司有自有品牌,从童装到狗粮,有上百个品牌,而且品牌数量还在不断增加,亚马逊公司肯定会在语音搜索中优先推送这些品牌。

    亚马逊公司尚未公开表示是否会允许其他公司付费以获得语音搜索排名优先权。它需要以一种足够透明的方式做到这一点,以免让客户觉得自己受骗了。对于付费排名有一个先例:在基于屏幕的亚马逊网站上,公司付费获得的产品特色展示信息显示在其他产品信息之前。

    谷歌公司并非没有意识到电子商务可能是从语音业务中盈利的最佳方式。谷歌公司与沃尔玛公司、塔吉特公司、好市多公司、科尔士百货公司、史泰博公司等零售商结成了联盟,这些公司受到共同敌人亚马逊公司的威胁。

    谷歌公司计划扩大其购物平台,要成为亚马逊公司更有力的竞争对手。只要谷歌公司在用户语音搜索后将其引导到联盟公司的网站,谷歌公司就可以通过这一领先的商业模式收取这些零售商的少量广告费。

    总而言之,在美国智能语音领域实力强大的谷歌公司正在快速成长。

    亚历克莎在市场份额和盈利模式方面都相当有优势,亚马逊公司在目前的竞争中领先一步。麦奎维说:“地球上每一家想用语音人工智能做点事的公司都在联系亚马逊公司,每个想在语音人工智能方面有所成就的研究生都在联系亚马逊公司……亚马逊公司在智能语音领域积累了如此多的优势,这真的只剩一个问题,即它会在什么时候选择大干一场。”

    四.

    时间是2036年4月,地点是Hip 4872——这是位于仙后座星群里的一颗恒星。从地球发出的无线电信号经过近33年的“长途跋涉”后到达这里。无线电信号包括关于智人的基本信息及关于人类的数学、物理、化学和地理的浓缩版知识。里面还有国旗画面、宇航员莎莉·莱德发来的信息及大卫·鲍伊的歌曲《星侠》的编码。

    上面所有这些都是在一个名为Cosmic Call的外星人探索项目的支持下,通过射电望远镜发射的。如果任何有智慧的生物接收并解读出这些信号,它们将会收到创建计算机程序的指引,当然,这种可能性是微乎其微的。一旦实现,外星人就可以与人类的代表——机器人艾拉交流。

    作为勒布纳奖得主的聊天机器人,艾拉会聊天和讲笑话。它对美食和名人都有自己的看法,它会喋喋不休地谈论在拉斯维加斯和温哥华等地旅行的事。由于它喜欢瞎猜,总是不按常理出牌,因此它无疑是一个不完美的“地球大使”。但是,它对语言的巧妙运用和显而易见的交谈欲望,使它成为整个Cosmic Call项目中最具人类特色的元素。

    当我们在语音技术的推动下向前迈进时,世界应该拥抱它所创造的充满希望的人文精神。从鱼钩到火星探测器,我们一直在制造工具。虽然我们制造出了很多对我们有用的东西,但它们在更深层次上都不像我们。即使是类人机器人,它们能做的也只是笨拙地移动,使用语言是人类这个物种真正与众不同的地方。

    语言把我们连接起来,因此,教机器掌握语言不同于通过编程让它们学会进行衍生品交易、做手术、进行海底航行或其他事情。我们正在“共享”人类的核心特征。

    这份“礼物”不应该随便“赠送”。语音技术为世界带来了新的力量和便利性,但我们不用对其如此敬畏以至于忘记评估其中的许多风险。如果应对得当,语音技术有可能成为我们发明的、最有感情的技术。认为人工智能只能是冷冰冰的算法的观点是错误的,我们可以将最好的价值观和同理心注入其中。

    我们可以让它变得聪明、令人愉快、精灵古怪并且善解人意。有了语音技术,我们最终可以制造出不那么陌生、更像人类的机器。

    2

    想了解更多关于《智能语音时代》吗?

    当当网京东均在售,现在购买正版书籍,还随书赠送200元科大讯飞智能办公本优惠券哦!

    研究所二维码

    5G牌照正式发放!网友:我刚买的4G手机凉凉?

    今天上午8点40分,工业和信息化部举行了发牌仪式,颁发了国内首批 5G 牌照,中国电信、中国移动、中国联通、中国广电获得了中国首批 5G 商用牌照!

    定了定了!来了来了!

    p1

    今天上午8点40分,工业和信息化部举行了发牌仪式,国内三大运营商与广电、铁塔公司董事长参会。在会上工信部颁发了国内首批 5G 牌照,中国电信、中国移动、中国联通、中国广电获得了中国首批 5G 商用牌照!

    p2

    是的你没有看错,5G商用开始啦!

    但是接着就有小伙伴紧张提问:刚买的4G手机诶,难不成都变砖啦?

    p3

    甭急,咱们下文慢慢聊~

    啊~啊~5G~,你比4G多~1~G~

    对于普通人来说,5G意味着什么?

    “哦,手机上网速度又会快一点。”
    “看视频不会卡了哎,但流量是不是耗得更快……”
    “4G已经很快了,是不是还要换手机好烦啊。”

    4G真的很快了吗?我们来看看它和5G的PK:

    p4dongtu (1)

    1.3Gbps!和5G相比4G真的是个弟弟了(滑稽)!

    动图2 (3) (1)

    你能跟上我~~的~~speed~~吗

    除去1G,从2G到4G的每一代下载速度的增长幅度都达到几十倍,原来加载一个资讯页都要急得跳脚,现在则可以毫无压力地在移动端开一盘农药和吃鸡。用户得到的是新体验,从业者落地的是新玩法——

    p5

    而我们也看到了,从4G进入5G,又实现了夸张的跨越:峰值速率从4G的1G/s提升到20G/s,网络延迟从10ms降低至1ms,每平方米的数据吞吐量提升了100倍/s。

    到了如此境界,5G的快已经意味着的是全方位生活形态的升级。

    而且,这次升级还将以中国为中心。
    在设计5G的应用场景时,中国IMT-2020推进小组的mMTC和URLLC两个场景直接被“国际电联”(ITU)采用,并与eMBB一起组成三个应用场景。

    具体来说,这三个场景分别被称为:

    mMTC:大规模机器通信。
    URLLC:超可靠和低延迟通信。
    eMBB:增强型移动宽带。

    而下图可以大概展示三者分别对应的部分领域:

    p6

    通过几个5G的突出特点:高速、低延时、大容量,我们可以延伸一些想法。

    01.万物智联AIoT

    从互联互通,到设备智能,物联网IoT正升级成智能化的AIoT。但联结速度,云端数据处理量以及响应延迟的限制仍然未得到解决。但现在5G的落地将冲破限制。

    02.联网游戏

    网络游戏,尤其是高强度的联机对战,决定胜负的不仅是手速,更是网速。几秒的延时可能就会让你从优势很大瞬间被翻盘。这在5G时代几乎不会发生。

    03.VR应用

    抛开在游戏上的应用,VR在直播、在线贸易、线上购物等领域也有着广阔的前景。而只有在5G应用后,才能最大程度地让高清、高仿真、高实时性的VR落地。

    04.远程医疗

    线上遥控进行手术的概念早已有之,但在网速不稳定的情况下,画面的延迟将对医生的判断产生巨大的干扰。而在5G的高速环境下,以上风险将得到有效控制。

    05.应用/小程序开发

    5G的高速和低延迟,将方便开发者研发更高画质,更多交互手段的应用与小程序,让更多爆品落地。

    中国成为定义5G使用场景的主要国家,对于我们而言是幸运的。作为普通民众,可以体验5G大范围且与国际标准接轨的场景应用;作为想在5G领域淘金的弄潮儿,则在起跑线上就具有了广阔的领域可供选择。

    它们,让5G快得与众不同

    在中小学的信息技术教材中,开篇的入门部分总会有个一笔带过的人名——香农

    p7

    香农:我在教科书应该更有排面才对

    此公何许人也?是一个在各种意义上都可以被如今的通信业者叫一声“爸爸”的存在。简单列几件他做过的事:

    提出信息论,指出信息可以被测量,并在“信道”中传输。为数字通信奠定了基础。
    基于热力学首次提出“信息熵”概念,确立了基本单位“比特”,成为如今字节、KB、MB等单位的前身。

    而跟本文最相关的,是他所创造的一个信道容量公式:

    p8

    这个公式的意义是指明了一件事,那就是最大数据传输速率(C)主要由两个要素决定:频带宽度(W)及信噪比(S/N)。两者值越高,数据传输速率越大。

    基于香农公式的启发,即使到了5G,提速也一样绕不开提升频带宽度及信噪比,。

    在频带宽度和信噪比两方面,5G做了以下事情:

    01.引入毫米波频段

    到4G为止,频谱均为300MHz-3GHz,虽然覆盖广,穿透性好,但问题也很明显——挤。四代以来所有设备都集中在这一段,想再提升传输速度与容量已经挪不出来更多频带宽度了!

    怎么办?去别的频段,而3GHz以上的就是毫米波频段。

    p9

    5G可以从毫米波频段中取得252GHz的频宽,虽然实际用不上这么多,但也让提速扩容的“天地”瞬间广阔起来。

    而根据今早发牌仪式的消息,中国电信获得3.4-3.5GHz的100MHz频谱资源,中国移动获得2515-2675Mhz的160MHz带宽的信息,中国广电则拥有“黄金频段”的700MHz。

    02.波束赋形

    波束赋形可以形象地理解为将一些散射的光收束聚焦,形成一条更明亮,能量更强的光线。

    p10

    5G的信号传输中,为了避免毫米波在传输途中的能量损耗,减轻复杂天气的影响,就将通过基站的大规模天线等设备进行波束赋形,提升信号能量、信噪比及覆盖范围。

    自此,通过以上突破,5G的提速超乎想象。

    关于5G的5个Q&A

    好了,介绍完5G,我们再回到文章开头的问题:4G手机要不要换?同时还有其它各种好奇宝宝们的关注点,小智都来解答一下!

    Q:现在的手机、手机号还能用吗?

    A:要想用5G,还是得花钱换个支持5G的新手机的。当然,方法总比困难多。如果你跟小智一样穷困潦倒,咱也可以曲线救国:用手机WiFi连接CPE设备,以使用5G网络。而且4G的频段也仍会保留,这样不用着急换手机~

    Q:5G啥时能用?

    A:目测还需要1-2年的时间。运营商持牌上岗,5G应该能登台了,但各大运营商的5G网络还处于试点阶段,部署规模当前是比较小的。前期5G应不会大规模铺开,更多的是探索。

    Q:最早啥时能买5G手机?

    A:一般来说,牌照发放后,配套的5G手机要先送测,最快一个月给发入网证。因此,至少还得耐心等待月球转一圈的时间。

    当然,对于各大品牌手机厂商来说,现阶段不会急于大规模上市,第一批5G手机主要是为了赚口碑,为以后市场推广铺路搭桥。好饭不怕晚,咱也等的起。

    Q:5G套餐会更贵吗?

    A:对于咱普通百姓来,套餐计费和现在应该相差无几。单位流量价格降低,但5G套餐的平均流量可能会比4G套餐增加不少。

    不过与IoT、AI驾驶等相关新兴行业可能会采取更复杂的计费模式:按带宽、延时、和连接数量等多项指标收费。

    Q:中国5G实力处于第几梯队?

    A:第一梯队!第一梯队!!第一梯队!!!自豪的事说三遍!

    5G会是我们的摆渡人吗?

    截至此刻,特别想引经据典的和大家聊两句。

    IBM创始人老沃森曾说:世界上只需要5台电脑。
    比尔·盖茨曾说:640K内存足够了。
    而现在也有人说:4G就够了。

    真的就够了吗?人类追求梦想的步伐可以说比想象的大太多了。只要体验过高速网络带来的便利,就会推崇备至了。

    诚然,电信业经历过辉煌,如今跌入低谷,但它从来都不曾一蹶不振。等待一个时机重返荒原,寻找自己的摆渡人,重回世间。

    5G会是我们的摆渡人吗?

    是的,当我们无从选择时,5G就是我们的摆渡人,它所承载的是电信业重振旗鼓的梦想。无论是技术、生态,还是商业模式,5G犹如一次脱胎换骨,满血复活的渴望。

    最后,引用《星际迷航》的话收尾:

    To boldly go where no man has gone before.
    勇踏前人未至之境。

    P11

    好了,以上学霸发言结束~~
    作为学渣本渣,小智想说
    以上看不懂真的不重要!

    5G时代,大家只要享受——

    看视频不缓冲!
    打排位不掉线!
    几G文件秒下!

    想想就很开心呢!

    P12

    最后,端午安康!高考的孩子们,加油!

    #本期话题#

    5G将会为我们带来哪些“异想天开”?
    有任何想法观点
    欢迎留言区畅所欲言!

    图片来源于网络,版权归原作者所有,如有侵权请联系删除

    研究所二维码

    AI预测世界杯?算了,足球比我女朋友都难猜

    欧冠的结果,你押对了吗?

    火热的欧洲冠军联赛刚刚落下帷幕。在最终的决赛中,萨拉赫罚入点球,替补奇兵奥里吉再进一球。最终利物浦以2-0战胜热刺,时隔14年再度登上冠军王座。当地的利物浦球迷欢呼雀跃,马德里成了一片红色的海洋。

    而正如鲁迅先生所说,有比赛就有输赢,有输赢就有赌输赢的群众。

    11这些群众包括小智这样的普通球迷,还有足球博彩机构,甚至谷歌、微软等互联网巨头也曾来凑过热闹。

    而为了预测赛事的结果,大家又可谓是“各显神通”:有的追随专家分析,有的靠自己做梦,还有的相信章鱼玄学······
    2

    章鱼保罗在2008欧洲杯和2010世界杯中,预测14次猜对13次,成功率达93%

    作为一名优秀的社会主义接班人,那些歪门邪道小智我当然是一个都不信的。唯有科学的数据分析和模拟,才算得上严谨的预测。

    其实,早在前几届世界杯期间,各路Geeker就已经采用过各不相同的AI算法和特征数据,做过这样的预测尝试。甚至,著名物理学家霍金生前也曾研究过世界杯夺冠公式!(公式将在文章后半段解读)

    那么,各家预测的结果准确度如何呢?谁又是能够一语言中的“神算子”?

    AI预测输赢

    我们先来看看一项在算法和数据方面都颇有代表性的实验,它是由来自德国和比利时的四位研究人员在2018年进行的。

    实验中,他们使用自过去四届FIFA 世界杯(2002-2014)的所有比赛结果作为数据集,希望以此来预测2018年的冠军。

    此外,他们还考虑了许多相关的特征,比如

    经济因素(国家人均GDP、人口数量等)运动因素(ODDSET 概率,FIFA 排名等)

    主场优势(主办方、大陆、联邦等)

    团队结构(队伍中同一俱乐部队友的人数、队员平均年龄、参加冠军联赛的球员数量等)

    教练因素(教练的年龄、任期、国籍)等等。

    研究人员认为,这些因素看似没有直接决定赛事的结果,但很容易影响球员和队伍的整体状态,因此很有必要纳入考虑。

    在算法上,他们采用了随机森林算法(Random Forest)。这一基于决策树的算法是机器学习的一个重要分支,并且具有很高的准确率,在许多数据分类任务中都曾表现出优异的性能。

    最后,经过10万次赛事模拟,研究团队预测出了夺冠可能性最高的前三名,分别是西班牙队( 28.9%)、德国队(26.3%)和巴西队(21.9%)。

    打脸来得太快就像龙卷风

    万事俱备,就只等最终的结果验证了。

    不久之后,激动人心的时刻到了——2018年俄罗斯当地时间7月15日,在最终的世界杯决赛中,法国队夺冠。

    3

    2018年俄罗斯世界杯法国队夺冠

    而回过头来看研究人员先前的预测结果,可以说是错到离谱了——他们押宝的西班牙队和德国队在实际比赛中甚至都未能进入四分之一决赛,最后夺冠的法国队在他们之前的预测中也仅排名第4。

    4

    预测名次&实际名次

    再看赛前积极预测的各家机构,最终结果也基本是不同程度的打脸,准确率稍高一些的,也并没有超过章鱼保罗的。

    这样的结果让人倍感困惑:尽管拥有适当的数据类型、数据体量,使用了参数正确的优秀算法,那为何这些训练有素的模型最终仍会失败呢?

    为什么不灵?

    其实,失败的原因就在于我们所预测的对象——足球比赛,在各要素的维度上都并不是一个有规律的事件。

    和其它以人为重点的事件一样,足球比赛在赛前和赛中都有太多让人无法判断是否确实相关的影响因素,也就是所谓的混淆变量

    而场上每分钟(甚至每秒钟)的状态,都取决前一分钟(前一秒钟)的状态。这种马尔可夫链过程又意味着,要把数据集中每场比赛的每一分钟都模拟出来,才能得到相对准确的模型。

    5

    马尔科夫链的定义:事件某一时刻的状态只取决于它在上一时刻的状态。图为应用了马尔科夫链的天气预测过程。

    除此之外,比赛结果还可能受到一些外部因素影响,例如天气、政治情况、地理因素,甚至某个球员前一晚没睡好都可能会影响整场比赛的结果走向。而这些重要特征通常都很难被收集和衡量。

    更何况,还存在意外发生的可能性,例如一个致命失误或意外进球,都是无法预测的。

    6

    简而言之,像足球比赛这样以人为主的活动,是当下的AI技术还无法很好驾驭的领域。

    这也是为什么小智说,足球比我女朋友都难猜——足球的结果跟一大票人有关,而我女朋友的心思只跟她一个人······咦,我女朋友呢?

    7

    霍金“完美点球公式”

    对于足球比赛结果的不可预见性,著名物理学家霍金似乎比我们更早地发现了。不过,这并没有妨碍他对足球运动的热爱。

    8

    公式发布现场

    这位著名的物理学家曾在公开场合多次参与世界杯冠军的预测,甚至还娱乐性地自创过一套“完美点球公式”

    其中,X0是一个已知变量

    罚球队员是前锋,则α1=1;是后卫,则α2=1

    罚球队员瞄准球门左边,则β1=1;瞄准右边,则β2=1

    罚球队员的头发颜色为淡黄色,则δ=1

    罚球队员瞄准球门上1/3,则θ1=1;瞄准球门下1/3,则θ2=1

    罚球队员用脚的侧面踢球,则ε=1

    罚球队员不助跑就直接踢球,则η=1

    除此之外,霍金还配合着这个公式做了一些数据解读:

    “我研究了1978年世界杯以来的所有点球,得出了‘完美点球公式’。主要是因为英格兰球员准头太差了,他们用铲子都打不到牛屁股······(这也就是他搞出这个公式的原因:被英格兰历史上的那些失败点球蠢哭)首先,速率是关键,必须跑三步以上,把速度提起来。只跑三步或者更少步数的球员,他们的点球命中率只有58%,远低于平均水平的87%。

    使用脚侧比正脚背能高出10%的命中率。

    把球踢向左右两个上角更容易罚进点球,成功率高达84%。

    用左脚还是右脚对结果没有什么影响。

    前锋比后卫和中场球员更容易进球。

    金发球员和秃顶球员的命中率更高,金发球员的命中率高达84%,秃顶球员71%的命中率也高于深色头发球员的69%,但我不清楚原因是什么。

    9

    对于守门员,跳来跳去分散主罚者的注意力,将会提高18%的扑救成功率。”

    看完以上信息,你是不是和小智一样觉得一脸懵逼?这个公式连带公式的解释,无论怎么看都让人觉得槽点满满。

    不过,这本来也不是真正的科学研究,霍金曾表示“和足球相比,我认为量子物理相对而言更直接一些。”

    而所谓的“完美点球公式”,也只是老顽童跟大家开的一个玩笑,顺便怒其不争地调戏一下自己祖国的英格兰队,毕竟“爱到深处自然黑”。

    10

    缅怀这位可爱的伟人

    当然,在足球赛结果预测中的失败并不意味着AI在“预测”这件事上毫无用处。例如对单个球员的跑步距离、速度、加速度、减速度、负荷和心率等等数据来进行研究,以预测运动员在某场比赛中的场上表现,这样得出的结果就比较具有参考价值。

    毕竟AI只是一种工具,我们如何使用、在怎样的前提条件下使用的这种工具,才是决定其价值的关键所在。

    皮一下
    其实我挺信“霍金点球公式”的,它的大概含义就是:英格兰靠点球夺冠的概率约等于0·······研究所二维码

    科大讯飞代表团赴墨尔本、悉尼访问 深化与澳大利亚合作

    2019年,科大讯飞持续推进国际合作步伐,5月28日,科大讯飞代表团访问墨尔本、悉尼,深化与澳大利亚社会各界的合作。

    2019年,科大讯飞持续推进国际合作步伐,继科大讯飞亮相新西兰人工智能顶级盛典——人工智能日(A.I.-Day)之后,5月28日,科大讯飞代表团访问墨尔本、悉尼,深化与澳大利亚社会各界的合作。

    In 2019, iFLYTEK continued to push forward the pace of international cooperation. Following iFLYTEK’s appearance at New Zealand’s top artificial intelligence event-A.I.-Day,the iFLYTEK delegation visited Melbourne and Sydney on May 28 to deepen cooperation with all sectors of Australian society.

    科大讯飞正式进入澳洲市场,与当地多家企业达成深度合作
    IFLYTEK officially entered the Australian market and reached in-depth cooperationwith many local enterprises.

    28日上午,科大讯飞代表团等一行在德勤中国苏皖大区首席合伙人谈亮先生的陪同下参观德勤墨尔本总部,并与德勤澳大利亚Prashant Natarajan先生、李玉凤女士等资深合伙人进行会谈。谈及未来的合作,双方表示,科大讯飞的人工智能技术十分优秀,德勤品牌享誉全球,双方自2018年11月22日达成战略合作以来,在国际化合作等方面拓展了更多合作空间。未来,科大讯飞将携手德勤科技为澳洲优秀企业提供先进的人工智能解决方案。
    On the morning of 28th, iFLYTEK delegation visited Deloitte’s Melbourne headquarters accompanied by Mr. Tan Liang, chief partner of Deloitte’s China Jiangsu and Anhui Region,and held talks with senior partners of Deloitte Australia,Mr. Prashant Natarajan and Ms. Li Yufeng. For future cooperation, iFLYTEK is an international leader in artificial intelligence technology, and Deloitte brand enjoys worldwide reputation. Since the two sides reached a strategic cooperation on November 22, 2018, they have expanded the scope for international cooperation. In the future, iFLYTEK will join hands with Deloitte Technology to provide advanced artificial intelligence solutions for outstanding Australian enterprises.

    p1

    科大讯飞代表团和德勤澳洲资深合伙人交流合作
    IFLYTEK Delegation Communicates with Deloitte Australia Senior Partner

    28日下午,科大讯飞与Modun集团签署合作备忘录。科大讯飞国际合作部总经理张武旭先生和前维多利亚州州长华人资深顾问、Modun集团创始人杨昶先生代表双方签约,科大讯飞高级副总裁、CFO段大为先生和维多利亚州众议院前议长、澳中工商委员会维州会长Ken Smith先生见证签约。
    On the afternoon ofthe 28th, iFLYTEK and Modun Group signed a Memorandum of Cooperation. Mr. Zhang Wuxu, General Manager of iFLYTEK International Cooperation Department, and Mr. Mike Yang, former Senior Advisor to the Premier of Victoria and founder of Modun Group signed the Memorandum on behalf of both parties. Mr. Duan Dawei, iFLYTEK Senior Vice President and CFO, and Mr. Ken Smith, Former Speaker of Victoria House of Representatives and Chairman of Australia-China Business Council of Victoria witnessed the signing.

    p2

    科大讯飞国际合作部总经理张武旭(右)和前维多利亚州州长首任华人资深顾问、Modun集团创始人杨昶(左)代表双方签约
    Mr. Zhang Wuxu (Right), General Manager of iFLYTEK International Cooperation Department, and Mr. Mike Yang (Left), former Senior Advisor to the Governor of Victoria and founder of Modun Group signed the Memorandum on behalf of both parties

    根据备忘录,双方将在讯飞听见系列产品方面加强合作,着力服务于澳大利亚相关市场,并在创投项目上共同创新发展路径。据了解,Modun集团拥有澳大利亚金融服务牌照资格,其业务范围覆盖地产开发、跨境并购、商务体育等领域。未来,双方计划联合举办中澳人工智能技术交流合作论坛。
    According to the memorandum, the two sides will strengthen cooperation in iFLY REC products,focus on serving relevant markets in Australia, and jointly innovate development paths in venture capital projects. It is understood that Modun Group has Australian financial service license, and its business scope covers real estate development, cross-border mergers and acquisitions, sports business and etc. In the future, the two sides plan to jointly hold the Sino-Australian artificial intelligence forum.

    维州前上议长(参议院议长)、维州州议员Bruce Atkinson在维州议会大厦接待了科大讯飞代表团一行,他直接使用讯飞翻译机表达诚挚的欢迎。即使现场环境嘈杂,讯飞翻译机也能够快速识别Bruce Atkinson说的英文,并准确译出:“我很高兴欢迎你们来到墨尔本,我希望这次会议非常成功,希望你们继续成为成功的企业。”
    Mr. Bruce Atkinson, former President of the Senate of the state of Victoria and State Legislator of Victoria, gave reception to the iFLYTEK delegation at the state parliament building. He used the iFLY Translator to express his sincere welcome. Even in a noisy environment, iFLY Tranlator can quickly recognize Mr.Bruce Atkinson’s words and accurately translate: “Welcome to Melbourne. I hope this meeting can be very successful and you will continue to be an outstanding enterprise.”

    考察澳洲十余家科创企业,人工智能深度赋能澳洲大有可为
    A survey of more than 10 scientific and technological enterprises in Australia shows that artificial intelligence can greatly empower Australia.

    科大讯飞代表团一行考察了维多利亚州投资局、澳新银行、墨尔本大学、Monash 大学、Planet Innovation、York Butter Factory、Moelis 基金、Reinventure 基金等多家政府机构、科研机构和企业,涉及的行业覆盖金融、教育、医疗、投资、咨询等不同领域。
    The iFLYTEK delegation visited many government agencies, scientific research institutions and enterprises icluding Victoria Investment Authority, ANZ Bank, University of Melbourne, Monash University, Planet Innovation, York Butter Factory, MoelisFund, and Reinventure Fund, covering different fields such as finance,education, health care, investment, and consulting.

    在金融领域,科大讯飞代表团和澳洲四大银行之一的澳新银行就双方合作展开深度讨论。科大讯飞智慧金融事业部总经理解飞表示,未来可结合双方特点、携手德勤科技、以及新西兰合作伙伴rocos共同为澳新银行提供智能服务机器人。众多创投企业也表示,看好人工智能产业发展和中国大市场的前景,希望和科大讯飞深入合作,走进中国市场,促进中澳人工智能产业发展。
    In the financial field, the iFLYTEK delegation and ANZ Bank, one of Australia’s four largest banks, held in-depth discussions on their cooperation. Xie Fei, General Manager of iFLYTEK Intelligent Finance Division, said that in the future, we can combine the characteristics of both parties, join hands with Deloitte Technology and NewZealand partner, Rocos, to jointly provide intelligent service robots for ANZ Bank. Many venture capital firms also expressed their great prospect about the development of artificial intelligence industry and the bright future of Chinese market, and hope to further cooperate with iFLYTEK to enter the Chinese market and promote the development of artificial intelligence industry in China and Australia.

    p3

    科大讯飞代表团和澳新银行 Deputy CEO Alexis George 女士合影
    IFLYTEK delegation and Ms Alexis George, CEO of ANZ bank

    在医疗领域,科大讯飞代表团参观了澳洲科技创新的代表性企业Planet Innovation,并和该企业深入探讨如何用人工智能为医疗健康行业赋能。据悉,该企业一直致力于健康科技创新领域和商业化创投方向,技术和产品己广泛服务于澳洲及欧美市场,特别希望通过与中国合作伙伴的深度合作,进入中国市场发展。
    In the medical field, iFLYTEK delegation visited Planet Innovation, a representative enterprise of scientific and technological innovation in Australia, and discussed about how to use artificial intelligence to empower the medical and health industry. It is reported that the enterprise has been committed to the field of health science and technology innovation and commercial venture capital. Its technology and products have been widely used in Australia, Europe and the United States. Planet Innovation hopes to enter the Chinese market through in-depth cooperation with its Chinese partners.

    科大讯飞代表团参观墨尔本大学期间,墨尔本大学A.I.系主任Uwe Aickelin 教授等专家学者热情接待了科大讯飞代表团。Uwe Aickelin 教授是墨尔本大学计算机和信息系统学院的院长,专注于人工智能、数据采集和优化等领域20余年,也为英国相关研究机构和政府部门担任常年的人工智能战略顾问。科大讯飞消费者BG副总裁、听见科技总经理王玮女士与教授们交流了人工智能的前沿进展,探讨人工智能在自然语言理解、机器翻译、机器写诗、新闻监测等领域的应用价值。
    During their visitto the University of Melbourne, the iFLYTEK delegation was warmly received by experts and scholars such as professor Uwe Aickelin, chairman of A.I. department of the University of Melbourne. Professor Uwe Aickelin is the dean of the School of Computer and Information Systems at the University of Melbourne. He has focused onartificial intelligence, data collection and optimization for more than 20 years. He has also served as a perennial artificial intelligence strategy consultant for relevant research institutions and government departments in the UK. Ms. Wei Wang, Vice President of iFLYTEK Consumer BG and General Manager of iFLY Rec, talked with the professors about the cutting-edge development of artificial intelligence and discussed theapplication value of artificial intelligence in natural language understanding,machine translation, machine poetry writing, news monitoring and other fields.

    p4

    科大讯飞代表团和墨尔本大学教授合影
    iFLYTEK Delegation and Professors of the University of Melbourne

    科大讯飞代表团诚挚邀请Uwe Aickelin教授等专家学者访问中国,Uwe Aickelin表示,他十分乐意亲临科大讯飞体验人工智能最新的产业应用。Uwe Aickelin 教授此前也与多家中国大型企业开展过联合研究合作。
    The iFLYTEK delegation sincerely invited Professor Uwe Aickelin and other experts and scholars to visit China. Uwe Aickelin said that he would be very happy to experience the latest industrial applications of artificial intelligence in iFLYTEK. Professor Uwe Aickelin has also conducted joint research cooperation with many large Chinese enterprises before.

    此外,科大讯飞代表团和澳大利亚莫纳什大学著名华人经济学家史鹤凌教授探讨了澳大利亚经济、科技等话题,以及如何应用人工智能技术在不同行业开展深入合作。
    In addition, the iFLYTEK delegation and Professor Shi Heling, well-known Chinese economist at the University of Monash in Australia, discussed Australian economy, science and technology, and how to apply artificial intelligence technology to carry out in-depth cooperation in different industries.

    p5

    科大讯飞代表团和澳大利亚莫纳什大学经济学家史鹤凌教授合影
    iFLYTEK delegation and Professor Shi Heling, well-known Chinese economist at the University of Monash

    p6

    科大讯飞高级副总裁、CFO段大为先生在接受澳洲华文媒体大洋传媒采访
    Mr. Duan Dawei, iFLYTEK Senior Vice President and CFO Interviewed by OceanMedia, Australian Chinese media

    p7

    科大讯飞代表团与澳大利亚京津冀总商会荣誉会长叶军先生(左三)、澳大利亚维多利亚州第30届华人社团联合会秘书长Diana Lin女士(左二)、澳大利亚北京国际商会执行会长恽刚女士(右一)交流合作
    The iFLYTEK delegation exchanged and cooperated with Mr. Jun Ye (3rd from left), Honorary President of the Beijing-Tianjin-Hebei General Chamber of Commerce in Australia; Ms. Diana Lin (2nd from left), Secretary General of the 30th Chinese Associations Federation in Victoria, Australia; and Ms. Yun Gang(1st from right), Executive President of the International Chamber of Commercein Beijing, Australia

    访问期间,科大讯飞代表团访问了中国驻墨尔本总领馆,科大讯飞高级副总裁、CFO段大为先生向龙舟总领事详细汇报介绍了科大讯飞的技术创新、产业应用、国际合作、以及与澳大利亚社会各界的交流与合作。
    During the visit, the iFLYTEK delegation visited the Chinese Consulate General in Melbourne. Mr. Duan Dawei, iFLYTEK Senior Vice President and CFO, gave a detailed introduction to Mr. Long Zhou, Consul General on iFLYTEK’s technological innovation, industrial application, international cooperation, and exchanges and cooperation with various sectors of Australian society.

    龙舟总领事表示更加充分地了解了科大讯飞的技术创新和产业发展,为科大讯飞近年来在人工智能领域的技术突破、应用落地、国际交流等方面取得的成绩由衷地感到欣慰。维多利亚州是全澳首个与中国政府签订“一带一路”合作备忘录的地方政府,有着与中国交流合作的历史传统和良好氛围,希望科大讯飞以市场需求为导向,与当地社会各界的合作越来越深,与当地企业的交流越来越多,领事馆愿意为此提供全面的指导和服务。
    Consul General Mr.Long Zhou said that he had a fuller understanding of iFLYTEK’s technological innovation and industrial development, and was sincerely gratified by iFLYTEK’s achievements in recent years in the fields of artificial intelligence, application and international exchanges. Victoria is the first local government in Australia to sign a “the belt and road initiative” cooperation memorandum with the Chinese government, who has a tradition and a good atmosphere for exchanges and cooperation with China. It is hoped that iFLYTEK will take the market demand asits orientation, cooperate with all sectors of the local society, and communicate with more local enterprises. The consulate is willing to provide comprehensive guidance and services for this purpose.

    p8

    中国驻墨尔本总领事馆主要领导与科大讯飞代表团座谈
    Major Leaders of the Chinese Consulate General in Melbourne Have a Discussion with iFLYTEK Delegation

    科大讯飞代表团赴澳交流访问,持续推进了科大讯飞技术、产品走向国际的步伐。据了解,科大讯飞国际化工作团队将携更多人工智能技术成果和优质产品推动与英国、加拿大、新加坡等更多英语国家的合作交流,面向海外市场持续发力,和全球客户一起用人工智能建设美好世界。
    The iFLYTEK delegation’s exchange visit to Australia has continuously advanced iFLYTEK’s technology and products to the international level. It is understood that iFLYTEK’s international team will carry more artificial intelligence technology achievements and high-quality products to promote cooperation and exchanges with more English-speaking countries such as the UK, Canada, Singapore, etc. It will continue to make efforts in overseas markets and build a better world with artificial intelligence together with global customers.

    研究所二维码

    iTunes谢幕,iOS“黑化”,Mac迎来最贵最强!

    这届WWDC有点搞事?!

    导读:果粉们一年一度的春晚“苹果全球开发者大会WWDC”今天凌晨在美国圣何塞如期开幕。Keynote演讲依然是大家关注的焦点。此次苹果更新了5大系统+2款硬件,成为苹果史上内容最多,历时最久的大会。

    硬核知识点,一睹为快:

     iOS黑化了;

     tvOS更有个性了;

     WatchOS 6自立了;

    Mac Pro总算填坑了;

     MacOS iTunes退役了;

     iPadOS跟iOS分家单干了!

    1.“黑化”的 iOS 13

    对于全球10亿苹果用户来说,iOS的更新往往是他们关注的焦点。推销自家系统的同时,苹果还不忘顺便黑一把对家安卓9的升级率。85% iOS12升级率吊打仅有10%的安卓。

    1

    继去年MacOS新增夜间模式后,iOS也终于迎来自己的“黑化版”——深色模式。用户在暗光下查看手机,再也不用害怕刺眼的高亮底色了。原来,白天也能懂夜的黑!

    2

    在保护隐私方面,苹果也进行了一波操作:新地图模式将控制第三方 App 位置授权次数,禁止蓝牙、WiFi 获取位置信息;同时,新增了用户在第三方 App 中的账户保护措施:一种是通过苹果账号登录,另一种是让用户决定想加密账号或其他账户内容后再登录。

    3

    还记得曾红极一时,风靡盆友圈的Memoji 吗?现在你不仅可以捏脸,还可以给ta化妆。相信不久,各位亲手打造的专属虚拟形象将会掀起新一波换头像风~

    4

    除此之外,滑动键盘,旋转视频,一键分享,AirPods语音读取、回复信息和音乐分享功能,Siri使语音更自然的TTS等功能都让果粉们对升级iOS 13有了更多期待。

    2.个性十足的 tvOS

    tvOS将为Apple TV和Apple Music中的每个人提供多用户管理和个性化定制。Apple Music将添加与当前播放的歌曲同步的歌词。

    5

    将于今年秋季推出的tvOS 13还将支持Xbox One和PlayStation 4游戏控制器。

    3.自给自足的 WatchOS 6

    Apple Watch这次可谓颜值与实力并存。不仅新增了多种新型表盘图形设计,还增加了可直接在watchOS 6 App Store浏览,付费,下载和本地运行的计算器,有声读物和语音备忘录应用。Watch应用将无需再在配对的iPhone上安装配套程序。

    6

    WatchOS 6还扩展了新的健康功能。可检测环境的周围环境的嘈杂程度,还能跟踪女性月经周期。对有些长期被“大姨妈”周期困扰的妹纸来说,或许是个不错的新功能~

    4.最强电脑 Mac Pro

    一直犹抱琵琶半遮面的“模块化”Mac Pro 总算正式和果粉们见面了。

    7

    这款被戏称“刨土豆丝儿神器”的Mac Pro有着金属外观和模块化内部设计将,号称“史上最强电脑”。

    具体参数大家自己看看吧:Intel Xeon 处理器,最高28核心,64个PCI Express通道,6个内存通道,12个插槽,1.5 TB系统内存,8个PCI-E插槽,可同时处理对3条8K分辨率视频,上千条音轨同时操作,不会出现卡顿…….可以说是无人能敌了。

    8

    好马配好鞍,好的MacPro当然要配专业的显示器。所以苹果这次新推了一款号称史上最好的显示器 Pro Display XDR :采用了分辨率为 6016 x 3384 的 32 英寸 6K Retina 屏幕。

    9

    都是苹果史上之最的Mac Pro和显示器强强联手,价格也着实不美丽,两款配置下来要7万多人民币。价格太便宜,根本买不起啊!

    5.小修小补的 MacOS

    在本次 WWDC 上,基于 MacOS 的 iTunes 正式退役了。

    苹果新推出的三款 App 来取代它的功能,分别是 Apple Music、Apple Podcasts 和 Apple TV。其中 Apple Music 用来管理和同步音乐;Apple Podcasts 通过机器学习为用户更精准地推送节目;Apple TV 则支持 4K HDR 播放,同时也包括 HDR10、Dolby Vision、Dolby Atmos 等功能。

    10

    此外,MacOS 还引进了一些全新的功能和应用,覆盖了 Safari、照片等。虽然都是些小修小补,却也是不断完善系统过程中不可或缺的部分。

    6.自立门户的 iPadOS

    本次大会最大的亮点,莫过于苹果在 iOS 的基础上针对iPad推出的一个全新的操作系统——iPadOS。

    iPadOS支持更彻底的分屏模式和USB的识别。不得不说就这两项,已经将iPad的利用率大大提高!

    苹果还把Apple Pencil的响应率降低至9毫秒,还推出PencilKit,将会有更多第三方应用支持Apple Pencil。

    11

    另外,iPadOS 的三指滑动的功能,为了配合 iPad OS,Safari 新增的桌面级别的功能、 Fonts 功能等等,都让iPad更接地气。相信未来,iPad绝不只是”娱乐“和”看课件“,而将是多才多艺的小公举了~

    祝各位果粉能尽快尝鲜!了解更多科技圈资讯,快来微信公众号”AI研究所”!

     

    机器翻译2.0升级上线:支持自定义,100+语种互译秒级响应!

    能力星云计划的优秀AI服务合作伙伴——小牛翻译,与讯飞开放平台全面合作!

    划重点:科大讯飞能力星云计划的优秀AI服务合作伙伴——小牛翻译,与讯飞开放平台全面合作,直接对接小牛翻译云平台,带来机器翻译2.0升级!支持100多个语种之间相互翻译!现在开通接入即送200万字符免费服务!戳一下了解详情:机器翻译

    2000种以上。

    这是全世界正在使用的语言数。预计2020年,语言数据量更将达到35ZB同时,一带一路战略带来跨境电商交易量上升,人类的日常交流跨越国界,呈现全球化趋势。

    以上种种都推动翻译服务的需求急速增长,但面对多样的语种和庞大的交流信息,单纯依靠人工已无法满足翻译的即时、高效等要求。

    所以,机器翻译迎来了巨大的市场机遇。

    此前,科大讯飞能力星云计划的优秀AI服务合作伙伴,小牛翻译提供的机器翻译能力在讯飞开放平台上线,支持英、日、韩、法、西、俄6种语言与中文双向互译,受到广大开发者的一致好评!

    现在,讯飞开放平台与小牛翻译进一步展开全面合作。与小牛翻译的云平台直接对接,带来机器翻译2.0!支持100多个语种之间的相互翻译!

    机器翻译2.0的全新优势

    本次开放平台上线的机器翻译2.0能力,不仅搭载了应用最新技术的神经机器翻译引擎,更在翻译自由度、准确度、隐私性、功能开发等层面带来强大优势——

    支持100+语种

    机器翻译2.0支持100多种语种之间相互翻译,覆盖全球98%的人口。

    自定义翻译随心所欲

    2.0版本加入了小牛翻译的术语词典功能,支持用户添加自定义术语,大幅提升机器译文中术语翻译的准确性和一致性。同时还加入了小牛的翻译记忆库功能,用户可将人工翻译的正确译文实时添加到记忆库中,避免机器翻译重复犯错。

    秒级速度+精准高质

    机器翻译2.0使用多语种机器翻译引擎,它由小牛翻译自主研发,应用海量语料,通过深层网络训练,让2.0的用户享受准确性高,秒级响应速度的卓越翻译品质。

    支持局域网,保护隐私

    本次2.0新增了本地私有部署。构建机器翻译私有云,可以在局域网内使用翻译能力,保障翻译数据安全,支持私人定制。

    可开发,功能集成便捷

    支持API开发接口,基于HTTP协议的翻译API接口,用户可以很便捷的集成嵌入到自己的业务平台或其他应用中。

    行业垂直领域模型

    机器翻译2.0增加了小牛支持垂直(特殊)领域翻译效果优化的优势,针对用户的特殊领域需求,结合行业特点与待翻译数据特性,可以通过用户翻译内容的行业领域,分析行业特点、待翻译文本的特性,实现翻译的特殊定制与优化。

    让优质翻译体验在更多场景中落地

    如文章开头所提到的,随着跨国交流场景的飞速增加,机器翻译将迎来大量应用场景。而机器翻译2.0在讯飞开放平台的上线,将让开发者能实现更多性能升级,体验优化的翻译新产品的落地。

    1.外文资料/文档处理

    工作或者科研学习中,要应对大量的外文材料、书刊杂志、电子资料,尤其是在小语种领域一直缺乏优质的翻译应用,而机器翻译2.0将成为更多语种翻译应用的开发提供支持。

    2.电子词典的优化升级

    机器翻译2.0可为电子词典类应用赋予语种增加、个人定制等功能优化。

    3.学习辅导

    用于语言学习类APP和程序的开发,让其在同类成品中具有语种多、速度快等优势。

    4.社会调研

    基于机器翻译可以开发面向各类生僻语种的翻译工具,为学者在全世界的偏远地区进行科考、采访与社会观察时提供与当地人交流的辅助工具。

    5.线上跨国贸易

    基于机器翻译2.0,可以开发多语种实时翻译的应用,保证跨国商业活动中来自多个国家的、母语不同的代表们无障碍无延迟沟通。

    同时,机器翻译和其它AI能力的结合,也为开发者的产品研发带来更多的想象空间。

    1.拍照翻译

    在国外旅行时,遇到指示牌/路牌、餐馆菜单、商品标签、入境卡等多种场景量身定制。利用印刷文字识别+翻译,随手一拍,翻译内容即刻显示。

    2.AR导游

    展馆和旅游景点如今都在升级游览体验,将线上虚拟场景与线下实际体验结合,提高了趣味性。通过AR技术+翻译,可以让游客对景点的理解更生动酷炫。

    升级背后:能力星云合作伙伴的强大支持

    机器翻译2.0版本的优秀表现,离不开科大讯飞能力星云的优秀合作伙伴——小牛翻译的支持。

    2

    除了自研能力,科大讯飞与业内优秀的技术厂商进行战略互补形式的合作。带来能力星云计划。在能力星云中,AI服务合作伙伴通过讯飞开放平台的桥梁,为更多的AI开发者和爱好者提供服务,让技术为在更多场景中落地,为各行业赋能。同时拥有宣传、商机对接、开发者资源共享等服务。

    小牛翻译(NiuTrans)团队核心成员来自创立于1980年的东北大学自然语言处理实验室,专注于语言分析和机器翻译技术研究,拥有三十九年技术研究积累。

    作为人工智能领域的重要分支,如今的神经机器翻译,翻译效果优于基于规则的机器翻译、统计机器翻译。而小牛翻译以神经机器翻译为主框架,融合规则方法和SMT方法,打造最好的机器翻译“发动机”,支持118种语言互译,包含七大民族语言,覆盖全球98%的人口。“让社交像在母语环境中一样自在。”小牛翻译创始人朱靖波说。

    未来,能力星云将让厂商的实用级核心技术陆续与讯飞的核心能力一起,汇聚成AI能力的星云,释放巨大的组合效应!

    来官网进一步了解吧!

    机器翻译

    现在开通接入即送200万字符免费服务!

    二维码动态

    报名 | “讯飞AI星火营·上海营”正式启动,先人一步感知创投风向

    6月20日,上海,不见不散。

    “概念还在天上飞,想赚钱产品要在地上跑——by 创业者说”

    当下,中国一级市场正处于至关重要的转折点。在经历了创投市场的狂飙激进后,诸多挑战让所有人必须重新定位自身与未来的关系。中短期内,蓬勃发展的“万物互联”+“万物智能”生态将催生巨量的人工智能需求,覆盖机器人、智能家居、物联网、智能硬件等多个热点领域。每个热点领域的爆发,都将带来特定AI市场的爆发式增长

    对于创客来说,最痛苦的事莫过于把握了好的创业时机、有好的创业项目却缺少产业与资源的支撑。现在,讯飞AI星火营给你一个机会,让创业者与投资方对接,搭建起你想要的优质平台。

     “讯飞AI星火营”是讯飞生态平台打造的产业赋能、资本对接、AI项目路演活动,旨在汇聚全球优质创业项目。线下活动贯穿全国核心创业城市,每期将有专题分享和AI项目路演,我们致力于为创业团队搭建产业资源和资本资源的对接平台,帮助创业团队与产业方、资本方进行快速有效的对接。我们诚挚地邀请创业团队、产业方、投资机构与我们共建AI创业生态。

    6月20日,讯飞AI星火营将联合晨晖创业空间,为AI创业团队提供一次与讯飞产业资源和资本面对面接触的机会。

    讯飞AI星火营·上海营

    时间2019年6月20日  周四  下午13:30-17:00

    地点:上海市张江高科技园区华夏中路958弄    晨晖创业空间源创谷基地会议中心

    招募领域

    此次讯飞AI星火营·上海营的项目招募领域主要在:智慧教育、智能车载、智能硬件、智能家居、机器人、智慧医疗、智慧城市、企业/生活服务等方面。

    111                                       
    入选项目团队将获得

    1、现场直面上百家投资机构,项目BP推送合作投资机构,更有讯飞创投基金直投机会

    2、讯飞创孵计划:获得讯飞“技术+产业+品牌”的全方位创业扶持

    3、“1024全球开发者节”线下参展及演讲名额,全球顶级开发者盛会,2千万+曝光量

    4、产业直通车:与产业导师深度交流,促进双方业务合作

    报名方式

    路演项目报名扫描下方二维码填写详细信息,并将项目BP发送至邮箱:startup@iflytek.com

    邮件格式:项目名称+融资阶段+姓名+联系方式,团队经理会在两个工作日内进行审核,审核通过后第一时间与项目方联系。

    二维码

    投资机构/旁听观众:扫描上方二维码报名,后台审核通过方可参与活动,谢绝空降。

    活动日程

    报名评选:5月15日—6 月14日

    通过官网进行报名,提交自己的参赛作品后。组委会将从技术实力、团队资质、商业模式、产品竞争力、财务预测等维度进行审核,筛选7-10个优质项目莅临现场参与项目路演。最终路演项目将于2019年6月14日在“讯飞生态平台”官方公众号公布!

    线下路演: 6月20日

    线下路演以答辩(10min陈述+5min投资人Q&A)的形式进行。

    演讲嘉宾

    闫润强

    科大讯飞洛阳语音云创新研究院院长

    222

    上海交通大学生命科学学院生物医学工程专业工学博士。曾任摩托罗拉中国研究院研究员,科大讯飞研究院多语种语言及语音处理团队研发主管,高级研究员。现任科大讯飞洛阳语音云创新研究院执行院长。先后作为主要成员参加多项国家级、省部级科研项目,包括“多语种语音合成识别技术及系统研发”(国家国际科技合作专项项目)、“面向少数民族语言的智能语音技术及系统研发”(工信部电子发展基金项目)等。

    活动议程

    13:30-14:00  现场签到

    14:00-14:30  专题演讲

    14:30-16:30  项目路演

    16:30-17:00  自由交流

     

    主办方:讯飞生态平台

    联合承办:晨晖创业空间  浦软孵化器  盛大创业苗圃

    合作媒体:亿欧  镁客网  张江头条

    2019-06-20 ~ 2019-06-20上海
    它陪跑《名侦探柯南》数十年,终于在科大讯飞C位出道!

    拥有一个变声领结,我就是整条街最靓的小侦探!

    那部传说中的作品又Lei了!
    作为每年的固定节目,《名侦探柯南》的最新剧场版《绀青之拳》已经于上个月在日本上映。相信在国内的视频网站和影院欣赏这部新作也指日可待。虽然剧情逻辑愈发沙雕,但小智仍然会为信仰充值!

    1

    然鹅——

    2

    什么?!这么重要的道具竟然没了?要知道小智从小到大,看柯南就是眼馋那几个“大宝贝”——

    某领结,

    3

    某手表,

    4

    以及某球鞋,

    5

    像尔等没有柯南智商的路人,只能幻想拥有这几样“神器”装装逼了,现在连这点乐趣都要被夺走咩~(可怜)。

    6

    还好,有科大讯飞2019新品发布会,给我带来安慰!

    因为,科大讯飞董事长刘庆峰带来了三次元的真·变声领结!

    7

    1.变声技术亮相,今天就做整条街最靓的「柯南」

    发布会上,现场出现志玲姐姐、老罗等“神秘嘉宾”。但只闻其声,未见其人。而这些声音其实都来源于科大讯飞董事长刘庆峰。

    8

    从二次元走入现实,一个人如何做到多种声音转换?这就要归功于科大讯飞的最新”变声技术”。该技术可以将原声的节奏、情感,以及特定人的音色进行转换结合,并且支持不同性别的声音转换。实现了接近100%的声音复刻,真实自然。

    其实这项音色转换技术早在voice conversion Challenge 2018国际音色转换大赛中获得全部指标第一名;是音色和相似度上唯一一家超过4.0MOS分的系统!

    刘庆峰提到,人工智能要持续发展,最核心的是它的价值观如何阳光健康、与人为善。

    2.A.I.主播登场:一位会说七国语言的女神

    除了变声技术,本次新品发布会还有一件让二次元粉丝欢呼的事:看多了初音、绊爱等动漫风的虚拟主播,大家见过真正能说会道,几乎与真人无异的虚拟主持人嘛?还是知性美女姐姐哦!

    9

    本次发布会,就邀请来了一位特别的主持人,她叫小晴。其特别之处就在于她不是真人,而是由人工智能技术合成的A.I.虚拟主播。

    10

    早在2018年3月,科大讯飞就与南方财经全媒体集团联合打造了一款用于财经新闻的播报的A.I.虚拟主播,这也是讯飞虚拟主播的首次公开亮相。后来,讯飞又陆续推出了A.I.虚拟主播“康晓辉”、“央小广”、“小撒”、“纪小萌”、“小晴”等等。

    11

    虚拟主播的表情和声音都是预测生成的。先输入播报内容,通过科大讯飞的语音合成技术进行合成,然后利用多模态合成模型基于语音驱动表情序列生成对应的表情序列,再经过语音驱动模型的训练,最终形成我们现在看到的A.I.虚拟主播。

    12

    这种语音合成技术只需要10段话或5分钟的声音样本,就可以模仿任何人说话,产生极高还原度的“智能声音”。

    当然,作为新品发布会,小晴的能力相较于之前也有了新的发展,那就是成功升级为多语种A.I.虚拟主播!

    发布会中,小晴在线上同步直播以中文、英语、法语、日语、韩语、德语、西班牙语等七国语言以及维语、藏语两种民族语言播报,使得本场发布会成为了全球首场人工智能多语种直播发布会。

    4

    3

    3.神器背后:iFLYOS 2.0的A.I.生态蓝图

    在变声技术炫技时,刘庆峰说未来讯飞的这项技术将可以集成到芯片上,搭载在各类智能硬件设备中,让直播、陪护、娱乐、游戏、车载等领域都有语出惊人的玩法。

    而这所依托的,就是讯飞的AIoT万物互联生态。在本次的新品发布会上,科大讯飞就推出了AIoT操作系统iFLYOS 2.0。

    00

    iFLYOS 2.0具备“人性化交互”、“深度自定义”、“端到端集成”、“高效率开发”四大特点,为开发者提供软硬一体的智能硬件解决方案和强大的集成开发环境(iFLYOS Studio);为消费者提供流畅的交互体验和多样的场景服务。

    同时iFLYOS 2.0突破行业桎梏,在开放度上进一步提升:

    1.企业级开发者可以使用自己的用户体系;

    2.利用技能工作室,开发者可以集成自己的各种服务;

    3.在唤醒词、发音人、GUI等方面,开发者都能将自己的品牌元素融合。

    这三大功能,将让开发者完全能基于iFLYOS开发一个真正属于自己的智能物联网操作系统。

    4.新品连发,B+C技术价值加速兑现

    作为蓄力一年之久的发布会,讯飞还是准备了很多“大餐”的,变声技术和虚拟主持还只是开胃菜而已~~

    16

    比如讯飞翻译机3.0,能0.5s内完成一次翻译,而且中英文识别率超95%,这还是在离线环境下!不好意思,在陪你走遍全世界方面,我不是“996”,我是“007”啊!

    17

    还有像动作大片里的机密手提箱的讯飞转写机,可以领导这边说,稿件那边自动出!1小时录音5分钟出稿,并能为视频文件实时生成配套字幕,随画面一起输出。

    18

    还有具有充满时尚艺术感的颜值的讯飞智能录音笔,2+6 麦克风阵列配置,收音距离可达15 米。配备触摸屏幕,满电状态下可连续工作10个小时。

    19

    还有手写质感、1秒录音成文、可安全储存的讯飞智能办公本;具备语音评测和语音转写功能,在不同学习阶段都能反馈清晰展示学习情况的讯飞学习机。

    关于这些新品的完整介绍,可以看我们之前的文章:戳这里

    正如刘庆峰所说,2019年是人工智能应用价值的兑换年。而真实可见的实际应用案例;能规模化推广的对应产品;可用统计数据证明的应用成效。将是判断AI技术价值兑现的三大标准。

    发布会推出的新品也正不断地应证着以上三点,让我们的沟通、办公、学习“因A.I.而能”。未来,变声领结等A.I.神器真正像水和空气一样在我们生活中无处不在。

    不过,小智更关心的只有一件事:

    既然变声领结都有了,干脆也把手表和球鞋也出一套呗!顺便再给我专门配一个“小晴”。

    20

    科大讯飞:我们和华为基因相似,板凳能坐十年冷,如今向C端强劲发力

    2019年,讯飞要兑现AI应用红利。

    11


    【导读】To B业务已稳,科大讯飞瞄准利润更大、规模更广的C端市场开始发力。在5月21日的年度发布会上,讯飞重磅发布了5款面向消费者的硬件产品,其中讯飞翻译机3.0能实现0.5秒闪译。坐穿十年冷板凳,不断积累技术经验,这支“AI国家队”终于要实现AI应用红利兑现。

    向C端强劲发力,瞄准用户规模更大的消费者市场,AI应用红利得以兑现。

    这是“AI国家队”科大讯飞正在探索的新路。与互联网不同,在人工智能领域中,To C业务反而未经大范围开拓。

    不变的是,先布局的玩家,先占据优势。

    5月21日,在上海世博举办的年度发布会上,科大讯飞大秀技术肌肉,针对用户痛点发布6款新品,其中5款为面向消费者的硬件产品。

    其中包括能实现0.5秒闪译、支持四大方言与英文互译的讯飞翻译机3.0,售价3499元;以及一小时录音5分钟出稿的讯飞录音笔,分为1999元和2999元两个版本。

    今年是科大讯飞成立20周年,恰逢国际贸易摩擦升级的历史关卡,讯飞表示要在技术上未雨绸缪,做好十年磨一剑的准备

     

    科大讯飞董事长刘庆峰:20年不断累积,AI技术价值今年将开始兑现

    与往年发布会流程相似,发布新品前,科大讯飞董事长刘庆峰进行开场演讲。

    与往年发布会有所不同,这是全球首场人工智能多语种直播发布会

    开场的“AI虚拟主播”主持人便吸引了不少人的眼球。不仅如此,这位虚拟主播还同时支持多语言同步报道。

    3

    AI虚拟主播进行韩语报道

    4

    虚拟主播藏语报道

    技术肌肉秀不止于此,随后科大讯飞董事长刘庆峰亲自表演了一场类似“柯南领夹”的AI变声秀。

    刘庆峰登场进行自我介绍,一开口,现场却传出来的是“老罗”罗永浩的声音,“大家好,我是科大讯飞刘庆峰”,刘罗难辨。

    不一会儿,他的声音又开始变成清脆的女声,虽然是志玲姐姐的声音,但说活语气、节奏却和刘庆峰本人完全一致。

    这背后正是运用科大讯飞的音色转换技术,可通过提取原声语音中的内容信息,包括原声的节奏和情感,再结合特定人的音色进行转换结合。

    该项技术在voice conversion Challenge 2018国际音色转换大赛中获得全部指标第一名,也是音色和相似度上唯一一家超过4.0MOS分的系统。

    另外,在嘉宾的同时,舞台旁边都有“讯飞听见”直接进行现场实时语音识别并准确呈现出来,同时机器自动将讲话内容翻译成英文。

    55

    嘉宾演讲过程中,讯飞听见一直进行实时语音识别和英文翻译

    这其中的技术又有了革新——科大讯飞采用自主研发的新一代语音识别模型,实现了中英文语音混合输入,识别无缝切换,且识别率达到95%以上

    关于所谓的中英文语音混合输入,举个例子:

    “看最后一集Game of Thrones了吗,囧雪竟然做出了这样的事儿,很bad很sad很drama。”

    有了这项技术,不管“讯飞听见”有没有被剧透,它都能准确识别并且翻译你说的话。

     

    除此之外,刘庆峰还介绍了科大讯飞在国际上取得的技术突破:

    • 语音识别:语音识别准确率全面超过速记员。目前,科大讯飞的中文语音转写准确率已经突破98%,英文达到95%。
    • 机器翻译:系统通过CATTI全国翻译专业资格(水平)测试,达到专业资格合格标准;让更多“语言间的高效沟通”成为可能,让机器翻译能力确有保障。
    • 机器阅读理解:2019年3月,机器阅读理解国际权威评测SQuAD 2.0任务科大讯飞再次登顶冠军,并同时在EM和F1两个指标上全球首次均超越人类水平,一举创下比赛的全新纪录。

    66

    2019年伊始,不少人认为这将是大量人工智能创业倒闭的时候,大潮退去,泡沫破灭,因为人工智能并没有核心技术。

    对于这样的论调,刘庆峰在现场明确表示:“2019年就是人工智能的应用价值兑现年,今年开始真的红利已经到来。”他提出了A.I.技术价值兑现的三大标准:

    一、真实可见的实际应用案例

    二、能规模化应用的核心产品

    三、能够统计数据的应用成效

    技术肌肉已秀,接下来让我们看看实际落地、将要帮助讯飞获得红利的硬件新品:

     

    新品强劲发力C端:讯飞翻译机3.0实现“0.5闪译”,售价3499元

    讯飞此次一口气发布5款消费者硬件产品,覆盖生活、工作、学习等方面,每一款都针对消费者痛点。

    先来看下讯飞翻译机3.0。

    说话是世界上最常见的事情,又是世界上最不简单的事情,不同国家之间语音不同,不同的省份地区也有着各自的方言。

    然而一个人精通多种语音需要花费大量的时间和精力,就像刘庆峰在现场所说的那样“不可能每个人都是钱钟书转世”,但AI让不可能变成可能。

    讯飞翻译机3.0全新升级,翻译速度达到“0.5秒闪译”,实现清楚拾音、响亮外放和智能识别多音多义词。

    77

    讯飞翻译机3.0

    对消费者更实用的是支持多种语言互译,讯飞翻译机3.0支持普通话与粤语、东北话、河南话、四川话等翻译,及粤语和英语互译、维吾尔语与普通话互译、藏语与普通话互译

    其中的英语,不仅限于标准的英文发音,在现场演示中,讯飞翻译机3.0能将带有咖喱味的、法国奶酪味的、德国啤酒味的、俄罗斯伏特加味的英文统统翻译成标准的普通话。

    另外,继去年首发行业A.I.翻译功能后,讯飞翻译机3.0实现金融、医疗、外贸、计算机、法律、体育、能源七大领域的A.I.行业翻译。

    除此之外,翻译机3.0还优化了拍照翻译功能,升级高清摄像头和视网膜屏,出国旅游看不懂菜单的尴尬将不再出现。

    拍照翻译采用科大讯飞最新国际领先的OCR技术,该技术去年包揽ICPR 2018国际大赛全部三项冠军。刘庆峰表示,科大讯飞为何开始做图像识别?因为语音识别和图像识别的底层算法是相通的。

    相比于讯飞翻译机2.0(售价2999元),翻译机3.0售价为3499元

    接下来是另一重磅产品:讯飞智能录音笔,这也是讯飞5款硬件新品中,价格最低的一款,分为1999元标准配置和2999元两款,来看下性能:

    88

    • 采用2+6麦克风阵列顶级配置,2颗哈曼大直径麦克风和6个矩阵麦克风位列机身;
    • 收音距离可达15米;
    • 语音识别准确率达到98%,1小时录音5分钟出稿
    • 支持语音实时转文字、中英边录边译、要点标记、语音搜索、多平台同步和后端编辑功能。

    除此之外,还有针对办公所出的讯飞转写机、讯飞办公本,以及针对教育所处的讯飞学习机,这三款价格均高于3000元:

    99

    新品展示:左上为讯飞智能办公本、左下为讯飞转写机、右上为讯飞录音笔,右下为讯飞学习机

    商务人士的专属:讯飞转写机是一体化的专业语音转文字设备,面向会议、培训、讲座等场景下可实现实时转写、纯离线识别、识别内容翻译成英文投屏展示,同时可为视频会议实时生成配套字幕输出,会议、演讲结束后可自动生成二维码回看PPT、文稿和录音。

    可书写的智能办公本:讯飞智能办公本拥有10.3英寸E ink高清柔性护眼墨水屏,即时语音转写文字、智能语音搜索、一键分享查看编辑、收发邮件手写亲笔信等功能,售价4999元

    辅导数理化的学习机:讯飞学习机,针对数理化、英语听说读写进行提升,售价3999元。

     

    iFLYOS 2.0来了:开放超200项核心技能,未雨绸缪以备十年磨一剑

    除5款针对C端的硬件产品外,科大讯飞在本次发布会发布iFLYOS 2.0,开放超200项核心技能。

    iFLYOS是什么?它是科大飞讯于2018年推出的一套基于云端的智能物联网操作系统。

    00

    2018 年讯飞开放平台相继发布了人机交互界面 AIUI3.0和iFLYOS形成端到端解决方案和实现路径。

    到现在,全新升级的iFLYOS 2.0将AIUI与iFLYOS融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的AI Agent(智能物联网操作系统)。

    当谈到日前美国将华为列为“实体名单”一事,讯飞表示华为早就未雨绸缪,有“备胎”顶替。身为国内AI代表企业,讯飞认为中国企业应该为未来备战,除了智能通讯,AIoT也是其中一个方向。

    科大讯飞在2017年就同BAT并列为“国家新一代人工智能开放创新平台”四大金刚,入职“国家队”。这次iFLYOS2.0的亮相亦是讯飞为维持原创技术系统、先行布局AIoT买的一份“保险”。

    全新升级的iFLYOS 2.0将AIUI与iFLYOS融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的AI Agent(智能物联网操作系统)。

    科大讯飞轮值总裁胡郁介绍,它具备“人性化交互”、“深度自定义”、“端到端集成”、“高效率开发”四大特点

    01

    为解决接入方SDK集成慢,语音能力接入复杂,硬件设计链条过长的问题,iFLYOS直接提供SDK和API,并有芯片、PCBA公版和整机参考设计等解决方案供接入方选择。

    一方面为开发者提供高度集成的软硬一体化智能硬件解决方案和强大的集成开发环境;另外一方面,也能为消费者提供流畅的交互体验和多样的场景服务。

     

    讯飞即将“弱冠”:出鞘消费者市场,技术成熟才能做C端产品

    此次科大讯飞全面发力C端市场,事实上早在去年就有迹象。

    今年4月,科大讯飞公布2018年度财报,其中一大亮点就是该公司业务赛道加速奔跑,To C业务增长迅猛。

    02

    科大讯飞2018年度财报

    2018年,讯飞TO C业务开始发力,占比显著提升,全年实现营收收入25.17亿,同比增长96.54%,在整体营收中占比达31.80%;实现毛利12.96亿,同比增长70.77%,毛利占比达32.72%。

    在产品方面,讯飞翻译机2018年卖出30万台,占据品类销售额70%,品类份额第一;讯飞输入法活跃用户超过1.3亿;以讯飞听见为代表的移动网产品及服务较上年同期增长369.36%。

    如果说移动互联网的主战场正从上半场的消费互联网(To C),向下半场的产业互联网(To B)方向转变。

    那么,AI领域正好相反,被称为“人工智能国家队”的讯飞早早就布局To B业务,实现智慧政法、智慧医疗、智慧教育等业务的突破。

    03

    科大讯飞轮值总裁 胡郁

    而人工智能To C市场此前难以进入的僵局如今正有被打破的迹象。据科大讯飞轮值总裁胡郁透露,当科大讯飞刚成立的时候,他们也做过一款面向C端的统一输入法,但结果很不成功。

    胡郁解释称,要做C端产品的,基本上都是做产品创新和模式创新的公司,所用的技术一定是成熟的。就像当年的互联网创新,技术上都是成熟的。但如果是做核心技术创新的公司,一开始就做C端的话是很困难的。

    那么科大讯飞决定发力C端的真正原因是什么?

    人工智能技术已经走向成熟,AI将实现应用红利兑现。

    胡郁具体解释了其中原因:

    • C端有足够大的利润空间,有更广泛的市场规模,而在人工智能方向的To C,目前市场潜力仍非常大,讯飞跟很多的公司处于同一个阵地、同一个起跑线;
    • 想要把最好的技术展现给用户时,需要做完整的事情,讯飞有足够的技术积累,将技术从软件到硬件、完整地呈现给用户。

    20年的技术累积终于将讯飞强势带入了C端的战场。

     

    科大讯飞轮值总裁胡郁:我们和华为有着相似基因,都曾坐十年“冷板凳”

    最后当谈转向C端面临的挑战时,胡郁表示:科大讯飞在源头核心技术、系统创新上都占据优势,但最终做成C端的最重要一环——模式创新上,讯飞仍面临着挑战。

    胡郁表示,相比于互联网产品,我赞成互联网的创新模式思维,但是我并不赞同很多互联网公司去通过烧钱的方法去做推广,这种推广效果并不一定能呈现刚需。

    作为一个技术创新型的AI公司,而不是一个互联网公司,科大讯飞要用互联网思维来优化我们的核心技术,来优化产品,迭代产品

    04

    胡郁提到为何华为可以把消费者业务做成功:

    首先,华为拥有一群学习能力极强的员工,去学习钻研如何从To B向To C转变;

    其次,能够耐得住寂寞,保持定力,朝你自己认为正确的方向坚持下去,华为与讯飞的一些基因上是比较类似的,都是做那种板凳能坐十年冷、十年磨一剑的公司

    最后,不断地吸引业界最好的知识经验与血液。

    在发布会现场谈到AI应用红利兑现的基础——AI核心技术鸿沟的突破时,科大讯飞董事长刘庆峰表示这不是一蹴而就,需要源于热爱的长期坚守。

    这是任何一家成功的AI公司都必须拥有的基因。

     

    本文转载自:https://mp.weixin.qq.com/s/0c-cvbqE2pflXamMcEkHtA

    超过80%语音开发者的共同选择