• 曾经不俗的苹果,如今正在流于平庸

    虚高的价格,并不是苹果销量下跌的唯一原因。

    大厂在新品发售前“泄露”出谍照,已经是一项传统了,苹果也不例外。

    不出所料,疑似iPhone的2019年新机渲染图已经被外媒曝光,紧跟着就是关于性能的预测与评估,什么简约边框经典大屏啊,前置摄像头升级更高像素啊,搭载5G芯片啊……但看着这些,小智只是眼泪在肚子里打转,反正是笑不出来。

    timg

    曾经卓越的苹果,如今正在流于平庸。

    一、从创新到小修小补

    把视线转回12年前,07年的发布会上,当第一代iPhone展现在世人眼前时,无异于工业文明突然降临在了石器时代。那时同期的手机还大多是这样的:

    • 按键操作;
    • 翻盖/滑盖/板砖造型;
    • 小屏幕,像素低,分辨率低,多媒体功能差。

    50cba28973308a024ef5047886639f08_hd

    而iPhone则告诉我们,手机可以:

    • 几乎占据一面的屏幕;
    • 电容屏、多点触控、重力感应交互;
    • 同期领先的分辨率和像素;
    • 更宽更薄的机身。

    timg (2)

    初代iPhone就像一个里程碑,决定了接下来是几年的智能手机设计方向——大屏幕、触屏交互、更薄更轻、摄影性能高、视频更高清……

    在震撼了手机界后,接下来的几年可以说都是iPhone的优势期,彼时其它手机厂商刚受到冲击开始起步追赶,而苹果则乘胜追击,始终占据着天花板。从iPhone 3G到iPhone 6S,手机圈同行看了只能说“我靠,原来这里可以这样玩。”

    微信截图_20190125171640

    但是从iPhone 7开始,苹果开始疲了。那几年的发布会,新品亮点中你能反复看到:

     

    上一代分辨率高吧?这次我们又把分辨率弄得更高了!

    大屏用的爽不爽?这次我们又推出了更大的屏!

    觉得可选颜色少了?这次我们推出了新的颜色!

    有线耳机不方便?我们推出无线耳机,只是用的时候不能充电!

     

    有的人会反驳:处理器升级了啊,芯片更新换代了啊

    但这些对一个新手机来说,不是理所应当的吗?

    用户更关注的,是这款新手机能否为自己带来完全不同的使用体验。

     

    G1546952400407

    再看这次对iPhone新机型的预测:简约边框等于是对之前工业设计风格的回归,而搭载5G芯片,在19年的5G大趋势下,并不独树一帜。

    从曾经的惊艳到如今的平淡,在创新上没有给粉丝们带来更多“盼头”的苹果,正在消耗大众的期待。

    哦差点忘了,其实发布会还是有一个新晋看点的,那就是:

    这次还能贵到什么地步?

    二、1万售价背后的困局

    一个手机卖1万多,你还会不假思索地掏腰包吗?

    与减速的创新相比,iPhone的价格提升简直可以用火箭来形容,我还记得自己当初入手SE时是4000多,如今再看XS MAX那突破五位数的价格,只让人感慨沧海桑田。

    timg (8)

    涨价没有错,企业的最终目的是盈利,逐步提高iPhone的平均售价是苹果实现利润增长的方式,而且当iPhone做得最好,卖得理应更贵,这也是消费者可以接受的。

    当iPhone看起来没有好到“印象深刻”时,再把价格狂抬那么高,又是在下哪步棋呢?

    小智认为,在不断的涨价策略背后,苹果已经陷入了一种困局,其中包含着以下影响因素——

    1.为了满足需求不断提升性能,带来零部件成本提升

    虽然前文中我们提到iPhone的革命性创新减少,但至少每一代的性能仍在提升,而为了带来更快的运行速度及处理能力,就要使用新的芯片等零部件,而这都会带来制造成本的巨大增加,也带来了一台新iPhone的售价的巨大增加。

    2.为了减小成本,对供应链获利加大管控+自研

    曾经苹果与供应链有着深度且和谐的合作,苹果提出设计与生产需求,对应的供应商参与并完成。苹果从供应商那里拿到第一手的技术与优惠价,也会给供应商可观的利润。

    timg (3)

    但随着生产成本的提升,苹果开始对供应链的价格愈发敏感,除了对供应链压价,苹果还开始通过强大的自研能力,逐渐摆脱对各供应链技术的依赖。这导致与供应商间的裂痕不断加深。

    3.老机型卖不出好价钱

    性能仍然优秀,价格相对较低的老机型虽然拥有巨大的市场,但它们更多是负责增加销售量,并进一步打开全球中低消费水平市场,不仅无法涨价,相反还不断降低价格到收不回成本。如在印度的iPhone 6S只卖1888元。

    这些因素导致了以下结果:

    1.新机型卖不出去,消费者选择其它手机品牌

    价格不断增高,超出消费者承受范围,除了少部分忠实的“土豪”果粉和科技研究者会掏腰包外,新的iPhone销量远远不达标。更多的消费者转而选择性能同样能满足需求,价格更低的其它品牌手机。

    2.供应商转而与其它品牌手机合作,苹果创新优势被缩小

    被“伤害”的供应商也开始与其它的手机厂商合作,有些手机厂商曾经只能跟在苹果之后与供应商沟通,生产出与iPhone相近的手机,而现在则可以通过合作实现不同的创新和技术飞跃,并且将吸引更多被高价iPhone吓跑的消费者,这对创新力度减缓的苹果来说无异于形成了巨大压力。

    综上,苹果最终形成的局面如下:

    1.成本提高——价格提高——消费者选择其它手机——销量盈利双低;

    2.控制成本——供应链压价——供应商流如其它手机——创新优势减小。

    目前来看,价格策略的恶果已经体现,2018年的Q4财报发布时,苹果宣布2019的财报将不再公布最新的销量数据,CEO库克也致信投资者,提前降低他们的预期。之后苹果股价大跌8%

    虽然库克表示业绩不佳的原因有“经济减速,特别是在大中华地区”,但在笔者眼中,狂飙的价格配上不够格的创新,还要面临与其它手机大厂间日益缩小的差距。不得不说苹果是——

    正在打烂原来的一手好牌。

    三、iPhone还能再火起来吗?

    小智并不是专业人士,但就目前来看,苹果仍然有很多机会。

    首先是iOS系统仍然充满魅力,与系统性能随着时间推移会经常出现出现运行卡、应用打不开、闪退等问题的安卓(Android)相比,iOS对多应用,多进程管理更加优秀,通过“墓碑机制”冻结非正在运行的程序并随时解冻,保证了进程不占用内存,让运行更加流畅;同时由于苹果的权限管理,iOS系统相对封闭,虽然无法像安卓那样高度自定义,但也保证了隐私安全。

    timg (4)

    所以,苹果继续优化iOS系统,并在过程中不断提升体验,iPhone就还会吸引许多喜欢高性能手机,更换周期长并且注意个人安全的消费者。

    另外,随着技术独立取得进展,未来iPhone的生产成本有望得到一定程度的降低,比如近期关注度超高的高通起诉苹果,要求禁售iPhone的诉讼,就是作为技术供应方的高通,认为苹果在使用技术时没有支付费用,但苹果则提到在新的iOS系统中已经规避了这些技术。所以,不让技术被别家掌控而徒增成本,或许将是苹果下一阶段的方向(当然还要保证不被禁售)。

    timg (5)

    当然,对于目前的苹果来说,首先要做的是不让粉丝被价格吓跑。

    近日苹果已经开始采用灵活的“补救”措施:包括iPhone XS Max在内的多种机型价格已经下调,降幅最高达到450 元;价格调整后的iPhone XR国行版在电商平台的最低价已到5000多元。


    说了这么多,回到开头对苹果的评价,以上的几点,对于如何让苹果重新拾起“行业搅局者,技术创新者”的荣光,显然远远不够。

    “产品线从未这么好,生态系统从未这么强,服务业务非常成功。”对于未来,库克则充满信心,而小智也愿意期待一下苹果的厚积薄发。

    当然,如果你要小智给下一代iPhone的创新提出点看法,那只能说:

    至少要做到这种程度吧(笑)——

    timg (11)

     

    30亿人次大迁徙:春运40年,细数被AI改变的回家路

    关于春运,每一辈人都有自己的记忆点,父辈们记得载着希望回家的绿皮火车,我们记得黄牛党抢票的手速,但这些记忆点近几年正悄然发生变化。

    不知从何时起买票开启了图形验证码,进站不再需要票和证,而是对着机器“刷下脸”,出行之前手机会推送拥堵路段的提醒……

    这些变化让回家的路变得不像以前那么艰难,也将一个悲情的春运时代逐渐带离我们的记忆。

    25995fd7645541b782a45ccc24303570

     

    1、「智能防抢票」:从被黄牛抢光票,到黄牛抢不到票

    被黄牛党抢光票的阴影,笼罩在我们头上很多年了。

    可怕的不是他们抢光票转身高价卖给我们,而是抢了票还要卖假票给我们。

    微信图片_20190130093319

    电影《人在囧途》中徐峥就在黄牛处买到了假票。

    为防止黄牛用机器刷票囤票,12306官网与第三方抢票平台利用人工智能及大数据等设置图形验证码。

    d8f9369ae92749828871166457e145be

    曾经让我们哭笑不得的图形验证码,也让黄牛党的抢票机器“哭笑不得”。

    图形验证码是随每日热门线路的出现而动态出现。当某一条线路非常热门时,为了减轻瞬时购票压力,图形验证码会随机出现;如果是非热门路线,旅客可直接购票,不会出现图形码验证,极大提高我们购票的效率。

    同时,为了防止黄牛党用专业化的工具来攻破图形验证码的防护,目前已经研发出一些AI的技术,不依赖于图形验证码本身,而是通过建模识别图形验证码的过程和行为,来判断是机器编程识别的过程,还是普通人识别的过程

    从被黄牛抢光票到黄牛抢不到票,时间算起来也不过是短短几年,但改变带来的幸福感却是巨大的。

    2、「刷脸进站」:从靠票回家到靠脸回家

    没想到,有一天回家也要靠脸。

    以前放假回家的时候,总是习惯性的去检查下车票是否带好,而近两年这种习惯正在被逐渐淡忘。

    在相应购票平台完成购票之后,查询到列车时刻、检票口、停靠站台等信息,找到站内自助实名制核验闸机,将二代身份证放在闸机的相应位置,摄像头会采集我们的人脸信息,并与身份证芯片里的照片进行对比分析。如果信息一致的话,闸机便会打开,让我们快速通过进站,整个过程大约只有3—4秒的时间。

    640 (1)

    值得一提的是,相对于人工查验,人脸识别不仅能够加快进站效率,减少我们在寒风中等待验票的时间。

    同时,基于大数据、云计算等技术,机器识别可实时对比身份证照片和人脸以此迅速判断是否是本人以及是否是在逃嫌犯,提升安防等级

    妈妈再也不用担心有人来偷我的手机了,毕竟他们被「人脸识别」挡在外面进不来。

    640 (2)

    3、「互联网订餐」:从瓜子花生八宝粥,到汉堡薯条啤酒鸭

    啤酒饮料矿泉水,花生瓜子八宝粥。

    “在火车上吃什么”这个问题曾困扰了我们很长一段时间,味道不好且价格贵的车餐,选择性极少的小推车食品,以至于以前每次坐火车都要大包小包带N多零食来充饥,为此还交到了不少吃货好友。

    9a3d6da8fee54eb3aaaca9a898df22a6

    但现在,“在火车上吃什么”这个问题已不再困扰我们。

    2017年7月,12306平台正式推出高铁订外卖服务,除了车次自营餐品外,还可以选择“途径配餐站”,即可以点途径各大站提供的商家配送的套餐,比如肯德基、麦当劳等。

    为了缓解2019年春运期间高铁送外卖压力,不少车站计划引入外卖智能物流调度系统,将根据订单数量、列车到达时间、配送人数合理安排各餐厅出餐数,避免人力浪费,合理协调各方资源提升整体配送率。

    当然,随着AI技术的不断发展,菜品制作等各类厨房机器人,中短距离外卖配送机器人都将出现在高铁订餐服务了

    说不定在未来的某天我们会突然发现,在车窗外跑来送餐的,是一个机器人。

    微信图片_20190130094452

     

    4、智慧出行」:从人在囧途的灾难片,到轻松回家的喜剧片

    30亿人次的全球最大规模的迁徙运动,注定让“拥堵”成为春运独一无二的代名词,尤其是高速公路发展迅猛的那几年。

    修好了路,汽车也变多了。公安部交通管理局数据显示,截至2017年底,全国机动车保有量达3.1亿辆,机动车驾驶人数达3.85亿人。每到节假日高速路便成了免费的停车场,有些拥堵路段移动速度基本是按天来计算,1天移动1公里。

    640 (4)

    「春运避堵」已成为困扰众多归乡人最头疼的问题之一。

    好在随着大数据和智能交通系统的发展,这一问题正逐步得到解决,智能交通系统将各条道路的拥堵情况汇总到相应的管理平台,再由平台将这些拥堵信息发布到各大智能出行的产品上(如高德地图、小飞鱼车载语音助手等),使得人们可以第一时间获得路况信息。

    以往我们只能肉眼预测拥堵路段有多长,拥堵多少时间?现在我们可以智能出行产品了解到前方因为什么发生拥堵,拥堵时间有多久,拥堵路段有多长,并及时了解附近路段的出行情况,快速找到一条不那么拥堵的路段,飞奔回家。

    微信图片_20190130094828

    曾经,春运的主题色彩是灰色的,在黄牛处买高价车票、寒冷天气里排队进站、拥挤不堪的绿皮火车里忍受饥饿、堵车堵到天荒地老。

    而今,这种略显悲情的色彩正在逐步褪去,技术的发展不仅带来了交通方式的革新,也在各种细节处提升人们出行的幸福感。

    就像今年春运期间上海虹桥和杭州东站推出了“聪明”厕所,不仅可以“刷脸”取纸,还设有“潮汐厕位”,机动厕位根据使用情况开放出来调节男女厕位数量。

    在女厕所门口排队半小时的日子,终于可以挥手告别啦~

    微信图片_20190130094950

    拼多多消失的几千万:未来10年 ,AI将全面对抗黑灰产的野蛮生长

    内附拼多多未完待续的分析……

    一觉醒来,拼多多消失了几千万。

    2019年1月20日凌晨,拼多多被曝出现重大bug,用户可领 100 元无门槛券在拼多多里抵扣使用。

    此次100元无门槛券并不需要用户去抢购,可以无限领取,且能用于充话费、Q币等虚拟产品中,约等于允许用户直接套现。

    羊毛党热闹了一夜,直到第二天上午10点拼多多才将这一bug修复,12点56分拼多多官方发表声明:将积极配合相关部门对涉事黑灰产团伙予以打击。

    f24300593d5e46b59f4daeb5eaf62532

    到此为止,事件的第一阶段落下帷幕。

    1、不被大众熟识的黑灰产

    在拼多多的声明中,出现了一个大众略感陌生的词:黑灰产

    什么是“黑灰产”?指的是电信诈骗、钓鱼网站、木马病毒、黑客勒索等利用网络开展违法犯罪活动的行为。稍有不同的是,“黑产”指的是直接触犯国家法律的网络犯罪,“灰产”则是游走在法律边缘,往往为“黑产”提供辅助的争议行为。

    2016年8月,准大学生徐玉玉接到了一通电话,将自己准备用来交学费的9900块钱转到了骗子给的账户,当她发现上当时,钱早已经被骗子全部拿走。

    从警察局回家的路上徐玉玉因为过于伤心,导致心脏骤停,生命永远的停留在18岁…..

    fc700f9724624f1f817bffd098ae02ed

    2017年5月,全球近100个国家共计7.5万台的计算机同时遭到了来自一款名为 wana Decrypt0r 2.0 的勒索软件的攻击,被感染电脑必须向黑客支付比特币来解锁电脑。中国各大校园网成重灾区,众多师生的文件被病毒加密,其中包括很多准毕业生的论文。

    d5e9202e79024199bb1b615b9b67d40b

    2018年,Facebook 8700多万用户数据泄露,这些数据被“剑桥分析”公司非法利用以发送政治广告。此次事件被视为 Facebook 有史以来遭遇的最大型数据泄露事件。

    2c01c2f2868d4682a73fe53e7eac4a68

    从徐玉玉案件到 Facebook 8700万用户数据被窃取,再到一晚上被薅走几千万的拼多多,黑灰产已经渗透到普通民众生活的方方面面。

    公开数据显示,全年国内有6.88亿的网民,因为垃圾短信、诈骗信息、个人信息泄露等造成经济损失估算达915亿元,且中国电信诈骗案每年以20%—30%的速度快速增长,网络黑灰产产业规模已达千亿

    0 (1)

    第42次《中国互联网络发展状况统计报告》中显示,中国8亿网民中约有86%的人遭到信息泄露带来的威胁。

    2、AI是黑灰产命中注定的利剑

    所有恶魔,命中注定都有一把击败他们的利剑。

    在对抗黑灰产的利剑还未问世之前,网络上曾一度充斥着大量教人如何辨别电信诈骗的帖子,里面将很多诈骗人员会提及的关键名词标出:例如转账、打钱等。

    这样普及的效果微乎其微,徐玉玉的悲剧依旧出现了。而在徐玉玉案件的同一年同一月,在全国大部分地区电话诈骗率增长了58%的同时,安徽省电话诈骗的发生次数却下降了60%。

    e2265008f1bc4d5ca61bd77c24aeef99_meitu_1_meitu_2

    为什么能够做到这样?因为科大讯飞联合安徽省公安厅,给全省所有的电话里面做了一个AI监控系统,人工智能可以对通话内容进行分析,对那些诈骗性质行为自动作出提醒,而这个过程是完全自动化的。

    这一举措,为安徽省避免了5个亿以上的可能的损失。

    在AI保护数据安全这块,英国公司Darktrace就是其中一个很好的例子。

    Darktrace提供的保护数据安全的AI技术主要是从云端或者公司内部网络,甚至一个专门的工厂,通过防止外部攻击者找到进入公司电脑的路径的方法,来达到保护公司内部人员正常使用网络不被打扰的目的。

    除了数据安全,内容安全目前也成为了一大审核和保护的重点。

    2018年初短视频呈爆发式增长,成为了新的UGC载体。随着视频数量的剧增、对平台运营的要求也原来越高,对文字、图像、视频等内容的审核力度也在不断加大,因此也催生了一批运用“人工智能”进行内容审核,减少人力成本的服务。

    例如阿里绿网开发的AI鉴黄师,可以提供文字审核、语音审核和图像审核等多种服务,最大程度保证了未成年人的网络内容安全环境。

    0

    中国青少年网民数据已达总网民数据的20%,保护青少年安全用网,刻不容缓。

    3、All in 安全 AI

    如果说,之前我们利用各种人工智能技术推出发现网络黑灰产的产品,那么从今年开始,将不再仅仅是发现,而是AI和网络黑灰产的正面对抗。

    前文所提到的英国公司Darktrace已经在“发现威胁”的基础上推出了能够“应对威胁”的产品,并且拥有了第一批使用者。

    人工智能的高速发展极大提高了识别安全威胁的准确度,移动安全机制的应急反应速度大幅提升,这些技术促进经济发展的同时也有效维护网络安全。

    当然,随着人工智能技术的发展,隐藏在网络另一端的黑灰产也在不断发展,针对AI技术的“数据投毒”让人工智能训练出来的数据被“污染”。

    949043a4d57347eb855c0cd542b90924_meitu_1

    比如通过给智能汽车输入“污染”过的训练样本,就可以把“禁止通行”的交通标志牌识别为“可以通行”,从而造成交通事故和人员伤亡。

    2019年被称为5G商用的元年,5G网络的基础建设趋于尾声,业内众多专家预测未来10年全球会有万亿计的智能设备连到互联网上,万物互联的时代,网络安全问题将变得至关重要,对黑灰产的打击防范也将在未来10年里呈白热化状态。

    毕竟,这是分分钟关系到人身安全的头等大事。民众需要的不仅仅是All in AI,而是All in 安全 AI。

    2019-01-25 ~ 2019-01-26网络
    音遇爆火两个月之后,仍有无数声音在高喊:盘它!

    万万没想到啊,今年社交榜单上最大的黑马,会是一个K歌接龙的鬼玩意儿

    音遇火了,在这个朋友圈刚飘完雪的冬天,燃烧起了无数人的热情。

    这款音乐社交产品刚上线,就立即冲到App Store总榜的前两名,甚至一度在社交榜上击败了微信。于是,无数声音响起,担忧音遇会不会成为下一个子弹短信,但截止目前,音遇依然势头强劲,成为“2018最后一匹黑马”。新的网络段子夹杂着流行词也应运而生:闲来无事,玩玩手机,打开音遇,盘它!

    2018年初的时候,任谁都想不到,今年社交榜单上最大的黑马,会是一个K歌接龙的鬼玩意儿。

    ——网友评论
    「音遇」,2018最后一匹黑马

    音遇是一款“以歌会友”的软件,主打K歌+社交,并添加了游戏和竞技的属性。实际上,音遇模拟了一个多人参与的KTV场景,并增加了竞技游戏的娱乐性,将“唱歌+交友+竞技游戏”融合在一起。主打多人实时在线匹配,设有多个明星专场,用户可根据自己的音乐喜好进入专场,与其他用户在线完成匹配,并进行竞技接唱玩法。

    014741430462

    音遇主要玩法有两种,一是劲歌抢唱:系统会给出歌词上半段,玩家需要抢到唱歌机会并唱出下半段,接唱成功增加积分;接歌成功会增加积分,但抢到歌曲却唱错会扣除抢歌机会(玩家每局游戏拥有 2 次机会);每局歌曲共 12 首,玩家 6 人,总分最高者会获胜。

    第二种是热歌接唱:唱法与劲歌抢唱相同,但系统会设定由 1 号玩家开始接唱,接唱成功增加积分,剩余玩家按顺序继续接唱;如果选定玩家接唱失败,剩余玩家可以抢唱,抢到且唱对的玩家会获得积分;每局人数与劲歌抢唱模式相同,总分最高者会获胜。

    2018122811

    这两种玩法都给用户带来了耳目一新的感觉,以往同类产品中所没有的“哼唱识别”技术也再次走入人们视野,并大大增加的了玩家体验。

    基于哼唱识别的“社交+游戏”

    音乐+社区的打法,之前的“全民k歌“和“唱吧”也实践过,但是前两者门槛较高,社交互动性跟音遇比差了很多。短时间内,音遇能够爆火的原因,和它的门槛低有一定关系。独特的battle模式使其在同类型产品中比较容易收获较高的用户体验。

    3424_66565_742323

    《巨星》游戏评测截图

    从技术角度来看,基于哼唱识别的“社交+游戏”产品从来不是新鲜事儿。早在 2008 年 12 月,盛大游戏上线了一款名为《巨星》的音乐竞技类游戏。但在模式创新的背后,《巨星》所需的硬件级声音处理用的是使用性能较强的独立声卡,且很多版本的声卡驱动也存在兼容性 bug。诸如此类的糟糕体验还有很多,最终《巨星》在运营三年并交出惨淡成绩单后退出了历史舞台。

    音遇作为一款软AI产品,不仅把当下流行的一些社交要素引入到了K歌软件之中,即时互动也可以让用户产生更多的代入感。同时,业内独有的哼唱定位功能,可以在接唱模式里有效判断,用户唱出的下一句是大致符合原歌曲,还是为了搞活气氛在那说社会语录。和传统哼唱技术搜集用户的清唱数据来构建检索库不同的是,音遇所使用到的哼唱识别技术,支持清唱提取,扩充了检索模板,让哼唱技术的准确率和识别率大幅度提升。而这种识别能力,正是来自讯飞开放平台。

    哼唱检索赋予音乐社交新玩法

    哼唱识别是通过对海量歌曲的人工分析和机器学习,将用户上传的音频指纹特征与库中的样本进行模糊匹配,并由系统判断正确与否。哼唱识别技术当然隐藏在我们「看不见」的地方。但它的厉害之处在于,可以从歌曲任何位置开始识别,并将结果实时返回至APP端。

    pse6pt0htds1ar7l

    但音遇绝不是讯飞哼唱识别技术的首款应用产品。早在2014年8月20日,讯飞在北京举行的“语音点亮生活”发布会上,所发布的灵犀语音助手3.0版本就开始突破性地支持哼唱搜索功能。即用户只需哼出调调就能搜索出歌曲,并能在线试听。而虾米音乐中,同样也使用了讯飞语音识别技术,推出哼唱检索。到了音遇中,更是将这一技能发挥到炉火纯青。用户可以任何哼唱歌曲的一段,从中提取相关特征,利用音乐本身内涵,如节奏、旋律、和弦、伴奏甚至是音色,来搜索想要的歌曲,得到检索结果。

    微信截图_20190114170157

    传统的哼唱技术大多使用MIDI数据或者搜集用户的清唱数据来构建检索库,成本高且效果欠佳。讯飞创新地开发出清唱提取技术,可以从海量的高品质音乐曲库中提取出对应的原唱清唱数据,也就是消除音乐中的伴奏。从而极大的扩充了检索模版,显著降低了检索库构建成本。另外,依靠音乐原曲的清唱信息,开发出了业内独有的哼唱定位功能,可以有效返回用户哼唱片段相对于原曲的起始位置。而且,讯飞还即将推出哼唱引擎 end time 定位功能,敬请期待。

    图片1

    讯飞哼唱定位功能

    同时,结合讯飞独有的多参考检索匹配技术,极大的规避了用户哼唱同一片段时长不一的难题,抗时间扭曲的性能始终处于业界最高水平。另一方面,由于该技术参考了多方面的特征,对于短时录音下的哼唱特征匹配鲁棒性更高,检索效果卓越。

    讯飞刘庆峰曾说过,“基于‘讯飞超脑计划’,科大讯飞开启了一场以语音和语言为入口的‘认知革命’。”超脑计划,计划主要针对智能家居化的三块功能实现——自然交互、智能交互、智能决策。而哼唱识别,正是自然交互的一部分。

    音遇的出现,为互联网音乐产品提供了一个新思路。无论它的异军突起,是要归结到产品路线、平台实力,功劳簿上,总要为有趣的哼唱识别技术记上一笔吧!

    qrcode_for_gh_1985e8ed98e0_430

    扫码识别二维码

    关注AI研究所

    音遇 | 如何收割19亿挑剔的Z世代?你需要向AI借点力

    当默认出生年份是2000年的那一刻,收割Z世代用户的战争就这样明晃晃的打响了。

    故事始于2018年9月20日。

    一款名为音遇的APP正式上线,在冷启动2个月之后便在APPStore排行榜单上表现抢眼,一度超越微信,霸占了社交免费榜第1的位置,并在不久前以超 2 亿美元的估值完成了新一轮融资。

    在互联网寒冬的大环境下,这样的成绩实属难得,音遇也由此被称为2018年最后一匹黑马。

    1

    本文将从3个方面拆解这款面向95后的音乐+游戏+社交APP,是如何一步步优雅地收割到众多Z世代用户,又是如何用冷门的AI能力成功打造Z世代的爆品?

    一、「傲娇」的用户定位:不是所有的韭菜都是割

    如果用两个词来形容音遇APP的用户定位,那就是「精准」和「傲娇」。

    「精准」是对Z世代的目标用户,「傲娇」是对目标用户之外的其他用户。

    明亮饱和的整体色彩,漫画风格的UI设计,让80后觉得有点眩晕的同时也很很多00后觉得Q萌可爱;默认2000年1月1日的出生年份让90后不好意思的同时,也让很多00后眼睛里闪现光芒,唤起心底深处的认同感:看,这是款专门针对00后的APP。

    2

    除了「暖萌系」的UI风格设计,在产品宣传上音遇也是剑走偏锋,选择95后和00后蛰居最多的B站和微博为主要宣传阵地,辅以最右和皮皮虾。视频内容也多以95后喜闻乐见的“沙雕视频”为主要传播内容,致力于成为他们每日份的快乐源泉。

    3

    和Y世代用户天天在朋友圈丧到不行,发着“人间不值得”不同的是,Z世代的用户明显更喜欢每天在朋友圈分享“哈哈哈”来显示人间很值得。

    在只专注于用户数量的APP争夺战里,音遇明显的用户区分略显「傲娇」,但也是这份「傲娇」让其能够在2个月内迅速收割让人眼红的几百万Z世代用户。

     

    二、别致的核心功能:音乐APP里的竞技游戏

    作为一款kill time类产品,很多人都在讨论音遇的本质是什么?

    有人说它是音乐,有人说它是社交,还有人说它是音乐+社交。在我看来,这些都不是,音遇APP的本质是游戏,是一场关于音乐的竞技游戏。

    音遇目前有2块核心功能,劲歌抢唱和热歌接唱,形式分别是6人抢唱12首歌和6人抢唱+接唱12首歌。

    和之前的K歌产品不同的是,音遇极大降低了演唱难度,减少演唱歌词数量,用户只需要唱出2-3句歌词即可;用户演唱歌曲时没有伴奏和旋律,只需要唱对大致旋律和歌词便可过关。

    在音遇里唱歌水平不重要,唱不唱比较重要。

    4

    在减少演唱难度的同时,音遇极大地强调了用户的「参与感」和「欢乐感」,一轮抢唱下来,用户体验到的是抢到麦的开心和激动,记住的是抢不到麦地懊恼,会因为听到了各种车祸演唱而和房间里地其他用户隔着屏幕哈哈大笑,也会拿到血而迫不及待想进行下一轮。

    音遇牺牲了用户在音乐方面的体验,增加了用户在游戏里的感觉。这种核心功能的定位非常符合Z世代用户的心理需求——欢乐感大于需要感,社交感战胜陌生感。

    如果非要用一个词来形容这种产品定位,那大概是别致。

     

    三、被忽略的硬辅助,不可或缺的AI能力

    伴随着Z世代年轻人一起长大的,还有移动互联网和人工智能。

    移动互联网让实际距离相隔千里万里的6个人,进入到同一个游戏场景,抢唱同一首歌,人工智能则负责判断用户所抢唱的歌词和旋律是否大致符合原歌曲,给出“匹配成功”或“匹配失败”而让游戏继续进行下去。

    音遇作为一款软AI产品,其APP中的哼唱识别能力来自讯飞开放平台,可以从歌曲任何位置开始识别,并将结果实时返回至APP端。

    和传统哼唱技术搜集用户的清唱数据来构建检索库不同的是,科大讯飞首次研发出清唱提取技术,扩充了检索模板,让哼唱技术的准确率和识别率大幅度提升。

    同时,业内独有的哼唱定位功能,可以在接唱模式里有效判断,用户唱出的下一句是大致符合原歌曲,还是为了搞活气氛在那说社会语录。

    当然,这些技术都隐藏在我们「看不见」的地方。

    若不是歌曲识别界面中出现有“AI识别中”5个汉字,我们很难在黄色线条抖动的4-5秒钟里,想到这样一款以好玩为主,功能简洁的APP的背后,会是着神秘强大的AI能力。

    5

    而这一点,也正是Z世代产品隐藏的共性:不可或缺的AI能力。这句话通常还有下半句,让用户感知不到或感受不明显。

    就像很少有人去剖析P图软件将照片变成漫画所运用到的AI算法,也很少有人去深究翻译软件里所包含的机器翻译能力。但这并不妨碍人们会把P成漫画风格的照片设置为微信头像,遇到看不懂的旅游标志会拍下来然后点击翻译。

    不去探寻背后的AI能力,但并不代表不会喜爱或依赖AI能力所带来的改变和便捷。

    Z世代年轻人的成长轨迹重合了人工智能第三次浪潮的轨迹,这造就了他们与生俱来的AI感知力,他们比任何一代的年轻人都更习惯更亲近这股强大的力量。

    所以,就算是和10年前《我爱记歌词》这种在Z世代心中略显老旧的娱乐节目高度重合,但因为有了AI能力的嵌入和移动互联网的加持,让Z世代的用户尝到了质朴的欢乐,并成为了他们近几个月的开心源泉。

    随着Z世代年轻人的不断长大,如何有效收割Z世代用户已经被各家提上日程,答案纷繁多样需要我们不断探索,本文也只是拆解了其中几个微小的方向。

    其实,在摸索答案的同时,未来的产品创造者如何将自家产品和AI能力巧妙结合,国内强大的AI能力提供平台(如讯飞开放平台)又会开放出怎样的AI能力赋予产品神奇的魔力,同样值得期待和思索。

    微信图片_20190111102352

     

     

    “A.I. ENABLES”行业沙龙天津站,AI赋能从“聊一聊”启程

    交流思想,碰撞观点,让擦出的火花成为凝聚AI领域奋斗者们的力量!

    英国著名作家萧伯纳曾有一句名言:“如果你有一种思想,我有一种思想,彼此交换,我们每个人就有了两种思想。”

    而在12月13日,讯飞服务市场“A.I. ENABLES”行业沙龙天津站科大讯飞天津智汇谷总经理郭华在开场致辞也说:“大家多聊聊天,喝喝茶,把思想一起碰撞一下。”

    微信图片_20181214152556_副本

    科大讯飞天津智汇谷总经理郭华

    交流思想,碰撞观点,让擦出的火花成为凝聚AI领域奋斗者们的力量,加速AI对行业的优化升级,这正是讯飞服务市场举办“A.I. ENABLES”行业沙龙的意义所在。

    微信图片_20181214143442_副本

    作为沙龙的第一站,本次天津站吸引60余位行业专家和大咖参加大家一起分享技术、经验,沟通合作,现场气氛十分热烈

    微信图片_20181214160540_副本

    天津市虚拟现实和增强现实技术应用协会会长郭一阳现场致辞发言

    微信图片_20181214135627_副本

    交流答疑

    微信图片_20181214155042_副本

    现场自由交流

    服务市场说

    让AI在各行各业“有所作为”

    讯飞服务市场自今年6月份发布以来,始终致力于整合AI上下游产业链,为AI服务商桥接商机,为企业客户匹配需求,我们希望构建AI生态产业圈,实现AI新市场,赋能全行业的平台愿景。

    讯飞服务市场的诞生,并非一蹴而就。

    在其强大的自有资源和市场整合能力背后,是科大讯飞AI技术的不断发展。讯飞服务市场技术总监潘锗《讯飞A.I.助力产业升级》的主题分享中,从AI发展历程出发,与大家分享了讯飞的技术进展,以及代表性的平台和活动,如为开发者提供AI能力的讯飞开放平台、人工智能学习与交流的园地AI大学、1024开发者节等等。

    微信图片_20181214152414_副本

    讯飞服务市场技术总监潘锗

    如今,时代对AI的关注已经从“AI能做到吗”转为了“AI怎么做”。

    “AI时代已经到来,人工智能正在进入各行各业。”讯飞服务市场总监董畅通过《AI新市场 赋能全行业》,向大家分享了讯飞AI+行业的应用案例,如海底捞的订餐机器人、口腔门诊的电子病历系统以及教育领域的机器阅卷等。

    微信图片_20181214174433_副本

    讯飞服务市场总监董畅

    AI+行业的市场不断增长,只提供技术是远远不能覆盖完全的。需要一个专业的服务交易平台,将AI服务商与企业客户聚集到一起。这个平台就是讯飞服务市场。董畅为大家介绍了它的优势——

    对AI服务商

    服务市场覆盖上百个行业,每月为入驻的服务商带来海量商机。并提供优惠甚至免费的高阶服务如核心AI技术,以及品牌渠道支持、精准融资对接服务。

    对企业客户

    服务市场满足基础服务、行业方案、智能家居、技术服务、智能制造、营销推广6大类需求,基于服务标签库对企业客户的需求进行智能匹配。同时通过甄选优质商家、全程交易担保、服务实时监控为客户提供充分的保障。

    “开放平等,合作共赢。我们坚持‘开放、包容、合作、共赢’,赋能万物,赋能未来,构建AI生态。”董畅说。

    嘉宾们说

    让AI等前沿技术赋能前人未至之地

    “2016年是VR的元年,而这次的沙龙将是一个新的纪元的开始,因为AI和VR、AR的联合,不仅是已知场景,还将在开辟出的更多新场景中赋能。”

    天津尚游天科技有限公司创始人张翔《AR/VR赋能动漫新体验》的分享中,从标准化、人才培养、行业应用及自主IP四个方面分析虚拟现实如何为传统动漫产业转型升级和再发展提供突破口。

    张翔还提到了VR在教育方向的应用,他指出目前VR所涵盖的领域,教育和游戏的比重是4:6,VR为教育赋能的潜力仍然值得继续挖掘。

    微信图片_20181214185951_副本

    天津尚游天科技有限公司创始人张翔

    “虚拟形象的影响力甚至可能高于我们平时在现实生活当中的形象,对于非现实性的网络它也不存在现实当中的很多束缚,甚至超越了人种,超越了性别,超越了物种。”

    北京触梦文化CEO张昊阳《虚拟形象新革命》中,解读曾经是较活跃的二次元亚文化现象“虚拟偶像”,为何在如今被赋予了越来越多的商业价值和玩法。他从受众的人格心理,虚拟形象的人设等角度分析虚拟形象火热的原因。同时介绍AI、VR、AR等技术如何让虚拟形象更深入人心。

    张昊阳与大家分享了目前动漫领域的流行词“文艺复兴”,即老IP在旧瓶装新酒后重新炒热的现象。“我们可以运用AI技术,前沿的图形学,AR、VR以及互联网技术去弘扬传统文化的价值。”他说。

    微信图片_20181214185955_副本

    北京触梦文化CEO张昊阳

    “现在,我们正处在短视频的黄金时代,但视频内容生产力远远未被释放。”

    杭州慧川智能创始人&CEO康洪文在沙龙上提出,通过AI,可以大幅提高视频制作的效率。在《AI 技术让视频更简单》中,他介绍了在短视频时代的AI视频制作平台中,通过智能化云操作系统,可以快速整合上下游资源,提高视频生产效率。

    微信图片_20181214193100_副本

    杭州慧川智能创始人&CEO康洪文

    当AI加入视频制作后,很多工作如字幕、剪辑都可以自动完成,真人可以将更多的精力集中在创作领域,重复的工作交给机器完成。

    本次讯飞服务市场线下沙龙天津站,AI领域的行业精英们齐聚一堂,进行观点碰撞,共同探讨AI+的落地场景,服务市场也将联合天津双创整合产业链上下游资源,匹配需求,桥接商机,挖掘更多价值。未来我们的沙龙还将走进更多城市,敬请期待我们的下一站。想了解更多,或有任何与服务市场有关的疑问,欢迎通过以下官方渠道与讯飞AI服务市场团队交流,我们期待你的声音!

    联系电话    4000-199-199

    邮箱交流    aifuwus@iflytek.com

    QQ交流    讯飞服务市场交流群(778105911)

    微信图片_20181214193722

    让计算机「看懂」世界,从这6个知识点开始!

    对于人类而言,最重要的两种感官应该就是视觉和听觉了。而在人工智能的发展中,如何让机器“看懂”和“听懂”信息,也一直是研究人员们的重点工作方向。

    在上一期的文章中,班主任主要带大家回顾了计算机“听觉”方面的智能语音技术知识点,大家有好好消化吸收吗?这一期,我就来为同学们讲述一下计算机视觉方面的重点知识。

    1
    5大常规任务

    计算机视觉是研究如何让机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉。

    计算机视觉中有5项常见任务,分别是图像分割、物体检测、物体识别、图像描述、语义推理

    图像分割是将图像分解成若干特定、具有独特性质的目标区域。例如用户输入左边这张照片,机器会对其做一些场景语义分割,将照片中的人和摩托车区分开来。

    timg (69)

    物体检测是发现目标并确定其位置。其最常见的任务有三类:这张图片中是否有XX?XX的数量是多少?XX的位置在哪里?

    物体识别是在物体检测的基础上,不仅找到物体在哪里,还能确认它是什么。物体识别通常由两类常规任务构成:第一类任务是相似检索问题,比如搜索引擎中的相同或相似图像的搜索功能;第二类任务是相似比对问题。

    图像描述即“看图说话”,由机器来描述照片中的内容。

    语义推理是五项任务中最难的一项,即挖掘图像或视频内容背后更深远的故事。以上图为例,机器根据“鞋子里的小猫”这张图像进行背后故事挖掘,猜想小猫是因为好奇所以钻进鞋子玩耍。

    2
    计算机视觉的应用领域

    计算机视觉在现实中的应用非常广泛。可以说,机器不仅能帮助人完成许多需要“看”的工作,还能“看见”更多人眼无法辨别的东西。例如以下几种应用:

    指纹及其它生物特征识别

    通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征来进行个人身份鉴定的技术。比如科幻片中经常看到的指纹和虹膜识别,就都是运用了计算机视觉技术。

    timg (74)

    人脸检测识别在往期的AI大学课程中,班主任有跟大家讲解过人脸识别的详细知识点哦视频监控和安防分析

    如住宅区分布的智能视频监控系统、银行安防系统等,能够有效地监控、分析现场情况。

     

    医学生物图像检测分析

    X线图像、多排螺旋CT等可获取人体内部的二维、三维医学图像,大大提高了诊断准确性和效率。

    除了以上四类应用,计算机视觉在拍照翻译和图像搜索方面也被广泛使用。例如讯飞翻译2.0就可以通过拍照来识别出文字,同时实现翻译。

    撒啊

    还有文档分析识别、VR虚拟现实、辅助驾驶领域等等,都是计算机视觉领域的热点。

    近两年有大量的资本涌入计算机识别领域,比如商汤科技已经融资33亿,旷视科技也融了31亿。在今年的4月份,商汤科技就宣布完成了6亿美元的C轮的融资,再次创下了人工智能单轮融资的记录。

    济公活佛

     

    由此可见,计算机视觉技术应用的发展前景是十分可观的。

    3
    计算机视觉技术的难点与挑战
    尽管能力强大且应用广泛,计算机视觉技术仍然有许多难点尚未找到合适的解决方法,因此可以说是机遇与挑战并存。计算机视觉技术的第一大难点是多变和非均匀的光照场景,例如一些逆光的场景。第二个是成像质量差异比如说不同清晰度的相机拍出来的照片质量不同。第三个是复杂易混淆的背景,比如说雪地里的一只白猫。第四点是不同场景存在干扰和遮挡timg (79)此外还有一些难点,包括失焦透视变形等等。

    4
    卷积神经网络处理图像的过程

    图像识别最常用的就是卷积神经网络,而卷积神经网络主要是模拟人的视觉神经系统提出来的。

    以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。

    6403

     

    卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

    卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核,一个卷积核覆盖的原始图像的范围叫做感受野(权值共享)。

    一次卷积运算(哪怕是多个卷积核)提取的特征往往是局部的,难以提取出比较全局的特征,因此需要在一层卷积基础上继续做卷积计算,这就是多层卷积。

    6401

     

    在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。

    通过这种池化的操作,能够一定程度上克服图像的一些旋转和局部的细微变化,从而使得特征的表达更加稳定。

    5
    人脸识别

    人脸识别技术是计算机视觉的一个典型应用,接下来我们就来讲解一下人脸识别中的相关知识点。

    人脸识别的分类

    人脸识别大体上分为静态人脸识别动态人脸识别,它们的难度是不同的。静态的人脸识别,人是非常配合的,难度小很多,比如身份证的录入、银行办理业务时的人脸验证。

    timg (80)

     

    而动态的人脸识别会由于人脸距离摄像头的距离等因素,配合度较低,需要准确捕捉到运动的人脸,难度就比较大了。

    人脸识别技术

    人脸识别技术中有两项常见任务:判断图像或视频中出现的人是不是同一人,即人脸认证;判断这个人到底是谁,即人脸检索。人脸认证和人脸检索的核心均为人脸相似度的判决。

    机器在判断两张图片中人脸的相似度时一般有以下4步:人脸检测—预处理—特征提取—特征对比。通过这些步骤不难看出,人脸识别技术是模仿人类识别人脸的过程,用计算机比较人脸图像的相似性。

    timg (70)

    看到这里可能有些同学要问:既然是比较相似性,那我们该如何评价人脸识别的效果呢?

    说到人脸识别的效果,就不得不提到人脸识别的公开测试集。目前在国际上比较有名的人脸识别公开测试集一个是LFW公开集,此公开集中6000个图像对,最高准确率已经达到99.83%,超过了人眼的水平;另一个公开集是华盛顿大学发布的MegaFace公开集。

    为人父为人few

    如果从公开测试集的效果来看人脸识别技术已经逐步接近甚至是超过人眼的水平。

    人脸识别效果的影响因素

    虽然在公开集中人脸识别取得了很高的准确率,甚至在某些特定情况的准确率已经超过了人眼识别,但在实际应用过程中会存在很多影响因素,一类是外因,一类是内因。

    外因的影响因素主要有光线影响,比如说极端的光线或者人脸光照分布不均等,除了光线以外摄像头分辨率也是一个很大的影响因素,拍摄角度不好或者离拍摄人物很远的时候,会导致机器识别不出人脸。

    内因则包括人脸部的遮挡——墨镜、刘海、口罩等;还有些拍照角度以及脸部纹理变化也会影响人脸识别的效果。

    6
    图文识别

    图文识别是计算机视觉的另一个典型应用。

    图文识别的分类

    图文识别的基本概念就是根据已有的文字把它识别出来。它主要有两个分类,第一个是OCR光学字符识别,即对已有的文字把它把它识别出来;另外一个就是在线手写识别,像大家熟悉的讯飞输入法里的手写输入,相比于OCR识别来说,手写识别包含了更多的笔划信息。

     

    timg (72)

    手写识别的演进过程

    以讯飞的图文识别技术为例,大概经过了这4个演讲过程:

    手写输入法

    输入法中运用的单个字的识别技术。

    手写图文

    对于手写的中英文字、词、句子的识别。

    行业文档识别

    例如发票以及快递号的识别。

    通用文字识别

    这是现在我们要做的,就是随机拍个照片,就能对里面的文字进行识别了。

    图文识别现在广泛运用于试卷评阅中。我们先让机器把手写的文字识别成机器能够看懂的格式,然后下面就可以做作文的评阅等相关工作了,现在,数学公式也能读出来了。最终,我们想要达到的目标是“Read anything”

    100年后AI统治下的世界,最珍贵的圣诞礼物原来是TA

    你有准备过一个有创意的圣诞节吗?

    灵魂拷问:还有两周就到圣诞节啦!大家都准备怎么过圣诞呢?

    缀满装饰的圣诞树放在壁炉的旁边,下面摆满了包装精美的礼物,红色的袜子挂在壁炉旁,一家人欢声笑语拆礼物。一说到圣诞节,脑海里一定浮现出这样的画面。是的,还有两周的时间就到圣诞节了,你有想好怎么过了吗?为了不显得太过俗套,不如让AI策划一个圣诞旅行,过一个黑科技满满的圣诞节。

    AI研究所淘出了3个有意思的视频,看能不能给你天才的大脑一些启发,为你的圣诞增添一丝趣味,然后一起开心过圣诞!

    你们家的机器人会送快递
    这个AI会送圣诞礼物

    机器人公司波士顿动力(Boston Dynamics)在视频网站YouTube上发布了一个视频。在视频里,波士顿动力公司生产的三台Spot机械狗被装扮成了圣诞老人的驯鹿,拉着装饰成雪橇的轮椅。而在轮椅上,一个圣诞老人打扮的妹子在向观众问候节日快乐。

    你会唱歌的机器人你见过
    这个AI能根据一张图谱曲

    最后,会唱歌的机器人你可能见过,但你见过能根据一张图片,就能创作一首圣诞歌曲的人工智能吗?

    加拿大多伦多大学的研究人员开发出了一种人工智能系统,能自动谱写新的圣诞节歌曲。这一人工智能系统被称作“神经卡拉OK”,可根据节日的数码照片生成歌曲。软件能自行谱写简单的旋律,并在屏幕上配以歌词。

    如果有一天AI统治了世界
    那Ta们也要过圣诞!

    这是一支来自德国超商 EDEKA 的圣诞节广告,全片采用 CG 技术讲述了在遥远的未来,地球已被机器人所占领,而这些机器人们都不过圣诞节。

    某天,其中一个机器人被路边墙上张贴的旧圣诞海报所吸引,强烈的好奇心促使它去偷偷了解当年的人类是如何欢度圣诞的。

    可是当它把服装模特还有各种礼物摆在餐桌前想重现圣诞节氛围时,它发现并不是那么有趣,那么令人高兴。

    正当它沮丧万分的时候,再次翻看了那条有关人类逃离城市的新闻,于是它决定按图索骥去寻找真正的人类。

    微信截图_20181214112138

    经过一番跋山涉水,小机器人终于在森林中的一所小木屋找到了人类,并受邀一起参加他们的圣诞晚会。

    当人类小女孩把爱心贴在它胸前的时候,很明显能察觉到它感受到了人类的爱。

    短片最后也点明了主题:“没有爱,圣诞节就只是一个机器人的盛宴”,强调了爱在节日期间的重要性。

    微信截图_20181214112228

    在广告创意方面一向锐意创新的 EDEKA ,这次的圣诞广告也充分发挥了优势,将一直所倡导的品牌理念——“爱与陪伴”又一次转换了一个新的角度,告诉我们即使是在有可能被人工智能占领的未来,爱都是永恒不灭的主题。

    所以,无论吃饭、看电影、送苹果,只要有爱,就足够了。你有准备过一个有创意的圣诞节吗?快来留言分享属于你的圣诞节的打开方式吧!

    为媒体人减负!更懂你的语音转写能力上线

    在语音转写产品下,讯飞开放平台对语音转写能力进行了优化, 升级为4.0版本。新版本不仅提供更好的性能支持,同时上线了个性化热词功能。

    最近,媒体人的工作真是忙到飞起。

    纵观国内外,近来的这几个月真可谓是多事之秋。互联网、医疗、文学、影视等各个行业都接连有重大新闻爆出,成为人们的茶余饭后的话题。

    对普通人来说是八卦谈资,对新闻媒体人来说可就是实打实的工作了。

    人工智能?人工智障?

    “无论是什么行业的热点,我们都要第一时间出街采访。“

    小编的记者朋友小D负责一档针对时下热点的街头采访节目,对他来说,今年是格外忙碌的一年。

    ”比如有IT新闻,我们就去高新产业园采访,娱乐新闻我们就去大学采访。所以几乎每天都在接触到不同行业的术语。”
    64011

     

    主题多样的街头采访类节目

    小D多次都跟我抱怨,说最头疼的部分就是后期制作,因为被访者的术语和口头语太多,原本靠转写软件可以轻松完成的文稿整理和字幕制作工作,现在变得困难重重。

    例如早前iphone XR发布时进行的街头采访,有这样的语音素材——

     音频内容是: XR的屏占比确实变高了,但是这个黑边也太夸张了,作为一个颜控,我还是继续用我的8吧。

     转写结果是:  差而凭站笔确实变高了,但是这个黑边也太夸张了,作为一个严控我还是继续用我的巴巴。

    小D说,有些时候修改字幕比直接人工输入还麻烦,真不知是人工智能还是人工智障了。

    个性化热词——让机器更懂你

    小D的经历并非个案,语料的丰富度是影响语音识别技术的重要因素。前期提交的语料越多、越全,语音识别的效果也就越好。

    宏观上看,人们说话的规则具有统一性,但同时也具有一定程度的变化性。例如行业的专业用语,一些口头禅、自行创造的暗语、某些特定事件带来的等等。一个人的遣词造句深受他“个性”的影响,因此产生的语音也带有“个性”标签。

    这种情况下,单纯使用通用化模型来识别风格各异发语音,显然是不够科学的。唯有做到“去陌生化”,进一步理解特定用户的语言习惯,才能得到更高效精准的结果。

    因此,在语音转写产品下,讯飞开放平台对语音转写能力进行了优化, 升级为4.0版本。新版本不仅提供更好的性能支持,同时上线了个性化热词功能。

     使用方法:

    用户将一些在转写中会出现的专用词汇上传至识别引擎,形成自己的个性化词库。后期在待转写音频中出现该词汇时,即可将其识别出来。
    640

     

    添加热词操作示例

     原理:

    运用声学激励语言激励两种方式,提高个性化热词的识别度。

    以词语“开放平台”为例,语言激励会在热词形成时对“开放平台”一词直接加分,提高识别出这个词的概率。

    声学激励的方法会将kai-fang-ping-tai泛化成kai-fan-ping-tai,kai-fang-pin-tai等,音频中出现类似发音时就会对待选词中的“开放平台”加分。

    如虎添翼

    除了新增个性化热词能力,本次更新的语音转写4.0版本还支持Web API调用形式,为开发者们提供了更多的便利与可能性。有了这些新功能的加入,语言转写能力可谓是如虎添翼。

    开放平台语音转写能力最初于2017年7月上线,能力基于科大讯飞独立研究的深度全序列卷积神经网络语音识别框架(DFCNN)建立声学模型和语言模型,将音频数据转换成文本数据,使信息传递更为高效,也为后续的数据检索和数据挖掘提供基础。

    更尖端的核心技术

    采用的DFCNN技术能更好地表达语音的长时相关性,比目前业界最好的语音识别框架——双向递归神经网络性能更优,遥遥领先于同类竞品。

    更可靠的硬件支持
    讯飞开放平台在多地进行了机房部署,服务器集群每天可承载30亿的语音交互量。每个IDC机房采用BGP或三网接入,保障接入速率。核心硬件方面采用内存双通道策略,GPU+CPU复合运算组合,提高引擎速度。

    更智能的转写能力
    运用超大规模的语言模型预测语境,提供中文智能断句和标点预测,并能将结果中的数字、日期、时间等格式化为规整的文本,最大程度地减少人工修改。

    更安全的用户数据
    转写系统接入讯飞开放平台统一账户体系,采用公钥与私钥结合的认证方式保证账户安全。接口统一采用https加密方式进行数据传输,用户上传的语音文件待转写完成后会彻底删除,不留痕迹。

    希望在不断的改进和完善中,开放平台能为大家提供更好的技术和服务,从而更好地落地到实际场景,为各行各业创造更高效的解决方案。

    现在就来讯飞开放平台体验吧!【点击体验最新的语音转写4.0版本】

    关注我们6407
     

    DNN、RNN、CNN.…..一文带你读懂这些绕晕人的名词

    在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。
    这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。

    「撞脸」一直都是娱乐圈一大笑梗。

    要是买火车票的时候碰上孙楠、杨臣刚、王大冶……脸盲症患者可以直接放弃回家,原地暴哭了。

    640

     

    当然,「撞脸」可不是娱乐圈的特有的,在AI界也有一些“长相相似”专业名词,让初学者傻傻分不清,比如我们今晚要科普的「相似三连」DNN、RNN、CNN。

    这3个名词其实是第三代神经网络里运用非常多3大算法:DNN(深度神经网络)、RNN(递归神经网络)、CNN(卷积神经网络)。
    6401

     

    1、三代神经网络的发展

    在正式开讲这3者的区别之前,我们先简单做个回顾,第一代和第二代神经网络到底是什么?

    第一代神经网络又称为感知器,在1950年左右被提出来,它的算法只有两层,输入层输出层,主要是线性结构。它不能解决线性不可分的问题,对稍微复杂一些的函数都无能为力,如异或操作。

    为了解决第一代神经网络的缺陷,在1980年左右Rumelhart、Williams等人提出第二代神经网络多层感知器(MLP)。和第一代神经网络相比,第二代在输入层之间有多个隐含层的感知机,可以引入一些非线性的结构,解决了之前无法模拟异或逻辑的缺陷。

    第二代神经网络让科学家们发现神经网络的层数直接决定了它对现实的表达能力,但是随着层数的增加,优化函数愈发容易出现局部最优解的现象,由于存在梯度消失的问题,深层网络往往难以训练,效果还不如浅层网络。

    2006年Hinton采取无监督预训练(Pre-Training)的方法解决了梯度消失的问题,使得深度神经网络变得可训练,将隐含层发展到7层,神经网络真正意义上有了“深度”,由此揭开了深度学习的浪潮,第三代神经网络开始正式兴起。
    6402

     

    2、深度神经网络最常用的三大算法

    说完了三代神经网络的大概发展,我们现在来看下第三代神经网络中经常让大家叫苦的3大名词:DNN、RNN、CNN。

    DNN:深度神经网络

    从结构上来说,DNN和传统意义上的NN(神经网络)并无太大区别,最大的不同是层数增多了,并解决了模型可训练的问题。

    简言之,DNN比NN多了一些隐层,但这些隐层的作用是巨大的,带来的效果是非常显著和神奇的。
    6403

     

    当然第三代神经网络能够带来神奇的效果,并不仅仅是因为它的模型结构和训练方法更为优化、算法更加先进,最重要的是随着移动互联网的普及海量数据的产生和机器计算能力的增强。

    DNN中的“deep”意为深度,但深度学习中深度没有固定的定义或者衡量标准,不同问题的解决所需要的隐含层数自然也是不相同的,就大家比较熟识的语音识别来说,解决问题可能4层就够了,但一般图像识别需要达到20多层才能够解决问题。

    DNN最大的问题是只能看到预先设定的长度的数据,对于语音和语言等前后相关的时序信号的表达能力还是有限的,基于此提出了RNN模型,即递归神经网络。

    RNN:递归神经网络

    全连接的DNN存在着一个无法解决的问题:无法对时间序列上的变化进行建模。

    为了应对这种需求,业内提出了上文中提到的递归神经网络RNN。

    在普通的全连接网络中,DNN的隐层只能够接受到当前时刻上一层的输入,而在RNN中,神经元的输出可以在下一时间段直接作用到本身。换句话说,就是递归神经网络它的隐层不但可以接收到上一层的输入,也可以得到上一时刻当前隐层的输入。

    这一个变化的重要意义就在于使得神经网络具备了历史记忆的功能,原则上它可以看到无穷长的历史信息,这非常适合于像语音语言这种具有长时相关性的任务。
    6402

     

    CNN:卷积神经网络

    卷积神经网络主要是模拟人的视觉神经系统提出来的。

    以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。
    6403

     

    卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层和全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

    卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核,一个卷积核覆盖的原始图像的范围叫做感受野(权值共享)。

    一次卷积运算(哪怕是多个卷积核)提取的特征往往是局部的,难以提取出比较全局的特征,因此需要在一层卷积基础上继续做卷积计算,这就是多层卷积。
    6401

     

    在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。

    通过这种池化的操作,能够一定程度上克服图像的一些旋转和局部的细微变化,从而使得特征的表达更加稳定。
    好啦,今晚对DNN、CNN和RNN的简单科普到这里就结束了,关于每种网络的用法大家还需要在实际建模中努力探索。

    当然不论是哪种算法,它们往往都会混合在一起使用以达到效果的最优化,同学们要做的便是掌握好理论知识,在实践中找到最灵活的组合方式。

    同时「AI大学移动端」已经上线了科大讯飞AI研究院王海坤院长的人工智能系列课程,小伙伴们记得戳菜单栏【AI大学】或点击阅读原文,去学习更多AI知识!
    640

     

    AI研究院副院长  王海坤博士

    w640

     

    5G网络第一条微博已发出!即将驱动AI进入新时代

    人工智能不可怕,可怕的是出现“人工智能克隆人”

    昨天晚间,小米联合创始人、小米总裁林斌在5G网络下发了一条微博:这可能是第一条5G网络下的微博吧

    微信截图_20181123164401

    我们由此得到的信息是:1、目前已经有测试环境下的5G网络;2、小米已经有了自己的5G终端。但最主要的是:5G时代终于来了!

    在4G网络下刷着抖音、吃着鸡的我们,终于等来即将到来的精彩5G时代,相信昨天这条微博,让无数人内心充满了期待。

    5G作为第五代移动通信网络,被认为将是彻底改变人与万物交互方式的技术浪潮。在对5G网络技术及发展趋势的相关报道中,朵妹和小智,特意挑选了几个最具代表性问题为大家集中解答,希望能帮助提前感受5G时代的厉害。

    小智

    5G网络只是速度快这么简单?

    朵妹

    当然不止,除了提升网速,5G带来的是更快的速率,更低的功耗,更短的延迟,更强的稳定性,能支持更多用户。不仅仅是网速的变化,更多的是生活方式的颠覆。

    任何一次移动通讯网络的换代升级都将带来网速的大幅提升,3G至4G如此,5G自然也不例外。5G网络延迟将从115毫秒降至5毫秒以内,这意味着不仅可以大幅度提升对战类手机游戏体验,更可在广阔的商业领域发挥威力。比如医生在远程通过5G网络连接机械臂和监控画面来进行手术,5G网络将为各个行业带来新机遇。

    ChMkJltZSu6IH9h2AADD2nQAZ-AAAqCRQCF8OYAAMPy197

    5G毫米波频段拥有高带宽和高速率的优势,因此可以容纳更多的人同时在线。比如在大型展会和赛事活动现场,我们再也无需面对人多挤占网速的尴尬。因毫米波波长较短,因此所需天线也更为小巧,更为灵活的小基站也更便于运营商部署,因此在实现高速大容量的5G网络同时,也可提升网络质量。

    小智

    5G时代手机将会变成什么样?

    朵妹

    我们的“智能手机”或将在5G时代升级成为“智联手机”。

    5G网络作为第五代移动通信网络,最直接的受益者恐怕就要数我们手里的手机了。由于5G网络具备速度快和延迟低这两大技术特性,并且对万物互联提供了底层技术支持。因此可以预见的是,当今我们手中的“智能手机”或将在5G时代升级成为“智联手机”。

    所谓“智联手机”,首先需要强调的变化是“智”。2019年后无疑将成为手机人工智能的爆发年。人工智能的核心是将机器赋予人类的“智慧”,我们的手机或许会变成“人”。“Ta”可以是你的助手、伙伴,甚至朋友。“他”会帮你安排生活中的一切,就好像《钢铁侠》中Tony的管家Jarvis。

    timg

    手机管家仅具备自身的聪慧远远不够,5G网络将赋予人工智能手机万物互联的能力,也就是“智联手机”中“联”字的诠释。作为最适合随身的智能终端,手机将成为我们与万物连接的中心。手机可以和智能家居、智能城市、无人机、车联网、机器人等互联。如果“智”的变化将你的手机变成“人”,那么“联”将赋予“他”更更广阔的应用。

    小智

    5G会给人工智能领域带来哪些改变?

    朵妹

    5G网络的落地应用将会开启一个全新的智能时代。

    5G时代,人工智能技术的发展将会呈现两大趋势,云端和边缘。基于云端的超强算力、庞大数据,以及深度学习能力可以打造一个近乎完美的“全能贴身管家”,透过5G网络您可以让“他”帮你看病拿药、决策理财、挑选产品,甚至控制你家里的智能机器人帮你洗衣做饭打扫卫生。

    而人工智能边缘计算,则是在靠近用户侧的边缘终端实现本地人工智能,和云端形成互补。未来更智能的手机可以根据你的习惯实现自动调节,懂你所需。基于5G+AI的手机应用将迎来广阔的发展空间,如更聪明的虚拟助手、更强交互的AI游戏、基于AR和AI技术的智能识别等创新应用。

    试想一下,我们下班后可以通过手机呼叫自动驾驶汽车在楼下等你,车上已经为你准备好合适的温度和你喜欢的音乐。路途中,我们通过手机连接VR沉浸体验一部短剧或者跟你的虚手机虚拟助手聊天打趣。到家后,汽车通过5G网络自动寻找停车位并进行无线充电,完全不再需要为抢车位而烦恼。而这一切,都是你的手机管家“Jarvis”帮你搞定。

    从“智能手机”到“智联手机”的变化,或将给我们的工作和生活带来翻天覆地的变化,并将成为催生手机全新应用形态的最大推动力。

    5G网络和人工智能技术的出现会将那些重复且繁重的工作解决掉,从而释放你的精力去进行创造,同时也会让你拥有更多的时间享受生活。

    小智

    5G网络能否再次改变这世界?

    朵妹

    一定能!我坚信,毕竟,我们都改变这么多次了……

    5G网络的意义是什么?或许,它就像是一条纽带,将所有未来的科技趋势连接在一起。5G+人工智能、5G+大数据、5G+云服务、5G+物联网、5G+智能家居、5G+远程医疗、5G+VR和AR新兴显示技术、5G+车联网、5G+智慧办公,几乎我们目光所能及的一切都将从5G网络身上获益,从而形成星火燎原般的彻底改变这个世界。

    ChMkJltZR6yIArlvAARP8KF94-EAAqCKAAwK-cABFAI688

    5G网络无疑将再次改变这个世界。无论是网联汽车、智慧家居和智慧城市、工业物联网、终端侧人工智能,还是网络基础设施或智能移动终端,都在热烈呼唤着5G万物智能互联时代的到来。

    在看过5G网络将带来众多新变化之后,或许你已经迫不及待的想要进入那么梦幻般的5G时代了。万物智能互联时代,无疑将给我们带来翻天覆地的变化。5G网络将成为连接世间万物的纽带,彻底改变整个世界沟通和运行的方式。而我们每个人,都将从5G网络中获益。

    当你还在使用2G或3G手机的时候,你会想到如今的4G时代会如此精彩吗?如果没有4G,你几乎不可能在地铁里刷着抖音,也不可能随时随地就能吃一把“鸡”。如今,5G网络箭在弦上,一场前所未有的革命或将爆发,你,准备好了吗?

    关注聋哑人,从“手”开始!

    你能想象一副手套就能让聋哑人“听到”声音并开口“说话”吗?

    发表于2018-11-21 18:47| 来源CSDN| 作者CSDN

    你能想象一副手套就能让聋哑人听到声音并开口说话吗?这事儿听起来很神奇,却被来自福州大学的一群在校生实现啦,而且还在科大讯飞AI开发者大赛的决赛现场技压群雄,勇夺冠军。


    据了解,这支颇具创新意识的冠军学生团队主要由三名研究生以及多名本科生组成,十几个人通过近半年时间,研发了一款具有社交功能的手套,主要通过手语识别、语音识别、语音合成等多项技术来破除听障人士的沟通障碍。

    据了解,“E-chat”聋哑人社交手套外形与普通手套无异,但上面却是机关密布。聋哑人只要佩戴手套后,通过采集相应的手势信息就可将手语表达翻译为语音信息;相反,正常人的语音通过识别之后,又将转化为聋哑人熟悉的手语,并显示在手机屏幕上,双向翻译形成语音和手语之间的沟通闭环,这就有点儿像风靡一时的语音翻译工具。

    谈及这款颇具人文情怀的发明,Forever Young团队的初创成员之一林鹏程表示,最初研发的灵感主要来自一场学校组织的手语比赛。当时我们都不懂手语,就想着先做个翻译器,后来觉得如果有一项技术可以将眼前的手语转化成声音,那不是更加方便了?而且对听障朋友会特别有意义!

    此外团队成员在本科阶段也确实接触并研发过这种性质的数据手套,又同时捕捉到MEMS传感器在最近几年内迅速发展的态势,所以从最初只是想通过这次实践深入学习一些有关传感器的技术点,结果却演变成通过见证聋哑人的生活并在学校图书馆进行学生手语调查等一系列切身实践后,深刻体会到这项发明的巨大潜力,也就随着时间推移不断完善,并加以推广了。


    据了解,就在去年12月,Forever Young团队凭借“Echat”聋哑人社交手套报名参加了与开发者相关的创新赛事,经过4个多月的比拼,从1700多支参赛队伍中脱颖而出,最终勇夺最佳创新项目特等奖。

    关于参加这次科大讯飞主办的AI开发者大赛,团队成员表示,之前本身就使用过科大讯飞的产品并对其深入了解过,如今看到这样一个现场学习的好机会,就抱着试一试的想法来了。没想到会有这么大的惊喜,而且能够为不懂手语的朋友与听障人士更便捷准确的交流带来助力,很有成就感。

    深入探讨这款酷产品,我们发现,从技术方面,Forever Young团队通过参加各类比赛切磋,带来了技术层面一次又一次的成功、精准的迭代,而且手语算法作为团队的核心竞争力,目前已经申请了国家级专利。历经发展,就在今年4月,团队首次尝试使用智能手机作为平台,并对算法进行提升,经过不断努力手套如今已能识别近300个词汇和短句。

    尽管这项创新应用已经获得了很多关注以及鼓励,但研发过程所中所面对的困难还是让人长舒一口气。

    硬件方面,我们希望产品完工后足够轻便,所以换了好几十版电路以及许多元器件的封装,最终为了可以更好集成在一块小电路板上。具体来说,我们开始使用的是0805的封装,后来又改用了0603,这样前前后后换了十几版电路,遗憾的是至今还没有达到我们理想中的大小,仍旧需要不断尝试。团队成员说。

    除了硬件层面,软件方其实也遇到了一些小问题。Forever Young团队的初创成员之一林鹏程总结道,其实开始从底层的驱动设计入手,就出现了很多bug,经过调试之后才有相对安全的范围以及稳定结果;另外对手势识别的设计方面,挑战是最大的:从最开始的机器学习过渡到深度学习方式,这是一个不断改进的过程,虽然目前已经达到了89%的识别率,但未来进步的空间还很大;此外对手套各项功能的提升,一直面临着不小的资金瓶颈,如果想要实现手套完全脱离手机这种智能化程度,未来还需要找到伯乐一枚共同完善设计。

    不过可喜的一点,通过参加比赛,团队成员纷纷从科大讯飞的语音技术上收获启发,将作品中加入讯飞的语音技术后收效明显,未来还将在识别能力以及硬件的外观方面完成更进一步的改进,更好发挥AIUI的能力,通过关键词语义理解技术来弥补词汇量的不足,实践更自然的表达。

    谈到对未来智慧时代的畅想,林鹏程觉得,在未来的发展中,即使AI不能完全替代人类枯燥乏味的工作,也至少可以帮助人类减少这类工作的重复执行,提高效率并解放双手根本不在话下;人们最起码的居家生活会不间断涌入AI 产品以及应用,就像如今风靡的智能音箱一样,丰富知识并拓宽信息获取的渠道将变得异常简单,在此背景下,来源于生活并助力生活便捷的手套只是一个开始。

    初学者不可错过的分布式机器学习4大知识点 | AI知识科普

    分布式机器学习成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

    随着“大数据”概念而兴起的分布式机器学习,在人工智能的新时代里解决了大量最具挑战性的问题。

    近几年,机器学习在很多领域取得了空前的成功,也因此彻底改变了人工智能的发展方向。大数据时代的到来一方面促进了机器学习的长足发展,另一方面也给机器学习带来了前所未有的新挑战。

    在这些发展与挑战中,分布式机器学习应运而生并成功解决了大量具有挑战性的关键问题,今天晚上班主任就来和同学们聊一聊分布式机器学习起源、流程、算法以及目前流行的分布式机器学习平台。

    1、起源:大数据和大模型带来的挑战

    在开始聊起源之前,我们先来看张图:
    1

     

    这张图是展示了ImageNet近几年的错误率,2011年的时候错误率还将近有25%,这样的错误率很难运用到实际应用中。到2015年,ImageNet错误率已经降低到3%左右,比人类的错误率(5%)还要低, 短短的4-5年时间,机器在ImageNet上的识别率便超过了人类。

    导致这一结果的原因有2个:一是数据,另一个是模型。

    大规模训练数据的出现为训练大模型提供了物质基础,大规模机器学习模型具有超强的表达能力,可以解决很多复杂和高难度的问题。

    在解决这些问题的同时,大规模机器学习模型也有着非常明显的弊端:包含参数众多,训练耗时;模型巨大,传统的计算机和工作站难以处理;容易过拟合,在训练数据集上表现良好,在未知测试数据上表现不尽人意。

    比较典型的例子是电商网站上的用户行为数据,比如在淘宝上很多用户每天都能看到系统推荐的产品,这些产品是根据用户日常浏览和点击习惯进行推荐的,淘宝的服务器将用户点击的产品行为记录下来,作为分布式机器学习系统的输入。输出是一个数学模型,可以预测一个用户喜欢看到哪些商品,从而在下一次展示推荐商品的时候,多展示那些用户喜欢的商品。

    类似的,还有互联网广告系统,根据几亿用户的广告点击行为,为其推荐更容易被点击的广告。
    2

     

    淘宝推荐系统大致如图所示

    由上述案例可以知,现在我们很难用一台计算机去处理工业规模的机器学习模型了,所以说分布式训练已经成为了一个先决条件。

    2、流程:了解-探索-设计

    分布式机器学习说白了,其实就是把任务发放给许多机器,然后让它们协同去帮忙训练数据和模型。
    3

     

    如图所示,我们会把任务下发给许多的worker,然后这些worker协同的去训练模型。

    通过对分布式机器学习起源的讲解,我们可以将分布式机器学习的使用场景粗分为三类:计算量太大、训练数据太多、训练模型太大太过复杂。

    这三种场景都有相对应的解决办法,对于计算量太大可采用共享内存的多机并行运算;对于训练数据太多,可以将数据进行划分,分配到多个工作节点上进行训练;而对于训练模型太大,也可以将模型进行划分,分配到不同的工作节点上进行训练。
    4

     

    不管是以上场景中的哪一种,还是几种场景混合在一起的情况,分布式机器学习都可以分为三步流程:

    第一步是了解机器学习的模型以及优化方法;第二步是要去探索分布式机器学习的范式;第三步是设计系统,无论系统的设计者还是系统的使用者,都要知道系统为什么要这样设计,这样设计对我们选择什么样的机器学习有怎样的帮助。

    3、算法:数据并行、模型并行、梯度下降

    数据并行

    数据并行是指由于训练样本非常多模型非常大,我们需要把训练数据划分到不同的机器上,比如说我们用100台机器同时存储这些数据,如果这些模型有10万个数据样,用100台机器来存储,每台机器存储1000条数据即可。

    对于每一台worker来说,训练算法、分布式和在单机上没有什么区别,只是需要在节点之间同步模型参数。

    其中参数平均是最简单的一种数据并行化。若采用参数平均法,训练的过程如下所示:

    1、基于模型的配置随机初始化网络模型参数

    2、将当前这组参数分发到各个工作节点

    3、在每个工作节点,用数据集的一部分数据进行训练

    4、将各个工作节点的参数的均值作为全局参数值

    5、若还有训练数据没有参与训练,则继续从第二步开始

    5

    模型并行

    模型并行将模型拆分成几个分片,由几个训练单元分别持有,共同协作完成训练。

    深度学习的计算其实主要是矩阵运算,而在计算时这些矩阵都是保存在内存里的,如果是用GPU卡计算的话就是放在显存里,可是有的时候矩阵会非常大。面对这种超大矩阵便需要将其拆分,分到不同处理器上去计算。6

     

    梯度下降

    1847年梯度下降被提出来之后,这些年业内提出了各种各样的优化算法,优化算法是一个非常漫长的演变过程。
    7

     

    大家可以看到图中有一条分界线, 在2010之前的算法主要是Deterministic algorithms,这种算法具有很强确定性。换句话说,就是可以在数学上保证此算法进行的每一步都是精确的,能够指导我们的优化目标。

    2010年之后的这些模型被称做stochastic algorithms,不再要求每一步都是精确的梯度下降,或者每一步要做最精确的优化。stochastic algorithms让每一步只进行随机的优化,最终把所有数据优化完以后,还是能够优化到最低点。

    随着数据越来越大,Deterministic algorithms规则已经越来变得越来越不适用了。对于大量的计算数据,我们不可能每一次都做梯度下降,随机梯度下降变得越来越有优势,资源利用率也会更高。

    4、分布式机器学习三大平台:Spark、PMLS、TensorFlow

    在纽约州立大学布法罗分校计算机科学与工程教授、Petuum Inc. 顾问 Murat Demirbas 和他的两位学生一起发表的那篇对比现有分布式机器学习平台的论文中,将分布式机器学习平台归类为了三大基本设计方法:

    1.基本数据流(basic dataflow)

    2.参数服务器模型(parameter-server model)

    3.先进数据流(advanced dataflow)

    并根据这三大基本设计方法,使用了业内著名的三大分布式机器学习平台,其中基本数据流方法使用了 Apache Spark、参数服务器模型使用了 PMLS(Petuum)、先进数据流模型使用了 TensorFlow 和 MXNet。

    并在测试中得出相应的结论,班主任摘取关键部分出来,供大家参考(论文原文可访问:https://www.cse.buffalo.edu/~demirbas/publications/DistMLplat.pdf,译文参考网络翻译)

    Spark

    在基本的设置中,Spark 将模型参数存储在驱动器节点,工作器与驱动器通信从而在每次迭代后更新这些参数。对于大规模部署而言,这些模型参数可能并不适合驱动器,并且会作为一个 RDD 而进行维护更新。

    这会带来大量额外开销,因为每次迭代都需要创造一个新的 RDD 来保存更新后的模型参数。更新模型涉及到在整个机器/磁盘上重排数据,这就限制了 Spark 的扩展性。

    PMLS

    PMLS节点会存储和更新模型参数以及响应来自工作器的请求。工作器会请求来自它们的局部 PS 副本的最新模型参数,并在分配给它们的数据集部分上执行计算。

    PMLS还采用了 SSP(Stale Synchronous Parallelism)模型,这比 BSP(Bulk Synchronous Parellelism)模型更宽松——其中工作器在每次迭代结束时同步。SSP 为工作器的同步减少了麻烦,确保最快的工作器不能超过最慢的工作器 s 次迭代。

     TensorFlow

     TensorFlow使用节点和边的有向图来表示计算。节点表示计算,状态可变。而边则表示多维数据数组(张量),在节点之间传输。

    TensorFlow 需要用户静态声明这种符号计算图,并对该图使用复写和分区(rewrite& partitioning)将其分配到机器上进行分布式执行。(MXNet,尤其是 DyNet 使用了图的动态声明,这改善了编程的难度和灵活性。)
    8关注我们,收看更多精彩课程

    640

    科技晚自习 | AI+教育 “生而不凡”

    一堂课告诉你,摆脱苦学模式,让教育回归快乐不是梦!

    现在,谈到学习,人人皆言“苦也!”比如个个在“陪娃写作业”中遭罪的家长——

    “不写作业,母慈子孝;一写作业,鸡飞狗跳!”的。

    f58daeea8b48347207dc53a35fa2c01b

    积郁成疾的。

    572de1f91546b81cae3eb1e52f17142c

    甚至还有“甩锅”给未来亲家的。

    77574ba703fa4e118638cadc9204e721

    连《三十六计》中的远交近攻,在当代也被赋予了全新含义:

    eebd0be59ef549f4b82031a168d60aee

    再看学生,人家也是“宝宝心里苦啊”。

    上不完的课,刷不完的题。尤其到了假期,功课量飙升,正可谓“我写一个月,师写一个‘阅’。”

    9fc4-fyqwiqi5991173

    那可以呼吁老师们给我们减轻一点压力吗?小编也曾这样想,直到看到了这张图:

    9eb4708cd7624195a75e50245c2aeefa

    ……算了,都不容易(囧)。

    那么,“埋头苦干”真的是当下教育的唯一正解吗?相信很多人都有这样的无可奈何:现在竞争激烈,知识爆炸,想不输在起跑线只能填鸭式吸收,素质教育呼吁了很多年,现在不是仍然没有完全落实吗?

    别急,我们准备了一堂课,听完它,启发你脱离苦海,让学习回归欢声笑语。它是——

    11月28日,AI大学第十七期《科技晚自习》

    480X720科技晚自习

    王士进院长将与大家一起探讨人工智能如何让教书育人展翅高飞。比如——

    对学生,自适应学习通过线上收集作业和考试成绩反馈,为每个学生定制教学方案,旨在帮助学生发挥特长,弥补薄弱环节。实现新时代的“因材施教”。

    对家长,伴随机器人等智能教育硬件将代替自己辅助孩子写作业和复习,它们全天候待命、可以和学生进行完全理性的无限制互动,让过去“输出靠吼”的陪读时光一去不复返。

    对老师,AI的大数据处理能力可以提供学生课业状态的反馈,AI助教则可以代替教师管理课堂秩序。未来的分工,将是AI陪着学生学习基础知识和构建知识图谱,而老师将主要精力放在与学生进行情感交流,帮助学生塑造正确的价值观和思想品德这些更有价值的工作上。

    AI+教育,能否让学生、家长、老师不再“苦干”?AI开发者想进入教育行业,又有哪些建议?

    11月28日晚7:00,第十七期科技晚自习,我们一起寻找答案!

    科技晚自习
    《科技晚自习》是由科大讯飞 AI 大学推出的一档轻量级科技脱口秀节目。

    聚焦人工智能以及其他前沿科技领域,关注技术在商业以及在生活中的应用,激发好奇心,体验黑科技,观察科技驱动的未来。

    关注“AI大学”公众号,后台回复关键词“教育”获得本期课程观看链接。

    我们在直播间为大家准备了精彩的福利互动,欢迎踊跃参与哦!

    扫码即可关注“AI大学”公众号

    AI大学

    服务商招募 | 我们诚邀你一起,搭几座未来城市

    讯飞服务市场招募物联网行业优秀服务商,推进IoT赋能智慧城市建设!

    太长不看版
    讯飞服务市场招募在物联网行业拥有成熟产品及解决方案的服务商,协同推进IoT在城市各个领域应用,加快智慧城市建设!点此登录讯飞服务市场,点击顶部“我是服务商”,选择“智慧城市”类目,即刻入驻! 

    随着AI、云计算和大数据的不断突破,越来越多的巨头们加入了塑造“智慧的城市”的宏大事业中——

    IBM开启“智慧星球计划”,希望基于大数据分析平台Watson的认知智能技术,对城市的空气状况,交通管理等进行实时优化。

    谷歌开启“Sidewalk Toronto”,在多伦多落地未来智能社区方案。在这个社区中,无人汽车、智能信号灯、送货机器人无处不在。

    9ea9283aaa6ade9ba4363a977b94fa6e

    “Sidewalk Toronto”概念图

    根据德勤《超级智慧城市报告》,目前全球已启动或在建的智慧城市达1000多个,中国在建500个,远超排名第二的欧洲(90个)。

    庞大的人口+移动互联网快速发展带来的多样化生活方式,在全世界最大的智慧城市项目实施国中,构建的每一座未来之城注定独一无二。

    在我们看来,“物联网(IoT)”将为未来的一座城市带来巨大能量。

    通过IoT,连接城市中所有智能设备,实现对城市的全面感知,并利用云计算等技术处理海量感知数据,完成对政务、民生、环境、公共安全等各项事务的实时响应与支持。

    而你,也许正好拥有这样的IoT产品及方案,为智慧停车场,智慧楼宇、智慧交通,智慧园区,智能抄表、城市安防等场景赋能。

    所以,我们想邀请你,一起抓住机遇,迎接挑战——

    讯飞服务市场招募广大在IoT行业有成熟产品、解决方案的服务商。

    我们希望与你协同努力,让IoT更好的应用在城市各个领域,加快城市智能化发展!

    PS:关于讯飞服务市场,点此了解

    加入我们,你将获得——

    首先——

    入驻讯飞服务市场的IoT服务商,只需使用讯飞IoT平台完成流程测试或项目实施,经评估即可通过各级认证服务,进入讯飞内部服务商资源池。依托城市、小镇、园区等项目可获得大量优质需求。

    除此之外,我们还为你准备了——

    服务商扶持,城市物联网需求对接支持
    依托讯飞强大的资源渠道吸引客户发布需求,旨在为广大服务商寻找最优质、最匹配的需求。同时我们提供完善的供需双方需求对接流程。
    IoT行业知识分享、优秀案例分析&方案指导                                                                  讯飞IoT为服务商提供全年多场线上线下行业知识分享,并会对优质服务商的优秀案例进行分析、拆解,帮助广大服务商提升方案质量及实施能力。

    服务商认证及露出,线上线下多维度品牌推广                                                                线上,我们为你提供服务市场、讯飞开放平台等优质广告位露出。在线下,你将有机会获得在各类行业峰会、1024开发者节等现场的开设展位,进行宣传推广的支持。

    服务商专属经理                                                                                                                    我们为服务商提供的专属经理是一对一为服务商提供服务,会快速响应服务商需求,并在反馈问题后24h内解决。

    我要如何入驻?

    1.登录讯飞服务市场 http://www.aifuwus.com/,点击顶部“我是服务商”

    微信图片_20181122140140

    2.选择“智慧城市”类目,完成服务商入驻申请

    3.平台进行资质审核,通过后即可入驻

    4.服务商入驻要求                                                                                                                       入驻的服务商公司需要符合国家相关法律、法规规定,拥有正规的公司资质。同时服务商需要具有15人以上的技术及客服团队,拥有2年以上的该行业服务经验。可提供不少于5*8小时的在线服务,具有一定的营销策划能力。按照讯飞服务市场相关协议开展业务合作。

    想了解更多,或有任何与服务市场有关的疑问,欢迎通过以下官方渠道与讯飞AI服务市场团队交流,我们期待您的声音!

    联系电话    4000-199-199

    邮箱交流    aifuwus@iflytek.com

    QQ交流    讯飞服务市场交流群(778105911)

    官方微信

    qrcode_for_gh_cfb53edb0e56_1280

    超过80%语音开发者的共同选择