• 城市故事2019:西安的硬科技之路准备联手讯飞这么走

    科大讯飞A.I.城市峰会@西安,古城新曲碰撞A.I.西引力!

    城市,是一部记载人类创造力的百科全书。

    泱泱三千年,从古丝绸之路起点到“硬科技之都”,西安传承着历史的底蕴,焕发着创新的生机,吸引着海内外高层次创新人才和团队,也让科大讯飞与西安“结缘”。一场AI城市赋能之旅,正在厚积薄发。

    4月13日,科大讯飞A.I.城市峰会走进西安,解读城市科创潜力,挖掘创新创业机遇!

    西安市副市长王勇、西安高新区管委会副主任贾轶昊、西安市科学技术局副局长楼文晓、西安高新区管委会副主任祝鹏翘、科大讯飞集团高级副总裁赵志伟、讯飞西安研究院院长王海坤、科大讯飞消费者BG副总裁于继栋、科大讯飞AI双创发展研究中心主任方明、西安讯飞超脑信息科技有限公司总经理付明磊出席本次峰会。

    微信图片_20190413175506

    峰会启动仪式

    研发+赛道+生态,西安AI赋能3重奏

    聚力发展“硬科技”产业,推进高端人才创业,服务科技企业创新发展……科大讯飞将如何通过AI赋能助力西安实现以上目标?

    科大讯飞集团高级副总裁赵志伟在致辞中分享了AI发展的三个关键要素:核心算法、核心大数据以及深耕各行业的开发者群体。“只有这三股力量作用在一起,才能够真正地改变一个有一个行业。”赵志伟说。

    赵志伟提到,人工智能产业并不是一家企业包打天下,必须要建立产业生态。他指出,产业生态建立的快慢,决定了一个企业,一座城市人工智能发展的速度。而推动西安AI双创事业发展,建设先进的AI产业生态是科大讯飞的工作重点之一。

    微信图片_20190415150447

    科大讯飞集团高级副总裁赵志伟

    “AI浪潮下,科大讯飞要做3件事:核心研发、垂直赛道、生态建设”这是讯飞西安研究院院长王海坤给出的答案。

    微信图片_20190413170459

    讯飞西安研究院院长王海坤

    核心研发

    作为国家级人工智能平台,科大讯飞持续优化核心技术。王海坤介绍,2018年科大讯飞在感知智能和认知智能领域共获得12项世界冠军。同时讯飞研究院与清华大学、中科大、西北大、麻省理工等国内外高校和科研院所建立合作。布局全球人工智能的核心研发体系。

    垂直赛道

    自然交互、智能学习,这是科大讯飞布局的垂直赛道。让语音交互为主,触摸交互为辅智能交互方式提升翻译、家庭、移动、汽车等场景的体验;让由行业专家和核心技术不断打磨讯飞超脑赋能城市、交通、医疗等领域,真正实现智能交互改变生活、智能学习改变行业。

    生态建设

    如何组织起AI人才“西安队”?王海坤展示了共建AI生态三大平台:讯飞开放平台不断为广大开发者解锁新的AI能力;智能硬件平台提供完善的人机交互解决方案;讯飞双创平台为孵化、加速、钻石三个级别的创业团队提供各层面支持。

    2018年,西安市人民政府、高新区与科大讯飞签署战略合作,共同打造“3+4+X”战略合作模式。推进西安市人工智能产业的规模化发展,西安AI研究院、丝路总部、讯飞西安AI+产业加速中心全部落地

    作为“3+4+X”战略的重要成果,科大讯飞西安AI+产业加速中心已实现入驻率近75%。入孵企业方向包括智能穿戴、夜视辅助驾驶、智能客服、医疗辅助、军民融合项目等。

    科大讯飞双创中心主任方明将AI赋能创业者成为“黑马”的法宝概括为找对人,选对事,少踩坑 ”

    微信图片_20190413170529

    科大讯飞双创中心主任方明

    未来,人类的全生命周期都与AI密不可分,萌生了大量新业态,新商机。科大讯飞通过基于AI核心技术的支撑系统,以讯飞资源配套相关核心服务,驱动创新企业孵化、产学研平台搭建、领军企业加速成长三个维度的产业体系发展,为创业团队量身打造基于全生命周期产业集群的孵化器、加速器。

    同时,AI创业者也将通过讯飞AI大学和讯飞加速营答疑解惑,避开技术坑、市场坑、管理坑

    2大拳头技术,凸显技术赋能实力

    AI为城市赋能的承诺,离不开领先的技术能力支撑,本次峰会同样带来了科大讯飞在AI领域技术研究新成果:

    语音合成:声形同步更真实

    “如果能将语音的成分自由的拆解和组合,将是对语音能力的巨大解放,未来将有无限想象的发展空间。”在《AI能力先行者》主题分享中,讯飞AI研究院副院长、语音合成方向专家江源如是说。他还提到,如今语音合成技术除了做到声如其人,语音更能与发声者的口唇实现精准同步!

    微信图片_20190413170504

    讯飞AI研究院副院长、语音合成方向专家江源

    为什么科大讯飞要在语音合成领域追求极致?江源把语音的成分拆分为信息、音色、韵律。他指出,熟悉的声音以其惯性和魅力,更易让听者沉浸其中。所以个性化音色以及特色声音IP将是未来内容生产的重要竞争力“声形兼备的虚拟形象将大大拓展声音的可用领域和具象效果。”江源说。

    iFLYIoT:催化单品/场景智能爆发机遇

    从互联互通为主,到设备智能为主,随着AI与物联网(IoT)的融合,智能化已经成为IoT发展的大潮流。而科大讯飞在AIoT时代推出的,就是iFLYIoT平台。

    科大讯飞云计算研究院副院长龙明康在iFLYIoT的主题介绍中,将AIoT的发展划分为单品智能-场景智能-万物智联三个阶段,而如今正处于单品智能和场景智能的爆发前期。但AIoT的落地也面临门槛高、成本高、技术链路长、细分领域市场不明朗等问题。

    微信图片_20190413170513

    科大讯飞云计算研究院副院长龙明康

    如何降低技术门槛,下沉能力,拉通上下游,提升效率,降低成本?科大讯飞通过iFLYIoT开发者平台,为开发者提供包括单品智能化、场景智能化等在内的全栈、便捷、高效的能力开发。而iFLYIoT生态平台则以AI服务市场为核心,链接开发者与客户,桥接商机,匹配需求,与更多的合作伙伴构建AIoT产业生态。

    4+行业领域,分享AI城市赋能应用成果

    技术顶天,应用落地。本次科大讯飞A.I.城市峰会@西安邀请企业代表来到现场,与大家分享如何选择AI+行业,以及把科研成果转化为产业动能的经验。同时展示讯飞生态合作成果。

    AI+翻译

    如今全世界正在使用的语言超过2000多种,预计2020年数据量更将达到 35ZB,即时翻译的需求增多,小牛翻译创始人,东北大学教授朱靖波介绍,小牛翻译以神经机器翻译为主框架,融合规则方法和SMT方法,打造最好的机器翻译“发动机”。支持118种语言互译,包含七大民族语言,覆盖全球98%的人口。

    微信图片_20190413170447

    小牛翻译创始人,东北大学教授朱靖波

    AI+阅读

    为了在满足阅读需要的同时解放双眼,“听书”成了时下流行的方式。“追书神器”APP副总裁项江江在分享中展示了语音朗读。相比于有声小说,语音朗读可以随时切换文章段落,同时不受网络限制,进一步满足用户听书体验。

    微信图片_20190413170509

    “追书神器”APP副总裁项江江

    AI+服务

    随着业务场景的增多,客服行业的工作强度和人力成本越来越大,西安晓多智能致力于通过自然语言核心技术研发的客服机器人帮助客户解决问题,晓多智能CEO李勇在峰会分享中,将智能客服解决的痛点总结为解决多渠道人力投入、让机器又快又准理解意图、构建长效运营的知识库、最大化再利用客服数据。

    微信图片_20190413170525

    西安晓多智能CEO李勇

    AI+更多

    不凡的事业,常起源于独一无二的idea。“AI创意集市”邀请5位西安本地优秀创业者团队代表向大家展示他们的创意理念和产品故事。老年陪护、文物保护、儿童健康、脑机融合、自动化生产是他们的秀场,新奇、酷炫、社会价值使他们的特点。

    《现代保健报》总经理何建华分享“智能陪伴机器人”项目,让不会使用智能手机的老人能够方便地得到健康资讯和服务,让子女方便远程照顾父母。

    1

    西安非凡士机器人科技有限公司大客户经理马煜为大家带来3D打印技术在文物研究领域的应用。

    2

    陕西儿童健康管理研究院顾问白易凡介绍了儿童体育健康监测系统,线下设备通过与AI健康管理系统结合,共同组成儿童健康管理平台。

    3

    西安臻泰智能科技有限公司CEO王浩冲分享了脑机接口技术的应用,通过脑控交互,人类可以通过思维发出指令。

    4

    西安凡果软件技术有限公司产品经理李宝宇带来RPA——“流程自动化机器人”,可处理高度可重复任务,具有效率高、成本低等优势。

    5

    科技的发展给各行各业带来了无限畅想,给城市注入了缤纷色彩和多种可能。在AI的时代浪潮里,我们希望每一座城市都能因每个开发者的能量而熠熠生辉。

    未来,科大讯飞A.I.城市峰会将携讯飞的开放资源深入更多城市,助力A.I.深度赋能产业,推动人工智能产业在每座城市的发展壮大,进一步促进人工智能产业氛围营造!

    微信图片_20190413184032111

    在宇宙中辛勤工作,这样一群“AI小伙伴”你能认出几个?

    “什么情况,我们这是在哪儿?”我问到。

    “你觉得呢?”那个男人说到。他满脸胡茬,一口黄牙看起来蛀坏了不少。

    “难道我们还停留在大天使系统里?”我说。

    “那倒不是,你们已经通过传送门了。”

    “那现在到底是什么情况?”

    “路径错误。你们没有从正确的孔洞里穿出来。”

    “天哪!”我摘下了围帽······

    一觉醒来,世界颠倒。

    这一情节来自英国科幻作家 Alastair Reynolds于2016年发表的科幻短篇小说《Beyond the Aquila Rift》(《天鹰座裂隙之外》),讲述的是男主角一行人在宇宙穿梭时由于系统错误,导致飞船偏离航线,来到了16.3万光年以外的其它星系。

    这篇优秀的科幻小说于今年年初被改编成了动画短片,也就是前段时间大火的《爱,死亡与机器人》系列中的第七集《Beyond the Aquila Rift》。

    u=3423376598,3031137795&fm=11&gp=0

    虽然是虚构的情节,但其中的许多细节其实非常符合真实世界里的技术的。

    例如驾驶员们都进入沉睡仓后,将后续的操作全权交给了Dispath(调度仓),这里的Dispath就是一个典型的人工智能系统。不仅具备专家系统的能力,可以在没有人工操作的情况下自动规划路线、驾驶飞船,还可以直接接受语音指令,进行语音沟通。

    而温热温热

    再比如主角们进行数据查询和分析时使用的酷炫界面,直接通过手势操作就可以移动地图并且进行标记。这则是具备体感机交互功能的AR技

    vv需持续

    自从1957年,前苏联发射了世界上第一颗人造地球卫星开始,人类的宇宙探索步伐迈得是愈发迅速而稳健了。

    在这一过程中,人工智能技术起了强有力的推动作用。

    1

    前段时间,天文学界发生了一件大事:人类拍摄到了有史以来第一张黑洞照片。这一过程中,就有AI技术的助力。

     

    timg (3)

    总体上说来,黑洞照片获取存在两个方面的难点:一是观测设备,二是观测数据的处理。前者相当于拍照片,后者则相当于洗照片。“拍照片“的设备要求很高,“洗照片”的过程也极其耗时而复杂。

    要知道,观测用的八台望远镜每天获取的数据量都的PB级别的(1PB=1024TB≈1000000GB)。在超级计算机的强大硬件和科研人员的创新算法结合的情况下,耗费两年时间,才最终合出了我们现在看到的这张照片。这一过程中用到的主成分分析法(PCA)等相关技术,就属于非常经典的机器学习算法。

    2

    可以说,人工智能正在改写人类宇宙的探索史,让航天事业的进步实现了指数级加速。

     1. 太空机器人 

    在许多科幻电影中,我们都曾看到过机器人的身影。这些造型各异的小家伙们是飞行员在太空探索中的有力助手。

     

    timg (4)

    而在现实的宇宙航行中也确实用到了不少太空机器人。

    太空机器人与地球上普通机器人有很大差别,由于面临的是微重力、超低温、强辐射、暗光线的空间环境,在失重条件下,物体处于漂浮状态,需要空间视觉识别以及手爪的配合,利用接近觉、触觉、力觉、滑觉传感器配合视觉系统完成各种操作。

    根据其作业类型的不同,太空机器人种类较多。例如维修机器人——负责修理和回收卫星、替换飞行器外的老旧部件、更换外部电池。

    94B6BD18A98E59A6535C925A6E95E256

    NASA空间站的维修机械臂Dextre

    又比如探测机器人。其中最著名的就是2011年上天的火星探测车“好奇号”。它可以在没有人类协助的情况下,自主探测火星气候、地质。

    W020180924612403557945

    火星探测机器人好奇号

    经过漫长而孤独的行走,好奇号发现了火星土质中存在有机物和水,也证实了火星上曾有生命存在过。这些发现为人类的宇宙探索进程做出了巨大的贡献。

    而近两年,科学家们还研发出了太空陪伴机器人,它们不仅能协助宇航员们的日常工作,其丰富的交互功能也能够减轻宇航员的压力。

    例如2018年欧洲飞机制造 、研发公司空中客车与德国航空航天中心的空间管理部门合作研发的球形机器人CIMON。

    bba1cd11728b47107285275fcecec3fdfd0323ff

    它可以识别宇航员的声音和面部,实现简单的对话,同时还能通过摄像头捕捉到对方的情绪变化,并利用这些信息与其更好地交互。

    CIMON内部安装的14个小风扇可以吸入空间站内的空气再吐出,由此推动机身向任何方向移动。哪里有宇航员呼唤,它就飘到哪里,为整个空间站的工作人员服务。

    脑补一下工作时的场景,还真是有点可爱呢~不过CIMON的脸长得确实有点·······你要说这是个表情包我也信的········

    timg (10) - 副本

    timg (9) - 副本

    timg (8) - 副本

     

    2.飞行员辅助 

    随着飞行器性能的日益强大,其操作的复杂度也越来越大,飞行员需要更好的支持系统来规划飞行资源。

    此时,基于人工智能技术的智能座舱管理系统就可以帮上忙。该系统能利用存储的知识进行推理,为飞行人员提供成功飞行所需的重要信息。

    W020160505397443643523

    2015年发射上天的“天龙号”飞船里的控制面板

    此外,空间站的其它运维工作,包括电源监护、推进器维护、太空服和生命支持系统的检查和维护等,都可以借助一系列智能控制系统实现自动控制。

     3.故障诊断系统 

    航天飞机的主发动机(SSME)是至今为止最复杂、最强的动力再生系统,其控制也最为困难。因此,为了正常可靠的飞行必须对SSME进行地面测试。

    研究人员研发出了名叫LEADER的专家系统。该系统使用了一系列传感器来监测发动机各部件的工作情况,并能够识别不同的发动机异常。它可以实时完成异常发动机系统操作的自动学习,并且完成确认和纠正,有效降低了航天事故的发生概率。

    除了上述介绍的航天飞机主发动机的故障诊断外,LEADER系统还广泛用于空间系统的监视和诊断。

     4.智能规划 

    如果我们计划要到达另一个行星,那飞行过程中该何时减速、如何飞到近地轨道,又该怎样选择落地时机呢?

    timg (10)

    嫦娥一号变轨示意图

    这些事项的规划直接决定了飞行的时间、成本以及飞行人员的工作强度。此时借助于AI飞行测试管理系统,就可以进行路线规划、监控和模拟仿真等工作,得到最优的飞行规划。

    3

    太空探索活动无论是对国家还是对整个人类,都意义重大。

    例如,通过气象卫星的监测,我们能掌握实时天气情况,进行自然灾害预警;我们有今天这样发达的通信水平,也多亏了围绕着地球的通讯卫星;对传回地球的图片和数据分析之后,我们甚至通过更好的土地规划实现了粮食产量的提高。

    可以说,近半个世纪以来人类生活水平的提高,宇宙探索过程中的发现和发明起到了不可磨灭的作用。

    timg (12)

    此外,探索宇宙的意义也不仅仅是对于新世界的挖掘,同时还是对人类自我存在的发现。

    随着宇宙研究的深入,我们对地球、对生命、对人类自身的认知也会愈加深刻。人工智能技术也是如此,在发展出更高速的解决方法的同时,也让人类对自身的思维构造、意识产生有了更加深远的认知。

    世界这么大,愿你我一同探索。

     

    新课来了 | 去西安,聆听机器翻译的光荣与梦想!

    公元652年,玄奘在慈恩寺西院建造了大雁塔,用于收藏他从天竺带回来的657部佛经经卷,之后的12年里玄奘一直在此翻译佛经。

    当巴别塔出现的时候,人类开始有了不同的语言,而大雁塔出现的时候,人类已经在不同的语言中开始翻译。

    这周的课程,我们来讲一个同学们都比较熟悉的知识点——机器翻译。

    之前咱们AI大学刘俊华导师从“三大核心翻译技术”的角度,给大家普及了基于规则的翻译方法(RMT)、基于统计的翻译方法(SMT)、基于神经网络的翻译方法(NMT)的三种翻译技术的相应原理。

    今天我们换个角度来聊机器翻译,从历史角度来看看这个比人工智能概念诞生还早的自然语言处理任务。

    微信图片_20190410145511

     

    一、从传说开始的故事《圣经》中记载了这样一个故事:

    人类曾经联合起来兴建能通往天堂的高塔——巴别塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。

    实现不同语种之间的无障碍沟通,一直都是人类终极梦想之一。

    在认识到不眠不休穷尽人类一生的力量,也只能掌握几十种语言时,很多科学家开始思考,是不是可以用机器来帮助人们去解决沟通问题?

    这一问题在1933年首次得到了答案,苏联科学家Peter Troyanskii向苏联科学院介绍了能将一种语言翻译成另一种语言的机器。

    这个法明很简单,在当时并未受到苏联政府的重视,他们觉得这台拥有各种语言卡片的机器没有实际作用。

    Troyanskii用20多年的时间将这台翻译机器发明出来,后死于心绞痛。

    我们今天能如此清晰的复述这段故事,是因为在1956年苏联2位科学家发现了Troyanskii所创造的翻译机器,并将它公之于世。

    如果不是这样,或许我们到现在都不会知道,早在1933年就有人想过将语言卡片、打字机、老式胶片组合在一起,发明一台翻译机器。

    0

    二、萌芽于冷战中的军备竞赛正像计算机是被战争催生出一样,机器翻译技术的萌芽也与军事有关。

    1947年杜鲁门主义出台,美苏冷战正式开始,对于俄文情报资料的翻译,需求量很大。

    1954年,美国乔治敦大学在IBM公司协同下用IBM-701计算机首次完成了英俄机器翻译试验,拉开了机器翻译研究的序幕。

    当时的系统,仅能容纳250个单词,遵循6条语法规则,翻译49个句子。

    但这一切已足以点燃科学家们的激情,机器翻译成功引起了苏联、日本和欧洲国家的研究兴趣。一时间,各国政府纷纷拨款,全球机器翻译热潮兴起。

    然而,技术的发展都是曲折艰难的,和这种狂热的关注相比机器翻译的研究进展着实缓慢,美国科学院成立了语言自动处理咨询委员会(ALPAC)于1966年公布了一份名为《语言与机器》的报告,该研究否认机器翻译可行性,机器翻译研究进入萧条期。

    虽然这一阶段的机器翻译发展并不顺利,但还是为现代自然语言处理技术打下了坚实的基础。

    微信图片_20190410150337

     

    三、20世纪末的又一次兴起20世纪70年代IBM沃森实验室的贾里尼克,他提出了基于统计的语音识别框架,这个框架对语音和语言处理都有着深远影响,它从根本上使得语音识别有实用的可能。从此,自然语言处理开始走上统计方法之路。

    1993年,IBM的Brown等提出基于词对齐的统计翻译模型,基于语料库的方法开始盛行,标志着第二代机器翻译技术——基于统计的机器翻译开始兴起,其核心在于设计概率模型对翻译过程建模。

    统计机器翻译避开了语言规则,使用大量的双语文本,建立两种语言的平行语料库,虽然避开了繁杂的语法规则,但需要大规模的语料库,这在当时非常难以实现。

    2014年谷歌和蒙特利尔大学提出的第三代机器翻译技术,也就是基于端到端的神经机器翻译,标志着第三代机器翻译技术的到来。

    2016年月28日,谷歌发布新的神经机器翻译系统GNMT,同时支持PC端和移动端,这项服务背后的核心算法是基于短语的机器翻译。

    同时期国内科技企业在机器翻译上的进展也非常迅速,以语音和语义理解见长的科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名,在2015年又在由美国国家标准技术研究院组织的机器翻译大赛中取得全球第一的成绩。

    自此,神经机器翻译开始大规模走向应用。

    微信图片_20190410151248

     

    四、重建巴别塔之路从1993年到2019年,机器翻译技术发展了80多年,巴别塔的传说已经成了过去,我们今天重温机器翻译的发展历史,并不是为了再去修建一座真的「通天塔」,而是想让同学们更加深刻地了解机器翻译这门学科。

    或许书面的文字终究没有亲身经历更加有力量,除了今晚的课程,班主任还给大家推荐一场特别有意义的线下峰会——4月13日科大讯飞全球1024开发者节西安峰会

    微信图片_20190408094518

    在这场线下峰会中,小牛翻译的创始人、AI大学的荣誉教授朱靖波将会和大家分享更多关系机器翻译的知识点,除了基本的技术原理和应用,朱教授还将从行业的角度给大家分析机器翻译未来究竟会往何处发展,以及会发展到何种程度。

    西安,这座诞生了中国首位翻译家的十三朝古都,见证了西周、秦、西汉等众多王朝的兴衰荣辱,见证了玄奘在大雁塔内为普渡众生日以继夜地翻译佛经,也即将见证人工智能用不可思议的技术重建现代「巴别塔」。

    当然,这一场峰会精彩的可不仅仅在于此,立足西安科技产业发展的现状,本次的1024开发者节A.I.城市峰会将分享讯飞的开放生态资源,深度剖析西安科创背景下A.I.前沿成果及应用,让这座古城释放出属于自己的“硬科技”魅力。

    官网报名二维码图

    人间四月,去西安聆听机器翻译的光荣与梦想,去赴一场AI之约。

    【重要的号外】除了4月13日科大讯飞全球1024开发者节西安峰会之外,4月24日AI大学还将上线朱靖波教授的直播课程,所以去不了西安峰会的同学们,可以安心等待4月24日晚的直播啦~~

    与总理对话的这家企业,已正式在西安布局区域总部!

    行业精英在西安的布局

    本文转载自公众号【西安城记】,版权归原作者所有

    今年的亚洲博鳌论坛上,一家人工智能公司获邀出席了总理对话会。就在去年,这家公司已正式宣布将在西安设区域总部。

    这家公司,就是科大讯飞——2008年,已在深圳证券交易所挂牌上市。本月13号,科大讯飞将在西安举办“2019科大讯飞全球1024开发者节AI城市峰会@西安”。这些,与西安打造的“全球硬科技之都”战略都不谋而合。

    出席总理对话会的行业领军企业

    AI头部企业

    在A股市场上,科大讯飞曾有“人工智能第一股”的称誉。作为人工智能企业,科大讯飞一直都是资本市场重点关注的对象,一举一动都在镁光灯下。

    2018年的中国-中东欧国家地方合作成果展上,人工智能产品展示台上的科大讯飞翻译机引起中国和保加利亚两国总理的兴趣:两位领导人不仅与翻译机进行了互动,李克强总理还亲自购买了讯飞翻译机2.0,将它作为礼物赠予了保加利亚总理。

    微信图片_20190410113928

    两国总理亲自测试科大讯飞翻译机◎中国政府网

    科大讯飞,是怎样一家公司?根据公开资料显示,科大讯飞成立于1999年。初创时,创始团队就坚持要让中文语音技术由中国人做到最好、中文语音产业由中国人自己掌握。

    2010年,科大讯飞开发出世界第二个、中国首款语音输入法,仅次于谷歌。作为语音输入代表应用的讯飞输入法,语音识别准确率超98%;支持23种方言语音输入,解决了口音和方言输入难题。正是智能语音技术的先发优势,为科大讯飞向人工智能发展、同时为赋能行业与落地应用夯实了根基。

    人工智能领域,按技术发展阶段可划分为计算智能、感知智能和认知智能,后两项仍需要持续不断的研发创新。科大讯飞以语音技术为突破口,在感知智能和认知智能方面均取得了不错的成绩。

    在语音合成技术方面,最初机器合成的声音还是一字一字的往外蹦,比较生硬。如今,科大讯飞研发的技术已超过真人发音水平,语音合成技术连续13年保持全球英文语音合成大赛第一名。

    在更高级别认知智能领域,科大讯飞率先在业内做到实际场景下通用语音识别率98%。同时,科大讯飞的机器翻译水平,已经超过大学英语六级。科大讯飞的“智医助理”,成为“成为全球第一个通过国家执业医师资格考试评测笔试的人工智能系统”。

    微信图片_20190410113937

    科大讯飞的人工智能+产业生态

    这些,都意味着科大讯飞在语音合成、识别、评测,翻译等领域拥有全球领先的核心技术。

    讯飞开放平台运营九年以来  ,已服务超过95万开发者与创业者,覆盖终端23亿,日均交互次数达47亿次。借力讯飞技术,各行业创业团队逐步发展成为国内具有影响力的明星企业,例如滴滴出行、寒武纪、优必选、美团、顺丰、掌阅等。

    2015年,科大讯飞进一步发布了对人工智能产业具有里程碑意义的人机交互界面——AIUI,重新定义了万物互联时代的人机交互标准。

    2017年11月,国家公布首批人工智能开放创新平台,科大讯飞与BAT被排在同一序列,负责承建智能语音方面的开放创新平台。

    从科大讯飞的企业财报来看,其产品也越来越多样化,主营业务涉及到的领域也更多,包括教育教学、智慧城市、政法业务、开放平台及消费者业务、汽车领域、智能服务和其他业务等。

    科大讯飞正式落户西安

    硬科技的西引力

    当前,人工智能正迎来潜力巨大的商业化前景。全球数据统计公司Statista预计,未来10年,全球人工智能市场规模有望保持年均50.7%的增长速度,到2025年,全球市场规模将达369亿美元。

    正如同印度的“班加罗尔”一样,信息时代是跨越工业化鸿沟的桥梁。作为西部重镇、拥有强大科教文化资源的西安,互联网时代曾落后于“成渝”兄弟。

    西安,拥有普通高校63所,有高达七所双一流高校(西安交大、西安电子科大等),每年输出近三十余万的高校毕业生。但是,因为包括产业基础在内的各种因素,许多“孔雀”飞往了京沪深。

    微信图片_20190410113940

    硬科技是西安重塑产业结构的抓手◎DESIGN

    近几年,西安相继通过“硬科技之都”政策定位、“百万校友回长安”等主题活动,大力改善产业环境,腾讯、阿里、华为、中兴、海康威视、京东等知名企业纷纷落户西安或加大投资。

    在这个背景下,西安被“激活”:2017年,科技成果交易额达到809亿,位居副省级城市第一。据《中国人工智能城市发展白皮书》显示,西安凭借科研、政策的优势异军突起,位列榜单12名。

    目前,西安拥有各类科研机构460多个,省部级以上重点实验室、工程技术研究中心216家,两院院士67人,各类专业技术人员近100万人。西安的云计算及大数据产业链条较为完整,聚集的大数据、云计算企业超过200家。其中,云计算中心、研发中心22家,行业应用达150余家。

    为了打造”全球硬科技之都“,西安在发展人工智能上的优势何在?AI时代,将怎样联合各大AI企业缩短差距?

    微信图片_20190410113943

    科大讯飞西安AI+产业加速中心◎DESIGN

    企业,也用脚在投票:2018年科大讯飞决定在西安设立甲级研究院、国家一级人工智能创新中心,西安成为科大讯飞的丝路总部。这次合作采用“3+4+X”模式,用人工智能发起城市“更新迭代”。

    “3+4+X”模式是指:“3”是指科大讯飞将在西安当地设立研究机构、创新创业平台和科大讯飞西安公司三个实体;“4”助力西安在教育等四大领域的人工智能产业应用落地;“X”是指依托科大讯飞国际领先的行业经验,结合西安当地产业生态,持续拓展在汽车、机器人、旅游、人才培养等方向的全面合作。

    其中,讯飞创新创业平台是重要组成部分:科大讯飞双创工作起始于2010年,目前已建成全国规模最大的线上人工智能产业生态云平台。

    这个平台上,聚合了95万支创业者团队,主要指标位列行业第一;在合肥、重庆、天津、苏州等地建设了双创基地和AI+产业加速中心,落地孵化开发者团队和公司六百余家,带动就业2.6万人,实现智能科技产业规模约800亿。

    目前,科大讯飞创新创业平台已培育出优必选、商汤科技、寒武纪、云迹科技、狗尾草智能科技等一批人工智能行业的独角兽和瞪羚企业,估值达上千亿。

    科大讯飞在西安的城市峰会

    一次业界的标志

    众所周知,“硬科技之都”已经成为西安一张新名片。去年,第二届“全球程序员节”和2018西安第二届全球硬科技创新大会已成功举办。

    在这几次重要的会议上,聚集了上百家国内外硬科技领域的诸多知名企业、独角兽企业、大型集团企业、中科院系统、硬科技龙头骨干企业。这些新产业和新经济强化的背后,是西安本身雄厚的科技实力和近两年来巨大的变化。

    作为人工智能行业领军者,此次科大讯飞将在西安举办“2019科大讯飞全球1024开发者节AI城市峰会@西安”,也为西安的硬科技蓝图增色不少。

    微信图片_20190327153303

    科大讯飞1024项目团队,秉持“打开、开放、生态、共享”理念,在2017年发起了业界首个以AI开发者为受众群体的“科大讯飞全球1024开发者节”,已经连续成功举办两届,成为了行业标杆级人工智能全生态盛会。

    为进一步促进西安人工智能产业氛围营造,充分利用科大讯飞全球1024开发者节的品牌资源,延续“AI追光 智缤纷”主题,本次峰会将充分展示讯飞的开放生态资源,共话人工智能发展趋势、人工智能生态建设,以促进人工智能产业在西安的发展壮大。

    除科大讯飞西安研究院院长以及云计算研究院副院长专题演讲外,本次峰会还邀请了优秀AI企业代表,展示与讯飞AI能力合作应用成果,分享新兴产业的发展趋势,他们分别是:

    ▶晓多智能:西安本地公司,深耕自然语言理解领域,与讯飞合作研发语音+文字的客服解决方案。

    ▶小牛翻译:基于三十九年东北大学机器翻译的研究积累,目前支持118种语言到中文互译的机器翻译引擎,荣获钱伟长中文信息处理科学技术一等奖。

    ▶追书神器:移动阅读APP,与科大讯飞合作,在了解用户喜好基础上,选取多款用户喜欢的声音,上线听书的功能和产品,带来能听好看的阅读体验。

    本次峰会,还将聚焦展示双创在西安的最新工作成果,首次介绍未来新双创政策。同时,现场会有五支优秀创业者团队代表(均来自西安团队),分享自己在不同领域的AI应用项目。

    微信图片_20190410113953

    西安高新区◎摄影/堂樾(版权所有)

    这次活动,将于4月13日下午在高新区举行。这两年,全球硬科技大会、全球程序员大会,也将会址设置在高新区。

    如今的高新区,是西安“经济发动机”,也是国家自主创新示范区、陕西自贸区、创新驱动发展引领区、大众创新创业生态区和对外开放合作先行区。无论是华为、中兴,还是三星和海康威视……高新区,已是中国西部最大的科技园区之一。

    这一次,众多人工智能各领域的研究学者、企业家、创业团队将一起面对面交流、互动,也许,不仅仅促动区域发展,更是开启了高新产业的新开端。

    官网报名二维码图

    1024城市峰会 | 当A.I.邂逅古都西安

    A.I.+“硬科技之都”,挖掘创业机遇,解读产业潜力!

    微信图片_20190328145524

    “阅尽千古风流, 独占万世潇洒”说的正是十三朝古都西安的盛世风采。同时,它也是一块不逊色于北上广深的科创宝地。

    西安何以在先进产业占据一席之地?答案是:硬科技

    何为“硬科技”?它们是立足于现实物理的一系列高精尖技术,如人工智能、航空航天、智能制造……这些技术准入门槛高,投资周期长、回报慢;但作为核心能力一旦有所突破,将极大地提高我国科研实力。

    西安最先倡导“硬科技”,也有执其牛耳的自信:西交大、西工大、西北大等100多所高校;光机所、石化院、西微所等1000多家科研院所,为西安提供了得天独厚的优势。

    人才、技术与政策支持,带来西安“硬科技”产业的丰硕成果,2018年5月发射的鹊桥号卫星,其测控、中继通信及天线分系统由西安分院研制,达到了100%的部件级产品国产化,完全实现自主可控。

    timg (1)

    截至2018年底,西安市有国家级高新技术企业1839家,科技小巨人企业1355家。2019年更有望达到众创空间、科技企业孵化器超过2500家,科技小巨人企业1980家的成绩。而作为“硬科技”的重要组成部分,A.I.技术“新鲜血液”的加入,将为古都带来更多的活力。

    这也意味着,西安的广阔天地正等待着每一位科技从业者大展拳脚。古城结缘A.I.。一场文化与科技,传统与前沿的交错碰撞正当时!

    4月13日

    2019科大讯飞全球1024开发者节

    A.I.城市峰会@西安

    邀你共赴古城,解读A.I.“西引力”

    秉承“开放·合作·生态·共享”理念,科大讯飞全球1024开发者节走进“硬科技之都”西安,邀请全国人工智能领域的产学研三方大咖,解读城市科创潜力,挖掘创新创业机遇。

    微信图片_20190327210402

    本次1024开发者节A.I.城市峰会带来8大主题,围绕以下热点展开交流——

    全球A.I.下一世代发展热点;

    语音合成技术声形同步的技术关键;

    突破瓶颈,机器翻译如何实现全球无障碍交流?

    何为真正智联万物的AIoT?

    科大讯飞及西安如何加速创业团队应用落地?

    A.I.科创企业的自身经验分享;

    ……

    通过8个主题,1024开发者节A.I.城市峰会将充分展示西安“硬科技之都”产业成果及讯飞的开放生态资源,共话人工智能发展趋势和生态建设。

    微信图片_20190327180838

    西安当前“硬科技”实力几何?

    古城未来A.I.发展机遇聚焦何处?

    谋定而后动,成功离不开对环境的精准洞察。

    本次1024开发者节A.I.城市峰会邀请来自西安讯飞研究院、东北大学信息学院等机构、院校的专家学者。深度剖析西安科创背景下A.I.前沿成果及应用。

    以语音合成为例,1024开发者节A.I.城市峰会为开发者们解读讯飞西安研究院与西北工业大学在音频信号处理方面的合作研究,基于研究成果优化的语音合成技术,不仅比单纯的语音合成具备更强的交互性,更能实现人物的口唇与声音精准同步

    立足西安科技产业发展现状,1024开发者节A.I.城市峰会将与大家探索本土人工智能的最新技术成果,分享下一世代西安AI创新创业的关键风口。

    微信图片_20190327191716

    西安推进科技企业创新发展的路上,也有科大讯飞的积极参与。

    科大讯飞在西安建立A.I.+产业加速中心,作为西安市、西安高新区政府与科大讯飞共同打造的“3+4+X”战略合作模式的重要组成部分,旨在打造人工智能方向的创新创业平台,吸引更多优质开发者团队落地西安。

    本次1024开发者节A.I.城市峰会将为大家解读“3+4+X”模式及双创扶持政策,阐述它们如何成就行业“黑马”。同时邀请人工智能领域企业代表,从自身经历出发,分享如何融入A.I.科技生态,洞悉客户需求的经验与观点。

    创意集市环节,5位西安A.I.创意分享人将分别用5分钟向大家展示创意理念和产品故事。关于人工智能在生活场景中的落地,他们的创新从不停歇。

    我们诚邀您参加科大讯飞全球1024开发者节A.I.城市峰会@西安,古都的未来图景将在您眼前逐一揭晓。

    扫下方二维码,前往官网报名

    更有机会获得开发者晚宴邀请函,

    与A.I.专家面对面交流

    微信图片_20190326175755

     

    把你的脸,换到杨幂的电影里——AI换脸术是如何做到天衣无缝的?
    前段时间,一个叫做“将朱茵的黄蓉换成杨幂的脸”的热门话题在微博上爆火。原以为又是一波P图热潮引发的粉丝狂欢,没想到小智在浏览具体内容之后发现:这次换脸的形式不是图片,而是视频——一位B站UP主用AI技术,将杨幂的脸“贴”在了朱茵饰演的黄蓉脸上。

     

    uui哦哦偶iu偶i哦偶

    说实话,看到视频和gif的小智真的被惊到了。

    一方面,大幂幂的颜+朱茵的演技,这真的是神仙搭配呀!

    另一方面,不同于传统观念里恶搞视频的“五毛特效”,这次的特效视频根本看不出P图痕迹,真实得宛如原作。

     

    timg (41) 这到底是什么神奇操作?又运用了什么样的智能技术?小智立刻展开了调查。

    Deepfake技术

    原来,这种神奇的换脸效果使用的是一种叫做Deepfake的人工智能技术。

     什么是Deepfake?

    Deepfake一词由“Deep learning”(深度学习)和“Fake”(假)组成,其含义是在图像或视频中把一个人的脸替换成另一个人的脸。这项技术的出现可以说是人脸交换技术的一个重要突破。

     

    iu偶偶

    几年前的Deepfake技术并没有像现在这样广泛的获取渠道,技术门槛也比较高。后来,有人推出了Windows程序FakeApp,即使是对人工智能或是对视频剪辑一窍不通的外行,只需要一个GPU和一些训练数据,再通过按部就班的操作也能制作出换脸视频。同时,Deepfake在GitHub 上也已经开源,这一系列的变化都大大降低了Deepfake的获取门槛。

     技术原理 

    从技术角度而言,Deepfake是深度图像生成模型的一次成功应用。

    在模型训练期间,先把目标人物A的脸抠出来,定位好A的五官位置,训练出一个“无论怎么扭曲和变化A的脸,最后都能生成正常的A脸”的网络。

    1525415097914

    网络训练好后,我们再向其中输入B的脸。此时,在神经网络的逻辑看来,B的脸就是“以某种方式扭曲的A的脸”,需要它来进行“纠正”。并且数据越多,效果越好。

     操作流程 

    在FakeApp上的具体的操作大体分为3个步骤:原始数据集获取,模型训练,视频生成。

    首先,我们需要一个包含Nvidia GPU的个人电脑,至少4GB的存储空间。至于训练神经网络所需的材料,用户则需要提供至少几百张照片或者时长足够的视频,以便FakeApp从视频中提取所有帧。然后调整合适的参数,就可以开始训练了。

    142734114377

    在训练过程中,FakeApp会显示一个分数,数值越大则表示训练结果的偏差越大。当这个值低于0.02时效果通常就OK了,此时可以停止训练程序。这一过程需要的总时长从十几到几十小时不等。

    最后选择上面训练好的模型和需要的换脸视频,再设置合适的帧率,就可以得到一段自制Deepfake视频。

     关键机制 

    其实AI换脸也不算是新鲜事,不过早期的换脸效果确实差强人意。

     

    9

    那使用Deepfake生成的人脸为何如此逼真?这很大程度上归功于一种叫做GAN(生成式对抗网络)的关键机制。

    在GAN中有两个机器学习模型,一个扮演“造假者”,在数据集上训练后生成假视频;另一个则扮演“检测者”,不断地检测这些假视频,一直到它再也不能检测出结果是假的。

    此外,用于训练的数据集越大,做出的Deepfake视频越真实。这也是为什么我们看到的Deepfake视频中出现的人物几乎都是著名的政客和明星——他们有太多的公开视频素材可供训练了。

     

    全网热议

    AI换脸的话题引发了众多网友的热议。吃瓜群众们表示,这下“P图宝贝”们可以名正言顺地换脸,假装自己在演戏了。

    obytb2w0r8erhbxk!1200

    还有群众表示,“最强狗仔”卓伟就要失业了,以后明星的八卦视频都可以直接甩锅给“恶意换脸”,再也不用承认了。

    对于影视从业者来说,这也是个好消息。因为以现在的技术,一些大型数字特效公司想要将一位演员的面容“移植”到另一个身体上,至少需要几个月的时间。特效公司工业光魔的首席运营官约翰·诺尔表示,如果这项技术能达到令人满意的视觉效果,同时能大幅度提高制作效率、节省成本,那他们会很乐于尝试。

    timg (44)

    当然,也有不少网友对这一技术表示了担忧

    mfupxgxgqh3jc216!1200

    142734534984

    同样感到担忧的还有政界人物。美国总统大选佛罗里达州候选人卢比奥曾表示:过去想要威胁美国,可能需要航母、核武器,还有洲际导弹。现在只需要登录互联网系统、银行系统、电网,甚至只要弄出一段足以以假乱真的虚假视频搞乱选举,就足以让美国陷入内乱。

    莫慌,造假有破绽

    这些担忧不无道理。

    你永远不知道最厉害的技术会落到什么人的手里,况且这还是已经开源了的技术。

    为了防范Deepfake背后的社会安全隐患,纽约大学的研究人员研究后发现:在Deepfake生成的虚假视频中,人物的头部动作和瞳孔颜色通常会很怪异,并且几乎不怎么眨眼。这成了目前Deepfake无法逃脱的bug。

     

    o4YBAFuMhOiAcLjCAAFJxweSysg444

    观察原视频和造假视频对应的关键帧,可以看出,假脸人物在原视频的眨眼处并没有眨眼。

    据了解,这一bug并非来自算法本身的问题,而是它使用的数据集。

    当训练深层神经网络时,我们使用的是来自网络的静态图像。即便是像尼古拉斯·凯奇这样的公众人物,他的大多数照片也都是睁着眼睛的,一般很少有人会有大量的闭眼照。既然数据集中几乎没有眨眼图像,那么Deepfake就无法“学会眨眼”,或者眨眼的时长和频率都远小于正常人。

    这样的进展,可以算是“魔高一尺,道高一丈”了。

     

    timg (42)

     

    科技时代,“技术造假”和“技术打假”必会进行旷日持久的战争。在鼓励研究人员找出“打假”方法的同时,小智觉得,我们还需要呼吁停止滥用技术以及传播相应的恶性作品。

    毕竟,科技的发展不仅需要顶尖科学家们的努力攻克,还需要芸芸大众的共同维护。

    2019创业江湖:人工智能与颠覆式创新!

    好事!新一轮的创业形态,正在冲出思维禁锢以一种更扎实的形态存活。

    2018年,所有互联网人尤其是创投圈深刻体验到“资本寒冬”带来的严峻考验。有媒体表示:2018,水大鱼大的移动互联网创业黄金10年,就此画上了句点。无论如何,大家很难再看到指数型爆发式的增长,创业和投资的门槛将比过去高得多。

    好事!新一轮的创业形态,正在冲出思维禁锢以一种更扎实的形态存活。

    没人再追逐风口,而是更加重视自身产品和细分领域的深度结合。从过去的粗犷式割据战场转而精细化行业落地应用,这是属于2019创业版块的转变

    就在昨天结束的讯飞AI星火营·北京站活动中,来自AI创业领域的9家团队带来了精彩路演。并探讨了在各自细分领域,诸如:物流、心理健康、智慧出行、在线教育在内的垂直应用产品的价值。踏实,是主旋律。

    颠覆式创新需要的不止是孤胆前行

    创业维艰,作为创业者所需要的除了一身孤胆,更重要的是具有颠覆式创新的前瞻性及生态发展视角。用人工智能技术赋能传统产业,将是这一契机的扭点。科大讯飞副总裁兼消费者事业群副总裁李传刚在活动现场带来《人工智能与颠覆式创新》专题分享。

    373a02a46e9805c21d17499808b04cec

    科大讯飞副总裁兼消费者事业群副总裁李传刚

    “技术革新与消费升级双轮驱动,将出现颠覆式创新机会”,李传刚与在场的创业者、投资人分享观点。新生代消费升级是众所周知的社会背景,针对新生代人群及催生出的消费需求,创业者本身的应变而为显得尤其重要。“以记者使用的记录工具为例,1935—1998年,磁带录音机占据主要市场,但1999年之后就被数码录音笔取而代之,到现今的讯飞AI智能录音笔能够实时根据场景进行语音转文字。所有的改变,都是应对消费升级的变革。”李传刚如是说。

    15105ca132a9c75a733350ac24fd1fbb讯飞AI智能录音笔

    的确,传统产业追求效率最大化,选择与人工智能技术的结合将会真正带来颠覆式创新。李传刚在现场也和创业者分享了自己的三次创业经历,“对于初次创业者来说,死亡率高达98%,所以我的建议是首次创业者可以进行模仿式创新。”“颠覆不一定要从头来,可以实实在在重塑价值。”

    精于专业,垂直深耕,9家路演团队精彩回顾

    1、AI+心理健康

    生活中的各种巨大压力,让减压、缓解抑郁成为了大众的迫切需求。

    阿尔法心理CEO姜巍在项目分享中,介绍AI通过自然语言理解和深度学习,从与患者的沟通中,分析患者行为反馈数据,结合人工情感支持,帮助每一位抑郁症患者找到最适合的治疗计划。为大众提供透明、快速、有效的心理新消费服务。

    84278d9a9a22b1d58bcf9839b67aaf80

    阿尔法心理CEO姜巍

    2、AI+大规模数据标定

    AI新需求不断出现,数据量爆发,泛AI公司、大数据公司需要在极短时间内对海量数据进行精准、快速、高质量的标定,但数据规模大、采集耗时一直是很多公司的难题。莫比嗨客创始人刘端阳在项目分享中,指出基于众包的理念、博弈的流程和AI 2.0时代的代表技术——群体智能算法,可以实现准确、高效、安全的数据采集+标注+清洗工作。

    c49e2ec2be04d003542cea65a6502a98

    莫比嗨客创始人刘端阳

    3、AI+语音交互应用开发

    语音交互正在衍生出更多的应用玩法,基于此产生的内容形式也受到越来越多人的推崇。

    Sugar voice(糖声)的创始人毛川提到,糖声平台的目标是搭建适用于语音交互的跨AI系统的内容生产平台,方便开发者、内容创作者一键部署。

    通过GUI模板快速生成VUI技能,技能部署后会生成测试报告,体验报告,方便硬件开发者和平台方、硬件厂商合作。

    584d6d9a27b8282d3156bfd1882c8426

    Sugar voice(糖声)创始人毛川

    4、AI+儿童成长辅导

    “据保守估计,中国存在情绪障碍的儿童超过1.5亿”,云智心联合创始人李鑫在演讲开始展示了这组数据。他提出,关注儿童的心理状况,脑科学和人工智能也能起到巨大作用。

    通过人工智能的最新技术,结合最前沿的交互技术、音频、图像和视频识别技术等,进一步实现自然情境下的儿童发展观察和评价,在为儿童提供优秀的智能陪伴机器人的同时,帮助父母更便捷有效获知儿童的发展情况。并为父母提供基于儿童发展情况的个性化教育服务和产品推荐方案。

    bceefb4e12d5240c9bd4f6400e2b1f38

    景云智心联合创始人李鑫

    5、AI+车载智能支架

    让行车变得更加安全,是驾驶体验重要的一环,而如何保证行车时,使用手机等数码设备的安全性,更是其中最受关注的一项。

    小飞智驾董事长王石磊在项目中提出,小飞语音支架是首款搭载科大讯飞iFLYOS平台的智能语音支架。拥有光感手控,全语音操控,单麦降噪等优点。

    通过打造智能车载“副驾”,驾驶员通过语音就可以导航、听歌、打电话、闲聊等。既满足驾驶者的硬件需求、娱乐需求、信息服务需求,同时保护驾驶者的行车驾驶安全。

    ea6c35b59e13ceb571ada8458c496f8d

    小飞智驾董事长王石磊

    6、AI+外语学习
    在语言学习上,越来越多人抛弃死记硬背模式,偏爱看电影学习等方式,而这正体现出沉浸式的场景化学习具有的可能性。cookie langs中国区总经理宋瑶晖在项目分享中指出,Cookie Langs 提供AI外语学习及娱乐APP,实现用户与最爱的好莱坞、中国及韩国明星、迪士尼等动画人物互动交谈。目前,该公司拥有5000部以上好莱坞电影的免费使用权,带有索引的电影明星AI视频库,拥有亚洲人气最高的电视节目使用权。通过AI技术,实现的交互式外语电影,在学习时具有价格远低于外教或课外班、具有感染力、支持碎片化学习等优点。通过AI语音识别技术,实现智能对话交互,可互动性学习。

    2d72c2ad6b9a09addcb65122822837a1

    cookie langs中国区总经理宋瑶晖

    7、AI+物流供应链服务
    物流业的低行业门槛,市场主体多,企业生命周期短,资金财务困难多等问题,带来了揽货信息不对称、交易价格不透明、物流管理不规范、服务评价不公开等痛点。得利供应链CIO杨旭阳在项目中提到得利以供应链物流自主交易SAAS平台为基础,通过优化物流环节,为物流企业和发货方搭建报价、交易、结算、评价排名、运力金融和货源金融服务平台。采用“信息共享+平台授信”的方式,得利供应链推动物流企业进入平台,通过辐射效应扩大客户群体规模构建供应链金融服务生态圈。

    35a6e47fa7bf65d362b1d7c4fc2b53a4

    得利供应链CIO杨旭阳

    8、AI+智能家居整装
    如今智能家居正成为常态,但也在全屋装修时产生了用户体验差、售后及运营服务成本高、定制服务能力差等问题。华迪物联创始人赵晓江在分享中介绍,华迪致力于为装修公司打造产品丰富稳定、运维简单快捷的全屋智能系统及产品服务平台。公司以产品-云服务-终端应用的全链路产品和技术为支撑,为智能家庭提供完美体验,集中打造智能空气净化、智能安防、智能控制、智能照明、智能关护等智能系统和配套产品,让用户轻松享受华迪智能产品的互联互通、智能联动,给用户创造更简单、更舒适的家居生活环境。

    2ef6e682f7db80c6cbf33050dd222911

    华迪物联创始人赵晓江

    9、AI+产品营销
    随着消费水平提升,如今的买买买氛围愈发浓烈,产品也层出不穷竞争激烈,如何提高产品的露出度和购买率,从而影响消费者的购买决策?混实科技CEO金文枫介绍说,行业+AI 是混实团队践行的战略方向。混实科技团队以行业需求为切入点,利用AI的部分模块提升终端促销员的销售能力,获取用户行为数据,提升消费者在终端的关注度,混实科技团队具有深厚的营销服务背景和对本行业的洞察,创造可以解决实际问题的AI应用产品。

    b37b12a313b7e4ded2c3752c26e84a06

    混实科技CEO金文枫


    最终,2019年讯飞AI星火营·北京站,莫比嗨客、Cookie langs、小飞智驾3支团队分别获得最具产业价值奖、最具创意创新奖、最具商业价值奖。

    5b2ab3166b1adff9cf5262e755bbb9d6

    集体合影

    2019年第一场AI星火营告一段落,但属于创业者的故事还在继续。对所有创业者来说,寒夜里终须自己点燃灯火,踏实前行,终会换来时代的进步。

      讯飞生态平台

    科大讯飞打造的“创业投资孵化平台”

      目标:汇聚人工智能精英团队,创造一个AI领域资源共享、开放共赢的产业生  态。

      服务:为团队提供技术支持、资本对接、创业指导、产业扶持、品牌背书等优 质创业生态资源,助力创业团队快速成长。

    加入科大讯飞AI生态创孵团队,开启你的创业新征程!

    联系邮箱:startup@iflytek.com

    WechatIMG1117
    2019-03-21 ~ 2019-03-21科大讯飞北京公司
    折叠屏手机:真创新or伪需求?

    2019,折叠屏手机元年

    刚刚过去的2018年可以说是智能手机“凹造型”的一年。

    从刘海屏、全面屏、双屏,到升降式摄像头、内置摄像头,出现了一众毁誉参半的“伪改进”。

    微信图片_20190312090725

    水滴屏和刘海屏

    相对于这些小打小闹,真正算得上突破的除了“5G”这一超级热点,还有一个就要属“折叠屏手机”了。

    除了外形上的巨大改变,折叠屏手机还带来了交互方式的革命性创新。这为当下全面屏同质化严重的手机市场,带来了新的曙光。

    折叠屏之战

    2018年10月31日,柔宇科技在北京国家会议中心举办2018全球新品发布会,正式发售可折叠柔性屏手机——FlexPai(柔派)。这也是全球首款折叠屏手机。

    微信图片_20190312090939

    柔派展开时是7.8英寸的Pad大小,折叠起来则与普通手机一般大。官方称,屏幕可以承受20万次的折叠——也就是如果每天折100次,共可以使用6年

    不过美中不足的是,它并不能实现完全平坦的折叠,折叠处的硅橡胶会堆起来,使得手机有不小的厚度。此外,折叠处的屏幕显示还容易产生眩光。

    微信图片_20190312091029

    柔派中间折叠处

    功能方面,柔派支持自定义分屏,可任意调整视频、聊天窗口的占屏幕面积,实现多窗口同步工作,避免因为看视频、刷微博而错过重要消息。

    而对于爱玩游戏的用户来说就更加方便了,在折叠状态下有来电、信息或通知时,侧曲屏上会流动出现防打扰泡泡,用户可及时在侧曲屏上处理或者忽略,不会打扰主屏上的游戏操作。

    微信图片_20190312091758

    侧曲屏上会显示消息提醒

    此外,拍照功能可以说是折叠屏手机优越性的集中体现。因为可折叠,所以手机装备一个摄像头就可以了。正过来是自拍,转过去就变成了外拍。而且柔派在折叠状态下采用镜像拍照,也就是正反两面同时显示取景画面,用户被拍时也可以“自导自演”,实时看到并调整自己的表情动作,可以说是“不管谁拍,都是自拍”。

    可以看出,虽然技术尚未成熟,折叠屏相对于传统屏还是在很多方面有着质上的优异性。再加上极其可观的市场前景,近年来各大厂商都一直在折叠屏手机的研发上你追我赶。

    三 星

    三星在柔性屏上的技术耕耘一直是有目共睹的。2018年11月,三星在 SDC 开发者大会上展示了“Infinity Flex Display”折叠屏幕方案。

    a3720b1c13f44afa924cf65e25827fc0

    三星折叠屏手机现场演示

    在演示中我们看到,平板大小的屏幕向内折叠后,外部变成了一块小屏幕。“正反皆屏幕”的思路省去了用户翻转手机的操作,跳出了大多数手机厂商在全面屏逻辑上的思维定势。

    而在软件层面,三星也拿出了适应折叠屏的全新系统UI——One UI。软硬件都做好了准备,看来是真的要“走心”了。

    华 为

    今年的2月1日,华为在 Twitter 公布了 5G 折叠屏手机邀请函,预告将在2月24日的 MWC 大会上发布首款折叠屏手机。据相关人士透漏,华为折叠屏手机采用的是 BOE 京东方制造的柔性屏。

    微信图片_20190312093257

    小 米

    今年1月,小米联合创始人、总裁林斌在微博上展示了一段小米双折叠手机的上手视频。

    不同于一般的单次折叠,这款手机采用的是两侧外向折叠的方式。展开状态下像是一款平板电脑,折叠后则是正常手机大小,左右边缘皆为屏幕,被折叠部分则只呈现背景色。

    小米折叠手机效果渲染图

    真创新?伪需求?

    为什么各大厂商都在争先恐后地开发折叠屏手机呢,这会不会又是一个概念性的噱头?

    我们都知道,手机最开始只是用来打电话、发短信的,而随着智能机的诞生手机功能越发丰富,无论是阅读、工作,还是看电影、玩游戏,更大的屏幕显然能带来更好的体验。这就是为什么在一段时间里,所有的手机都在做得越来越大,就连一向“顽固”的苹果也顺应了这一趋势。

    微信图片_20190312094035

    越来越大的苹果手机

    但手机的尺寸显然是不可能无限制变大的,否则就与平板电脑无异了。于是商家又开始在占屏比上下功夫,出现了各种曲面屏、全面屏手机。至此手机屏幕尺寸已达极限,这才促生了折叠屏的诞生。

    当前状况下,折叠屏手机基本是唯一的选择。

    就像当年的按键机变为触屏机一样,倘若折叠屏手机真的能攻破各种难点,进入实用阶段,必将又会掀起手机市场上新的革命。

    完美折叠,没那么简单

    虽然已有成型的产品,但事实上,折叠屏手机在普及和量产上还面临很多问题,主要来自以下方面:
    材料

    可折叠屏需要采用的OLED面板。在今年的CES上LG展示了可折叠的电视,但是离量产还有一定距离。

    微信图片_20190312094318

    OLED面板

    除了面板,还有很多手机内部的零部件能否跟着一起折叠也是一大难题。三星的工程师曾表示,晶体管是显示器架构中最薄弱的环节,负责为单个像素供电的组件尚不足以抵御频繁折叠。

    体积

    因为采用了两款折叠的屏幕,要分别布置显示面板元器件,手机体积和重量都会不可避免地增加,折叠时的厚度问题也是一个需要解决的问题。

    续航

    智能手机最耗电的部分就是屏幕,约占手机总耗电量的50%。折叠屏手机的屏幕用电量至少是原来的2倍,再加上支持多应用同屏操作,手机的续航时长实在堪忧。

    应用适配

    手机操作模式的变更,势必会带来应用适配的问题。目前,绝大多数App都没有针对折叠手机的解决方案,只能等待开售后提高市场份额来推动开发者进行研发,这将是一个曲折又漫长的过程。

    d27abb94b00f4c2488a3789a0ee6308d

    安卓系统刚刚踏上折叠屏手机系统研发的长征

    未来手机趋势

    eSIM卡取代SIM卡

    eSIM 是指嵌入式 SIM 卡,本质上还是一张 SIM 卡,不过是直接嵌在手机内部的电路板上。eSIM 支持通过空中写卡,可以远程配置 SIM 卡,实现运营商配置文件的下载、安装、激活及删除,省去了去营业厅办业务的繁琐。

    目前三大运营商都已经开始了 eSIM 卡的试点,部分城市已经可以使用,在 5G 的推动之下应该会更迅速地普及。

    无线无孔

    Less is more.设计越简洁,使用越方便。

    苹果推出无线耳机之初被吐槽太丑,现在却被证实是又一个“真香”现场。此外,无线充电设备也已经在市场上出现很久了。

    微信图片_20190312095552

    支持多设备同时充电的无线充电器

    至于扬声器孔,不少厂家采用了屏幕发声,这项技术相对来说还是比较成熟的。

    金属机身将被淘汰

    4G 时代,大部分手机只要 4 根天线就可以收发信号;而 5G 时代的天线数量会增加到 64/128/256 根。如此多的天线,手机中框是无法装下的,所以会放到机身里面。而金属机身会屏蔽信号,所以后盖的材料会普遍使用玻璃或者塑料。

    生物特征识别的普及

    密码解锁和手势解锁将渐渐退出舞台,取而代之的是指纹和面部解锁。例如三星在2018年10月公布了全屏幕指纹解锁的专利,比固定区域解锁更加方便。

    微信图片_20190312095843

    不限区域的全屏幕指纹解锁技术

    iPhone的人脸解锁为标杆,安卓机也正在人脸解锁的道路上愈发精进。拿起手机瞬间解锁,必然是最便捷的趋势。

    AI技术赋能

    在高性能处理器的支持下,目前很多手机都已经在高端机中实现了智能场景加入,为用户提供更加智能的手机设备。未来各大手机生产商对AI的研究与投入必然会更加注重。

    qrcode_for_gh_1985e8ed98e0_1280

     

    曾经不俗的苹果,如今正在流于平庸

    虚高的价格,并不是苹果销量下跌的唯一原因。

    大厂在新品发售前“泄露”出谍照,已经是一项传统了,苹果也不例外。

    不出所料,疑似iPhone的2019年新机渲染图已经被外媒曝光,紧跟着就是关于性能的预测与评估,什么简约边框经典大屏啊,前置摄像头升级更高像素啊,搭载5G芯片啊……但看着这些,小智只是眼泪在肚子里打转,反正是笑不出来。

    timg

    曾经卓越的苹果,如今正在流于平庸。

    一、从创新到小修小补

    把视线转回12年前,07年的发布会上,当第一代iPhone展现在世人眼前时,无异于工业文明突然降临在了石器时代。那时同期的手机还大多是这样的:

    • 按键操作;
    • 翻盖/滑盖/板砖造型;
    • 小屏幕,像素低,分辨率低,多媒体功能差。

    50cba28973308a024ef5047886639f08_hd

    而iPhone则告诉我们,手机可以:

    • 几乎占据一面的屏幕;
    • 电容屏、多点触控、重力感应交互;
    • 同期领先的分辨率和像素;
    • 更宽更薄的机身。

    timg (2)

    初代iPhone就像一个里程碑,决定了接下来是几年的智能手机设计方向——大屏幕、触屏交互、更薄更轻、摄影性能高、视频更高清……

    在震撼了手机界后,接下来的几年可以说都是iPhone的优势期,彼时其它手机厂商刚受到冲击开始起步追赶,而苹果则乘胜追击,始终占据着天花板。从iPhone 3G到iPhone 6S,手机圈同行看了只能说“我靠,原来这里可以这样玩。”

    微信截图_20190125171640

    但是从iPhone 7开始,苹果开始疲了。那几年的发布会,新品亮点中你能反复看到:

     

    上一代分辨率高吧?这次我们又把分辨率弄得更高了!

    大屏用的爽不爽?这次我们又推出了更大的屏!

    觉得可选颜色少了?这次我们推出了新的颜色!

    有线耳机不方便?我们推出无线耳机,只是用的时候不能充电!

     

    有的人会反驳:处理器升级了啊,芯片更新换代了啊

    但这些对一个新手机来说,不是理所应当的吗?

    用户更关注的,是这款新手机能否为自己带来完全不同的使用体验。

     

    G1546952400407

    再看这次对iPhone新机型的预测:简约边框等于是对之前工业设计风格的回归,而搭载5G芯片,在19年的5G大趋势下,并不独树一帜。

    从曾经的惊艳到如今的平淡,在创新上没有给粉丝们带来更多“盼头”的苹果,正在消耗大众的期待。

    哦差点忘了,其实发布会还是有一个新晋看点的,那就是:

    这次还能贵到什么地步?

    二、1万售价背后的困局

    一个手机卖1万多,你还会不假思索地掏腰包吗?

    与减速的创新相比,iPhone的价格提升简直可以用火箭来形容,我还记得自己当初入手SE时是4000多,如今再看XS MAX那突破五位数的价格,只让人感慨沧海桑田。

    timg (8)

    涨价没有错,企业的最终目的是盈利,逐步提高iPhone的平均售价是苹果实现利润增长的方式,而且当iPhone做得最好,卖得理应更贵,这也是消费者可以接受的。

    当iPhone看起来没有好到“印象深刻”时,再把价格狂抬那么高,又是在下哪步棋呢?

    小智认为,在不断的涨价策略背后,苹果已经陷入了一种困局,其中包含着以下影响因素——

    1.为了满足需求不断提升性能,带来零部件成本提升

    虽然前文中我们提到iPhone的革命性创新减少,但至少每一代的性能仍在提升,而为了带来更快的运行速度及处理能力,就要使用新的芯片等零部件,而这都会带来制造成本的巨大增加,也带来了一台新iPhone的售价的巨大增加。

    2.为了减小成本,对供应链获利加大管控+自研

    曾经苹果与供应链有着深度且和谐的合作,苹果提出设计与生产需求,对应的供应商参与并完成。苹果从供应商那里拿到第一手的技术与优惠价,也会给供应商可观的利润。

    timg (3)

    但随着生产成本的提升,苹果开始对供应链的价格愈发敏感,除了对供应链压价,苹果还开始通过强大的自研能力,逐渐摆脱对各供应链技术的依赖。这导致与供应商间的裂痕不断加深。

    3.老机型卖不出好价钱

    性能仍然优秀,价格相对较低的老机型虽然拥有巨大的市场,但它们更多是负责增加销售量,并进一步打开全球中低消费水平市场,不仅无法涨价,相反还不断降低价格到收不回成本。如在印度的iPhone 6S只卖1888元。

    这些因素导致了以下结果:

    1.新机型卖不出去,消费者选择其它手机品牌

    价格不断增高,超出消费者承受范围,除了少部分忠实的“土豪”果粉和科技研究者会掏腰包外,新的iPhone销量远远不达标。更多的消费者转而选择性能同样能满足需求,价格更低的其它品牌手机。

    2.供应商转而与其它品牌手机合作,苹果创新优势被缩小

    被“伤害”的供应商也开始与其它的手机厂商合作,有些手机厂商曾经只能跟在苹果之后与供应商沟通,生产出与iPhone相近的手机,而现在则可以通过合作实现不同的创新和技术飞跃,并且将吸引更多被高价iPhone吓跑的消费者,这对创新力度减缓的苹果来说无异于形成了巨大压力。

    综上,苹果最终形成的局面如下:

    1.成本提高——价格提高——消费者选择其它手机——销量盈利双低;

    2.控制成本——供应链压价——供应商流如其它手机——创新优势减小。

    目前来看,价格策略的恶果已经体现,2018年的Q4财报发布时,苹果宣布2019的财报将不再公布最新的销量数据,CEO库克也致信投资者,提前降低他们的预期。之后苹果股价大跌8%

    虽然库克表示业绩不佳的原因有“经济减速,特别是在大中华地区”,但在笔者眼中,狂飙的价格配上不够格的创新,还要面临与其它手机大厂间日益缩小的差距。不得不说苹果是——

    正在打烂原来的一手好牌。

    三、iPhone还能再火起来吗?

    小智并不是专业人士,但就目前来看,苹果仍然有很多机会。

    首先是iOS系统仍然充满魅力,与系统性能随着时间推移会经常出现出现运行卡、应用打不开、闪退等问题的安卓(Android)相比,iOS对多应用,多进程管理更加优秀,通过“墓碑机制”冻结非正在运行的程序并随时解冻,保证了进程不占用内存,让运行更加流畅;同时由于苹果的权限管理,iOS系统相对封闭,虽然无法像安卓那样高度自定义,但也保证了隐私安全。

    timg (4)

    所以,苹果继续优化iOS系统,并在过程中不断提升体验,iPhone就还会吸引许多喜欢高性能手机,更换周期长并且注意个人安全的消费者。

    另外,随着技术独立取得进展,未来iPhone的生产成本有望得到一定程度的降低,比如近期关注度超高的高通起诉苹果,要求禁售iPhone的诉讼,就是作为技术供应方的高通,认为苹果在使用技术时没有支付费用,但苹果则提到在新的iOS系统中已经规避了这些技术。所以,不让技术被别家掌控而徒增成本,或许将是苹果下一阶段的方向(当然还要保证不被禁售)。

    timg (5)

    当然,对于目前的苹果来说,首先要做的是不让粉丝被价格吓跑。

    近日苹果已经开始采用灵活的“补救”措施:包括iPhone XS Max在内的多种机型价格已经下调,降幅最高达到450 元;价格调整后的iPhone XR国行版在电商平台的最低价已到5000多元。


    说了这么多,回到开头对苹果的评价,以上的几点,对于如何让苹果重新拾起“行业搅局者,技术创新者”的荣光,显然远远不够。

    “产品线从未这么好,生态系统从未这么强,服务业务非常成功。”对于未来,库克则充满信心,而小智也愿意期待一下苹果的厚积薄发。

    当然,如果你要小智给下一代iPhone的创新提出点看法,那只能说:

    至少要做到这种程度吧(笑)——

    timg (11)

     

    30亿人次大迁徙:春运40年,细数被AI改变的回家路

    关于春运,每一辈人都有自己的记忆点,父辈们记得载着希望回家的绿皮火车,我们记得黄牛党抢票的手速,但这些记忆点近几年正悄然发生变化。

    不知从何时起买票开启了图形验证码,进站不再需要票和证,而是对着机器“刷下脸”,出行之前手机会推送拥堵路段的提醒……

    这些变化让回家的路变得不像以前那么艰难,也将一个悲情的春运时代逐渐带离我们的记忆。

    25995fd7645541b782a45ccc24303570

     

    1、「智能防抢票」:从被黄牛抢光票,到黄牛抢不到票

    被黄牛党抢光票的阴影,笼罩在我们头上很多年了。

    可怕的不是他们抢光票转身高价卖给我们,而是抢了票还要卖假票给我们。

    微信图片_20190130093319

    电影《人在囧途》中徐峥就在黄牛处买到了假票。

    为防止黄牛用机器刷票囤票,12306官网与第三方抢票平台利用人工智能及大数据等设置图形验证码。

    d8f9369ae92749828871166457e145be

    曾经让我们哭笑不得的图形验证码,也让黄牛党的抢票机器“哭笑不得”。

    图形验证码是随每日热门线路的出现而动态出现。当某一条线路非常热门时,为了减轻瞬时购票压力,图形验证码会随机出现;如果是非热门路线,旅客可直接购票,不会出现图形码验证,极大提高我们购票的效率。

    同时,为了防止黄牛党用专业化的工具来攻破图形验证码的防护,目前已经研发出一些AI的技术,不依赖于图形验证码本身,而是通过建模识别图形验证码的过程和行为,来判断是机器编程识别的过程,还是普通人识别的过程

    从被黄牛抢光票到黄牛抢不到票,时间算起来也不过是短短几年,但改变带来的幸福感却是巨大的。

    2、「刷脸进站」:从靠票回家到靠脸回家

    没想到,有一天回家也要靠脸。

    以前放假回家的时候,总是习惯性的去检查下车票是否带好,而近两年这种习惯正在被逐渐淡忘。

    在相应购票平台完成购票之后,查询到列车时刻、检票口、停靠站台等信息,找到站内自助实名制核验闸机,将二代身份证放在闸机的相应位置,摄像头会采集我们的人脸信息,并与身份证芯片里的照片进行对比分析。如果信息一致的话,闸机便会打开,让我们快速通过进站,整个过程大约只有3—4秒的时间。

    640 (1)

    值得一提的是,相对于人工查验,人脸识别不仅能够加快进站效率,减少我们在寒风中等待验票的时间。

    同时,基于大数据、云计算等技术,机器识别可实时对比身份证照片和人脸以此迅速判断是否是本人以及是否是在逃嫌犯,提升安防等级

    妈妈再也不用担心有人来偷我的手机了,毕竟他们被「人脸识别」挡在外面进不来。

    640 (2)

    3、「互联网订餐」:从瓜子花生八宝粥,到汉堡薯条啤酒鸭

    啤酒饮料矿泉水,花生瓜子八宝粥。

    “在火车上吃什么”这个问题曾困扰了我们很长一段时间,味道不好且价格贵的车餐,选择性极少的小推车食品,以至于以前每次坐火车都要大包小包带N多零食来充饥,为此还交到了不少吃货好友。

    9a3d6da8fee54eb3aaaca9a898df22a6

    但现在,“在火车上吃什么”这个问题已不再困扰我们。

    2017年7月,12306平台正式推出高铁订外卖服务,除了车次自营餐品外,还可以选择“途径配餐站”,即可以点途径各大站提供的商家配送的套餐,比如肯德基、麦当劳等。

    为了缓解2019年春运期间高铁送外卖压力,不少车站计划引入外卖智能物流调度系统,将根据订单数量、列车到达时间、配送人数合理安排各餐厅出餐数,避免人力浪费,合理协调各方资源提升整体配送率。

    当然,随着AI技术的不断发展,菜品制作等各类厨房机器人,中短距离外卖配送机器人都将出现在高铁订餐服务了

    说不定在未来的某天我们会突然发现,在车窗外跑来送餐的,是一个机器人。

    微信图片_20190130094452

     

    4、智慧出行」:从人在囧途的灾难片,到轻松回家的喜剧片

    30亿人次的全球最大规模的迁徙运动,注定让“拥堵”成为春运独一无二的代名词,尤其是高速公路发展迅猛的那几年。

    修好了路,汽车也变多了。公安部交通管理局数据显示,截至2017年底,全国机动车保有量达3.1亿辆,机动车驾驶人数达3.85亿人。每到节假日高速路便成了免费的停车场,有些拥堵路段移动速度基本是按天来计算,1天移动1公里。

    640 (4)

    「春运避堵」已成为困扰众多归乡人最头疼的问题之一。

    好在随着大数据和智能交通系统的发展,这一问题正逐步得到解决,智能交通系统将各条道路的拥堵情况汇总到相应的管理平台,再由平台将这些拥堵信息发布到各大智能出行的产品上(如高德地图、小飞鱼车载语音助手等),使得人们可以第一时间获得路况信息。

    以往我们只能肉眼预测拥堵路段有多长,拥堵多少时间?现在我们可以智能出行产品了解到前方因为什么发生拥堵,拥堵时间有多久,拥堵路段有多长,并及时了解附近路段的出行情况,快速找到一条不那么拥堵的路段,飞奔回家。

    微信图片_20190130094828

    曾经,春运的主题色彩是灰色的,在黄牛处买高价车票、寒冷天气里排队进站、拥挤不堪的绿皮火车里忍受饥饿、堵车堵到天荒地老。

    而今,这种略显悲情的色彩正在逐步褪去,技术的发展不仅带来了交通方式的革新,也在各种细节处提升人们出行的幸福感。

    就像今年春运期间上海虹桥和杭州东站推出了“聪明”厕所,不仅可以“刷脸”取纸,还设有“潮汐厕位”,机动厕位根据使用情况开放出来调节男女厕位数量。

    在女厕所门口排队半小时的日子,终于可以挥手告别啦~

    微信图片_20190130094950

    拼多多消失的几千万:未来10年 ,AI将全面对抗黑灰产的野蛮生长

    内附拼多多未完待续的分析……

    一觉醒来,拼多多消失了几千万。

    2019年1月20日凌晨,拼多多被曝出现重大bug,用户可领 100 元无门槛券在拼多多里抵扣使用。

    此次100元无门槛券并不需要用户去抢购,可以无限领取,且能用于充话费、Q币等虚拟产品中,约等于允许用户直接套现。

    羊毛党热闹了一夜,直到第二天上午10点拼多多才将这一bug修复,12点56分拼多多官方发表声明:将积极配合相关部门对涉事黑灰产团伙予以打击。

    f24300593d5e46b59f4daeb5eaf62532

    到此为止,事件的第一阶段落下帷幕。

    1、不被大众熟识的黑灰产

    在拼多多的声明中,出现了一个大众略感陌生的词:黑灰产

    什么是“黑灰产”?指的是电信诈骗、钓鱼网站、木马病毒、黑客勒索等利用网络开展违法犯罪活动的行为。稍有不同的是,“黑产”指的是直接触犯国家法律的网络犯罪,“灰产”则是游走在法律边缘,往往为“黑产”提供辅助的争议行为。

    2016年8月,准大学生徐玉玉接到了一通电话,将自己准备用来交学费的9900块钱转到了骗子给的账户,当她发现上当时,钱早已经被骗子全部拿走。

    从警察局回家的路上徐玉玉因为过于伤心,导致心脏骤停,生命永远的停留在18岁…..

    fc700f9724624f1f817bffd098ae02ed

    2017年5月,全球近100个国家共计7.5万台的计算机同时遭到了来自一款名为 wana Decrypt0r 2.0 的勒索软件的攻击,被感染电脑必须向黑客支付比特币来解锁电脑。中国各大校园网成重灾区,众多师生的文件被病毒加密,其中包括很多准毕业生的论文。

    d5e9202e79024199bb1b615b9b67d40b

    2018年,Facebook 8700多万用户数据泄露,这些数据被“剑桥分析”公司非法利用以发送政治广告。此次事件被视为 Facebook 有史以来遭遇的最大型数据泄露事件。

    2c01c2f2868d4682a73fe53e7eac4a68

    从徐玉玉案件到 Facebook 8700万用户数据被窃取,再到一晚上被薅走几千万的拼多多,黑灰产已经渗透到普通民众生活的方方面面。

    公开数据显示,全年国内有6.88亿的网民,因为垃圾短信、诈骗信息、个人信息泄露等造成经济损失估算达915亿元,且中国电信诈骗案每年以20%—30%的速度快速增长,网络黑灰产产业规模已达千亿

    0 (1)

    第42次《中国互联网络发展状况统计报告》中显示,中国8亿网民中约有86%的人遭到信息泄露带来的威胁。

    2、AI是黑灰产命中注定的利剑

    所有恶魔,命中注定都有一把击败他们的利剑。

    在对抗黑灰产的利剑还未问世之前,网络上曾一度充斥着大量教人如何辨别电信诈骗的帖子,里面将很多诈骗人员会提及的关键名词标出:例如转账、打钱等。

    这样普及的效果微乎其微,徐玉玉的悲剧依旧出现了。而在徐玉玉案件的同一年同一月,在全国大部分地区电话诈骗率增长了58%的同时,安徽省电话诈骗的发生次数却下降了60%。

    e2265008f1bc4d5ca61bd77c24aeef99_meitu_1_meitu_2

    为什么能够做到这样?因为科大讯飞联合安徽省公安厅,给全省所有的电话里面做了一个AI监控系统,人工智能可以对通话内容进行分析,对那些诈骗性质行为自动作出提醒,而这个过程是完全自动化的。

    这一举措,为安徽省避免了5个亿以上的可能的损失。

    在AI保护数据安全这块,英国公司Darktrace就是其中一个很好的例子。

    Darktrace提供的保护数据安全的AI技术主要是从云端或者公司内部网络,甚至一个专门的工厂,通过防止外部攻击者找到进入公司电脑的路径的方法,来达到保护公司内部人员正常使用网络不被打扰的目的。

    除了数据安全,内容安全目前也成为了一大审核和保护的重点。

    2018年初短视频呈爆发式增长,成为了新的UGC载体。随着视频数量的剧增、对平台运营的要求也原来越高,对文字、图像、视频等内容的审核力度也在不断加大,因此也催生了一批运用“人工智能”进行内容审核,减少人力成本的服务。

    例如阿里绿网开发的AI鉴黄师,可以提供文字审核、语音审核和图像审核等多种服务,最大程度保证了未成年人的网络内容安全环境。

    0

    中国青少年网民数据已达总网民数据的20%,保护青少年安全用网,刻不容缓。

    3、All in 安全 AI

    如果说,之前我们利用各种人工智能技术推出发现网络黑灰产的产品,那么从今年开始,将不再仅仅是发现,而是AI和网络黑灰产的正面对抗。

    前文所提到的英国公司Darktrace已经在“发现威胁”的基础上推出了能够“应对威胁”的产品,并且拥有了第一批使用者。

    人工智能的高速发展极大提高了识别安全威胁的准确度,移动安全机制的应急反应速度大幅提升,这些技术促进经济发展的同时也有效维护网络安全。

    当然,随着人工智能技术的发展,隐藏在网络另一端的黑灰产也在不断发展,针对AI技术的“数据投毒”让人工智能训练出来的数据被“污染”。

    949043a4d57347eb855c0cd542b90924_meitu_1

    比如通过给智能汽车输入“污染”过的训练样本,就可以把“禁止通行”的交通标志牌识别为“可以通行”,从而造成交通事故和人员伤亡。

    2019年被称为5G商用的元年,5G网络的基础建设趋于尾声,业内众多专家预测未来10年全球会有万亿计的智能设备连到互联网上,万物互联的时代,网络安全问题将变得至关重要,对黑灰产的打击防范也将在未来10年里呈白热化状态。

    毕竟,这是分分钟关系到人身安全的头等大事。民众需要的不仅仅是All in AI,而是All in 安全 AI。

    2019-01-25 ~ 2019-01-26网络
    音遇爆火两个月之后,仍有无数声音在高喊:盘它!

    万万没想到啊,今年社交榜单上最大的黑马,会是一个K歌接龙的鬼玩意儿

    音遇火了,在这个朋友圈刚飘完雪的冬天,燃烧起了无数人的热情。

    这款音乐社交产品刚上线,就立即冲到App Store总榜的前两名,甚至一度在社交榜上击败了微信。于是,无数声音响起,担忧音遇会不会成为下一个子弹短信,但截止目前,音遇依然势头强劲,成为“2018最后一匹黑马”。新的网络段子夹杂着流行词也应运而生:闲来无事,玩玩手机,打开音遇,盘它!

    2018年初的时候,任谁都想不到,今年社交榜单上最大的黑马,会是一个K歌接龙的鬼玩意儿。

    ——网友评论
    「音遇」,2018最后一匹黑马

    音遇是一款“以歌会友”的软件,主打K歌+社交,并添加了游戏和竞技的属性。实际上,音遇模拟了一个多人参与的KTV场景,并增加了竞技游戏的娱乐性,将“唱歌+交友+竞技游戏”融合在一起。主打多人实时在线匹配,设有多个明星专场,用户可根据自己的音乐喜好进入专场,与其他用户在线完成匹配,并进行竞技接唱玩法。

    014741430462

    音遇主要玩法有两种,一是劲歌抢唱:系统会给出歌词上半段,玩家需要抢到唱歌机会并唱出下半段,接唱成功增加积分;接歌成功会增加积分,但抢到歌曲却唱错会扣除抢歌机会(玩家每局游戏拥有 2 次机会);每局歌曲共 12 首,玩家 6 人,总分最高者会获胜。

    第二种是热歌接唱:唱法与劲歌抢唱相同,但系统会设定由 1 号玩家开始接唱,接唱成功增加积分,剩余玩家按顺序继续接唱;如果选定玩家接唱失败,剩余玩家可以抢唱,抢到且唱对的玩家会获得积分;每局人数与劲歌抢唱模式相同,总分最高者会获胜。

    2018122811

    这两种玩法都给用户带来了耳目一新的感觉,以往同类产品中所没有的“哼唱识别”技术也再次走入人们视野,并大大增加的了玩家体验。

    基于哼唱识别的“社交+游戏”

    音乐+社区的打法,之前的“全民k歌“和“唱吧”也实践过,但是前两者门槛较高,社交互动性跟音遇比差了很多。短时间内,音遇能够爆火的原因,和它的门槛低有一定关系。独特的battle模式使其在同类型产品中比较容易收获较高的用户体验。

    3424_66565_742323

    《巨星》游戏评测截图

    从技术角度来看,基于哼唱识别的“社交+游戏”产品从来不是新鲜事儿。早在 2008 年 12 月,盛大游戏上线了一款名为《巨星》的音乐竞技类游戏。但在模式创新的背后,《巨星》所需的硬件级声音处理用的是使用性能较强的独立声卡,且很多版本的声卡驱动也存在兼容性 bug。诸如此类的糟糕体验还有很多,最终《巨星》在运营三年并交出惨淡成绩单后退出了历史舞台。

    音遇作为一款软AI产品,不仅把当下流行的一些社交要素引入到了K歌软件之中,即时互动也可以让用户产生更多的代入感。同时,业内独有的哼唱定位功能,可以在接唱模式里有效判断,用户唱出的下一句是大致符合原歌曲,还是为了搞活气氛在那说社会语录。和传统哼唱技术搜集用户的清唱数据来构建检索库不同的是,音遇所使用到的哼唱识别技术,支持清唱提取,扩充了检索模板,让哼唱技术的准确率和识别率大幅度提升。而这种识别能力,正是来自讯飞开放平台。

    哼唱检索赋予音乐社交新玩法

    哼唱识别是通过对海量歌曲的人工分析和机器学习,将用户上传的音频指纹特征与库中的样本进行模糊匹配,并由系统判断正确与否。哼唱识别技术当然隐藏在我们「看不见」的地方。但它的厉害之处在于,可以从歌曲任何位置开始识别,并将结果实时返回至APP端。

    pse6pt0htds1ar7l

    但音遇绝不是讯飞哼唱识别技术的首款应用产品。早在2014年8月20日,讯飞在北京举行的“语音点亮生活”发布会上,所发布的灵犀语音助手3.0版本就开始突破性地支持哼唱搜索功能。即用户只需哼出调调就能搜索出歌曲,并能在线试听。而虾米音乐中,同样也使用了讯飞语音识别技术,推出哼唱检索。到了音遇中,更是将这一技能发挥到炉火纯青。用户可以任何哼唱歌曲的一段,从中提取相关特征,利用音乐本身内涵,如节奏、旋律、和弦、伴奏甚至是音色,来搜索想要的歌曲,得到检索结果。

    微信截图_20190114170157

    传统的哼唱技术大多使用MIDI数据或者搜集用户的清唱数据来构建检索库,成本高且效果欠佳。讯飞创新地开发出清唱提取技术,可以从海量的高品质音乐曲库中提取出对应的原唱清唱数据,也就是消除音乐中的伴奏。从而极大的扩充了检索模版,显著降低了检索库构建成本。另外,依靠音乐原曲的清唱信息,开发出了业内独有的哼唱定位功能,可以有效返回用户哼唱片段相对于原曲的起始位置。而且,讯飞还即将推出哼唱引擎 end time 定位功能,敬请期待。

    图片1

    讯飞哼唱定位功能

    同时,结合讯飞独有的多参考检索匹配技术,极大的规避了用户哼唱同一片段时长不一的难题,抗时间扭曲的性能始终处于业界最高水平。另一方面,由于该技术参考了多方面的特征,对于短时录音下的哼唱特征匹配鲁棒性更高,检索效果卓越。

    讯飞刘庆峰曾说过,“基于‘讯飞超脑计划’,科大讯飞开启了一场以语音和语言为入口的‘认知革命’。”超脑计划,计划主要针对智能家居化的三块功能实现——自然交互、智能交互、智能决策。而哼唱识别,正是自然交互的一部分。

    音遇的出现,为互联网音乐产品提供了一个新思路。无论它的异军突起,是要归结到产品路线、平台实力,功劳簿上,总要为有趣的哼唱识别技术记上一笔吧!

    qrcode_for_gh_1985e8ed98e0_430

    扫码识别二维码

    关注AI研究所

    音遇 | 如何收割19亿挑剔的Z世代?你需要向AI借点力

    当默认出生年份是2000年的那一刻,收割Z世代用户的战争就这样明晃晃的打响了。

    故事始于2018年9月20日。

    一款名为音遇的APP正式上线,在冷启动2个月之后便在APPStore排行榜单上表现抢眼,一度超越微信,霸占了社交免费榜第1的位置,并在不久前以超 2 亿美元的估值完成了新一轮融资。

    在互联网寒冬的大环境下,这样的成绩实属难得,音遇也由此被称为2018年最后一匹黑马。

    1

    本文将从3个方面拆解这款面向95后的音乐+游戏+社交APP,是如何一步步优雅地收割到众多Z世代用户,又是如何用冷门的AI能力成功打造Z世代的爆品?

    一、「傲娇」的用户定位:不是所有的韭菜都是割

    如果用两个词来形容音遇APP的用户定位,那就是「精准」和「傲娇」。

    「精准」是对Z世代的目标用户,「傲娇」是对目标用户之外的其他用户。

    明亮饱和的整体色彩,漫画风格的UI设计,让80后觉得有点眩晕的同时也很很多00后觉得Q萌可爱;默认2000年1月1日的出生年份让90后不好意思的同时,也让很多00后眼睛里闪现光芒,唤起心底深处的认同感:看,这是款专门针对00后的APP。

    2

    除了「暖萌系」的UI风格设计,在产品宣传上音遇也是剑走偏锋,选择95后和00后蛰居最多的B站和微博为主要宣传阵地,辅以最右和皮皮虾。视频内容也多以95后喜闻乐见的“沙雕视频”为主要传播内容,致力于成为他们每日份的快乐源泉。

    3

    和Y世代用户天天在朋友圈丧到不行,发着“人间不值得”不同的是,Z世代的用户明显更喜欢每天在朋友圈分享“哈哈哈”来显示人间很值得。

    在只专注于用户数量的APP争夺战里,音遇明显的用户区分略显「傲娇」,但也是这份「傲娇」让其能够在2个月内迅速收割让人眼红的几百万Z世代用户。

     

    二、别致的核心功能:音乐APP里的竞技游戏

    作为一款kill time类产品,很多人都在讨论音遇的本质是什么?

    有人说它是音乐,有人说它是社交,还有人说它是音乐+社交。在我看来,这些都不是,音遇APP的本质是游戏,是一场关于音乐的竞技游戏。

    音遇目前有2块核心功能,劲歌抢唱和热歌接唱,形式分别是6人抢唱12首歌和6人抢唱+接唱12首歌。

    和之前的K歌产品不同的是,音遇极大降低了演唱难度,减少演唱歌词数量,用户只需要唱出2-3句歌词即可;用户演唱歌曲时没有伴奏和旋律,只需要唱对大致旋律和歌词便可过关。

    在音遇里唱歌水平不重要,唱不唱比较重要。

    4

    在减少演唱难度的同时,音遇极大地强调了用户的「参与感」和「欢乐感」,一轮抢唱下来,用户体验到的是抢到麦的开心和激动,记住的是抢不到麦地懊恼,会因为听到了各种车祸演唱而和房间里地其他用户隔着屏幕哈哈大笑,也会拿到血而迫不及待想进行下一轮。

    音遇牺牲了用户在音乐方面的体验,增加了用户在游戏里的感觉。这种核心功能的定位非常符合Z世代用户的心理需求——欢乐感大于需要感,社交感战胜陌生感。

    如果非要用一个词来形容这种产品定位,那大概是别致。

     

    三、被忽略的硬辅助,不可或缺的AI能力

    伴随着Z世代年轻人一起长大的,还有移动互联网和人工智能。

    移动互联网让实际距离相隔千里万里的6个人,进入到同一个游戏场景,抢唱同一首歌,人工智能则负责判断用户所抢唱的歌词和旋律是否大致符合原歌曲,给出“匹配成功”或“匹配失败”而让游戏继续进行下去。

    音遇作为一款软AI产品,其APP中的哼唱识别能力来自讯飞开放平台,可以从歌曲任何位置开始识别,并将结果实时返回至APP端。

    和传统哼唱技术搜集用户的清唱数据来构建检索库不同的是,科大讯飞首次研发出清唱提取技术,扩充了检索模板,让哼唱技术的准确率和识别率大幅度提升。

    同时,业内独有的哼唱定位功能,可以在接唱模式里有效判断,用户唱出的下一句是大致符合原歌曲,还是为了搞活气氛在那说社会语录。

    当然,这些技术都隐藏在我们「看不见」的地方。

    若不是歌曲识别界面中出现有“AI识别中”5个汉字,我们很难在黄色线条抖动的4-5秒钟里,想到这样一款以好玩为主,功能简洁的APP的背后,会是着神秘强大的AI能力。

    5

    而这一点,也正是Z世代产品隐藏的共性:不可或缺的AI能力。这句话通常还有下半句,让用户感知不到或感受不明显。

    就像很少有人去剖析P图软件将照片变成漫画所运用到的AI算法,也很少有人去深究翻译软件里所包含的机器翻译能力。但这并不妨碍人们会把P成漫画风格的照片设置为微信头像,遇到看不懂的旅游标志会拍下来然后点击翻译。

    不去探寻背后的AI能力,但并不代表不会喜爱或依赖AI能力所带来的改变和便捷。

    Z世代年轻人的成长轨迹重合了人工智能第三次浪潮的轨迹,这造就了他们与生俱来的AI感知力,他们比任何一代的年轻人都更习惯更亲近这股强大的力量。

    所以,就算是和10年前《我爱记歌词》这种在Z世代心中略显老旧的娱乐节目高度重合,但因为有了AI能力的嵌入和移动互联网的加持,让Z世代的用户尝到了质朴的欢乐,并成为了他们近几个月的开心源泉。

    随着Z世代年轻人的不断长大,如何有效收割Z世代用户已经被各家提上日程,答案纷繁多样需要我们不断探索,本文也只是拆解了其中几个微小的方向。

    其实,在摸索答案的同时,未来的产品创造者如何将自家产品和AI能力巧妙结合,国内强大的AI能力提供平台(如讯飞开放平台)又会开放出怎样的AI能力赋予产品神奇的魔力,同样值得期待和思索。

    微信图片_20190111102352

     

     

    “A.I. ENABLES”行业沙龙天津站,AI赋能从“聊一聊”启程

    交流思想,碰撞观点,让擦出的火花成为凝聚AI领域奋斗者们的力量!

    英国著名作家萧伯纳曾有一句名言:“如果你有一种思想,我有一种思想,彼此交换,我们每个人就有了两种思想。”

    而在12月13日,讯飞服务市场“A.I. ENABLES”行业沙龙天津站科大讯飞天津智汇谷总经理郭华在开场致辞也说:“大家多聊聊天,喝喝茶,把思想一起碰撞一下。”

    微信图片_20181214152556_副本

    科大讯飞天津智汇谷总经理郭华

    交流思想,碰撞观点,让擦出的火花成为凝聚AI领域奋斗者们的力量,加速AI对行业的优化升级,这正是讯飞服务市场举办“A.I. ENABLES”行业沙龙的意义所在。

    微信图片_20181214143442_副本

    作为沙龙的第一站,本次天津站吸引60余位行业专家和大咖参加大家一起分享技术、经验,沟通合作,现场气氛十分热烈

    微信图片_20181214160540_副本

    天津市虚拟现实和增强现实技术应用协会会长郭一阳现场致辞发言

    微信图片_20181214135627_副本

    交流答疑

    微信图片_20181214155042_副本

    现场自由交流

    服务市场说

    让AI在各行各业“有所作为”

    讯飞服务市场自今年6月份发布以来,始终致力于整合AI上下游产业链,为AI服务商桥接商机,为企业客户匹配需求,我们希望构建AI生态产业圈,实现AI新市场,赋能全行业的平台愿景。

    讯飞服务市场的诞生,并非一蹴而就。

    在其强大的自有资源和市场整合能力背后,是科大讯飞AI技术的不断发展。讯飞服务市场技术总监潘锗《讯飞A.I.助力产业升级》的主题分享中,从AI发展历程出发,与大家分享了讯飞的技术进展,以及代表性的平台和活动,如为开发者提供AI能力的讯飞开放平台、人工智能学习与交流的园地AI大学、1024开发者节等等。

    微信图片_20181214152414_副本

    讯飞服务市场技术总监潘锗

    如今,时代对AI的关注已经从“AI能做到吗”转为了“AI怎么做”。

    “AI时代已经到来,人工智能正在进入各行各业。”讯飞服务市场总监董畅通过《AI新市场 赋能全行业》,向大家分享了讯飞AI+行业的应用案例,如海底捞的订餐机器人、口腔门诊的电子病历系统以及教育领域的机器阅卷等。

    微信图片_20181214174433_副本

    讯飞服务市场总监董畅

    AI+行业的市场不断增长,只提供技术是远远不能覆盖完全的。需要一个专业的服务交易平台,将AI服务商与企业客户聚集到一起。这个平台就是讯飞服务市场。董畅为大家介绍了它的优势——

    对AI服务商

    服务市场覆盖上百个行业,每月为入驻的服务商带来海量商机。并提供优惠甚至免费的高阶服务如核心AI技术,以及品牌渠道支持、精准融资对接服务。

    对企业客户

    服务市场满足基础服务、行业方案、智能家居、技术服务、智能制造、营销推广6大类需求,基于服务标签库对企业客户的需求进行智能匹配。同时通过甄选优质商家、全程交易担保、服务实时监控为客户提供充分的保障。

    “开放平等,合作共赢。我们坚持‘开放、包容、合作、共赢’,赋能万物,赋能未来,构建AI生态。”董畅说。

    嘉宾们说

    让AI等前沿技术赋能前人未至之地

    “2016年是VR的元年,而这次的沙龙将是一个新的纪元的开始,因为AI和VR、AR的联合,不仅是已知场景,还将在开辟出的更多新场景中赋能。”

    天津尚游天科技有限公司创始人张翔《AR/VR赋能动漫新体验》的分享中,从标准化、人才培养、行业应用及自主IP四个方面分析虚拟现实如何为传统动漫产业转型升级和再发展提供突破口。

    张翔还提到了VR在教育方向的应用,他指出目前VR所涵盖的领域,教育和游戏的比重是4:6,VR为教育赋能的潜力仍然值得继续挖掘。

    微信图片_20181214185951_副本

    天津尚游天科技有限公司创始人张翔

    “虚拟形象的影响力甚至可能高于我们平时在现实生活当中的形象,对于非现实性的网络它也不存在现实当中的很多束缚,甚至超越了人种,超越了性别,超越了物种。”

    北京触梦文化CEO张昊阳《虚拟形象新革命》中,解读曾经是较活跃的二次元亚文化现象“虚拟偶像”,为何在如今被赋予了越来越多的商业价值和玩法。他从受众的人格心理,虚拟形象的人设等角度分析虚拟形象火热的原因。同时介绍AI、VR、AR等技术如何让虚拟形象更深入人心。

    张昊阳与大家分享了目前动漫领域的流行词“文艺复兴”,即老IP在旧瓶装新酒后重新炒热的现象。“我们可以运用AI技术,前沿的图形学,AR、VR以及互联网技术去弘扬传统文化的价值。”他说。

    微信图片_20181214185955_副本

    北京触梦文化CEO张昊阳

    “现在,我们正处在短视频的黄金时代,但视频内容生产力远远未被释放。”

    杭州慧川智能创始人&CEO康洪文在沙龙上提出,通过AI,可以大幅提高视频制作的效率。在《AI 技术让视频更简单》中,他介绍了在短视频时代的AI视频制作平台中,通过智能化云操作系统,可以快速整合上下游资源,提高视频生产效率。

    微信图片_20181214193100_副本

    杭州慧川智能创始人&CEO康洪文

    当AI加入视频制作后,很多工作如字幕、剪辑都可以自动完成,真人可以将更多的精力集中在创作领域,重复的工作交给机器完成。

    本次讯飞服务市场线下沙龙天津站,AI领域的行业精英们齐聚一堂,进行观点碰撞,共同探讨AI+的落地场景,服务市场也将联合天津双创整合产业链上下游资源,匹配需求,桥接商机,挖掘更多价值。未来我们的沙龙还将走进更多城市,敬请期待我们的下一站。想了解更多,或有任何与服务市场有关的疑问,欢迎通过以下官方渠道与讯飞AI服务市场团队交流,我们期待你的声音!

    联系电话    4000-199-199

    邮箱交流    aifuwus@iflytek.com

    QQ交流    讯飞服务市场交流群(778105911)

    微信图片_20181214193722

    让计算机「看懂」世界,从这6个知识点开始!

    对于人类而言,最重要的两种感官应该就是视觉和听觉了。而在人工智能的发展中,如何让机器“看懂”和“听懂”信息,也一直是研究人员们的重点工作方向。

    在上一期的文章中,班主任主要带大家回顾了计算机“听觉”方面的智能语音技术知识点,大家有好好消化吸收吗?这一期,我就来为同学们讲述一下计算机视觉方面的重点知识。

    1
    5大常规任务

    计算机视觉是研究如何让机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉。

    计算机视觉中有5项常见任务,分别是图像分割、物体检测、物体识别、图像描述、语义推理

    图像分割是将图像分解成若干特定、具有独特性质的目标区域。例如用户输入左边这张照片,机器会对其做一些场景语义分割,将照片中的人和摩托车区分开来。

    timg (69)

    物体检测是发现目标并确定其位置。其最常见的任务有三类:这张图片中是否有XX?XX的数量是多少?XX的位置在哪里?

    物体识别是在物体检测的基础上,不仅找到物体在哪里,还能确认它是什么。物体识别通常由两类常规任务构成:第一类任务是相似检索问题,比如搜索引擎中的相同或相似图像的搜索功能;第二类任务是相似比对问题。

    图像描述即“看图说话”,由机器来描述照片中的内容。

    语义推理是五项任务中最难的一项,即挖掘图像或视频内容背后更深远的故事。以上图为例,机器根据“鞋子里的小猫”这张图像进行背后故事挖掘,猜想小猫是因为好奇所以钻进鞋子玩耍。

    2
    计算机视觉的应用领域

    计算机视觉在现实中的应用非常广泛。可以说,机器不仅能帮助人完成许多需要“看”的工作,还能“看见”更多人眼无法辨别的东西。例如以下几种应用:

    指纹及其它生物特征识别

    通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征来进行个人身份鉴定的技术。比如科幻片中经常看到的指纹和虹膜识别,就都是运用了计算机视觉技术。

    timg (74)

    人脸检测识别在往期的AI大学课程中,班主任有跟大家讲解过人脸识别的详细知识点哦视频监控和安防分析

    如住宅区分布的智能视频监控系统、银行安防系统等,能够有效地监控、分析现场情况。

     

    医学生物图像检测分析

    X线图像、多排螺旋CT等可获取人体内部的二维、三维医学图像,大大提高了诊断准确性和效率。

    除了以上四类应用,计算机视觉在拍照翻译和图像搜索方面也被广泛使用。例如讯飞翻译2.0就可以通过拍照来识别出文字,同时实现翻译。

    撒啊

    还有文档分析识别、VR虚拟现实、辅助驾驶领域等等,都是计算机视觉领域的热点。

    近两年有大量的资本涌入计算机识别领域,比如商汤科技已经融资33亿,旷视科技也融了31亿。在今年的4月份,商汤科技就宣布完成了6亿美元的C轮的融资,再次创下了人工智能单轮融资的记录。

    济公活佛

     

    由此可见,计算机视觉技术应用的发展前景是十分可观的。

    3
    计算机视觉技术的难点与挑战
    尽管能力强大且应用广泛,计算机视觉技术仍然有许多难点尚未找到合适的解决方法,因此可以说是机遇与挑战并存。计算机视觉技术的第一大难点是多变和非均匀的光照场景,例如一些逆光的场景。第二个是成像质量差异比如说不同清晰度的相机拍出来的照片质量不同。第三个是复杂易混淆的背景,比如说雪地里的一只白猫。第四点是不同场景存在干扰和遮挡timg (79)此外还有一些难点,包括失焦透视变形等等。

    4
    卷积神经网络处理图像的过程

    图像识别最常用的就是卷积神经网络,而卷积神经网络主要是模拟人的视觉神经系统提出来的。

    以CNN做人脸识别任务为例,先得到一些像素信息,再往上层得到一些边界信息,然后再往上提取就是一些人脸的部件信息,包括眼睛、耳朵、眉毛嘴巴等,最后是人脸识别,这整个过程和人的视觉神经系统是非常相似的。

    6403

     

    卷积神经网络的结构依旧包括输入层、隐藏层和输出层,其中卷积神经网络的隐含层包含卷积层、池化层全联接层3类常见构筑,接下来我们着重讲解下卷积和池化的相关知识点。

    卷积层的功能是对输入数据进行特征提取,其内部包含多个卷积核,一个卷积核覆盖的原始图像的范围叫做感受野(权值共享)。

    一次卷积运算(哪怕是多个卷积核)提取的特征往往是局部的,难以提取出比较全局的特征,因此需要在一层卷积基础上继续做卷积计算,这就是多层卷积。

    6401

     

    在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。

    通过这种池化的操作,能够一定程度上克服图像的一些旋转和局部的细微变化,从而使得特征的表达更加稳定。

    5
    人脸识别

    人脸识别技术是计算机视觉的一个典型应用,接下来我们就来讲解一下人脸识别中的相关知识点。

    人脸识别的分类

    人脸识别大体上分为静态人脸识别动态人脸识别,它们的难度是不同的。静态的人脸识别,人是非常配合的,难度小很多,比如身份证的录入、银行办理业务时的人脸验证。

    timg (80)

     

    而动态的人脸识别会由于人脸距离摄像头的距离等因素,配合度较低,需要准确捕捉到运动的人脸,难度就比较大了。

    人脸识别技术

    人脸识别技术中有两项常见任务:判断图像或视频中出现的人是不是同一人,即人脸认证;判断这个人到底是谁,即人脸检索。人脸认证和人脸检索的核心均为人脸相似度的判决。

    机器在判断两张图片中人脸的相似度时一般有以下4步:人脸检测—预处理—特征提取—特征对比。通过这些步骤不难看出,人脸识别技术是模仿人类识别人脸的过程,用计算机比较人脸图像的相似性。

    timg (70)

    看到这里可能有些同学要问:既然是比较相似性,那我们该如何评价人脸识别的效果呢?

    说到人脸识别的效果,就不得不提到人脸识别的公开测试集。目前在国际上比较有名的人脸识别公开测试集一个是LFW公开集,此公开集中6000个图像对,最高准确率已经达到99.83%,超过了人眼的水平;另一个公开集是华盛顿大学发布的MegaFace公开集。

    为人父为人few

    如果从公开测试集的效果来看人脸识别技术已经逐步接近甚至是超过人眼的水平。

    人脸识别效果的影响因素

    虽然在公开集中人脸识别取得了很高的准确率,甚至在某些特定情况的准确率已经超过了人眼识别,但在实际应用过程中会存在很多影响因素,一类是外因,一类是内因。

    外因的影响因素主要有光线影响,比如说极端的光线或者人脸光照分布不均等,除了光线以外摄像头分辨率也是一个很大的影响因素,拍摄角度不好或者离拍摄人物很远的时候,会导致机器识别不出人脸。

    内因则包括人脸部的遮挡——墨镜、刘海、口罩等;还有些拍照角度以及脸部纹理变化也会影响人脸识别的效果。

    6
    图文识别

    图文识别是计算机视觉的另一个典型应用。

    图文识别的分类

    图文识别的基本概念就是根据已有的文字把它识别出来。它主要有两个分类,第一个是OCR光学字符识别,即对已有的文字把它把它识别出来;另外一个就是在线手写识别,像大家熟悉的讯飞输入法里的手写输入,相比于OCR识别来说,手写识别包含了更多的笔划信息。

     

    timg (72)

    手写识别的演进过程

    以讯飞的图文识别技术为例,大概经过了这4个演讲过程:

    手写输入法

    输入法中运用的单个字的识别技术。

    手写图文

    对于手写的中英文字、词、句子的识别。

    行业文档识别

    例如发票以及快递号的识别。

    通用文字识别

    这是现在我们要做的,就是随机拍个照片,就能对里面的文字进行识别了。

    图文识别现在广泛运用于试卷评阅中。我们先让机器把手写的文字识别成机器能够看懂的格式,然后下面就可以做作文的评阅等相关工作了,现在,数学公式也能读出来了。最终,我们想要达到的目标是“Read anything”

    超过80%语音开发者的共同选择