2016国际语音合成大赛科大讯飞再创佳绩 用技术为中国发声

北京时间6月30日晚,在刚刚结束的国际语音合成大赛上,科大讯飞通过承建的语音及语言信息处理国家工程实验室报送的参赛系统,除了继续在自然度, 相似度,可懂度等传统指标上保持领先之外,更是在语篇段落表现测试中的所有7项测试指标位列第一。

北京时间6月30日晚,在刚刚结束的国际语音合成大赛上,科大讯飞通过承建的语音及语言信息处理国家工程实验室报送的参赛系统,除了继续在自然度, 相似度,可懂度等传统指标上保持领先之外,更是在语篇段落表现测试中的所有7项测试指标位列第一。这是科大讯飞自2006年首次参赛以来,第十一次参与该 项赛事,持续巩固了讯飞智能语音技术的全球领先地位。

国际语音合成大赛是由美国和日本联合发起的国际上规模最大、最具影响力的语音合成大赛,历届大赛吸引了美国卡耐基-梅隆大学、英国爱丁堡大学、日本名古屋工业大学、IBM研究院、微软亚洲研究院等语音技术领域的世界一流研究机构与企业参加。

与前两届相比,本次大赛再次将主要测试语种由非英语语种转换到英语,要求测试的数据库是一个5小时英文儿童有声读物,共有16个系统参测。主办 方拟定的测试指标除了传统的相似度、自然度、听写错误率外,还有针对故事合成的段落评分,包括总体感觉等共7项指标,科大讯飞全部是以显著优势获得第一。 其中,在非常关键的自然度指标上,讯飞是4.2分,第二名是3.9分,讯飞是唯一超过4.0分的参赛系统。

本次参赛,在不到两个月的时间内,研究团队克服了时间紧、音库小、风格变化极大等困难,充分发挥了科大讯飞的核心技术优势,采用基于统计声学模 型的单元挑选与参数合成技术方案,并研发了基于深度神经网络的语音合成新方法,高质量完成了语音合成系统的构建。最终提交的参赛系统获得了英语合成语音相 似度与自然度、可懂度等共计7个指标的第一名。

此次参赛再创佳绩,进一步扩大了科大讯飞在语音合成等关键技术领域的国际领先优势,对推动智能语音技术在社会各领域的深入应用、赢取国际竞争、开拓国际市场等方面具有重大而深远的战略意义。

一直以来,科大讯飞的语音合成技术代表着世界最高水平,不仅中文语音合成技术超过了普通人说话水平,而且在英语等多语种语音合成上牢牢树立了国 际领先地位。未来科大讯飞将积极开展人机对话、小说合成等热点领域的研究,着力提升语音合成的表现力和真实感,通过语音处理、个性化、定制化等技术,进一 步扩大应用范围,不断提升核心效果。

语音及语言信息处理国家工程实验室

语音及语言信息处理国家工程实验室是由国家发改委于2011年批复成立,由科大讯飞和中国科学技术大学联合共建,是我国智能语音领域唯一的国家级研究平台。

【原文转自新浪科技,链接http://news.sina.com.cn/o/2016-07-04/175933191342.shtml】

微软CEO:人类是AI最好的老师

昨天,微软CEO Satya Nadella在Slate上表示:计算机行业必须开始思考如何让智能软件尊重人类。这表明:他非常担心AI对人类生活的影响。

他写道:“科技行业不应该扭曲未来的价值观,我们应该教会AI树立正确的价值观。”

Nadella呼吁:“算法有责任拥有一个正确的三观,这样人类才不会受到伤害。”他表示智能软件必须这样设计:我们必须检阅算法的工作方式,让它不歧视某类人群,或者用暗黑的方式使用私人数据。

其实,Nadella的建议是明智而中肯的。一直以来,AI总是被指控腹黑,存在着性别或者种族歧视。我们现在正在努力摆正AI的三观,让人们不会为AI的此问题困扰。

联邦贸易委员会的研究发现:在互联网时代早期出现的网络种族和经济歧视现在又卷土而来了,出现在广告或者其他的网上服务之中。

毋庸置疑,Nadella说的一些问题确实存在。近日,微软研究员Kate Crawford在《纽约时报》总结了现在AI的歧视现象:现在,工作场所、家庭、法律系统中使用的微软都不公平。

关于未来AI的发展方向,Nadella是这样说的:AI的下一步发展,便是尊重种族和性别平等。

正如没有哪个孩子天生就是一个性别歧视者或种族歧视者,那些都是被教出来的。AI也是这样,而人类就是最好的老师。

谷歌远征教育的路上说不上成功,但你不得不服

这两天,谷歌推出积木式编程教育平台Project Bloks,以及宣布要把VR带入课堂的消息,让不少人兴奋了一把。毕竟,在大家盯着VR游戏和羞羞事的时候,大佬出来带头做教育。有盼头啊!

谷歌远征教育的路上说不上成功,但你不得不服

然而,搜索巨头谷歌搞教育也不是一天两天的事了。而且,地域也早已超越美国,远征非洲。但是,高潮似乎还没到。

谷歌远征教育的路上说不上成功,但你不得不服

再但是,管它呢~ 醉翁之意不在酒

第一战:工具先行,硬件跟上

先是一款让在线教育能够动起来的Oppia

2013年7月份,谷歌推出一个名为Helpouts的在线教学网站。2013年底,谷歌推出互联教室(Connected Classroom)。先热身。

而在2013年在线教育开始热起来后,谷歌继续在2014年2月也推出一款在线教育工具Oppia。这可以说是谷歌为在线教育生态放出的第一个大招,让软件先high起来,云端管理硬件支持什么的都是后话。

谷歌远征教育的路上说不上成功,但你不得不服

之所以说Oppia是第一个大招,是因为这件工具给视频和学生这样的单向在线教育一个大大的耳光——Oppia让在线教育可以互动起来。

怎么说呢,其实就是有了这个工具,学生换个地方被“老师”虐。

谷歌远征教育的路上说不上成功,但你不得不服

Oppia是一个开源项目,它的工作过程是这样的:通过模拟一位导师向学员提问,基于学员的回答,导师决定下一问题的内容,信息反馈,是否进行进一步考察,或是否开始学习新内容。

这些活动可以由多名用户通过Web界面创建,不需要编程经验,也不受地理位置限制。所有用户在这里都可以方便地创建在线互动活动,然后让其他人参与学习。

看视频在线学习,你就是在学习;用Oppia学习,你还能虐完自己后虐别人。这叫“授人以鱼不如授人以渔”。

谷歌远征教育的路上说不上成功,但你不得不服

不过,Oppia一直以来出于无人监管的放养状态,谷歌也曾特别发出免责声明。现在也是不温不火。

谷歌远征教育的路上说不上成功,但你不得不服

然而,不管说这是西方实用主义也好,还是我们老夫子说的“授人以鱼不如授人以渔”,用技术培养技能就是谷歌搞教育的风格。

硬件到位,谷歌推出教育应用套装

谷歌教育系统中底层的硬件设备其实在2011年就推向市场了,首先是覆盖率的问题,它跑龙套好多年后才成为重要角色。

2015年,Chromebook在教育市场的份额已经占到一半以上,超过iPad、MacBook等苹果产品以及微软的Windows产品。

谷歌远征教育的路上说不上成功,但你不得不服

到了这个时候,可以说是谷歌教育开始大规模展开的时代。

谷歌远征教育的路上说不上成功,但你不得不服

而随着硬件Chromebook的推广,2014年8月13日谷歌推出了“课堂”(Classroom)服务,这是谷歌免费提供的教育应用套装(Apps for Education)的一部分。

说起这个套装,那是比全家桶要厉害多的。

谷歌远征教育的路上说不上成功,但你不得不服

当时,谷歌整合了旗下的效率工具应用到教学中,包括Gmail、Google Classroom、Google Docs、Google Drive、Gtalk、Google Calendar、Google Tasks、Google Maps等,让教师可以随时布置、检查作业、回答问题,学生也可以随时交作业、管理日程、提问等等。就是尽力消除一切阻碍学习效率的因素。就是说,你还有 什么理由忘记做作业以及拖延作业?

不知道美帝的学生哥们会不会得一种叫笔记本恐惧症的病?——打开笔记本,“喂,交作业啊~”(一脸冷淡)

谷歌远征教育的路上说不上成功,但你不得不服

“占据美国教育市场一半以上”,对此你想到的可能是赚得红红火火。然并,在基于ChromeOS的Chromebook笔记本项目上,谷歌扮演的是“科技慈善家”。谷歌没有在Chromebook上获得真金白银的收入。

因为,Chromebook用的ChromeOS操作系统,是由谷歌免费提供给电脑厂的。在这里面,获利的是电脑厂商。

那么,谷歌想不想赚钱呢?

大约两年前,谷歌发布了一个教育版的Play Store,即Play for Education项目。

谷歌远征教育的路上说不上成功,但你不得不服

谷歌推出该项目的目的,是在美国教育界推广Android平板电脑。但是,这没有让Android平板电脑在市场中的地位有多大提升,而是给了Chromebook笔记本电脑一个助攻,后者在教育市场占有重要份额,这还引起了苹果和微软的担忧。

当 时,由于Chromebook的出色表现,微软还曾被迫下调Windows授权费。一直以来,OEM厂商需要向微软缴纳每台50美元(约合305元人民 币)的Windows授权费用,而谷歌则是免费向OEM厂商提供和Android和Chrome OS系统,二者在推广系统的做法上天壤之别。为了能够与谷歌竞争,微软将下调Windows系统授权费用,并推出更多廉价Windows设备来与 Chromebook对抗。

而那个Play for Education项目项目,也在2016年2月被关停了,因为谷歌不需要它了。从根本上说,谷歌目前在教育市场的重点是Chrome——而不是安卓平板。

谷歌远征教育的路上说不上成功,但你不得不服

然而,你以为谷歌这就完了吗?在教育市场这一块,谷歌继续主动出击!

Chromebook提供了一个可通过云端访问Windows应用的功能。

2014年4月,WindowsXP开始退出历史舞台,那么,大批的Windows XP用户会在那时放弃Windows XP而升级Win7、或者Win8.1。

而在谷歌推出这项服务之后,这部分用户多了一个选择,那就是Chrome OS。。。。。。求微软高管此时心理阴影面积。

谷歌远征教育的路上说不上成功,但你不得不服

理论上说,未来随着Chrome OS用户数量的提升,其应用商店的价值会像Applestore一样,随之而来的是付费应用的收入、免费应用网站的收入。占领了教育和低端笔记本市场后,这几乎是稳赚不赔的事儿!

不过,这到现在还没发生,目前这些应用仍是免费的,谷歌似乎也没有特别投入去运营。反正,你们先用着吧……

第二战:零基础教育

培养程序员计划

谷歌为IT界人才可谓操碎了心。他觉得人们不会编程实在太可怜了,很多问题都没办法自己解决。于是,决心用技术武装人类。

谷歌远征教育的路上说不上成功,但你不得不服

过去,除了教育全家桶,谷歌还有很多好好玩的教育产品。比如“谷歌涂鸦”、“安卓训练营”、“计算机领袖”等,在此不做赘述。在这里,我们要重点介绍的是谷歌的小伙伴——Udacity,因为谷歌推出了一个可以让你零基础变身代码猴的产品。

谷歌远征教育的路上说不上成功,但你不得不服

上周,谷歌宣布通过在线平台Udacity提供“Android基础微学位”课程,这是首个面向无经验人士的“微学位”课程。

谷歌远征教育的路上说不上成功,但你不得不服

这个酷毙了的平台Udacity,其实也是前谷歌一个酷毙了的员工创立的。

Udacity公司创始人、总裁兼CEO塞巴斯蒂安·斯伦(Sebastian Thrun)是Google X 实验室的联合创始人,斯坦福大学终身教授,参与了很多酷毙了的项目,也被誉为“谷歌无人驾驶汽车之父”。喏↓

谷歌远征教育的路上说不上成功,但你不得不服

2012年,斯伦创建了Udacity,将大学课程免费放到互联网上,让更多人受益。

在2015年I/O的演讲上,斯伦说,他觉得斯坦福的有很多用户权限制,在他不知道的地方,有很多人其实更需要他。

谷歌远征教育的路上说不上成功,但你不得不服

好吧,认真地来说说。

“我 开始意识到,我们的社会有一些做的不好的地方,教育资源的分配不平等,我们的教育模式不对,没有关照到每个人,所以,该是我wake up 并做点什么的时候了。所以我们建立了Udacity,唯一的目标就是:Democratize Education (让教育民主)”

“我 们相信:if you give a man a fish, or a women, the person has dinner for one night, but if you teach him or her how to catch fish, they have food for the rest of their lives.”(授人以鱼不如授人以渔)

再一次出现。

谷歌项目经理表示,谷歌希望让所有人都可以接触并理解Android开发。无论你是什么背景,都可以学习开发能改善周围人们生活的应用。“我们有让你达到与Goolge工程师相等的水平的能力!”

谷歌远征教育的路上说不上成功,但你不得不服

所以再不学你好意思吗?妹子问你安卓卡死了该怎么办你可如何是好?

具体来说,Udacity借鉴Uber的模式,把“打分评价”的事情众包给世界各地的专业人士,当然他们大部分是程序员。有些“打分专家”因此每月挣得钱可以11300美元——比当程序员挣得都多。

又是一个虐完自己虐别人的故事。

玩具模块学编程

编程要从娃娃抓起

谷歌近日发布全新的开放硬件平台Project Bloks,让儿童可以通过玩具方块学习编程。《连线》撰文指出,在谷歌看来,编程教育的未来是玩具方块。

牛人的世界我们是不理解的。

谷歌远征教育的路上说不上成功,但你不得不服

编程代码晦涩难懂,谷歌立志要将它变成一种游戏。

他们设计了一套能够组装形成程序的方块(包括物理方块和电器方块)。利用这些方块,你可以拼出乐器程序、自动化玩具或者可以用来给智能手机和平板电脑发送信息的设备。相当于“电子积木”。

说道这里,你感受到谷歌的真心了吗?

谷歌远征教育的路上说不上成功,但你不得不服

第三战:新硬件时代,VR也要用来玩教育

谷歌旗下的教育产品分为三类:免费的工具类软件、Google Classroom课堂解决方案,以及硬件。不管那个年代新兴、流行的什么技术,谷歌都要用他来搞教育。

去年9月,谷歌推出了探索计划(Expeditions Pioneer Program)。

这个设想很简单:VR技术兴起后,谷歌想要带孩子去到校车到不了的地方。

这个计划需要的装备也不多,就是谷歌已经正式发布教学应用Expeditions+cardboard

谷歌远征教育的路上说不上成功,但你不得不服

与普通的谷歌Cardboard不同,专为谷歌探索先锋项目设计的VR头显上有鱼、行星以及卡通地标的剪影,还有金色的星星和缤纷的彩色印记。然后老师就可以带学生们开启虚拟课堂之旅!

这种教学方式可能无法用于难度教学,但是体验性的课程,杠杠的。至于近视眼什么的问题,不知道谷歌要如何权衡呢?

故事讲得差不多,最后拔高一下:

谷 歌用技术推动教育的路子,无非是:工具先行,整合软硬件搭建底层平台。该公司没有在教育市场获得太多直接受益,9.9包邮的cardboard除了出货量 还能有什么?我们或许可以将其视为理想主义式的浪漫尝试。谷歌VR教育的做法,与想趁着VR热在教育市场大捞一把的企业相比,还真说不到一块,除了大家能 做的事情都还不太多。

业内人士认为,这样的做法,其实是想要跨越经济让科技与文化触及更多人。

【转自雷锋网】

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

今年8月,雷锋网将在深圳举办盛况空前的“全球人工智能与机器人峰会”,届时雷锋网将发布“人工智能&机器人Top25创新企业 榜”榜单。目前,我们正在逐一拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。如果你也想加入我们的榜单之中,请联 系:2020@leiphone.com。

前几天,雷锋网(搜索“雷锋网”公众号关注)小编为大家深八了好多学术大咖,一个个简直碾压……

But!如果说其它参加CCF-GAIR的大牛们是学霸,那你只能用“学神”来形容琳恩•帕克了。

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

因为,她本科和硕士都是以满绩从田纳西大学毕业的……

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

而博士嘛,有点可惜,没能拿5.0。

但是人家的绩点是4.9好吗!

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

琳恩•帕克的主要研究方向是异构多机器人合作,而且还顺手辅修了大脑认知科学的相关知识。

因为帕克在毕业之时有着几乎完美的履历,所以非常顺利地就到了美国能源部所属最大的科学和能源研究实验室——橡树岭国家实验室担任研究员,主要还是她的老本行:异构分布式机器人。

或许帕克对自己的母校还是怀有深厚的感情,所以在2002年之后,她又重回学校执教,与此同时,帕克还建立了分布式智能实验室,并从事协作机器人及人工智能的研究。目前,帕克的主要研究方向是分布式智能系统的计算化——特别是物理层面的,比如多机器人及传感器网络。

而说了这么久的异构多机器人、分布式智能系统的,这到底是个啥玩意儿?

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

简单而言,多机器人系统指的是通过组织多智能体系统,并协作完成某一共同任务的机器人群体。而其中,协作性是多机器人系统的重要特征和关键指标。

这和之前介绍的另一位CCF-GAIR嘉宾迈克尔·伍尔德里奇所研究的方向有些类似,但琳恩•帕克更关注实践领域,来看看她的得意之作吧:

这个由她经手的早期DAPRA项目,主要是针对现有的多机器人在搜索环境下的能力及局限性进行设计的。从路径规划到环境研究,甚至到搜索概率的预判,都结合了通信及算法的权衡。

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

而 下面的这个DARPA项目是为了解决室内搜索的问题,由科学应用国际公司(SAIC)牵头,田纳西大学、Te琳恩•帕克cordia及南加州大学一同完成 的。这一批机器人能够利用新型的协成控制算法探索一层未知的楼层。而更重要的是,这些萌萌哒机器人的自动化程度已经达到一定水准,研究者只需要在一个完善 的用户界面上进行简单的操作,它们就可以动起来了!快没电的时候,它们还会自己跑回“大本营”充电噢。

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

如果它不说自己是史上最复杂的多机器人系统,哪就没有系统敢说是第一了。别小看这几个小家伙,它们可是能够进行导航援助的自动异构机器人团队。涉及多个组件的配合,从标记检测、自主操控、颜色标记、激光定位、基于地图的路径规划,都可以让它们“一手包办”。

其实,机器人也是人(大雾),所以它们也是难免会犯错误的。于是,为了提高机器人的容错能力,琳恩•帕克开发了一个基于机器学习的故障诊断系统(Learning-based Fault diagnosis),简写为LeaF(这强行缩写我也是醉呢)。琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

目前,她已经发表了135篇学术论文,包括6本已经出版的专业书。

除了在学校搞搞科研,我们的琳恩•帕克大神当然不会闲着,她还是美国国家科学基金会(NSF)信息及智能系统(IIS)部门主任,(顺便)当当IEEE院士。同时,她也担任IEEE RAS的行政委员会成员以及多个顶级学术期刊的总编。

而除了笔耕不缀外,琳恩•帕克还经常在公开场合发表演讲,阐述她能人工智能的理解。

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

想必你对这位大神也充满了崇拜,心里也一定有很多问题想咨询她,好了,现在进入Q&A时间!

(友情提示,以下问答由琳恩•帕克在公开场合的演讲/采访整理而成)

Q:您对人工智能的理解是怎样的?

A:由于人工智能将人类从无意义的劳动中解放出来,它会让人类有更多时间和精力去创造。我认为,人类有机会抓住这个机遇,从无聊繁琐的事务中脱离,从事更多有意义、有创造性的事情。至于我们能否把握这个机会,需要我们去探索答案。

(画外音:从此过上只吃饭不干活的生活……)

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

Q:对于人类,您感到最惊讶的一点是什么?

A:那就是,我们不完全明白大脑是如何工作的。事实上,人类大脑所做的工作是如此惊人,它是如此有力和富有适应性。你花费很多精力投身于建立人工智能系统的事业,其实只算得上人类大脑的一部分。

(画外音:机器人想统治地球什么的?还是先歇歇吧)

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

Q:琳恩•帕克大大,您印象最深的一个和人工智能有关的设备是什么?

A:印象最深的是人们根据Roger Ebert以前的许多影评来提取他的声音,并以此创造了一个不错的语音合成器。这其中涉及了许多信号处理与理解人类语言的工作。我认为这很酷,而且效果也不错。人们可以听到他的声音,而不是来自于合成机器的。

(画外音:Roger Ebert是美国一个著名的影评人,于2013年因癌症离世。)

Q:您最喜欢的一部科幻电影是什么?

A:我最喜欢的科幻电影是那些人工智能在里面发挥积极作用的电影,而不是人工智能毁灭世界的故事。我喜欢的电影是《机器人总动员》,因为它的故事告诉我们,机器人可以有情绪。人工智能系统可以没有情绪,但情绪能让人和它有更多的互动。而且,这个小家伙在最后帮了人类的大忙。

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

我比较倾向对人工智能的这类描述,因为我觉得这些才是真的。人工智能可以为社会做一些真正有益的事,而现在太多的科幻电影把目光放在了消极的一面。

(画外音:看来琳恩•帕克大神和薛之谦的心愿是一样一样的啊!)

琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

在琳恩•帕克的眼里,即使人工智能有情绪,也不存在所谓的威胁。对于现在非常流行的人工智能威胁论,你有什么想和琳恩•帕克探讨的吗?欢迎报名参加8月份的CCF-GAIR大会吧!

【原文转自雷锋网】

刷脸识“网红”机器人还嫩点

王昱珩在“寻找网红童年照”环节进行观察。

人脸识别机器人“蚂可”。

6月30日下午5时许,杭州西湖区凤凰创意园一会场,一场人机识别极限对抗大赛正在进行。决战双方是有着超强微观识物能力、人称“鬼才之眼”的 王昱珩和人脸识别机器人“蚂可”。双方挑战的“道具”———50名青春靓丽的网络红人身着统一的服装站在舞台一边,舞台另一侧大墙上密密麻麻地贴着数百张 姑娘们的自拍照。

在公证员的见证下,观众从现场网红中随机抽取数位。对战双方需要对被选中者进行观察后,再从照片墙中挑出对应的照片。比赛共分三场且难度依次递 进,前两个回合,双方打成平手。第三轮的“寻找网红童年照”却将人机双方置于极限挑战之中:十多年的成长脱变足以让人的容貌发生巨大改变,辨识难度巨大。 21分48秒,王昱珩率先按下按钮,提交答案。7分钟后,机器人“蚂可”也完成了识别。答案揭晓:王昱珩成功认出一位网红的童年照,并放弃辨认另一位,而 此轮“蚂可”辨识的两位网红照片都出现差错。

赛后,王昱珩笑称事先并不知道比赛内容也未经彩排,“她们(网红们)的变化真的太大了。”人脸识别机器人“蚂可”的研发团队负责人陈继东则说,人和机器各有所长,此次和人类最强大脑的P K,说明机器学习人类的大脑,“还有一段路要走。”

 历史

  利用人脸识别身份从“找规律”到“对号入座”

“利用人脸识别身份”,人类的这个想法其实早在百年以前就已经出现。早在1888年,达尔文的表弟、英国科学家弗朗西斯·高尔顿,在发表于《自 然》杂志上的文章《对于人的识别与描述》就提出,用一组数字代表不同的人脸侧面特征,并且还对人类自身的人脸识别能力进行了分析。有关“自动人脸识别”最 早的研究论文,至今也有五十年的历史。

直到上世纪九十年代,人脸识别一直都未能突破最初的瓶颈。这项技术在一开始被研究者们认为是一个一般性的模式识别问题,通俗地说就是“找规律”。不过,最初的这三十余年间,研究者们并没能取得多少非常重要的成果,更不要说“投入应用”了。

进入20世纪90年代,麻省理工学院人工智能实验室的一次实验,在对比了基于结构特征和基于模板匹配两种方法的识别性能之后,得出模板匹配的方法。其识别性能,要优于此前“基于特征”的方法。这次试验,基本终止了此前研究者们“找规律”的研究思路。

从1991年到1997年,基于“模板匹配”方法,诞生了若干具有代表性的人脸识别算法。最负盛名的当属麻省理工学院特克(T urk)和潘特(Pentland)提出的“特征脸”。这一方法的思路,是将许多张人脸图像变换到另一个子空间,将图像“降维”,用向量的形式表现出来, 并在平均后得到平均向量,也就是一张“平均脸”。进而再通过计算得到“特征向量”即“特征脸”,并通过对每张人脸与“特征脸”相似性的计算,来实现最终的 “识别”。和之前“找规律”的思路相比,这种思维更酷似于“对号入座”。

 学习

  “训练”机器人让人脸识别真正“落地”

与此同时,人工智能的发展也进入了新的阶段。人们不再满足于将计算机仅仅当成一种工具,而是在思考能否建立、模拟出人脑进行分析学习的神经网 络,让机器能够模仿人脑的机制来解释数据。通俗地说,人们想让机器具备思维的能力,如同Google资深院士Jeff Dean所言,“我们现在最需要从机器学习中取得的是‘理解力’”。

2006年,基于这种想法,英国科学家H inton以自己此前对“人工神经网络”的研究为基础,提出了“深度学习”的概念。此后的几年里,H inton和他的N CA P团队逐渐建立了有效的深度学习算法,并且在2012年的Im ageN et比赛中完胜其他参赛团队。利用深度模型在竞赛中学习得到的特征,可以被广泛应用到其它数据集和各种计算机视觉的问题。而由Im ageN et训练得到的深度学习模型,更是推动计算机视觉领域发展的强大引擎。

2013年,Im ageN et大规模物体检测任务挑战中最高的检测率只有22.6%。目前,香港中文大学由欧阳万里、王晓刚和汤晓鸥教授带领的D eepID团队,将此项成绩大幅提高至50 。3%,达到全球最高。而在此之前,D eepID团队还在LFW人脸识别挑战上战胜了Facebook,并在全世界范围内首次实现了机器人脸识别算法超越人眼,获得了高达99.15%的识别率。

一旦具备“深度学习”这种能力,机器的人脸识别功能就可以变得无比强大。机器不再需要人为输入算法来指示它进行对图像的判别,而是在一种更高阶 的体系下,让机器更加自主地完成这项工作。学界广泛认为,深度学习是过去十年中人工智能领域的最大突破,在计算机视觉、语音识别、自然语音处理等领域有许 多应用。《麻省理工科技评论》还将其列入2013年10项最具突破性技术。

应用

  从实验室进入商用刷脸需降低错误率

近两年,深度学习和大数据两项技术的相互作用,大大提高了人脸识别的准确率。生物识别智能开始进入商用,尤其是金融领域,成为数家互联网公司竞相追捧的香饽饽。在不久的将来,人脸识别技术或将逐步可以取代密码和手机短信校验码,用于互联网金融的身份验证基础平台。

资深专家陈继东表示,人脸识别的互联网级应用和金融级应用存在很大区别。“身份被盗用,直接导致财产的损失。”他指出,在金融行业,对人脸识别 技术的误识率要求非常高。“人脸识别的现实应用,不仅要做到在一堆照片中将同一个人识别出来,也需要将不同的人也能区分出来,这才是最难的一点。”陈继东 强调,识别率和误识率应该综合起来看,尤其是在金融行业,必须把错误率设低。

这一点,绝非危言耸听。人脸识别从实验室进入商用,尤其是金融领域,一个大的技术难点,就是如何防伪造,比如用照片或者视频来代替真人。不过, 大量图片数据被抓取,也让人担心用户的隐私信息是否会遭到泄露。对此,与陈继东团队合作研发人工智能机器人的旷视F ace+ +市场负责人谢忆楠解释称,人脸数据的存储是经过加密处理的。即使泄露,被人拿走的图片也是焦的,黑乎乎的一片,只有算法才能还原,普通人根本看不懂。同 时,数据源也在国家的有效控制之下,一般只有具备经营资质的企业才能开通此项业务。他认为,生物识别智能进入商用,尤其是金融领域,很有必要运用多种生物 特征交叉比对验证。也就是说,除了人脸识别,还要综合运用指纹识别、声纹识别、眼纹识别等多因子生物特征,更好、更安全地服务用户。

  揭秘

  如何训练人工智能机器人

谢忆楠介绍,所谓深度学习,打个形象的比喻就像是在“教小孩儿”。在深度学习的程序中,第一个步骤是人脸检测,即在一张照片中把人脸结构勾画出来。随后 就要在人脸上进行关键点标注,这一步相当于“训练”程序学习观察人脸部特征。“这相当于一个监督式学习,我们会告诉机器人这个人到底是不是一个人。”久而 久之,机器人会得出一些关键点参数。

谢忆楠向南都记者举例,人的两个瞳孔就是两个关键点,瞳距在判断人脸是否为同一人的过程中所占权重较高。众多关键点之间相互联系,形成一个统一 的函数,该函数再对应不同人脸形成一个独有的数值。“每个人脸都有属于自己的数值”,谢忆楠说。以蚂可为例,它识别用户人脸是从二维图片中提取600多个 关键点,进行交叉验证和动态识别。

原文转自新浪科技,链接:http://tech.sina.com.cn/it/2016-07-01/doc-ifxtsatm1103982.shtml?cre=techpc&mod=inf&loc=1&r=0&doct=0&rfunc=71

索尼把自己的未来放在了机器人和虚拟现实?

接下来的几年时间,机器人和虚拟现实会是索尼最重要的两个业务。

周三,CEO平井一夫在公司的年度战略会议公布了公司业务的调整,他说索尼正在开发一款“和用户做情感交流的机器人”。公司还会成立一个规模100亿日元(约合人民币6.5亿元)的创新基金,投资和人工智能相关的公司。

这是索尼时隔近 20 年又重新捡起来的新业务。1999 年索尼发售智能机器狗Aibo,到 2006 年因业绩不佳停产,期间一共卖出 15 万台。2014 年,连售后服务也停止了。

undefined

Aibo机器狗

除 了机器人,游戏和网络服务被描述为是“中期计划中最强的增长推动力”,其中虚拟现实“为索尼带来了机会”。虚拟现实头盔PlayStation VR 已经发布,售价 399 美元(约合人民币 2600 元),索尼成了 Oculus 和 HTC 之后第三家做消费者版本 VR 头盔的公司。

相 关的营收预期也被调高:下一个财年(截止到 2018 年 3 月),索尼预计该部门的利润率会在 8%—10% 之间,高于预期的 5%—6%。整体的营收在 1.8 万亿到 1.9 万亿日元(1164 亿- 1229 亿元人民币)之间,高于预期 1.4 万亿至 1.6 万亿日元。

但为智能手机厂商提供图像传感器的半导体业务,这次的目标被调低近 30%,索尼主营业务的优先级次序正在发生变化。

索尼自 2008 年以来就一直亏损,直到 2015 财年终于盈利。贡献主要来自游戏和网络服务,这部分的收入增长了 11%,其中最重要的是 PlayStation 4 及其相关业务。

在这之外的业务都不怎么好,图像感应器亏损了 2.53 亿美元,手机业务亏损 5.44 亿美元。加上日本熊本大地震导致索尼部分工厂停工,索尼的销售额面临几亿美元的减少。

VR 产品依然有很高的不确定性,目前来看它价格高昂、体验有限。索尼采取的策略是把 VR 头盔当成是 PS4 主机的配件。接下来就看几千万 PS4 用户有多少愿意再花四千块买 VR 了。

原文转自网易科技,链接:http://tech.163.com/16/0701/07/BQSF6RSH00097U7U.html#index_wit

地平线机器人获新一轮投资,将推进人工智能芯片研发
根 据地平线官方消息,地平线机器人获得了新一轮融资,投资方包括双湖投资、青云创投和祥峰投资,晨兴、高瓴、金沙江、线性资本和真格基金等种子轮投资机构也 继续追加了投资。该轮融资金额不详,但来自其中一家机构的投资人在 5月 时告诉 36 氪,这一轮融资估值非常高。官方表示,这笔投资将用来加大对自动驾驶和智能家居领域的研发投入,加快产品研发和落地速度;推进人工智能芯片和系统的研发。

地 平线致力于打造基于深度神经网络的人工智能 “大脑” 平台 – 包括软件和芯片,可以做到低功耗、本地化的解决环境感知、人机交互、决策控制等问题。其中,软件方面,地平线做了一套基于神经网络的 OS,已经研发出分别面向自动驾驶的的 “雨果” 平台和智能家居的 “安徒生” 平台,并开始逐步落地。硬件方面,未来地平线机器人还会为这个平台设计一个芯片——NPU (Neural Processing Unit) ,支撑自家的 OS,到那时效能会提升 2-3 个数量级(100-1000 倍)。

安徒生平台方面,今年3月 上海的家博会上,地平线机器人展示了与家电大厂合作的智能家电,近期还会推出其他新品。雨果平台方面,今年3月9日奇点汽车发布会上,地平线机器人首次展示了基于雨果平台的 ADAS(先机辅助驾驶系统)原型系统。据悉,世界某知名 tier-1 汽车零部件供应商的 ADAS 系统也确定将采用地平线研发的单目感知技术。

成立于 2015年7月 的地平线机器人,已经获得了晨兴、高瓴、红杉、金沙江、线性资本、创新工场和真格基金的联合投资,今年4月 曾获得硅谷知名投资人 Yuri Milner 的投资。值得关注的是,这次参投的双湖投资,龙湖集团掌门人吴亚军正在以个人名义运作一个投资机构。

原文转自36氪,链接:http://36kr.com/p/5048910.html

思科和IBM携手进军企业级服务领域,先从聊天机器人入手

思科和 IBM 今天宣布合作,将人工智能Watson部署到办公和企业级软件中。

这次协作意味着思科和 IBM 将会彼此整合、匹配各自功能服务,很可能会为企业级工作任务平台推出一款全新的聊天机器人。这款聊天机器人将会被用于集成声控软件、自动执行日常工作任务,甚至可以帮助用户从各种繁琐的 App 和数据库信息搜索操作中解脱出来。

本次思科和 IBM 的合作,也反映出行业内对企业级聊天机器人的需求在不断增长,更重要的是,这两家公司希望能够联手对抗其他竞争对手,包括 Slack、Yammer、微软旗下的 Skype、以及 Facebook 企业聊天客户端Facebook at Work

IBM 协作解决方案部门总经理 Inhi Cho 表示:

如 今,很多企业协作平台工具都提供了大量功能,但讽刺的是,这样做反而降低了员工的工作效率。通过技术整合,IBM 和思科可以理解、强化企业团队的工作方式,IBM-Cisco 下一代协作工具可以培养创新、驱动生产力。我们的解决方案里融合了人工智能分析和认知技术,可以根据具体工作情况判断工作优先级,让用户执行正确的工作行 为操作。

据悉,双方合作将会从应用整合开始,其中包括思科的聊天 App 和视频会议工具 Spark 和 WebEx、IBM 电子邮件客户端 Verse、以及 IBM 聊天应用 Connections。

IBM 在一份声明中提到:

双方合作的目标,就是希望能够进一步简化协作办公,IBM 在数据分析、人工智能 Watson、电子邮件和社交协作上拥有丰富经验,而思科则可以提供商务消息、会议和电话协作解决方案。两家公司将会发挥各自优势,设计联合解决方案,基 于每个不同的员工角色、历史工作模式和当前工作任务,根据工作环境提供工具、应用、文档、行为分析等支持,帮助企业用户提高工作效率,用更少的时间做更多 工作。

同时,人工智能 Watson 将会支持 IBM-Cisco 解决方案,利用一个强大的合作伙伴生态系统提供支持。举个例子,在思科视频会议上,某个金融顾问与高净值投资人会晤,此时 Watson 可以提供实时顾问建议、并提供任务处理服务。此外,文件还可以被安全存储在 IBMConnections 里面,并通过 WebEX 无缝传输分享。

如今,企业员工平均每隔 11 分钟就会收到工作干扰,并且需要 25 分钟才能重新专注到工作职责。因此,IBM 和思科计划打造一个更鼓舞人心、更具生产力和数据驱动的工作平台,提高企业员工工作效率。

悟空遥控——会否成为电视交互领域亿级用户工具?

2013年以后,当大量的互联网内容涌入电视,当便宜的智能电视终端开始普及,电视的交互却还停留在“频道切换”的逻辑。

对用户来说,他们强烈需要在爆炸式增长的资源中找到他们想看的内容;对电视厂商来说,交互应该成为电视本身价值和体验的一部分;而对内容提供方来说,他们亟需在对用户注意力的争夺中找到一条最有效的路径。

国内每年电视与盒子的总出货量在数千万量级,电视本身也早早是一个用户过亿的存量市场。今天在电视上,也应该像移动互联网一样诞生出一批用户量能够过亿的基础工具——而在这些产品中排序最为靠前的非电视遥控莫属。

一、安装应用是电视智能化的第一步

2013 年,孙鹏刚刚从上一段创业经历中抽身退出。赋闲在家时,他发现电视的遥控器非常难用。这年刚好碰上各个厂商的电视盒子大卖,据说以Android操作系统 为主导的智能电视已经达到了50%的渗透率。但电视遥控器还是10年前的样子——如果你要安装应用,那得“上 下 左 右”在26字母的软键盘上完成打字和安装操作。程序员出身的孙鹏此时已经有将近10年的互联网工具开发经验,他所参与和联合发起的产品影响上亿人。

这时在家看电视的孙鹏没有闲住,他花了一些时间写了一个PC上通过WiFi向电视盒子推送安装应用的客户端,他把这个客户端命名为悟空助手。这个助手的特点是用起来比较直观简单,当你在PC上把一个应用图标拖进特定窗口,在电视盒子一端应用就会自动安装了。

像 他上一个创业的产品一样,孙鹏把悟空助手挂到网上,就有不少人找来下载,有人在论坛发帖称赞,也有人问怎么不支持XX品牌的盒子。到2013年年底,雷锋 网编辑与孙鹏认识时,悟空助手已经支持市面上好些主流的电视盒子。到了2016年,他讲起前阵子还有个用户在悟空的QQ群里说起来“悟空助手不错”。孙鹏 一笑,“要是我们09年做了这个,那就没有豌豆荚什么事了。”

用户能在电视上安装应用,是电视开始智能化的第一步,也是悟空团队最早的出发点。

二、像操作手机一样直达内容

悟空助手上的开发工作,大部分是孙鹏一个人完成的。他说,

“(悟空)助手只是解决了安装应用的问题,还要解决怎么让用户更容易看电视的问题。”

2013年底,“悟空”由他一个人变成了一间不大的工作室,有了早期的团队雏形。经过摸索,悟空遥控器成为现在的核心产品,解决用户管理应用和看海量内容的诉求。

悟空遥控器是一款在智能手机上操作电视的应用。为什么要用手机来遥控?悟空的团队讲述过一个逻辑是,

传统电视用户通过切换频道来选择内容,像是做“Yes / No”的是非题;但当电视智能化之后,大量的内容进来,再做“Yes / No”反而就变得复杂了;智能手机的普及程度很高,人们也很熟悉手机基于触摸的操作逻辑,用手机app来选择会简单很多。

悟空遥控此后所坚持打造的核心优势主要是两项:应用管理,发现海量视频内容。

悟空遥控——会否成为电视交互领域亿级用户工具?

悟空遥控——会否成为电视交互领域亿级用户工具?

但仅仅这两个功能并不容易,电视遥控app这件事可大可小。

2014 年大部分互联网电视和传统电视厂商都有自己的电视遥控app,但多数是简单模拟了物理的遥控面板。大厂内部真正能投入做如此细分工具产品的资源寥寥,往往 只有几个人的团队。同时将产品往复杂来讲,如果要做一个操作电视的app,它要包含的模块和能力是非常多的:视频聚合、应用推荐、搜索… 放在PC和手机终端上,每一个独立出来都是用户量可能上亿的工具产品。

2013年 – 2015年,刚好是风口理论盛行的年份。在智能电视上,可以说风头起起落落。

  • 互联网厂商进来做电视硬件,重新整合了供应链,打破了传统厂商的利润空间,以至于大家现在千把块就可以买到一台40寸智能电视。
  • 广电总局的政策波动,2014年底 – 2015年初,影响到了小米、乐视、阿里等巨头,几家每年出货上百万的电视盒子,说不卖就不卖了。
  • 视频网站大把砸钱烧版权,实力雄厚的厂商逐渐拉开领先差距;同时电视厂商也重金买版权整合内容,其中的代表如微鲸小米乐视。

应该说行业内的整体环境在变好。但在风头波动里,电视上的工具应用们如“铁打营盘,流水的士兵”。与悟空遥控器同时期,好些大公司通过手机向电视分发应用的各类助手纷纷停止了更新。

而悟空团队在过去3年中稳健增长到近40人。翻看他们的应用更新记录,他们大概每2 – 3周更新一个版本。围绕应用和视频,悟空遥控器在应用管理、视频导航、视频搜索的核心服务上不断完善,甚至加入了童锁、一键清理内存、一键关机这样细腻的辅助工具。

三、观看长视频是用户最核心的需求

孙鹏告诉我们,他们所更新的产品细节,都得从“用户怎样更简单地看电视”出发。

用户首先需要安装应用来提供内容,其次在丰富的视频内容中需要个性化的推荐和快速查找,此外需要一些工具来辅助简化看视频的过程(比如清理内存就是为了更流畅地观看视频)。

从行业数据和用户使用产品的习惯来看,今天的用户看电视,90%以上的时间都是在看视频,而且是长视频。

而 仅仅是为了服务好用户看视频的需求,悟空遥控器已经用几年时间做了大量优化;此外,他们还需要在用户需求上平衡,既能给用户提供各种简捷的路径,同时又不 至于使得产品过重,导致学习起来很复杂。除了产品,它还涉及到大量技术上的优化,比如对众多电视厂商的适配支持。这对于大厂中的小团队,都是很难做到的。

经过3年多的积累,孙鹏说他们现在主要的用户增长来源是现有用户的推荐,其次一些心态开放的电视、盒子厂商也会推荐他们的遥控器app,甚至推荐他们的还有家电卖场的售货员们(因为能教会顾客怎么简单使用电视)。他没有透露目前悟空遥控器具体的用户总量,但他告诉雷锋网(搜索“雷锋网”公众号关注):腾讯视频、优酷视频、芒果TV、爱奇艺、搜狐视频等几家主要的视频网站都已经跟他们建立视频源上的合作,这在行业里还属于少数。简单地说,“今天悟空遥控上的内容将近是小米电视上的2倍。”

因为现有的用户量基数,以及应用和视频的分发能力,悟空遥控器目前已经有了一些收入。但孙鹏告诉我们,眼前的商业收入对他们来说并不是重点。

现有的智能电视观看方式与传统电视本质上还没有出现差别,用户同样会在沙发上享受一个视频。而悟空想做的事情是,让开始使用电视的过程更为流畅,并且让用户在使用电视的过程中形成一种新的互动习惯——也许几年以后,人们能够再次以全新的方式喜欢上电视,就像“红包”重新以微信红包的形式活跃在社交网络上一样

新的电视互动会怎样被诠释,仍然是一个在不断探索中的议题。对悟空来说,给用户们找到“新的互动方式”,才能带来真正的价值和兴奋。

原文来自于雷锋网,链接:http://www.leiphone.com/news/201606/RJj7yHZLlMQGxoa8.html

自定义生命?「碳云智能」要通过基因数字化来改变未来的「人设」

编者注:本文根据「碳云智能」 CEO 王俊在「网易未来科技峰会」上的演讲整理,文章内容略有删改。


我们希望把生命完整地数字化,利用它来开发自己的生命。我们现在正在做的一个项目叫「生命的数字化与长寿」,每个人都有一个长寿的梦,每个人都想自己能够长命百岁,碳云将如何帮你做到?

我 们都知道,生命的程序和基因程序的设定对每个人来讲是 150 岁左右,人的生命代码应该能活到 150 岁左右,为什么你没有活到,如果你想像你的生命程序本身是生命代码的话,有很多的程序让你在半路中程序运行就卡壳了,比如说程序有一个很严重的 Bug 运行到一半就卡壳了,这时候你要改一改。

还有一种情况下程序在运行的过程中被病毒给黑了,这个病毒是从人和生物体的演化而来的,有了病毒怎么办要杀毒,或是你原来的程序被改了,本来爸妈的程序是挺好的,可是因为北京的天气不好,结果你的程序出了问题,就得了癌症的。基因就改变了,我们怎么早期地诊断和治疗?

或 者程序本身不在运行的最佳的状态,每个程序出生的时候就在一个框框,你最好在一个框框里生活,如果这个框框太小你老是愿意往框框的外面跑,你生下来得糖尿 病的风险又很高,你又不注意饮食,又部运动,就很容易得糖尿病。在生命的状态下你应该知道框框在哪儿,你也知道如何干预。

我会集中精力讲干预这块,我们讲程序如果有严重的 Bug 现在是可以用比较简单的方法来做基因编序的,既然有 bug 我们把这个改一下就可以了,而这种会逐步地被身体接受,这个逐步变成未来很有可能很常规去应用的技术。

我能不能把我的基因改一改活得长一点?美国有一个公司叫 BioViva,这个公司的 CEO 自己就做基因的改编,可以延缓衰老的程度和干细胞的可能性,这样安全性能的动力已经逐步地获得了证明,但在人这里是没有做到,他是第一个吃螃蟹的人,我们静观其变。

第 二,如果你的程序被改了,得了癌症怎么办?这种情况下早诊和早治每一个在座的人都应该去做一下你生下来的时候程序会有什么变动。但现在的技术已经远远超过 了这个,除了预测和预防,英国这个小女孩原来有白血病,她自己的免疫细胞都没有了,她拿了一个供体的免疫细胞,做了基因的编辑,再输入到自己的体内,她就 能把自己的肿瘤细胞杀死,同时后面也有药物的排斥反应。她是第一个在基因编辑的方法来治疗白血病的,今后这样的案例会越来越多。

我们都知道 魏则西事件,这使得中国的免疫治疗很可能会退后 10 年,但这并不意味着这个不好,美国总统卡特得了癌症,就是用 PD-1 用新型的免疫治疗的方法治疗了癌症,肿瘤很有可能在未来的 20 年完全被消灭,因为它是完整的可以被预测、可以被干预可以被治疗的病。

讲 了这么多碳云有可能会涉及到的方面,还有一个非常重要的,我们每天在环境里,我们每天在框框里怎么能确保自己活得久。我们每个人的衰老是可以被测量的,在 血液里面有各种各样的指标,如果我们把你的血液完整的数字化可以正确地评估你现在所谓的衰老指数,衰老指数我可以编辑得更广泛一点,随着人群的数量越来越 多,你可以定义每一个人此时此刻的衰老状况,这个是很重要的,它是一个定量的评估地衰老的可能性。

如果我们问自己一个问题,如果每一天我吃 一粒长寿药你里面应该包含什么?我们想起了我的老祖宗开始炼丹,每个丹药应该放什么,我们如果长命百岁每天应该吃什么?这个在科学界有非常多的研究,比如 说端粒酶,端粒的长度随着你年龄的增长会越来越少,而且端粒酶本身会保护 DNA,有时候会修复损伤的 DNA,已经被证实端粒酶本身跟长寿有很大的关系,我们每天有好几十种的植物提取物有端粒酶。

维生素 C 抗氧化,抗氧化会引发身体各种各样好的反应,所以诺贝尔奖获得者曾经讲过,几乎所有的疾病都可以直接用营养学的方式来全部地治疗。维生素 D,就可以提高自身的免疫体系的效用,有人说吃维生素 D 不好,有人说维生素 D 很好,到底怎么回事呢?

二甲双胍是一个神药,低剂量的二甲双胍有很好的治疗的效果,它的作用原理是什么?比如说它有可能是因为细胞本身的氧化增加了更多的氧气给这个细胞,有人说二甲双胍本身改善了肠道微生物,可以改善你的肠道的状况,具体是什么样的?我很希望看到。

阿 司匹林,医生已经建议我的父母每天要吃,阿司匹林可以健康血管。雷帕霉素,这个是可以一直卡路里摄入的一种药物,这种药物本身它有一个基因是 MTO2,这个基因是可以某种意义上延缓衰老,组织或者是延缓细胞的生长。同样的,白藜芦醇,会激发另外一个基因 SRT1,这也是限制卡路里的摄入度,某种意义上延缓衰老和增加寿命。有人说我每天喝一杯红酒,澳大利亚有一个特别的酒庄,有人说那里面的酒的白藜芦醇的 含量特别高,所以喝起来特别好。

还有亚精胺,在生物钟的频率随着年龄越来越增长,我们的生物钟就会越来越缓慢,如果我们补一些亚精胺很可能调节生物钟的频率。这样的案例还有很多,有的人甚至想到了换血,可以把一个年轻的血液换到年老的人身上,这样年老的人变年轻了。

干 细胞,如果我把年轻时候的干细胞换到年老的体内,不仅皮肤会好,身体也可以好。还有免疫细胞,可以清楚衰老细胞,这种清楚衰老细胞的公司,上海有一家公司 在做,可以清楚体内衰老的细胞,达到长寿。但不要忘了,所有你听到的可能性,也许是对的,但它一定只会对坐在这个屋子里面的一部分人起作用,还有一部分人 是不起作用的,甚至有一部分人是有害的。

什么样的东西对于你是最适合的?什么样的东西对你是最适合延长你的寿命,使你的衰老指数越来越好,这就涉及到生命的数字化,所有的东西都是数据驱动的,我需不需要维生素 C,我需不需要维生素 D,我需不需要二甲双胍,所有的数据都需要根据你的数据进行检测。

我自己做了很多的检测,我自己还在做新的数字化的检测,从我的代谢和肠道微生物等各个方面,我也做过研究我自己每天要吃什么东西能长寿。我是痛风携带者,所以在我的长寿药丸里一定要牛蒡,这样能让我的尿酸回到正常的水平。

每 个人都有不一样的东西,那是什么?全方位的生命数据的收集,不仅基因告诉你的框框在哪儿,我的代谢物告诉我体内应不能吃维生素 C,应不应吃维生素 D,我的整个表情会告诉欧应该不应该有阿司匹林的摄入,最终所有数据的结合放到一个人工智能的体系里,你的生命会逐渐被读懂,我们要知道回到刚才衰老指数 的反馈,你可以根据自己血液里的数字化,判断这个人此时此刻的衰老状况,而你的衰老状况和干预手段可以反过来证明,此时此刻这个药,这个胶囊吃了以后对我 是一个保护性的措施还是促进我的衰老。

所以你的所谓的「个体化」的益生菌,所谓的最重要的一件事就是你的个性化的长寿胶囊会在这样一个数据 化的基础上逐步地实施、逐步地实现。可以讲从基因的编辑,从肿瘤的防治、治疗,从复杂性疾病的理解,生活方式的改变,运动、营养各种东西,还有辅助于每个 人有可能能让你活到长命百岁的个性化的长寿胶囊,我们的未来的生命科技对每一个人一定会充满惊喜,这个市场一定比任何一个你看到的市场都要大,因为它切合 到你每一个人自己本身,切合到你每一个人能够活得多好,活得多久、活得多健康。

原文出自极客公园,链接:http://www.geekpark.net/topics/215956

面对越来越火的机器人市场,我们到底应该关注什么?

编者注:本文根据 IDG 资本的合伙人牛奎光、科大讯飞 AIUI 负责人马汉君、图灵机器人联合创始人杨钊、Rokid 联合创始人兼 CEO 黄伽卫和Emokit 创始人兼 CEO 魏清晨在「网易未来科技峰会」上的演讲整理,文章内容略有删改。


「会话时代」的机器人经济

111.jpg

牛奎光:今天很高兴跟各位嘉宾一起讨论一下智能机器人的事,人工智能我们发现从微软上发布了微软的智能机器人,后来包括谷歌、苹果、亚马逊、Facebook 都发布了自己的智能机器人平台,智能机器人有一个新的名词,叫做「会话经济」。

马 汉君:机器人这个事情应该是说最开始 2015 年突然是从以前的物业变成商用,非常普通,我们 2015 年下半年开始发力,机器人这个事情推动了机遇的起步期吧,这个事情的确到现在为止整个行业已经是非常清晰的商业模式,这个方向非常明显,机会是属于前期扩 张、快速沉淀的模式,我们一定会参与,而且在这里面和行业一起寻找真正未来能够落地的机会。

杨钊:从 2014 年起,我们也是转向机器人这个行业,因为我们觉得人工智能对话系统是共同的,机器人应该是更自然的交互,从 2014 年开始我们开始做机器人这块的产品和模型,在 2014 年 11 月份发布了图灵机器人的一个对话系统平台,到现在应该是将近 20 万开发者,其实是以我们的力量来迎接和推动整个行业的发展。

黄伽卫:我们是把很多不同的技术集合起来,做一个面向用户的产品,有很多不管技术方面的水平,目前为止我们看到的机会,我们开始看到把这些不同的技术,不管它是 AI 方面的,或者是传感器、硬件,把它融入到一起,觉得很好用,是我们的一个很大的机会。

刚刚我们记得是一个搜索器,牛总说我们是一个做机器人的公司,而且我们看到一个更大的机会,我们认为是叫做通 AI,我们看到一个很大的机会,把 AI 的一切可能放在家庭层面,所以这样的一个产品它也可能长得像机器人,它也可能不是。

所 以我们第一代产品去看它的话,它其实不太像机器人,因为他没有手、没有脚,不过它是去把 AI 的那种可能性,比如说很多这方面去想的话,我们去听音乐,整个去做机器人的不会想到听音乐那么重要,我们的产品把音乐体验放大,它背后的 AI 会了解你的喜好。他们聚集更好的音乐给你,他有一个很特殊的灯光的效果,其实我们看到这方面很多新的尝试。刚刚牛总也说到了,国外的据说卖了 300 万台,后面又看到了谷歌发布了 Google Home,它长得不像机器人,但是它是机器人。

机器人应用的两大切入点

222.jpg

牛奎光:我想我们机器人现在看起来的话,主要的应用也应该是两个方向,一个是刚才黄总讲的我们叫做情感类的机器人,更多的是以家庭应用场景为主,还有一类是叫交易型的机器人,我不知道剩下的两位嘉宾对这两个具体应用的切入点怎么看?

谢 殿侠:我先接着您刚才讲的那个问题,聊机器人和会话经济还是跟人机交互发展的阶段有关,最早 PC 出现的时候,键盘鼠标是人机交互的媒介。移动互联网手机平板,它的主要媒介变成了触摸,现在智能硬件、包含机器人,我们把 Robot 放在这里面,现在键盘鼠标没有了,触摸屏也没有了,还原到了最自然的人和人之间的交互方式,就是说话,我们必须要学习了。

这意味着任何可能过去的产品服务,过去通过网页来呈现的,通过 APP 来呈现的,现在可以通过聊天对话来呈现了,不管是在手机还是 PC 机上,以及各种各样的智能硬件上,所以从这个角度上来讲,可能现在是一个分水岭,以后人人、事事、物物都可以来交互。

在 交互的过程中,如果说是跟情感有关,尤其是做这一块的,人和机器之间聊天,对微软来讲主要是完成任务,它不管你的情感,对小工来讲呢,就是跟你闲聊的,怎 么能够消磨时间。这个时候对他来讲情感就会变得非常非常地重要,如果说再深入到更深层面,我们儿童机器人经常聊天,律师机器人帮着判案子,股票机器人可以 跟交易对接,再更进一步深入,企业内部企业的管理怎么能够跟这些机器人对接,在报销方面,财务方面制度那么多,我怎么来了解,财务制度那么多,我遇到了什 么问题就问。

这种情况下,只要有智库,只要用户的交互方式过去用键盘鼠标,或者是触摸屏,现在都可能会变成是用聊天的方式,对方无非是个 人,还是个机器人,我作为一个用户我用我最适合最自然的方式获得我想要的结果,得到我想要的服务。我们刚好在中间做语音的 API,我们做得更垂直一点,各位都可以合作,我们有一些音乐也可以聊,最终帮助我们做最终端产品的能够超越用户的期待。

牛奎光:第二个问题,您现在做语音类里面,你碰到的做交易类型的多一些还是做情感类型的多一些?

谢殿侠:实际上对我来讲,我做交易本质上没有区别,我还有一个观点,支持我们的合作伙伴做面向特定用户,针对特定场景提供特定领域服务的这么一些可能性。语义理解我们关注的点有三个,第一个是懂用户的意图,这是语言层面的东西,跟你有相关性,但是弱。

第二部分我知道你的答案,那好了,这个我们反过来来讲要构建知识图谱,这一块我们会做一些基础的,合作伙伴他可能会有一些他自己独特领域的积累,他有模拟性就可以了,还有一个连接的服务,不论是哪一块,第三方服务的对接。

魏 清晨:我非常赞同黄总说的观点,机器人未必像人的形态一样,有胳膊、有腿、有眼睛、有嘴,机器人它只是一些分子而已,其实它背后人工智能的部分,他说过这 么一句话,他是在《情感计划》这本书下了一个很重要的结论,如果要让机器实现真正智能,并且跟我们产生自然而然的交互,需要具备情绪识别和表达的能力,就 需要具备情感。

其实机器人不光要具备智力方面的一些东西,还要具备情感方面的一些东西,这句话里面渗透两个信息,第一个未来的智能和机器人具备情感是它智力的很重要的一部分。

第二个观点,他认识到情感这一块分为情绪的识别和情绪的表达,不光是让机器人知道我们在说什么,或者知道我们长得怎么样,我说的过程是什么样一种情绪,在这个技术上再做一些匹配的服务,实现这样一些东西,这是我们对机器人的一些想法。

机器人如何听懂人话?

333.jpg

牛 奎光:今天来的五位嘉宾也都比较一致,基本上都是把软件作为自己核心的突破的点,我觉得这件事也应该是对的,因为软件,包括计算能力,包括数据的搜集的可 获得性,现在基本上都还是在继续以摩尔定律也好,以一个爆炸数在增长,实际上它本身的进展是很难的,今年进展 3% 到 5% 就不错了,未来的创新我的观点也是这样,我觉得可能更多的创新,或者是说你更容易突破的地方可能还是在软的机会上可能会更大一些。

具体再说 回来,刚才我们谈到了会话经济,它一个起源和大家认为的机会。再反过来说,它解决了跟用户之间的沟通界面更加自然的一个,叫技术的发展上来讲,深度学习的 发展上来讲,它对于自然语言的理解还是有很大的困难,跟之前的语音不一样,语音可能是最早解决的第一个问题,图像和人脸可能是解决的第二个问题。

确实相对来讲自然语言的理解应该是第三个问题,而且这个事情往前看起来还有很多的路要走。所以我想也请因为讯飞也做了大量的工作,我想请马总讲一下在语义的理解上,您认为未来两三年是一个什么样的看法?

换句话说,我们之所以能够让机器人有感情,能够听懂人说的话,未来的两三年之内你认为是一个什么样的进展?

马汉君:其实刚才牛总问到一个问题,你已经把语义分成两端,一个叫做语义和情感,我们在讯飞一种叫做服务,一种叫做闲聊。

牛奎光:应该是一个分法,两种叫法。

马汉君:对,我们这个观点跟谢总刚才讲的略有差异,我们讨论的时候,这两种语义解决的问题是不完全一样的,你像我们举一个闲聊来说的话,先老很多时候我们要解决的问题是说大家是想去跟他进行一些互动。

我 想获得的是一种放松,或者是进行一些玩啊为目的,能陪着它一起说下去就好,刚才导航来说,导航的时候我们可能会说我要去哪儿,我从哪儿出发,我大概要考虑 什么路线,但是大家很多人也提过这个问题,但是其实在人和人的对话也是一种合理的情况,我们转化成用最少的对话帮你完成你的问题。

可能是你先提了一个问题以后,你要去哪儿,我能主动帮你问出来最主要的问题是什么?所以我们正在解决语义这个事情上面,会有两种手段。所以从讯飞的角度,我们现在来做的会把更多的精力集中在解决一个服务的目标,这是我们的一个重点的工作。

牛奎光:第一个问题是交易型的问题。

马 汉君:做闲聊这一块有很大的接触,我们解决的服务的目标也被认为是切入点,我们真正需要解决的问题可能是音乐、可能是订票,可能是一个什么领域,每个领域 它有它的特性,大家每个人都可以集中在自己擅长的领域去做,最后每个人做出来的领域合并在一起以后,整个行业、整个大众老百姓的生活里面他想要的各种领域 下面都能完成比较好的理解了。我们在做的时候能形成一种模式和趋势。

牛奎光:马总也说了一个比较有意思的现象,有的机器人聊天是越短越好,有的机器人聊天是越长越好,结合以下具体的应用,我想先请黄总讲一下你在家庭应用场景中,你是这两种情况都存在呢?还是说基本上是聊天聊得越长越好?

黄 伽卫:就是两种都存在,语义这方面确实是一个很大的挑战,这种方法其实是分层级,这个很窄的场景里面你能很准确地去给用户一个很直接的反馈,我觉得场景方 面,尤其是我们产品的设计,几个场景用的时候你很清楚,控制智能家电、智能计算,这些场景你很清楚,根据不同的场景你在语音方面其解决。

另外一方面,刚刚提到的也会有人忍不住去调侃,他要去聊天,所以我觉得这个性质有点不一样,给他一个很有趣的方法来聚焦,这两个性质是不一样的。

要 是你去问我们的话,我会希望用户怎么用呢?我希望是一个在家庭里面使用的产品,我希望它给我们的感觉是放松、很好玩、很有乐趣,比如说我回家的时候,我回 到家不会一直跟机器聊天,我回到家也不会跟我太太聊天,想休息一下。其实很多别的服务变得很重要,像垂直的领域,听音乐也好,你讲个故事给我,听新闻,这 些更多我们会觉得比较有用、更放松、更好的,能够用到 AI 方面的一些场景。

当然,也会有一些自由的交谈,这方面我们也会一直去加深,因为产品已经上市了,我们会很主动地了解用户怎么用到产品,我们发现用户会问到这种问题,根据我们本身搜集到的一些真实的数据,我们来优化产品,不管是垂直的产品还是只有聊天闲聊。

牛奎光:产品迭代的过程是非常重要的,图灵机器人杨总您这边看到跟用户沟通也是做得挺久的了,你这个地方看到的应用和数据反馈的情况是什么样的?能不能给大家介绍一下?

杨 钊:我觉得现在有一个机器人的平台,让我们平台上面有各种产品的接入,刚才两位讲的就是有的产品可能偏向于聊天,纯粹就是找乐子的,另外一种就是实际应 用,我要解决实际问题的。当然还有很多产品两者兼有之,它会有一个共通的,在我们的架构里面,其实也跟两家差不多,一个是调侃聊天是一类,另外一块是垂直 应用,在我们的使用数据的情况来看,在明确意图的情况下,它的目标比较狭窄,我们通过数据的训练,包括模型迭代是很容易能做到一个非常高的水准的。

因 为聊天这块它的意图相对不明显,表达过量,加上如果你没有很好的知识库和计算的话,包括它的 NLG 生成不够有趣的话,都会极大地影响每个用户跟它进行交互的欲望,所以从目前来讲,因为我们有一个开放平台。所以从我们开放平台出来的产品和用户的数据来看 的话,总体来讲我们的平台的垂直场景准确率还是非常地高。

从对话系统,聊天这个场景来看的话,它的整个对话的准确度,包括它的上下文关联也都在逐步提升至中。当然这块确实刚才讲到对非明确意图的聊天确实是一个很大的难题,这块确实还得根据不同的场景、不同的产品来做对应的优化。

牛 奎光:这个我再稍微请教一下,按理说明确意图的比较容易形成用户的反馈,换句话说你比较容易做到闭环,比较短的迭代的产品。相反的话,因为情感类的事情, 他自己也很难表达他自己的情感,给你反馈说你给我的东西好还是不好,相对来说闭环更难一些。但是你刚才讲的好像做服务类的他们会更难一些?

杨钊:可能我刚才表达得不是很清楚,做垂直应用场景肯定是容易做闭环的,我们的需求问题都非常地明确,另外调侃聊天,因为用户的表达多样化,目的更明确,包括他关心的一些内容都会很多样化,这块其实相对来说更难形成闭环。

但是通过不同的算法和模型我们可以对一些调侃、聊天的一些数据进行一些深层的分析和迭代,然后我们能把对话能够衔接起来,这个衔接的效果确实数据的积累和模型的优化是有提升,但是它准确度肯定是比不上垂直应用场景带来的情况。

机器人创业如何应对巨头竞争?

444.jpg

牛 奎光:了解了,我想接下来问一个稍微尖锐一点的问题,先从这边的四位嘉宾开始,你们在做应用的时候有没有担心因为数据积累的速度不够快,或者是因为计算立 项成本的问题,导致你有担心说以后巨头干了怎么办?我们因为讯飞相对来讲语音干得比较早,至少在语音这个层面上算是一个巨头,我们马总最后说,我们从谢总 先开始说,这个事你怎么想?

谢殿侠:这个问题的确也是个好问题,但我觉得几点,第一因为语音交互张嘴说话,它带来的情况是什么呢?它不像任 何传统的产品或者应用,你没有菜单,你没有界面、尺寸大小的限制,我们知道大家一说话一张嘴随便讲什么都可以。就意味着过去有很多 APP 的时代过碎了,单点解决一个问题。

但是现在到了开口说话的时候,就容易有我想到哪儿就说到哪儿,前面还有讲闲聊,就是你有问我能够单向回 答。但是任务型的我希望能够准确,如果不准确吃不准的我不回答,为什么比如说现在 BAT 还慢,我们就说苹果、谷歌、Facebook,他们能力、资源都很厉害,大家仍然很大程度上把它当做一个玩具,每个人张嘴说话之后的随意性,以为着我们日 常生活工作中的需求,假定如果是八千个,或者是一万。

牛奎光:技术还是不成熟。

谢殿侠:还不够成熟,所以这种情况下,对 于这种创业的公司来讲,如果你是 CMO,一个细分领域扎得比较深,那好了,我在这个领域里边我挖,我可能让针对这个领域的用户场景,或者说是我们能够提供的服务能够让用户的满意度更高, 这种情况下可能巨头看不上的,我们做一些脏活、苦活、累活,我们让用户爽了。

魏清晨:就像前几年有人问这个活如果腾讯干了,BAT 干了你会怎么办?他们如果干这个事就证明这个事有价值,但是具体谁能跑出来,从以往的经历来讲这是一个未知数,这是第一点。

第二点,你刚才说那个问题是数据的积累和算法决定你精度的提升,但是还有一块,我们算法有很大一部分算法是基于专家模型加上深度学习的,而不是单纯进行深度学习的。

还 有一点,可能巨头它切的是某一块,比如说有只切语音的,有只切表情的。我们知道如果判断情绪呢,我们主要是分两类数据,第一类数据就是说我们的大脑可以控 制的,可以伪装和掩饰的,比如说语音和表情,还有一类是大脑控制不了的,比如说心率和皮电。这是作为一个多模态的形式判断,从渠道数据来源的角度去做综合 判断,这是专业性的,我们希望这一点上能走得更远更长一些。

我补充一下刚才提的那个问题,我对于情感和交易这两块还有自己的一些看法,我认 为情感它不仅只是闲聊,它同时也是一种服务,甚至它是评价服务品质和质量的很重要的一个因素,比如说送菜机器人,如果只是把某一盘菜端到某一个人面前,这 样的服务顾客很难认可、很难买单的。比如说他说出来一种语音不是纯机器很深的应验,它带有某种情感,当他看到这个顾客伤心的时候,或者看到这个顾客开心的 时候,它以不同的语音表达出来。

谢殿侠:我补充一下情感结合的问题,比如说听音乐,我听周杰伦的音乐是这样,实际上是我回家了今天比较积 累,他给你放一个比较放松的音乐,我今天签了一个大单非常爽,它给你放贝多芬的《第九交响曲》,所以当构建了个人的知识图谱、音乐的图谱之后,你要表达的 只是你的一个情绪和诉求。

这种诉求当这些文化类的服务是跟情感密切相关的,所以在这个时候我高兴了,你放一首不好听、不好听。这个有点好听,但是有点好听你可能会是一个积极的情绪,也可能会是一个消极的情绪,当如果知道了之后后边再去调整算法的时候,给你的可能是适合你的音乐。

你说它是一个完全任务型的领域服务呢,还是闲聊型的,或者是一个情感服务呢?这个界限已经模糊了。所以这两块只是说我们在分类的时候这么分,但是对用户来讲实际上是一码事。

魏清晨:用户只是以自己的感受为主,拿了一个音乐举例子,我们现在分析根据情绪提供音乐,3 分钟的音乐我们采集六千个数据点,分析它的音高、旋律,打一个标签,这种标注过的应用我们已经超过 160 万首了。

所以说我们跟讯飞、跟图灵都是那种在合作的机构,跟图灵的合作就是除了基本的情绪的识别以外,针对幼儿会有一些更深的基于大数据的对他情感情绪的分析和建议,这个还没有正式发布,就不多讲了。

包 括跟讯飞的合作,有些集成厂商他接入的是讯飞的语义识别的功能,同时又想通过语音,通过语调、语速来判断情绪的功能。可能讯飞的接口占用麦克风以后,其他 的 SDK 就没法再占用了,要占用就会产生冲突,这个机器人厂商正好推动和讯飞的合作,一段语音讯飞来分析识别语义我来判断情绪。

牛奎光:今天来的都是上下游关系。我们听听黄总准备把自己的科技竞争力、壁垒护城河建立在什么地方?

黄伽卫:我们不担心大公司都来做这个事情,我们看到这是一个大趋势,我们做的创新模式是大模式,这个是很早期,现在的问题是要教育市场,从这个角度很多客户来做确实是好事情,到头来确实需要竞争,我们希望能够在市场里面能够留一席之地。

一个家庭的领域里边听的不一定是技术,听的是用户的体验和产品,这个就不一样了。

牛奎光:一旦不拼技术了,大公司也没有什么优点。

黄 伽卫:我们很糟的时候在考虑,因为我们是一个以产品为导向的公司,在家的产品我们要不要设置那么多好的选择?我们最终做了一个比较风险高的决定,我们还是 相信不同的场景它的需求是不一样的,性质不一样,那个时候很早我们做了一个决定,从语音识别到语义,我们自己来,这里面其实有一个原因,因为我们做的一个 产品比较全,我们相信这个产品到家庭环境里面,我们可能需要比如说它的算法、硬件,包含了灯光的效果要结合在一起,要这样做的话,只有我们自己来做。

比如说我举一个简单的例子,我们发现用这种声控产品一定要唤起他的注意,因为唤醒是很重要的,他要很快很准,现在比如说大公司都是唤醒音节越多越好,我们发现在用户使用的过程当中,发现唤醒的感觉很坏,特别是对中国人,声音有点怪,我们把这个压缩成两个音节。

因为我们自己做这个技术,我们自己投入,所以我们把它缩到两个音节的原因我们认为这将会更加智能,我们产品交互的时候,说请就可以了,一个小的案例背后技术投入是蛮高的。

牛奎光:黄总把产品用户体验的能力作为自己一个很高的壁垒,我们期望黄总能卖到 300 万台。杨总对这事怎么看?

杨 钊:我认为现在市场还在一个教育期,人机交互,包括语音交互这一块,整个生活场景,包括解决用户的需求,范围还是非常广的。现在我觉得在一个广袤的想象空 间里边,其实很难说直接是竞争,更多是一个合作,谁能率先以这种语音交互、人机交互方式能解决实际用户的痛点需求,能让市场、让用户能够接受,会为自己买 单,然后让整个产业能够快速地成熟起来,我觉得这个东西其实更有价值。

另外一点,假若这个事情逐渐地在所有的合作商,不管是做语义的、做情感的、做产品的、包括做 AI 技术的,做数据服务的,做内容的等等等等,在整个产品里大家一起把这个市场做得足够大、足够成熟的时候,可能这个时候谈竞争可能是更加合适。

当然我是相信不管是大公司也好、小公司也好,跟所有产业相似的一点,如果一个公司在自己关心的一块、感兴趣的一块有很长时间的积累,如果很担心大公司进来的话,这个心态是有问题的,如果持这种心态,很多事情都不用做了。

杨钊:我感觉大家都想合作,每个公司都有自己最擅长的一部分,但是要真正把这个行业推起来,推出很多经典的产品,能够教育市场、教育用户的话,我觉得合作更关键。

牛奎光:我们听完了创业公司的想法之后,听听巨额是怎么想的?讯飞在语音识别上还是第一把交椅。

马汉君:我这个观点跟黄总有一点相似,数据的确从技术角度来说是很关键的一个东西,我们想在行业里来说,数据我们可能有一个比它还要关键的问题,就是说你的定位。在讯飞里我们把它叫做命题,首先你想做个什么东西,你想解决什么问题去做这个事情。

这个跟杨总讲的一样,在当前比较早期的时候,大家甚至做得一模一样,比如说我们就是为家庭做贡献,一模一样的东西,我们两边的想法和定位对它未来的发展都是一模一样的。在这个时间点的时候,取决于你的成败,很多时候是取决于你对你想做的东西是一个什么样的定位。

如果说最后真的走到一个阶段大家定位是一模一样,再拼的时候,在座的在那个时候都已经是大公司了,更多拼的是合作了。

牛 奎光:所以马总心态很开放,从一个垂直领域扎进去,定位定准了,等这个事情被大家所接受的时候,都变成是大公司了,这也是个好事,应该说会话经济,或者叫 智能机器人,这个事情今年刚刚开始,我觉得在这样的一个背景之下,在人工智能取得一个算是突破性的发展的情况下,还是会有很多的机会,也是你希望能有更多 稀奇的、好玩的、实用的、高效的机器人出来,能够简化和丰富我们的生活。

原文来自极客公园,链接:http://www.geekpark.net/topics/215957

胡郁:5年内,机器语音识别率达到人类水平

干货胡郁:科大讯飞的深度学习之路(PPT下载)1新智元推荐

干货胡郁:科大讯飞的深度学习之路(PPT下载)

干货胡郁:科大讯飞的深度学习之路(PPT下载)

请在新智元后台回复“0628”下载PPT全文

干货胡郁:科大讯飞的深度学习之路(PPT下载)

【胡郁】首先非常高兴有机会在这里跟大家进行交流和讨论,刚才汪建老师说,将来的世界是一个生命科技的时代,我非常同意这一点,将来人类的命运掌握在我们自己手里,我们可以改造自己,但是我们人类也想扮演上帝的角色。

大 家都知道人类能够在地球上统治整个世界,是因为我们有智能,现在人类不仅仅自己有智能,还希望能够创造出新的智能。在当前世界,各种各样的智能层出不穷, 甚至有段时间“智能”一词都被用滥了,到底智能应该向什么方向发展,智能到底应该给我们带来什么?今天我们带着这个疑问想跟大家探讨一下。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

大 家都知道3月份时有个非常著名的AlphaGo大战李世石,在此之前很多人都给出了预测,包括我自己在内,我当时的预测是机器人一定能够战胜人类。为什么 呢?其实在研究界有句很有名的话,机器人在智能方面战胜人类一定用它最擅长的方式,而不是用人类思维的方式。我们原来在讨论时总想着下围棋是一个非常高尚 的运动,并不是每个人都能把围棋下得很好,但其实机器根本不是这么想的,在下完这个比赛后,凤凰卫视《一虎一席谈》请我去讨论AlphaGo和李世石对弈 的情况,记得在比赛前柯洁九段并不认为AlphaGo有多厉害。但在节目上连线柯洁九段时,他就比较谦虚了,说自己还需要好好准备。

为什么这么说呢?我们来看一下,AlphaGo为什么能够战胜人类,因为它用的确实不是人类所擅长的方法,而是机器所擅长的方法,AlphaGo能够同时计算每步棋下几十步甚至上百步的可能性,而且AlphaGo能够记住3000万种法的对弈,而这是我们人类所不擅长的。

反过来人工智能是不是能够在所有方面超越人类呢?我觉得这也不一定,因为我们看到围棋是一个完全信息透明情况下的公开博弈,就像以前的国际象棋,机器是占有很大优势的。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

很 多人会问,人工智能到底体现在什么方面呢?我们知道人类有农业革命、工业革命,还有现在讲的信息革命,但可能很多人不知道的是,人类在统治地球的过程中其 实经过了漫长的历史发展。有一本书《人类简史》,以色列一个年轻的历史学家写的,他在这本书里写道,其实人类在地球上已经出现200万到300万年了,但 这些人类在全球各地,就是我们讲的猿人——中国的山顶洞人、元谋人和蓝田人——但经过历史学家和基因工作者的研究,大家知道,7万年前,我们的祖先叫智 人,从非洲走出来,走到世界各地,把其他猿人都给灭种了。现在不管是黑人白人还是棕色人种、黄种人,都是智人的后代。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

在 这个过程中,好像他们突然开窍了一样,人的智能在经过两三百万年的发展,突然迈上一大步,是什么让他们走到这一点?历史学家把这叫做“认知的革命”,因为 他们发现这些人跟其他猿人最大的不同是在他们的语言得到了极大的丰富,大家知道先有对话才产生文字,产生文字后有几个好处:

第一个好处,它 可以更好地描述周围的自然世界,比如河边有只狮子,他们知道狮子长多大,身上有没有病,处于什么样的状态,更重要的是因为有了语言、有了语音,我们可以描 述团队和团队之间的关系,如果没有语言,看现在动物群种里面的黑猩猩,一个团队最大不能超过50头,超过50头就无法管理。但智人因为有了语言,因为他们 之间可以八卦,张家长李家短,他们可以组织上千人的团队做一件事情。更重要的是,有了语言以后我们可以描述我们共同想像的内容,一些虚构的概念,“公 司”、“梦想”都是从此得来。所以我们可以看到,现在历史学家一个非常重要的认为,就是人类的认知革命将人类的智能带到一个新的高度。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

回顾一下我们可以看到,从刚才讲的机器所擅长的运算智能,算棋谱时机器比我们强很多,但如果讲到感知智能,就是我们看到世界、听到周围世界的能力,机器也在快速赶上来,但在认知方面,让我们能够有语言、有语音,能够积累知识、能够进行判断这方面,机器其实比我们差得很远。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

这也是科大讯飞现在以语音和语言为入口的计算机的认知革命,我们所执行的讯飞超脑计划想要做的事情,就是把机器的感知智能和认知智能通过传感器和算法感知世界,并且能够对自然的人类世界进行认知,作为我们人工智能一个非常重要的突破点。

用机器计算模拟人类的感知和认知

干货胡郁:科大讯飞的深度学习之路(PPT下载)

怎 样实现这种突破,其实我们有两种不同的途径,一种和我们的脑科学非常有关,我们可以对大脑所有的神经元构造和它的工作机理进行分析,我们甚至可以根据大脑 的整个工作机理重构出来真正和大脑相同的机制,这是一条思路,但这条思路时间比较长,现在包括一些发达国家也在投入这方面的研究,另外一条思路就是用互联 网的思维,利用我们机器学习算法和大数据在尽可能快的过程中,就像AlphaGo一样,它其实就是利用了这种方法,不完全能模仿大脑,但利用机器运算的方 法能够模拟我们的感知和认知。今天我讲的主要是后面的具体方式。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

从人脑中获取智能最关键的一点是,就像我们都知道人类现在能飞上天,但我们并没有把自己变成鸟,我们是知道了鸟在飞行时的空气动力学,我们研究大脑,其实并不是把大脑完全复制,而是希望找到大脑中的“智力动力学”,进一步优化我们整个学习的算法。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

从 另一个角度,如果用互联网思维来解决、改进我们的人工智能,要感谢三个方面的进展:一是人工神经网络,这个人工神经网络就像我刚刚说的,只是学到了大脑一 些简单的机理,没有大脑那么复杂,但已经可以很好地工作了;另外拜互联网和移动互联网所赐,我们可以得到大量的数据;更重要的是我们有千千万万的,就像网 易、讯飞这些直达用户的产品,这些产品把用户的使用习惯源源不断传入后台,我们可以利用网络的效应不断地优化它。正是因为有这三者的支撑,我们得到了非常 好的结果。

用识别图像的方法“看”语音,正确率大幅提高

干货胡郁:科大讯飞的深度学习之路(PPT下载)

真 正人工智能的框架应该是什么样的呢?再给大家举个例子,人类大脑皮层在工作过程中分为两个层面:一个叫感知层面,就是我们讲的视觉、听觉和触觉,还有一个 层面是认知层面,当我们看到一只猫,听到猫的叫声,或者是摸猫的皮毛,人脑里有一个概念,这些概念形成了我们语言中的单词和词汇,就是“猫”这个概念,它 们汇聚到我们讲的语言和理解的大脑的认知皮层层面。所以在讯飞超脑里分两个层面:一是感知智能,是对我们听到的、看到的、碰到的东西进行识别,另一个是认 知智能,就是把识别结果上升到我们认知的层面,形成一个概念空间的表示和推理。在过去5年中,科大讯飞相继把深度学习网络应用在刚才讲的感知和认知,包括 视觉、包括听觉,包括自然语言,包括翻译的各个方面。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

介绍一下我们最新的研究成果(工作人员播放一下第一句,再播放一下第二句)。

这 是一段语音片断,大家听到第一个好像是“休息”,第二个好像是“休息室”。但当听完完整片断时你会知道,原来是“《西游记》之大闹天宫”,人脑是怎么工作 的呢?人脑能够记下短时或中间的或长时的记忆,通过这种记忆,我们可以看到我们现在的神经网络其实是可以很好地模拟这个过程的,我们通过一种递归的方法, 就可以让神经网络能够模拟大脑方面的感觉,这是现在最新型的递归神经网络用于语音识别的过程,这个过程非常复杂,我就不一一介绍了。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

但光有递归还不够,光能够存储记忆还不够。现在最新的一个方式是用图像的方法识别语音, 这是当前最新的技术,什么叫做图像方法呢?大家可以看到,下面这个语音是我们平常在录音里看到的波形,但当语音进入我们的耳朵时,耳朵里的纤毛会根据它的 长度不同与语音中不同的频率进行共振,如果把共振的频率分析出来,我们可以得到下面的语谱图,这张图可能会受噪音、口音的干扰,但这个图形里的信息很丰 富。在MIT专门有科学家研究,如何根据这些图形就能够分辨出你说的这句话里用了哪些文字。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

如果你是一个盲人,你的耳朵就会特别灵,因为它借用了我们在视神经方面的一些神经系统和细胞,这样可以把一些能力借用过来。

可以说,现在我们的语音不仅可以听到,而且可以看到。因为这样的结果,在各种各样的输入法里,在语音搜索里,还有在各种各样的语音交互式系统里,语音识别的错误率正在以每年30%的水平下降我相信再过四到五年的时间,最后的语音识别系统就能跟人整个的感觉完全一样了

干货胡郁:科大讯飞的深度学习之路(PPT下载)

刚 才说了,在感知方面,讯飞的语音识别技术不断取得提升,但是在认知方面,它还要解决几个非常核心的任务——讯飞超脑关于语言理解及深层、知识表述及推理, 还有自主学习,要实现这些必须要有两个层面的东西:第一是要解决自然语言描述的问题,在此基础上我们要解决语言理解,还有更深一层的知识表述及推理。下面 我们一一看一下。

用“词语卷积”在空间上表达词语

干货胡郁:科大讯飞的深度学习之路(PPT下载)

刚 才我们提到了大脑在大脑皮层中关于概念的表示,它是一张图,不同的词语它们之间概念是有空间的,我给大家举个例子,比如“大家好”,传统的表达,每个词就 代表了一个空间,我们把每个词的出现看成“1”,不出现的地方看成“0”,这是传统表现词语的一种方法,词语和词语之间,要不就是距离相同,要不就是不 同。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

现在我们采用一种连续的空间来表现词语,每个字、每个词都可以用“词语卷积”的方法,用一段连续的数字,相当于一个空间里的坐标系,这样每两个单词之间的距离就可以把它计算出来

把 所有词分一下类就可以看到这么一个结果,比如我们可以看到新浪、网易、腾讯,这些东西是连在一起的;我们可以看到吕布、张飞、关羽、诸葛亮,它们是比较接 近的。实际上,在我们的大脑皮层中如果你来测量,比如我播放一个词语,我的大脑里会出现放电,相关词语在大脑皮层中存储的位置也是非常接近的。

利用这种方法,我们就建立了一种表现词语空间概念的表达体系,在这样的表达体系之下,我们可以进一步地去分析词语层面、句子层面和篇章层面,以及它们在各个层面上的连接和计算的距离。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

有了这个以后,我们来看一些实际的作用,它们能做什么样的事情呢?首先我们看一下语言的理解。

首先来看翻译,在翻译方面,我们知道要进行语句的练习,因为不同语言是不一样的,这时候用到人脑中一个非常重要的概念——关注度模型,比如我们人在看一幅图像,海边有一个灯塔,我们看的时候注意力是集中在灯塔上而不是其他方面。

基于注意力模型的神经网络

下边这张图比较有意思,下面这张图是一个女司机在开车时观察各种各样的东西,她的注意力只能集中在有限的方面,相对男性要窄一些,所以人们常说“女司机杀手”可能就是这么来的。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

如果我们来看一段文字,这两天正好欧洲杯,我们的注意力其实也是集中在那些文字中比较有信息量的地方。这种关注度模型,其实它的方法是能够把我们最关注的那些输入量自动寻找出来,与我们最终的结果进行对应。我们来看一下基于机器翻译的实际例子:

大 家都知道,不同的语言之间的机器翻译,比如有很多谓语、主语、宾语,它们的位置是不同的,会进行倒装,顺序也会发生很多变化,原来用规则的方法来描述这些 变化非常复杂,通过我们现在讲的这个神经网络,大家可以看到,输入“我是谁”,“谁”和“我”,它们的位置是有差异的,利用attention这个神经网 络,它们可以自动找到对应关系。采用全新注意力模型的神经网络翻译系统,相比传统系统,提高会非常多。

再看下一个具体的例子,我们都知道最近科大讯飞在教育方面做了非常多的工作,我们希望能够利用机器人帮助我们的老师进行卷面批改,比如我们写了一个作文,这篇作文,我们希望机器人也能给它打出分数并给出它的评语。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

大家看这个样例,右上角的94分是这篇文章的得分,从这篇文章中可以看到它用到了排比,用到了一些语句的引用,我们如何来做,让机器也能看懂这些东西?机器的关注度如何自动落在这些关键的地方呢?其实很简单,刚才我们讲了,用连续空间把它表示出来,这些范文和作文之间的向量,利用关注度模型,会自动找到彼此之间比较对接的地方,它找到这些对接之后,就会进行深层分析

通过这种方法,机器自动找到了这中间有相关的地方,应该讲,现在我们这方面的结果在中考和高考的作文评卷,不管是中文还是英文,都取得了很好的效果,比普通老师改得还要准确,当然这是大规模的结果。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

最 后我们来看一个阅读理解题,大家看到了,这其实是一个答题系统,我们看一段话,“月牙的影子在水中晃动”,原来有个题目叫“小鸭子看见了,以为是条鱼,赶 紧游过去”,这是阅读理解,现在题目是我把“小鸭子”抠掉,让机器看完这段话以后自动在上面填出来这地方应该填什么,利用我们现在的系统,我们会把篇章和 问题进行attention的规划,“小鸭子”也在其他地方也出现过,它可以计算出每个地方热力度(关注度)的情况,后来我们发现“小鸭子”的关注度最 高,这样我们就可以把“小鸭子”填在这个地方,而且是填对的。

现在我们的机器在阅读理解方面能达到6岁儿童的水平,大家不要小看6岁儿 童,6岁儿童在常识的理解达到了一个水平,而在6岁以后主要是学各种各样的知识,这就跟我们认知到的,2岁、3岁、4岁形成个人最重要的学习能力,这方面 是最一致的。相信随着6岁儿童常识的学习能力达到以后,我们再给他灌输小学、初中、高中的知识以后,它最后就能考上大学。

非常感谢大家的聆听,谢谢。

干货胡郁:科大讯飞的深度学习之路(PPT下载)

谁把王石坑到了这一步

把王石带进坑的,是他的队友。

宝能否决重组议案和“血洗董事会”两波冲击明显让他猝不及防。据说审计部门也在介入。

在股东大会上,王石向姚振华道歉,向小股东道歉,表示愿意妥协,两次提及离职。

从来不低头的王石,低头了。

他的队友没有跟他一起低头,因为他们没在坑里。

一、看错了势

悦涛以前提过,万科股权争夺背后的大势是,没有资本愿意再做配角,无论原来的大股东华润,还是新晋大股东宝能。

以前资本方交给经理人主导,因为经理人能带来最大的成长性:利润和市值双扩张。

“华润入主万科的2000年,是房地产业爆发的前夜。无论从量,还是价,中国地产业都有巨大的增长空间。

资本方什么都不做,只靠企业本身的经营,都能获得足够可观的回报。这个阶段需要充分释放经营管理者的积极性,这是华润的智慧。王石管理层也对华润的“积极不干预”政策感激涕零。

2000年-2007年,万科的净利润增长了15倍,股价则增长了20倍。作为大股东的华润无论从分红,还是股价增值上,都赚得盆满钵满。管理层和资本方皆大欢喜。

2007年以后,好梦不再。2015年万科净利润比2007年增长了3倍,但股价每况愈下。要不是宝能的姚大哥前来打劫,股价连2007年的一半都不会到。”

万科的股价走势,以2007年为中点,前后鲜明反差,最后一段拉升是宝能自己作出来的

房地产的扩张周期彻底结束了,首先终结的是资本溢价。这时管理层在经营层面再牛逼,也给不了资本想要的回报。

资本的着眼点是以公司为平台进行资本运作,而非局限在产业经营。新晋的资本方会有同样的诉求。这就是大势,不因哪一个股东而改变。

此时王石继续反客为主,把资本当玩偶进行配置,运作越得意,越激怒资本。

王石其实没有追求过万科的股权。但郁亮运作了一个“合伙人计划”。一直到宝能敲门,他们都没意识到,这个计划会让所有大股东不安。

计划不在大股东掌控之内,倏忽间,万科两个资管计划加工会持股超过了7个点,之前已是仅次于华润的万科二股东。

相比万科公司层面蜻蜓点水的百亿回购,合伙人计划用了加杠杆的激进风格。岂不让大股东生疑?

不要说华润和宝能在争夺控制权,万科管理层自身已争权在先。

一路走来,体现出的是万科管理层整体对资本方存在感的漠视。到宝能进场,演变成资、管对立的局面,万科管理层对大势的错判,是根本原因。

二、看错自己

王石和万科管理层一直自恃的是团队优秀到无可替代,资本离我不行。因此有我行我素甚至叫板的权利。

首先优秀不是轻慢的理由。

其次,这是一个被夸张了的错判。

优秀是相对的,相对是看程度的。

万科某种程度上是被符号化了:把想做到什么,当成已经做到了什么。

万科在研发,但也待实现

万科的优势在于杰出,劣势在于没杰出到不可替代。这是与资本博弈的最大短板。

万科的专业,说到底是土地、资金周转和流程管理上的专业,还没转化到用户端的口碑和品牌溢价。

也就是在开发端,效率很强;在产品质量、社区服务等用户端的专业溢价上,还没体现出来。

但是在中国地产业,开发端的这种差异,还谈不上是壁垒。从拿地的资质,到产品销售时的溢价,都没有不同。

如郁亮所说:“住宅行业一直是粗放式的发展,万科的管理能够精细化到哪里去呢?我们的粗放管理问题还没解决呢,在精细化管理上可以说还在学习阶段。”

这也是整个中国地产业在粗放发展期的特征:开发端的钱好赚,用户端还在理念阶段,边研究边等风来。

这阶段企业经营间的差异,不是苹果和小米的区别,而是小米与小米。

经理人对企业的差异,也就是成本、周期上的差异,和苹果对乔布斯的依赖,有本质不同。

孙宏斌谈到万科之争,举例自己的融创:有万科1/4的销售额,但只有万科1/27的市值。他如果是资本,会选择收购自己的企业。虽然他敬重万科。

为免误解,再说一遍:万科和万科经理人都很优秀,没达到不可替代。

当万科管理层以不可替代来博弈股东时,只会让股东加速进场。因为这是对股东永久的威胁:任何一家公司的大股东也承担不了管理层的集体罢工。

三、看错股东

王石最初对宝能的出言不逊,因为两方确实结过梁子:深圳东部海上运动基地的争夺。情有可原。

但此后跟两大股东都闹翻,说明确实太任性。

像华润这样的大股东,在A股市场不会再有了。自身有地产,让位万科去发展,为挺万科,不惜让任志强净身出户。

企业是自己的,你尽可以去做自己。但你是上市公司时,必须考虑大股东的阶段性诉求。

遗憾的是,万科从没考虑过。有个段子,说当年郁亮制定了万科的发展战略,向大股东华润的新任董事长宋林介绍,宋林表示挺好,然后来了一句:郁亮,你告诉我,在万科整个发展战略里,股东在哪里?

郁亮当时是懵逼的。我好不就是你好么?可他解释不了万科这么好,王石为什么还要去登山游学。股东亦然,是有自身的发展规划和成长诉求的。

在万科历史上,华润郑重其事追求过控股股东地位,连操作方案都拿出来过。宋林落马前都表达:履职期间未能令华润控股万科,系其职业生涯憾事。万科不是不知,但最后搞了自己的“合伙人计划”。

王石去年求救华润时,就应该感觉到华润态度暧昧背后的意图。他最后的决定是坚决引入深铁新股东,其实是连华润做控股股东都不想接受。

这个股东,不该小看

董事会一战,已是冰冻三尺之后的结果,绝不是突如其来的对决。这一战,各自已无退路。

王石想毕其功于一役,宝能想毕其功于一役,都输了。华润找漏洞反制即可。

华润的特殊性还在于,它是个有信心整合外部资产的玩家。包括万家、怡宝、雪花啤酒、三九医药,无一不是并购整合而后发扬光大。而且市场化运作为主导。

当万科说“我输了你能赢么”的时候,这个大股东,有理由不这么想。

基于自身的经验、地产业务的布局、长期规划和短期阵痛的平衡,以及对管理团队的分化策略。都是可出的牌。

四、看错队友

王石在对外沟通和换位思考方面是有短板的。点火为主,需要的是水。他的队友如果真心把老王看作家人,不会看着他一步步走到今天。

在傅育宁说“这合适吗”的时候,万科的回应居然是:合适。管理层上下无一人去跟华润沟通,哪怕是获取华润的真实想法也好。

华润要拿回第一大股东。是傅育宁在华润履新以来,头一次做这么大的决策,一旦定下,会使出多么大的力度来给自己立威,可以想象。

万科这边,即使不认可这个诉求,也不能说,因为有一个已经闹翻的大股东宝能。更何况把华润直接打入敌营。

6月26日,万科发出“致合伙人”的内部信(其实是对外)。内容一共有10段,分段总结如下:

1、2000亿、500强、新十年;

2、全体合伙人,勇敢面对新股东;

3、数英雄人物,还看事业合伙人;

4、曾经有一份股权摆在我面前,我没要,我骄傲;

5、请股东和我们共建和谐社会;

6、我们是优秀团队,不是资本奴隶;

7、数人才和知识,还看事业合伙人;

8、数各种压力,还看事业合伙人;

9、数东山再起,还看事业合伙人;

10、全体合伙人大团结万岁!

看到这封信时我先替王石崩溃了。是要用这阵势来镇住两个大股东?还是自我感动?

这是股权争夺战啊兄弟,真正应该发出的是“致全体股东信”。告诉全体股东,这些年管理层为股东做了多少事情,奉献了多少心血,哪些是别人没做到而我万科为你们做的,以及希望股东支持什么,理由是什么?

并不需要多么高深的公关策略,坦诚、开放、尊重股东是最好的策略。

任何强化管理层存在感、弱化股东存在感的口号,都把老王往坑里又推进了一步。

通观万科股权战,王石是点火的人,需要的是水。但队友里没人给他,反而帮他点火,强化对立。戏到半场时,面对两大股东,还是如此。

然而,出头的是王石,压力集于他一身。宝能提案罢免的是董事会和监事会,实质是针对王石,而非郁亮及其领衔的业务管理层。

在年度股东大会,王石自己已经意识到这一点,对大股东和小股东双双致歉,姿态放到最低,对所有问题尽量沟通,希望弥补自己之前的出言不逊和高高在上。

但他的队友没跟他走一个频道。对“不善意”的问题,不善意回应之。在小股东建议王石和郁亮向小股东因沟通不畅鞠躬致歉时,王石起身,郁亮没动。

说明……

1、管理层不认为自己有股东沟通上问题。只要公司干得好,这不是事。

2、王石想挽回,下面的人也不听他的了。

老王点火的时候,队友帮他火上浇油。现在想灭火,没有队友来帮他。

这形势就像,王石给自己挖了一坑之后,一堆有情怀的支持者把他往坑里推,但是没有人跟他往下跳。甚至包括他的“合伙人”。

“事业合伙人”,不是一个强纽带的联系,也不是一份攻守同盟的契约。在外压面前极其脆弱。

万科停牌前,17名万科高管清空股票。一位万科高级副总裁出售1379万股,仅余2.1万股。这位“万科合伙人”,很可能把万科抛给了姚振华。

万科团队会因董事会改组集体出走么?我看难。对大多数人来说,情怀诚可贵,饭碗价更高。

离开万科还有他发挥的舞台么?中小地产商这些年一样活得滋润,并不是靠万科的模式,政商关系、银企关系。他适应别人还是别人适应他?

郁亮淡定。因为:

1、这事里出头的是老王,他没有直接开罪大股东;

2、他的筹码,比老王多,万科的管理主干目前在他这里,资本对他的需求超过老王。

最终是走是留,恐怕也会权衡利弊。

虽然人们情感上希望看到有难同当的江湖豪情,但大概率是老王一个人留在坑里。其他人成为新股东的“新合伙人”。

文:悦涛。转自虎嗅。http://www.huxiu.com/article/154191/1.html?f=index_top1

超过80%语音开发者的共同选择