• 聊天机器人公司NextIT 计划融资2000万美元,在美国军队部署人工智能助手
    可能很多人不知道,在苹果 Siri、微软小娜、以及亚马逊 Alexa 推出之前,Next IT 就已经开发了多款聊天机器人应用了。这家总部设在华盛顿州斯波坎谷的初创公司为阿拉斯加航空公司开发了“Ask Jenn”,为美国铁路公司开发了“Ask Julie”,这一次,他们为美国军方开发了“Sgt. Star”

    NextIT 正在募集 2000 万美元融资,希望能在这一波对话人工智能助手的行业浪潮中获得竞争优势。该公司总裁 Tracy Malingo 表示,本次融资将分为两部分,其中 1200 万美元将采用股权投资模式,而剩下的 800 万美元则会选择债务重组完成,她说道:

    我们当然不应该错过这次人工智能行业发展大潮,对于这次融资,我们感到非常高兴。

    截至目前,该公司一共获得 1450 万美元投资,Malingo 希望本次融资能在三个月内完成。不过,作为一家私人公司,她拒绝透露本次融资中 Next IT 的公司估值,也没有告知参投投资方的具体信息,目前只知道共有 11 家投资公司参与了本轮融资。

    NextIT 成立于 2002年,创始人是自诩为 “竞技牛仔” 的软件工程师兼连续创业家 Fred Brown,他们也是业内首批在自动电话助手里提供自然语言识别服务的公司。举个例子,下面是阿拉斯加航空公司官网上自动助手服务的一段对话:

    Jenn:你好,我是 Jenn,阿拉斯加航空公司的自动旅行助手,如果需要在我们网站上寻求帮助,可以输入你的问题。

    用户(你):你是由 Next IT 公司开发的吗?

    Jenn:我们是科技前沿公司 NextIT 开发的,也是美国航空业内最早出现的自动助手服务。

    如 今,几乎所有科技巨头都在研发聊天机器人技术:微软的人工智能战略是以 “小娜” 聊天机器人为中心的(尽管微软也尝试了另外一款 Twitter 聊天机器人 Tay,但似乎效果不佳);Facebook 也将聊天机器人整合到了旗下 Messenger 平台;当然还有我们熟知的亚马逊 Alexa 和苹果的 Siri。

    人工智能助手看上去正在掀起一股全新的科技浪潮,不过 Malingo 却认为,目前整个行业依然处于基础阶段。

    NextIT 采取了 “迂回策略”,没有和行业巨头进行正面竞争,相反,他们利用所谓的 “触点和端点” 技术,用专属虚拟助手连接多用途机器人,提供各种服务。比如,用户可以轻松修改自己的航班预留信息、挂失更换丢失的借记卡、或是确认是否按时吃药。

    去年,Next IT 发布了 Alme 软件平台的应用程序接口集合,帮助企业更便捷地开发虚拟助手功能,提供个性化的用户交互服务。此外,Next IT 还将旗下医疗健康部门转型成了一个独立运营的实体机构。

    根据 Malingo 透露,目前 Next IT 的员工数量大约是 150 人,利用这笔最新投资,公司计划扩大员工队伍,招募更多人工智能专家,希望此举能帮助该公司在人工智能领域里占据更好的竞争位置。

    她说道:

    我们认为对于 Next IT 来说,现在才算是刚起步。我们希望帮助其他行业里的企业,成为他们的自助语音助手专家。如今,每家公司都在寻求人工智能解决方案,我们希望这些公司能够利用 Next IT 平台获得帮助。

    【本文转自36氪】

    智能灯具开关制造商Deako获得350万美元风险投资,预计明年西雅图市场占有率将达到10%

    该公司表示,他们刚刚做了产品 beta 版测试,不仅完善了服务接口,还新增了控制功能,允许用户使用 Deako 智能开关轻松控制家中所有灯具。

    Deako 是一家智能灯具开关制造商,公司总部设在西雅图。本周四,该公司获得了一笔 350 万美元风险投资,预计到明年,该公司的技术将会应用到西雅图地区 10%的新房中。根 据该公司向美国证券交易委员会提交的文件显示,本次最新融资之后,Deako 近八个月的融资总金额达到了 680 万美元。公司联合创始人兼 CEO Derek Richardson 透露,截止目前,共有来自硅谷、纽约和芝加哥的六家风投公司投资了 Deako,但他没有透露这些投资方的名字。

    Deako 的客户并不是房屋户主,而是房屋开发商或是家庭装潢电路设计服务公司,后者需要负责在新房内安装硬件和家用电器设备。Richardson 没有透露他们的合作伙伴信息,但是表示目前 Deako 的合作公司数量已经达到了两位数。

    该公司表示,他们刚刚做了产品 beta 版测试,不仅完善了服务接口,还新增了控制功能,允许用户使用 Deako 智能开关轻松控制家中所有灯具。此外,用户还能在配套的智能手机 App 应用上控制室内灯具。

    智能灯具开关制造商Deako获得350万美元风险投资,预计明年西雅图市场占有率将达到10%

    今年秋季,Deako 公司计划在西雅图地区的 50-100 户家庭中进行产品试运行,然后根据用户的使用反馈进一步优化技术,之后再发布最终产品。Richardson 没有透露产品发布的具体时间。

    Deako 开关非常安全,即便在不断电的情况下也可以随意更换,这也意味着产品升级会非常轻松,消费者也不用担心自己房屋里的开关会过时。

    Richardson 说道:

    技术发展如此之快,人们需要在家里部署一些能够长时间使用的技术,如果现在使用了我们 Deako 的灯具开关技术,至少在未来 5、10、甚至 15年 内都不会被淘汰。

    作为公司创始人,Richardson 并没有任何家庭装修行业背景,相反,他是技术出身,之前曾在黑莓和半导体制造公司Cypress Semiconductor工作过。之所以会产生创立 Deako 智能灯具开关公司的想法,是源于他本人的一次购房体验,在拿到新房之后,Richardson 不得不将室内所有的灯具开关更换掉,非常不方便。而且他发现当时的市场上还没有相关解决方案,因此决定自己创业来解决这个市场痛点。

    值得一提的是,在拿到这笔投资之后,Deako 公司也获得了一定行业关注度。Richardson 也受邀出席今年八月Sunbelt Builders Show大会,分享智能家居技术经验。

    【本文转自36氪】

    谷歌研究总监 Peter Norvig:AI-first 意味着什么
    Peter Norvig是誉满全球的人工智能专家,Google研究总监(Director of Research),他同时也是经典书籍《人工智能编程范式:Common Lisp案例研究》(Paradigms of AI Programming: Case Studies in Common Lisp)和《人工智能:一种现代方法》(Artificial Intelligence: A Modern Approach)的作者/合著者。在本文中,我们将看到Peter Norvig对人工智能目前进展和未来发展的思考,对人工智能技术在Google应用的解读,以及对最新软件工程师在人工智能时代的成长的观点。 Peter Norvig眼中的人工智能 问:人工智能领域在哪些方面发生了您未曾预料的演变? Peter Norvig:在1980年我开始从事人工智能研究时人工智能意味着:一位研究生用说明性语言写下事实,然后拨弄这些事实和推理机制,直到从精心挑选的样本上得到不错的结果,然后写一篇关于它的论文。 虽然我接受并遵循这种工作模式,在我获得博士学位的过程中,我发现了这种方法的三个问题: 写下事实太慢了。 我们没有处理异常情况或模糊状态的良好方法。 这个过程不科学——即使在选定的样本上它能工作,但是在其他样本上工作效果会如何呢? 整个领域的演变回答了这三个问题: 我们依靠机器学习,而不是研究生付出的辛苦努力。 我们使用概率推理,而不是布尔逻辑。 我们希望使用科学严格的方式;我们有训练数据和测试数据的概念,而且我们也有比较不同系统处理标准问题所得到的结果。 1950年,阿兰图灵写道:“我们只能看到未来很短的一段距离,但是我们很清楚还有什么需要完成。”自从1950年,我们已经得到许多发展并实现了许多目标,但图灵的话仍然成立。 问:对于机器学习研究,工业界与学术界有何不同呢? Peter Norvig:我认为,在教育机构、商业机构还是政府机构并不是很重要——我曾经在这三种机构都学到很多东西。 我建议你在有着一群出色同事和有趣问题的环境下工作。可以是工业界、学术界、政府或者非营利企业,甚至开源社区。在这些领域里,工业界往往有更多的资源(人、计算能力和数据),但如今有很多公开可用的数据供你使用,一个小团队,一台笔记本电脑,或者一个小而廉价的GPU集群,或者在云计算服务上租赁或捐献时间。 问:您对深度学习有什么看法? Peter Norvig:我清楚地记得80年代初的那一天,Geoff Hinton来到伯克利进行了关于玻尔兹曼机的讲座。对我来说,这是个了不起的视角——他不赞同符号主义人工智能很强大很有用,而我了解到了一种机制,有三件令人兴奋的新(对我而言)事情:根据大脑模型得出的认知合理性;从经验而不是手工编码中学习的模型;还有表示是连续的,而不是布尔值,因此可以避免传统符号专家系统的一些脆弱问题。 事实证明,玻尔兹曼机在那个时代并没有广泛普及,相反,Hinton、LeCun、Bengio、Olshausen、Osindero、Sutskever、Courville、Ng以及其他人设计的架构得到很好的普及。是什么造成了这种不同呢?是一次一层的训练技术吗?是ReLU激活函数?是需要更多的数据?还是使用GPU集群可以更快地训练?我不敢肯定,我希望持续的分析可以给我们带来更好的了解。但我可以说,在语音识别、计算机视觉识别物体、围棋和其他领域,这一差距是巨大的:使用深度学习可以降低错误率,这两个领域在过去几年都发生了彻底变化:基本上所有的团队都选择了深度学习,因为它管用。 许多问题依然存在。在计算机视觉里,我们好奇深度网络实际上在做什么:我们可以在一个级别上确定线条识别器,在更高层次确定眼睛和鼻子识别器,然后就是脸部识别器,最终就是整个人的识别器。但在其他领域,一直很难了解网络在做什么。是因为我们没有正确的分析和可视化工具吗?还是因为实际上表示不一致? 在有许多数据的时候,深度学习在各种应用中表现不错,但对于一次性或零次学习,需要将一个领域的知识转移并适应到当前领域又如何呢?深度网络形成了什么样的抽象,我们可以如何解释这些抽象并结合它们?网络会被对抗性输入愚弄;我们如何预防这些,它们代表了根本缺陷还是不相干的把戏? 我们如何处理一个领域中的结构?我们有循环网络(Recurrent Networks)来处理时间,递归网络(Recrsive Networks)来处理嵌套结构,但这些是否已经足够,现在讨论还为时过早。 我对深度学习感到兴奋,因为很多长期存在的领域也是如此。而且我有兴趣了解更多,因为还有许多剩余问题,而且这些问题的答案不仅会告诉我们更多关于深度学习的东西,还可以帮助我们大体理解学习、推理和表示。 问:在深度学习最近取得的成就之后,符号主义人工智能是否还有意义? Peter Norvig:是的。我们围绕着符号主义人工智能开发了许多强大的原理:逻辑预测、约束满足问题、规划问题、自然语言处理,乃至概率预测。因为这些算法的出色表现,我们处理问题的能力比原来提升了几个数量级。放弃这一切是件可耻的事。我认为其中一个有意识的研究方向是回过头看每一种方法,探索非原子式符号被原子式符号取代的这个过程究竟发生了什么,诸如Word2Vec产生的Word Embedding之类的原理。 下面是一些例子。假设你有这些逻辑“事实”: 人会说话; 除人以外的动物不会说话; 卡通人物角色会说话; 鱼会游泳; 鱼是除人以外的动物; Nemo是一个卡通人物; Nemo是一条鱼; 那么我们要问了: Nemo会说话吗? Nemo会游泳吗? 用逻辑来表述和解释这个场景的时候遇到了两个大问题。首先,这些事实都有例外,但是用逻辑很难穷举这些例外情况,而且当你逻辑出错的时候预测就会出问题了。其次,在相互矛盾的情况下则逻辑无能为力,就像这里的Nemo既会说话又不会说话。也许我们可以用Word Embedding技术来解决这些问题。我们还需要Modus Ponens Embedding(分离规则,一种数学演绎推理规则)吗?不学习“如果A且A暗示B,则B”这样一种抽象的规则,我们是否可以学习何时应用这种规则是恰当的?我觉得这是一个重要的研究领域。 再说一点:许多所谓的符号主意人工智能技术实际上还是优秀的计算机科学算法。举个例子,搜索算法,无论A*或是蚁群优化,或是其它任何东西,都是一种关键的算法,永远都会非常有用。即使是基于深度学习的AlphaGo,也包含了搜索模块。 问:我们哪儿做错了?为什么Common Lisp不能治愈世界? Peter Norvig:我认为Common Lisp的思想确实能治愈这个世界。如果你回到1981年,Lisp被视作是另类,因为它所具有的下面这些特性还不被C语言程序员所知: 垃圾回收机制; 丰富的容器类型及相应的操作; 强大的对象系统,伴随着各种继承和原生函数; 定义测试例子的亚语言(sublanguage)(并不属于官方版本的一部分,但我自己配置了一套); 有交互式的读入-运算-打印循环; 敏捷的、增量式的开发模式,而不是一步到位的模式; 运行时对象和函数的自省; 能自定义领域特定语言的宏。 如今,除了宏之外的所有这些特性都在主流编程语言里非常常见。所以说它的思想取胜了,而Common Lisp的实现却没有 —— 也许是因为CL还遗留了不少1958年编程语言的陋习;也许只是因为一些人不喜欢用大括号。 至于说宏,我也希望它能流行起来,但当用到宏的时候,你成为了一名语言设计者,而许多开发团队喜欢保持底层语言的稳定性,尤其是那些大团队。我想最好有一套使用宏的实用指南,而不是把它们全部抛弃(或是在C语言里严格限制的宏)。 问:在未来10年里,有没有哪些情况下软件工程师不需要学习人工智能或机器学习的,还是每个人都需要学习? Peter Norvig:机器学习将会是(或许已经是)软件工程的一个重要部分,每个人都必须知道它的运用场景。但就像数据库管理员或用户界面设计一样,并不意味着每个工程师都必须成为机器学习专家——和这个领域的专家共事也是可以的。但是你知道的机器学习知识越多,在构建解决方案方面的能力就越好。 我也认为机器学习专家和软件工程师聚在一起进行机器学习系统软件开发最佳实践将会很重要。目前我们有一套软件测试体制,你可以定义单元测试并在其中调用方法,比如assertTrue或者assertEquals。我们还需要新的测试过程,包括运行试验、分析结果、对比今天和历史结果来查看偏移、决定这种偏移是随机变化还是数据不平稳等。这是一个伟大的领域,软件工程师和机器学习人员一同协作,创建新的、更好的东西。 问:我想从软件工程师转行成为人工智能研究员,应该如何训练自己呢? Peter Norvig:我认为这不是转行,而是一种技能上的提升。人工智能的关键点在于搭建系统,这正是你手头上的工作。所以你在处理系统复杂性和选择合适的抽象关系方面都有经验,参与过完整的设计、开发和测试流程;这些对于AI研究员和软件工程师来说都是基本要求。有句老话这样说,当一项人工智能技术成功之后,它就不再属于人工智能,而是成为了软件工程的一部分。人工智能工作者抱怨上述观点的意思就是他们的工作永远离成功有一步之遥,但你可以认为这表明你只是需要在已知的基础上再添加一些新概念和新技术。 人工智能在Google 问:Google“没有更好的算法,只是多了点数据而已”这种说法是真的吗? Peter Norvig:我曾引用微软研究院Michele Banko和Eric Brill发表的一篇关于分析词性辨析算法的论文,他们发现增加训练数据得到的效果提升比更换算法更明显。我说过有些问题确实如此,而另一些问题则不见得。你可以认为这篇论文是“大数据”的功劳,但要注意,在这个领域十亿个单词规模的训练数据集就能看出效果 —— 在笔记本电脑的处理范围内 —— 还不到数据中心的量级。所以,如果你用不了数据中心,不必担心 —— 你拥有的计算资源和数据量几乎完胜任何一个上一代的人,你可以有更多的新发现。 所以没错,大量与任务相契合的高质量数据必然会有帮助。然而真正有挑战的工作在于发明新学习系统的研究和让其真正落实到产品中的工程实现。这个工作正是大多数机器学习成功案例的驱动力。正如Pat Winston所说:“人工智能就像葡萄干面包里的葡萄干,葡萄干面包的主要成分还是面包,人工智能软件主体也是常规的软件工程和产品开发。” 问:成为一家“AI-first”公司对Google意味着什么? Peter Norvig:“传统”的Google是一个信息检索公司:你提供一个查询,我们快速返回10个相关网页结果,然后你负责找到与查询词相关的返回结果。“现代”的Google,CEO Sundar Pichai设定了愿景,它不仅基于相关信息建议,还基于通知和助理。通知,意味着当你需要时,我们提供你需要的信息。例如,Google Now告诉你该去赴约了,或者你目前在一家杂货店,之前你设定了提醒要买牛奶。助理意味着帮助你实施行动——如规划行程、预定房间。你在互联网上可以做的任何事情,Google都应该可以帮你实现。 对于信息检索,80%以上的召回率和准确率是非常不错的——不需要所有建议都完美,因为用户可以忽略坏的建议。对于助理,门槛就高了许多,你不会使用20%甚至2%的情形下都预定错房间的服务。所以助理必须更加精准,从而要求更智能、更了解情况。这就是我们所说的“AI-first”。 Peter Norvig 在 Google 问:你的职业生涯如何起步? Peter Norvig:我很幸运地进入了一所既有计算机编程又有语言课程的高中(在马萨诸塞州牛顿县)。这激发了我将两者结合起来学习的兴趣。在高中阶段无法实现这个想法,但是到了大学我主修应用数学专业,得以研究这方面(当时,我们学校并没有真正的计算机专业。我开始是主修数学,但很快发现自己并不擅长数学证明,反而在编程方面如鱼得水)。 大学毕业后,我当了两年的程序员,不过仍旧一直在思考这些想法,最后还是申请了研究生回来继续从事科研(我过了四年才厌倦大学生活,而两年就厌倦了工作状态,所以我觉得我对学校的热爱是对工作的两倍)。研究生阶段为我学术生涯打下了基础,而我却迷上了今天所谓的“大数据”(当时还没有这种叫法),我意识到在工业界更容易获得所需要的资源,因此放弃了高校里的职位。我感到幸运的是每个阶段都有优秀的合作伙伴和新的挑战。 问:你在Google具体做什么? Peter Norvig:在Google最棒的事情之一就是总有新鲜事;你不会陷入例行公事之中。在快节奏的世界中每周都是如此,当我角色改变之后,每年更是如此。我管理的人员从两人变成了两百人,这意味着我有时候能深入到所参与项目的技术细节中,有时候因为管理的团队太大,只能提一些高层次的笼统看法,并且我相信我的团队正在做的事情是正确的。在那些项目里,我扮演的角色更多的是沟通者和媒介——试图解释公司的发展方向,一个项目具体如何展开,将项目团队介绍给合适的合作伙伴、制造商和消费者,让团队制定出如何实现目标的细节。我在Google不写代码,但是如果我有一个想法,我可以使用内部工具写代码进行实验,看看这个想法是否值得尝试。我同样会进行代码审查,这样我就可以了解团队生产的代码,而且这也必须有人去做。 还有很多的会议、邮件、文档要处理。与其他我工作过的公司相比,Google的官僚主义更少,但有时候是不可避免的。我也会花一些时间参加会议、去大学演讲、与客户交流,以及参与Quora问答。 问:在加入Google之前,你曾担任美国宇航局(NASA)计算科学部门的主要负责人,在美国宇航局的工作与Google的工作有何不同?有哪些文化的差异? Peter Norvig:美国宇航局与Google有很多共同之处:它们都有一群优秀敬业并且充满激情的员工,这些人相信它们的工作使命。而且两者都在推动各自技术的上限。因此,他们在特定项目中的文化往往是相似的。 同时也存在一些差异。美国宇航局的Gene Kranz曾说过一句名言:“失败不是种选择(Failure is not an option)。”美国宇航局经常会有几亿美元的使命任务,任何一个错误都有可能毁灭一切。因此,需要极其小心。Google的项目范围往往更接近Adam Savage的想法(与Jeff Dean相互呼应)“失败自古至今就是一种选择(Failure is always an option)”。Google相信,单台计算机可能会发生故障,而设计网络系统可以从故障中恢复。在Google,有时我们可以在用户看到错误之前进行恢复纠正,而有时当一个错误曝光后,我们可以在简短的时间内纠正它,同时向受到影响的用户致歉,而这在美国宇航局是很少见的。 一方面是因为失败的预期成本存在差异,另一方面是由于空间硬件的成本巨大(参见我在那做的东西),再者就是政府与私人机构的差异,基于这一优势,Google更容易启动新项目,并在已有的项目中迅速推动新项目的进展。 问:你是如何权衡新功能的开发与旧功能的维护呢? Peter Norvig:尽你所能将任务做得最好,并且不断改进,这样就会得到提高。 我曾一次次地发现:团队的新员工说“我们为什么不使用X?”,一位老员工回答说:“我们三年前就试过了X,结果证明它并不管用”。此时的难题是:你是否接受那位老前辈的回答?或者说,现在的情况已经改变了,是时候重新审视X了?也许我们有新的数据,或者新的技术,又或者新员工将采取不同的方法,或者说世界改变了,X将会比以往工作得更好。我无法告诉你该问题的答案,你必须权衡所有证据,并与其他类似问题进行比较。 程序员提升之道 问:《人工智能:一种现代方法》还会有新的版本吗? Peter Norvig:是的,我正在为此努力。但至少还需要一年的时间。 问:我是一名研究生,我的人工智能课程使用《人工智能:一种现代方法》作为参考教材,我如何才能为人工智能编程项目做贡献? Peter Norvig:现在正是时候:我正在为《人工智能:一种现代方法》这本书的下一个版本的配套代码工作,在https://github.com/aimacode上,你可以找到Java、Python和JavaScript子项目,我们一直在寻找好的贡献者。除了提供书中所有算法的代码实现,我们还希望提供tutorial材料和练习。此外,GitHub上也还有其他好的人工智能项目,都希望有铁杆贡献者。 问:有没有像可汗学院(Khan Academy)和Udacity一样的在线资源,可以让人们在不到“十年”就精通一门学科呢? Peter Norvig:精通可能需要十年,或者是10000个小时,这种时间会因任务、个体以及训练方法的不同而有所差异。但真正的精通并非易事。可汗学院和Udacity主要是提供了技术培训,让你不断努力地学习直到你真正地掌握它。在传统的学校教学当中,如果你在考试中获得的成绩是“C”,你就不会再去花更多的时间去学习并掌握它,你会继而专注于下一个学科,因为班集里每个人都是这样做的。在线资源不是万能的,精通它需要加倍努力地学习,而学习需要动力,动力则可以通过人与人之间的联系逐步提升,这在网上是很难学到的。因此,在一个领域,走上正轨,我们需要在社交、动机方面做更多的工作,我们需要对个人需求有针对性地做更多的定制培训,同时我们还需要做更多使实践审慎和有效的工作。我认为,在线资源主要的最终结果不是缩短精通的时长,而是增加更多学生实现精通的机会。 问:如果请你再次教授《计算机程序设计》(Udacity)这门课程,会做哪些改变呢? Peter Norvig:我认为这门课程很好,反馈(不管是数量还是质量)大多都是好的。就个人而言,我希望有更多的实例程序和技术。我想修正之前我们犯下的一些错误(主要是因为课程进展太快,没有太多的时间去测试所有的东西)。我希望系统能够更加互动:让学生获得更多的反馈信息,不仅仅是“你的程序不正确”,同时可以让学生看到下一件要做的事情,让他们知道到目前为止已经做了什么。我认为对于学生而言,正则表达式和语言这部分进展速度过快了;另外,我还想添加更多的材料,让学生加快学习速度,同时给他们更多的机会去实践新想法。 本文基于Peter Norvig最近一次在线访谈,Norvig授权《程序员》翻译整理为中文

    【原文转自新智元】

    语音如何变成文字?这是一篇你能读懂的技术原理

    简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。

    首先,我们知道声音实际上是一种波。常见的 mp3、wmv 等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如 Windows PCM 文件,也就是俗称的 wav 文件。wav 文件里存储的除了一个文件头以外,就是声音波形的一个个点了。下图是一个波形的示例。

    图1.png

    在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。这个静音切除的操作一般称为 VAD,需要用到信号处理的一些技术。

    要对声音进行分析,需要对声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧。分帧操作一般不是简单的切开,而是使用移动窗函数来实现,这里不详述。帧与帧之间一般是有交叠的,就像下图这样:

    图2.png

    图中,每帧的长度为 25 毫秒,每两帧之间有 25-10=15 毫秒的交叠。我们称为以帧长 25 ms、帧移 10 ms 分帧。图中,每帧的长度为 25 毫秒,每两帧之间有 25-10=15 毫秒的交叠。我们称为以帧长 25 ms、帧移 10 ms 分帧。

    分 帧后,语音就变成了很多小段。但波形在时域上几乎没有描述能力,因此必须将波形作变换。常见的一种变换方法是提取 MFCC 特征,根据人耳的生理特性,把每一帧波形变成一个多维向量,可以简单地理解为这个向量包含了这帧语音的内容信息。这个过程叫做声学特征提取。实际应用中, 这一步有很多细节,声学特征也不止有 MFCC 这一种,具体这里不讲。

    至此,声音就成了一个 12 行(假设声学特征是 12 维)、N 列的一个矩阵,称之为观察序列,这里 N 为总帧数。观察序列如下图所示,图中,每一帧都用一个 12 维的向量表示,色块的颜色深浅表示向量值的大小。

    图3.png

    接下来就要介绍怎样把这个矩阵变成文本了。首先要介绍两个概念:

    1.音素:单词的发音由音素构成。对英语,一种常用的音素集是卡内基梅隆大学的一套由 39 个音素构成的音素集,参见 The CMU Pronouncing Dictionary。汉语一般直接用全部声母和韵母作为音素集,另外汉语识别还分有调无调,不详述。

    2.状态:这里理解成比音素更细致的语音单位就行啦。通常把一个音素划分成 3 个状态。

    语音识别是怎么工作的呢?实际上一点都不神秘,无非是:

    • 第一步,把帧识别成状态(难点);
    • 第二步,把状态组合成音素;
    • 第三步,把音素组合成单词。

    如下图所示:

    图4.png

    图 中,每个小竖条代表一帧,若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个单词。也就是说,只要知道每帧语音对应哪个状态了,语 音识别的结果也就出来了。图中,每个小竖条代表一帧,若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个单词。也就是说,只要知道 每帧语音对应哪个状态了,语音识别的结果也就出来了。

    那每帧音素对应哪个状态呢?有个容易想到的办法,看某帧对应哪个状态的概率最大,那这帧就属于哪个状态。比如下面的示意图,这帧对应 S3 状态的概率最大,因此就让这帧属于 S3 状态。

    图5.png

    那这些用到的概率从哪里读取呢?有个叫「声学模型」的东西,里面存了一大堆参数,通过这些参数,就可以知道帧和状态对应的概率。获取这一大堆参数的方法叫做「训练」,需要使用巨大数量的语音数据,训练的方法比较繁琐,这里不讲。

    但 这样做有一个问题:每一帧都会得到一个状态号,最后整个语音就会得到一堆乱七八糟的状态号,相邻两帧间的状态号基本都不相同。假设语音有 1000 帧,每帧对应 1 个状态,每 3 个状态组合成一个音素,那么大概会组合成300个音素,但这段语音其实根本没有这么多音素。如果真这么做,得到的状态号可能根本无法组合成音素。实际上, 相邻帧的状态应该大多数都是相同的才合理,因为每帧很短。

    解决这个问题的常用方法就是使用隐马尔可夫模型(Hidden Markov Model,HMM)。这东西听起来好像很高深的样子,实际上用起来很简单:

    • 第一步,构建一个状态网络。
    • 第二步,从状态网络中寻找与声音最匹配的路径。

    这样就把结果限制在预先设定的网络中,避免了刚才说到的问题,当然也带来一个局限,比如你设定的网络里只包含了「今天晴天」和「今天下雨」两个句子的状态路径,那么不管说些什么,识别出的结果必然是这两个句子中的一句。

    那如果想识别任意文本呢?把这个网络搭得足够大,包含任意文本的路径就可以了。但这个网络越大,想要达到比较好的识别准确率就越难。所以要根据实际任务的需求,合理选择网络大小和结构。

    搭建状态网络,是由单词级网络展开成音素网络,再展开成状态网络。语音识别过程其实就是在状态网络中搜索一条最佳路径,语音对应这条路径的概率最大,这称之为「解码」。路径搜索的算法是一种动态规划剪枝的算法,称之为 Viterbi 算法,用于寻找全局最优路径。

    图6.jpg

    这里所说的累积概率,由三部分构成,分别是:

    • 观察概率:每帧和每个状态对应的概率
    • 转移概率:每个状态转移到自身或转移到下个状态的概率
    • 语言概率:根据语言统计规律得到的概率

    其中,前两种概率从声学模型中获取,最后一种概率从语言模型中获取。语言模型是使用大量的文本训练出来的,可以利用某门语言本身的统计规律来帮助提升识别正确率。语言模型很重要,如果不使用语言模型,当状态网络较大时,识别出的结果基本是一团乱麻。

    这样基本上语音识别过程就完成了。

    以上介绍的是传统的基于 HMM 的语音识别。事实上,HMM 的内涵绝不是上面所说的「无非是个状态网络」那么简单。以上的文字只是想让大家容易理解,并不追求严谨。

    【本文为知乎用户张俊博原创】

    微软 CEO 纳德拉亲自撰文:人类与机器未来的关系究竟会如何?

    编者注:人工智能(AI)技术在今年成为了一个热词,无论你是否了解它,每个人似乎都能发表两句自己的观点,但由此产生的人类与机器 的关系、失业问题、机器人统治世界等各式担忧也都浮出了水面。然而,人类和机器之间到底应该是什么关系?人工智能的未来究竟该是什么样的?微软公 司 CEO Satya Nadella 亲自撰文表达了自己的观点。

    本文刊载于 Slate,原文标题为「The Partnership of the Future」http://www.slate.com/articles/technology/future_tense/2016/06/microsoft_ceo_satya_nadella_humans_and_a_i_can_work_together_to_solve_society.html)。


    增 强机器学习(Advanced machine learning)也被称为人工智能(Artificial Intelligence),它在未来的前景远不止于靠在一些像象棋或围棋这样的比赛中击败人类而登上新闻头条这么简单。最终,人类和机器能够共同工作 ——而不是相互对抗。计算机也许能够赢得游戏的胜利,但想象一下人类与机器一起工作的画面吧,双方携手并进也许就能够解决像疾病、知识的匮乏以及贫穷这样 重大的社会问题。

    然而,想要到达到这种程度,我们需要一个大胆而雄心勃勃的计划才行,这个计划要能够超越现有的事物。通过对现有技术渐进式的改良,我们能够实现它。现在到了与 AI 技术展开更广泛合作与协同的时间了。

    在 今年年初同 Saqib Shaikh——这位开发了能在一定程度上帮助视力障碍人士技术的微软工程师——待在一起的时候,我对这个领域有了一些灵感。利用一些包括视觉识别、增强 机器学习等前沿技术,Saqib 和他的同事们开发了一些能在小型计算机上运行的应用,彼时,他总喜欢戴着一副墨镜工作。这项技术能够实时处理并解释数据。从本质上说,这项技术是用他的听 觉而非视觉描绘了一幅他心中的世界的样子。他感受世界的方式更加多样,比如能将走廊里的噪音联系到一副滑板,又比如将开会时突然的沉默联系到同事们正在思 考;他能用「听」的方式「阅读」菜单;但对他来说最重要的也许是,他能发现自己正在和亲人们一起在一个热闹的公园里野餐。

    160628_FT_Nadella-Shaikh.jpg.CROP.promo-xlarge2.jpg

    (左边的就是微软工程师 Saqib Shaikh,而他是一位盲人)

    机 器与人类共同协作的美好画面在 AI 究竟是好的还是坏的这类争论中被忽视了,我们对 AI 的看法似乎陷入到了《2001:太空漫游》的场景与现在的个人虚拟助手(Cortana、Siri 以及 Alexa)之间去。当机器能够帮我们开车、帮我们做家务、帮我们更好地做决策时,我们可以更好地利用我们的闲暇时间去完成我们的梦想。当然,我们也可以 为机器人可能引起的巨大的经济混乱而感到担心。基于你所听取的意见,那个所谓的计算机的智能超越人类的「奇点」时刻既有可能在 2100 年左右出现,也可能只是科幻小说中的一个情节而已。

    在我看来,最有成效的辩论不是 AI 是好还是坏,而是:这场辩论应该向人们及组织机构传递这项技术的价值。在《与机器人共舞》这本书中,约翰•马尔科夫写道:「回答一个充满了智能机器的世界 的控制权问题,最好的方式是去理解创造了这些系统的那些人们的价值观。」这是一个有趣的问题,也是一个我们这个行业必须讨论、回答的问题。

    在 今年年初的开发者大会上,我分享了一套我们做 AI 的方法。第一,我们想要去开发一个能增强人类能力与体验的人工智能,最终,它不会出现人类 vs. 机器的画面。我们人类拥有创造力、同情心、情感、以及智慧,这些都让我们可以与强大的 AI 计算能力相结合,让我们的社会更快向前发展。第二,我们也需要对我们的技术建立信任。我们必须在技术中注入对隐私的保护、透明度以及安全性。AI 设备必须能检测到新的威胁,也要能设计出合适的方法去解决问题。第三,我们所有的技术都必须要包容、尊重每一个人。

    这套方法是一个开始,但我们能走得更远。

    科 幻小说作家阿西莫夫也提供了一套非常好、但最终不够完美的方法。在 1940 年代,他为自己小说中的道德准则提出了「机器人三定律」,阿西莫夫的定律是分层级的,第一定律优先于第二定律,第二定律同样优先于第三定律。第一定律是: 机器人不得伤害人类,或因不作为使人类受到伤害;第二定律:除非违背第一法则,机器人必须服从人类的命令;第三定律:在不违背第一及第二法则下,机器人必 须保护自己。每一条定律都不能相互违背。虽然阿西莫夫的定律很有启发性,但它没有为科技公司和研究人员提供清晰的价值观和设计准则;也没有告知社会人类应 该在新的时代所必须具备哪些能力。

    i-robot.jpg

    计 算机领域的先驱 Alan Kay 讽刺道:「预测未来的最好的方式就是自己去发明一个。」在 AI 的话语中,他的基本观点认为,我们要停止去预测未来会是怎样,而是应该用符合规律的方式去创造未来。我同意这个看法。就像软件设计中遇到的挑战一样,符合 规律的方法开始于你所立足的平台。在软件开发领域,AI 正在变成第三代的「run time」——下一代的运行平台。在计算机领域,「run time」就是程序员开发和执行应用程序的顶部系统。换句话说,我们开发 Office,里面是为了 PC 而生的 Word、PowerPoint 这样的应用;而今天的 Office 365 则是为了网页而生的。在一个 AI 和机器人的世界里,这样的生产力和沟通工具将会在一个全新的平台中开发,它将不会只是管理信息,它还能从信息中学习,并且和真实的世界展开交互。

    这 个新的平台看起来正在被创造。我还记得比尔•盖茨在 1995 年发给所有微软员工的「互联网浪潮」备忘录,他在里面预测,互联网将会在连通性、硬件、软件开发及商业上都带来巨大的影响。20 年之后,我们正在面临一场新的浪潮——AI 浪潮。所以,指导我们的思维、设计及开发的通用设计原则和价值观应该是什么?

    有些人正在成为解 决这个问题的领先者。来自 MIT 传媒实验室的 Cynthia Breazeal 将她的生活投入到了探究一个更加人性化的 AI 与机器人当中去。她认为,技术往往会忽略社会及人类行为方面的考虑。在最近的一次对话中,Cynthia 认为,我们人类是所有物种里最社会化、也是最富情感的一个,但我们很少花时间去思考设计和技术中的情感元素。她说道:「毕竟,我们感知世界的方式是通过通 信和协同的方式进行的,如果我们对帮助我们工作的机器感兴趣,那我们就不能忽略其中的人文因素。」

    为此,我已经意识到了哪些原则和目标是我们这个行业和社会应该去讨论和辩论的。

    • AI 必须以帮助人类的形式而设计:作为我们开发的更加自动化的机器,我们需要尊重人类的自主权。协作式机器人应该去做那些更加危险的工作,比如采矿,这样,我们能够为人类工人创造一个更加安全的保障。
    • AI 必须是透明的:我们应该了解这种技术的运行原理和他们的运行规则。我们需要的不仅仅是智能的机器(intelligent machines),而是可理解的机器(intelligible machines);不是人工智能(artificial intelligence),而是共生智能(symbiotic intelligence)。技术要能理解人类,而人类也必须要了解机器。人类应该明白技术是怎样「看」这个世界、「分析」这个世界的,这样能让道德和设 计携手并进。
    • AI 必须在不伤害人类尊严的条件下将效率最大化:它应该要有文化上的承诺,让多样性得到增强,我们需要在设计这些系统时对不同的族群有更宽广、更深远和更多样化的考虑。科技产业不应该规定人类未来的价值观和道德观。
    • AI 必须为智能化的隐私而设计:用值得信任的精细化保护手段保证个人及群体的信息安全。
    • AI 必须有算法上的问责制,这样人类就能处理意外出现的伤害。我们必须在设计这些技术时考虑到意料之中及意料之外的双重情况。
    • AI 必须对偏见有所防范,它要能保护正确和有代表性的研究。这样,错误的诱导不会让它变得带有歧视性。

    但这些所有的「必须」也是为人类设计的,特别是当它涉及到我们后代的未来所应该具备的技能时。为了保证一致,我们的下一代以及之后的小朋友们应该具备:

    • 同情心:同情心是如此难以复制到机器上,它将会在一个 AI 的世界中对人类来说格外有价值。理解他人的想法和感受,与他人合作并建立良好的关系,这些在未来都将至关重要。
    • 教 育:有些人觉得,因为人的寿命会增加、出生率会下降,这会导致我们在教育上的支出也会下降。但我坚信,如果想要创造和管理我们今天还无法实现的创新,我们 需要增加教育投资去获得更高层级的思维以及更公平的教育成果。开发新的知识和技巧让新技术能够大规模实现,这需要很长的时间来解决。在创新、技术、薪资和 财富这不同元素之间有着直接的联系。动力织布机在 1810 年就发明了,但花了 35 年的时间才改变了织布行业,这是因为没有足够的技术工人。
    • 创 造力:在人类所有的技能中,最令人垂涎的就是创造力了,而这也不会改变。机器将会继续丰富并增强我们的创造力。在最近的采访中,小说家 Jhumpa Lahiri 被问及为什么一位具有如此特殊的英文能力的作者会选择用意大利语——她的第三语言——去创造一种全新的文学语言,她的回答是:这不就是来自创造力的观点 吗?我们需要持续去探索。
    • 判断力和问责制:我们也许会愿意接受计算机给出的诊断或法律裁决,但我们仍然期待会有一个人出来为最终结果承担责任。

    那 么如何才能平等呢?自动化将会导致更平等还是更不平等呢?一方面,我们被告知不必为此担心。在历史中,人类劳动力被替代之后,工人们总是变得更加富裕而不 是更穷。另一方面,我们也被告知,经济领域的替代现象如此剧烈,企业家、工程师和经济学家们都应该面对这个「新的挑战」——去补充而不是替代人类劳动力的 设计承诺。换句话说,我们的商业领袖们必须用制造者和创造者的思维去代替之前那种节省劳动力的自动化思维。

    AI 的轨迹和他们对社会的影响才刚刚开始。想要真正抓住这个未来时代的意义,我们需要深入的、多样化的分析。我在微软研究员的同事 Eric Horvitz 是 AI 领域的先驱,他寻求这方面问题的答案已经很多年了。Eric 和他的家人已经在以私人名义支持斯坦福大学的「百年研究计划」,为了将要到来的新世纪,他们每年会推出一个有关社会经济、法律和道德方面可能与智能计算有 关的长期及短期报告,同时它也会提供机器智能方面的观点变化和人机关系方面的变化。

    虽然前面没有什么已经设计好的路线,但通过之前的工业革 命,我们已经看到了社会的变革不会是一帆风顺的。第一,我们要发明和设计的革新性技术是我们赖以存在的东西。第二,我们要改造我们的未来。举个例子,无人 机驾驶员可能需要训练;老式的方向盘可能不会存在了,它将会变成自动驾驶汽车。第三,我们要解决扭曲、不和谐和错位的现象。当机器能够更好地解读 X 光图时,放射科医生的职责会是什么?当计算机能够检测数百万份不同形式的文件时,律师的功能是什么?然而,如果我们已经整合了正确的价值观和正确的设计原 则,如果我们已经准备好了我们人类所需要的技术,那么我们人类和我们的社会将会迎来蓬勃的发展。

    为《纽约时报》撰文的认知科学家与哲学家 Colin Allen 总结道:「就像我们能够设想机器可以在人类的监督下获得更高的自主权,我们也可以设想机器的控制权会涉及到更加敏感的、道德方面的内容。但可以确定的是,没有完美的机器,只有更好的机器。」

    在追寻 AI 的过程中,下一个最关键的步伐是去在其设计中允许加入道德和同情心的框架。

    【原文转自极客公园】

    微软CEO:人类是AI最好的老师

    昨天,微软CEO Satya Nadella在Slate上表示:计算机行业必须开始思考如何让智能软件尊重人类。这表明:他非常担心AI对人类生活的影响。

    他写道:“科技行业不应该扭曲未来的价值观,我们应该教会AI树立正确的价值观。”

    Nadella呼吁:“算法有责任拥有一个正确的三观,这样人类才不会受到伤害。”他表示智能软件必须这样设计:我们必须检阅算法的工作方式,让它不歧视某类人群,或者用暗黑的方式使用私人数据。

    其实,Nadella的建议是明智而中肯的。一直以来,AI总是被指控腹黑,存在着性别或者种族歧视。我们现在正在努力摆正AI的三观,让人们不会为AI的此问题困扰。

    联邦贸易委员会的研究发现:在互联网时代早期出现的网络种族和经济歧视现在又卷土而来了,出现在广告或者其他的网上服务之中。

    毋庸置疑,Nadella说的一些问题确实存在。近日,微软研究员Kate Crawford在《纽约时报》总结了现在AI的歧视现象:现在,工作场所、家庭、法律系统中使用的微软都不公平。

    关于未来AI的发展方向,Nadella是这样说的:AI的下一步发展,便是尊重种族和性别平等。

    正如没有哪个孩子天生就是一个性别歧视者或种族歧视者,那些都是被教出来的。AI也是这样,而人类就是最好的老师。

    谷歌远征教育的路上说不上成功,但你不得不服

    这两天,谷歌推出积木式编程教育平台Project Bloks,以及宣布要把VR带入课堂的消息,让不少人兴奋了一把。毕竟,在大家盯着VR游戏和羞羞事的时候,大佬出来带头做教育。有盼头啊!

    谷歌远征教育的路上说不上成功,但你不得不服

    然而,搜索巨头谷歌搞教育也不是一天两天的事了。而且,地域也早已超越美国,远征非洲。但是,高潮似乎还没到。

    谷歌远征教育的路上说不上成功,但你不得不服

    再但是,管它呢~ 醉翁之意不在酒

    第一战:工具先行,硬件跟上

    先是一款让在线教育能够动起来的Oppia

    2013年7月份,谷歌推出一个名为Helpouts的在线教学网站。2013年底,谷歌推出互联教室(Connected Classroom)。先热身。

    而在2013年在线教育开始热起来后,谷歌继续在2014年2月也推出一款在线教育工具Oppia。这可以说是谷歌为在线教育生态放出的第一个大招,让软件先high起来,云端管理硬件支持什么的都是后话。

    谷歌远征教育的路上说不上成功,但你不得不服

    之所以说Oppia是第一个大招,是因为这件工具给视频和学生这样的单向在线教育一个大大的耳光——Oppia让在线教育可以互动起来。

    怎么说呢,其实就是有了这个工具,学生换个地方被“老师”虐。

    谷歌远征教育的路上说不上成功,但你不得不服

    Oppia是一个开源项目,它的工作过程是这样的:通过模拟一位导师向学员提问,基于学员的回答,导师决定下一问题的内容,信息反馈,是否进行进一步考察,或是否开始学习新内容。

    这些活动可以由多名用户通过Web界面创建,不需要编程经验,也不受地理位置限制。所有用户在这里都可以方便地创建在线互动活动,然后让其他人参与学习。

    看视频在线学习,你就是在学习;用Oppia学习,你还能虐完自己后虐别人。这叫“授人以鱼不如授人以渔”。

    谷歌远征教育的路上说不上成功,但你不得不服

    不过,Oppia一直以来出于无人监管的放养状态,谷歌也曾特别发出免责声明。现在也是不温不火。

    谷歌远征教育的路上说不上成功,但你不得不服

    然而,不管说这是西方实用主义也好,还是我们老夫子说的“授人以鱼不如授人以渔”,用技术培养技能就是谷歌搞教育的风格。

    硬件到位,谷歌推出教育应用套装

    谷歌教育系统中底层的硬件设备其实在2011年就推向市场了,首先是覆盖率的问题,它跑龙套好多年后才成为重要角色。

    2015年,Chromebook在教育市场的份额已经占到一半以上,超过iPad、MacBook等苹果产品以及微软的Windows产品。

    谷歌远征教育的路上说不上成功,但你不得不服

    到了这个时候,可以说是谷歌教育开始大规模展开的时代。

    谷歌远征教育的路上说不上成功,但你不得不服

    而随着硬件Chromebook的推广,2014年8月13日谷歌推出了“课堂”(Classroom)服务,这是谷歌免费提供的教育应用套装(Apps for Education)的一部分。

    说起这个套装,那是比全家桶要厉害多的。

    谷歌远征教育的路上说不上成功,但你不得不服

    当时,谷歌整合了旗下的效率工具应用到教学中,包括Gmail、Google Classroom、Google Docs、Google Drive、Gtalk、Google Calendar、Google Tasks、Google Maps等,让教师可以随时布置、检查作业、回答问题,学生也可以随时交作业、管理日程、提问等等。就是尽力消除一切阻碍学习效率的因素。就是说,你还有 什么理由忘记做作业以及拖延作业?

    不知道美帝的学生哥们会不会得一种叫笔记本恐惧症的病?——打开笔记本,“喂,交作业啊~”(一脸冷淡)

    谷歌远征教育的路上说不上成功,但你不得不服

    “占据美国教育市场一半以上”,对此你想到的可能是赚得红红火火。然并,在基于ChromeOS的Chromebook笔记本项目上,谷歌扮演的是“科技慈善家”。谷歌没有在Chromebook上获得真金白银的收入。

    因为,Chromebook用的ChromeOS操作系统,是由谷歌免费提供给电脑厂的。在这里面,获利的是电脑厂商。

    那么,谷歌想不想赚钱呢?

    大约两年前,谷歌发布了一个教育版的Play Store,即Play for Education项目。

    谷歌远征教育的路上说不上成功,但你不得不服

    谷歌推出该项目的目的,是在美国教育界推广Android平板电脑。但是,这没有让Android平板电脑在市场中的地位有多大提升,而是给了Chromebook笔记本电脑一个助攻,后者在教育市场占有重要份额,这还引起了苹果和微软的担忧。

    当 时,由于Chromebook的出色表现,微软还曾被迫下调Windows授权费。一直以来,OEM厂商需要向微软缴纳每台50美元(约合305元人民 币)的Windows授权费用,而谷歌则是免费向OEM厂商提供和Android和Chrome OS系统,二者在推广系统的做法上天壤之别。为了能够与谷歌竞争,微软将下调Windows系统授权费用,并推出更多廉价Windows设备来与 Chromebook对抗。

    而那个Play for Education项目项目,也在2016年2月被关停了,因为谷歌不需要它了。从根本上说,谷歌目前在教育市场的重点是Chrome——而不是安卓平板。

    谷歌远征教育的路上说不上成功,但你不得不服

    然而,你以为谷歌这就完了吗?在教育市场这一块,谷歌继续主动出击!

    Chromebook提供了一个可通过云端访问Windows应用的功能。

    2014年4月,WindowsXP开始退出历史舞台,那么,大批的Windows XP用户会在那时放弃Windows XP而升级Win7、或者Win8.1。

    而在谷歌推出这项服务之后,这部分用户多了一个选择,那就是Chrome OS。。。。。。求微软高管此时心理阴影面积。

    谷歌远征教育的路上说不上成功,但你不得不服

    理论上说,未来随着Chrome OS用户数量的提升,其应用商店的价值会像Applestore一样,随之而来的是付费应用的收入、免费应用网站的收入。占领了教育和低端笔记本市场后,这几乎是稳赚不赔的事儿!

    不过,这到现在还没发生,目前这些应用仍是免费的,谷歌似乎也没有特别投入去运营。反正,你们先用着吧……

    第二战:零基础教育

    培养程序员计划

    谷歌为IT界人才可谓操碎了心。他觉得人们不会编程实在太可怜了,很多问题都没办法自己解决。于是,决心用技术武装人类。

    谷歌远征教育的路上说不上成功,但你不得不服

    过去,除了教育全家桶,谷歌还有很多好好玩的教育产品。比如“谷歌涂鸦”、“安卓训练营”、“计算机领袖”等,在此不做赘述。在这里,我们要重点介绍的是谷歌的小伙伴——Udacity,因为谷歌推出了一个可以让你零基础变身代码猴的产品。

    谷歌远征教育的路上说不上成功,但你不得不服

    上周,谷歌宣布通过在线平台Udacity提供“Android基础微学位”课程,这是首个面向无经验人士的“微学位”课程。

    谷歌远征教育的路上说不上成功,但你不得不服

    这个酷毙了的平台Udacity,其实也是前谷歌一个酷毙了的员工创立的。

    Udacity公司创始人、总裁兼CEO塞巴斯蒂安·斯伦(Sebastian Thrun)是Google X 实验室的联合创始人,斯坦福大学终身教授,参与了很多酷毙了的项目,也被誉为“谷歌无人驾驶汽车之父”。喏↓

    谷歌远征教育的路上说不上成功,但你不得不服

    2012年,斯伦创建了Udacity,将大学课程免费放到互联网上,让更多人受益。

    在2015年I/O的演讲上,斯伦说,他觉得斯坦福的有很多用户权限制,在他不知道的地方,有很多人其实更需要他。

    谷歌远征教育的路上说不上成功,但你不得不服

    好吧,认真地来说说。

    “我 开始意识到,我们的社会有一些做的不好的地方,教育资源的分配不平等,我们的教育模式不对,没有关照到每个人,所以,该是我wake up 并做点什么的时候了。所以我们建立了Udacity,唯一的目标就是:Democratize Education (让教育民主)”

    “我 们相信:if you give a man a fish, or a women, the person has dinner for one night, but if you teach him or her how to catch fish, they have food for the rest of their lives.”(授人以鱼不如授人以渔)

    再一次出现。

    谷歌项目经理表示,谷歌希望让所有人都可以接触并理解Android开发。无论你是什么背景,都可以学习开发能改善周围人们生活的应用。“我们有让你达到与Goolge工程师相等的水平的能力!”

    谷歌远征教育的路上说不上成功,但你不得不服

    所以再不学你好意思吗?妹子问你安卓卡死了该怎么办你可如何是好?

    具体来说,Udacity借鉴Uber的模式,把“打分评价”的事情众包给世界各地的专业人士,当然他们大部分是程序员。有些“打分专家”因此每月挣得钱可以11300美元——比当程序员挣得都多。

    又是一个虐完自己虐别人的故事。

    玩具模块学编程

    编程要从娃娃抓起

    谷歌近日发布全新的开放硬件平台Project Bloks,让儿童可以通过玩具方块学习编程。《连线》撰文指出,在谷歌看来,编程教育的未来是玩具方块。

    牛人的世界我们是不理解的。

    谷歌远征教育的路上说不上成功,但你不得不服

    编程代码晦涩难懂,谷歌立志要将它变成一种游戏。

    他们设计了一套能够组装形成程序的方块(包括物理方块和电器方块)。利用这些方块,你可以拼出乐器程序、自动化玩具或者可以用来给智能手机和平板电脑发送信息的设备。相当于“电子积木”。

    说道这里,你感受到谷歌的真心了吗?

    谷歌远征教育的路上说不上成功,但你不得不服

    第三战:新硬件时代,VR也要用来玩教育

    谷歌旗下的教育产品分为三类:免费的工具类软件、Google Classroom课堂解决方案,以及硬件。不管那个年代新兴、流行的什么技术,谷歌都要用他来搞教育。

    去年9月,谷歌推出了探索计划(Expeditions Pioneer Program)。

    这个设想很简单:VR技术兴起后,谷歌想要带孩子去到校车到不了的地方。

    这个计划需要的装备也不多,就是谷歌已经正式发布教学应用Expeditions+cardboard

    谷歌远征教育的路上说不上成功,但你不得不服

    与普通的谷歌Cardboard不同,专为谷歌探索先锋项目设计的VR头显上有鱼、行星以及卡通地标的剪影,还有金色的星星和缤纷的彩色印记。然后老师就可以带学生们开启虚拟课堂之旅!

    这种教学方式可能无法用于难度教学,但是体验性的课程,杠杠的。至于近视眼什么的问题,不知道谷歌要如何权衡呢?

    故事讲得差不多,最后拔高一下:

    谷 歌用技术推动教育的路子,无非是:工具先行,整合软硬件搭建底层平台。该公司没有在教育市场获得太多直接受益,9.9包邮的cardboard除了出货量 还能有什么?我们或许可以将其视为理想主义式的浪漫尝试。谷歌VR教育的做法,与想趁着VR热在教育市场大捞一把的企业相比,还真说不到一块,除了大家能 做的事情都还不太多。

    业内人士认为,这样的做法,其实是想要跨越经济让科技与文化触及更多人。

    【转自雷锋网】

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    今年8月,雷锋网将在深圳举办盛况空前的“全球人工智能与机器人峰会”,届时雷锋网将发布“人工智能&机器人Top25创新企业 榜”榜单。目前,我们正在逐一拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。如果你也想加入我们的榜单之中,请联 系:2020@leiphone.com。

    前几天,雷锋网(搜索“雷锋网”公众号关注)小编为大家深八了好多学术大咖,一个个简直碾压……

    But!如果说其它参加CCF-GAIR的大牛们是学霸,那你只能用“学神”来形容琳恩•帕克了。

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    因为,她本科和硕士都是以满绩从田纳西大学毕业的……

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    而博士嘛,有点可惜,没能拿5.0。

    但是人家的绩点是4.9好吗!

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    琳恩•帕克的主要研究方向是异构多机器人合作,而且还顺手辅修了大脑认知科学的相关知识。

    因为帕克在毕业之时有着几乎完美的履历,所以非常顺利地就到了美国能源部所属最大的科学和能源研究实验室——橡树岭国家实验室担任研究员,主要还是她的老本行:异构分布式机器人。

    或许帕克对自己的母校还是怀有深厚的感情,所以在2002年之后,她又重回学校执教,与此同时,帕克还建立了分布式智能实验室,并从事协作机器人及人工智能的研究。目前,帕克的主要研究方向是分布式智能系统的计算化——特别是物理层面的,比如多机器人及传感器网络。

    而说了这么久的异构多机器人、分布式智能系统的,这到底是个啥玩意儿?

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    简单而言,多机器人系统指的是通过组织多智能体系统,并协作完成某一共同任务的机器人群体。而其中,协作性是多机器人系统的重要特征和关键指标。

    这和之前介绍的另一位CCF-GAIR嘉宾迈克尔·伍尔德里奇所研究的方向有些类似,但琳恩•帕克更关注实践领域,来看看她的得意之作吧:

    这个由她经手的早期DAPRA项目,主要是针对现有的多机器人在搜索环境下的能力及局限性进行设计的。从路径规划到环境研究,甚至到搜索概率的预判,都结合了通信及算法的权衡。

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    而 下面的这个DARPA项目是为了解决室内搜索的问题,由科学应用国际公司(SAIC)牵头,田纳西大学、Te琳恩•帕克cordia及南加州大学一同完成 的。这一批机器人能够利用新型的协成控制算法探索一层未知的楼层。而更重要的是,这些萌萌哒机器人的自动化程度已经达到一定水准,研究者只需要在一个完善 的用户界面上进行简单的操作,它们就可以动起来了!快没电的时候,它们还会自己跑回“大本营”充电噢。

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    如果它不说自己是史上最复杂的多机器人系统,哪就没有系统敢说是第一了。别小看这几个小家伙,它们可是能够进行导航援助的自动异构机器人团队。涉及多个组件的配合,从标记检测、自主操控、颜色标记、激光定位、基于地图的路径规划,都可以让它们“一手包办”。

    其实,机器人也是人(大雾),所以它们也是难免会犯错误的。于是,为了提高机器人的容错能力,琳恩•帕克开发了一个基于机器学习的故障诊断系统(Learning-based Fault diagnosis),简写为LeaF(这强行缩写我也是醉呢)。琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    目前,她已经发表了135篇学术论文,包括6本已经出版的专业书。

    除了在学校搞搞科研,我们的琳恩•帕克大神当然不会闲着,她还是美国国家科学基金会(NSF)信息及智能系统(IIS)部门主任,(顺便)当当IEEE院士。同时,她也担任IEEE RAS的行政委员会成员以及多个顶级学术期刊的总编。

    而除了笔耕不缀外,琳恩•帕克还经常在公开场合发表演讲,阐述她能人工智能的理解。

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    想必你对这位大神也充满了崇拜,心里也一定有很多问题想咨询她,好了,现在进入Q&A时间!

    (友情提示,以下问答由琳恩•帕克在公开场合的演讲/采访整理而成)

    Q:您对人工智能的理解是怎样的?

    A:由于人工智能将人类从无意义的劳动中解放出来,它会让人类有更多时间和精力去创造。我认为,人类有机会抓住这个机遇,从无聊繁琐的事务中脱离,从事更多有意义、有创造性的事情。至于我们能否把握这个机会,需要我们去探索答案。

    (画外音:从此过上只吃饭不干活的生活……)

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    Q:对于人类,您感到最惊讶的一点是什么?

    A:那就是,我们不完全明白大脑是如何工作的。事实上,人类大脑所做的工作是如此惊人,它是如此有力和富有适应性。你花费很多精力投身于建立人工智能系统的事业,其实只算得上人类大脑的一部分。

    (画外音:机器人想统治地球什么的?还是先歇歇吧)

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    Q:琳恩•帕克大大,您印象最深的一个和人工智能有关的设备是什么?

    A:印象最深的是人们根据Roger Ebert以前的许多影评来提取他的声音,并以此创造了一个不错的语音合成器。这其中涉及了许多信号处理与理解人类语言的工作。我认为这很酷,而且效果也不错。人们可以听到他的声音,而不是来自于合成机器的。

    (画外音:Roger Ebert是美国一个著名的影评人,于2013年因癌症离世。)

    Q:您最喜欢的一部科幻电影是什么?

    A:我最喜欢的科幻电影是那些人工智能在里面发挥积极作用的电影,而不是人工智能毁灭世界的故事。我喜欢的电影是《机器人总动员》,因为它的故事告诉我们,机器人可以有情绪。人工智能系统可以没有情绪,但情绪能让人和它有更多的互动。而且,这个小家伙在最后帮了人类的大忙。

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    我比较倾向对人工智能的这类描述,因为我觉得这些才是真的。人工智能可以为社会做一些真正有益的事,而现在太多的科幻电影把目光放在了消极的一面。

    (画外音:看来琳恩•帕克大神和薛之谦的心愿是一样一样的啊!)

    琳恩帕克:调教一个机器人不难,她要教一群机器人自动“聚沙成塔”

    在琳恩•帕克的眼里,即使人工智能有情绪,也不存在所谓的威胁。对于现在非常流行的人工智能威胁论,你有什么想和琳恩•帕克探讨的吗?欢迎报名参加8月份的CCF-GAIR大会吧!

    【原文转自雷锋网】

    刷脸识“网红”机器人还嫩点

    王昱珩在“寻找网红童年照”环节进行观察。

    人脸识别机器人“蚂可”。

    6月30日下午5时许,杭州西湖区凤凰创意园一会场,一场人机识别极限对抗大赛正在进行。决战双方是有着超强微观识物能力、人称“鬼才之眼”的 王昱珩和人脸识别机器人“蚂可”。双方挑战的“道具”———50名青春靓丽的网络红人身着统一的服装站在舞台一边,舞台另一侧大墙上密密麻麻地贴着数百张 姑娘们的自拍照。

    在公证员的见证下,观众从现场网红中随机抽取数位。对战双方需要对被选中者进行观察后,再从照片墙中挑出对应的照片。比赛共分三场且难度依次递 进,前两个回合,双方打成平手。第三轮的“寻找网红童年照”却将人机双方置于极限挑战之中:十多年的成长脱变足以让人的容貌发生巨大改变,辨识难度巨大。 21分48秒,王昱珩率先按下按钮,提交答案。7分钟后,机器人“蚂可”也完成了识别。答案揭晓:王昱珩成功认出一位网红的童年照,并放弃辨认另一位,而 此轮“蚂可”辨识的两位网红照片都出现差错。

    赛后,王昱珩笑称事先并不知道比赛内容也未经彩排,“她们(网红们)的变化真的太大了。”人脸识别机器人“蚂可”的研发团队负责人陈继东则说,人和机器各有所长,此次和人类最强大脑的P K,说明机器学习人类的大脑,“还有一段路要走。”

     历史

      利用人脸识别身份从“找规律”到“对号入座”

    “利用人脸识别身份”,人类的这个想法其实早在百年以前就已经出现。早在1888年,达尔文的表弟、英国科学家弗朗西斯·高尔顿,在发表于《自 然》杂志上的文章《对于人的识别与描述》就提出,用一组数字代表不同的人脸侧面特征,并且还对人类自身的人脸识别能力进行了分析。有关“自动人脸识别”最 早的研究论文,至今也有五十年的历史。

    直到上世纪九十年代,人脸识别一直都未能突破最初的瓶颈。这项技术在一开始被研究者们认为是一个一般性的模式识别问题,通俗地说就是“找规律”。不过,最初的这三十余年间,研究者们并没能取得多少非常重要的成果,更不要说“投入应用”了。

    进入20世纪90年代,麻省理工学院人工智能实验室的一次实验,在对比了基于结构特征和基于模板匹配两种方法的识别性能之后,得出模板匹配的方法。其识别性能,要优于此前“基于特征”的方法。这次试验,基本终止了此前研究者们“找规律”的研究思路。

    从1991年到1997年,基于“模板匹配”方法,诞生了若干具有代表性的人脸识别算法。最负盛名的当属麻省理工学院特克(T urk)和潘特(Pentland)提出的“特征脸”。这一方法的思路,是将许多张人脸图像变换到另一个子空间,将图像“降维”,用向量的形式表现出来, 并在平均后得到平均向量,也就是一张“平均脸”。进而再通过计算得到“特征向量”即“特征脸”,并通过对每张人脸与“特征脸”相似性的计算,来实现最终的 “识别”。和之前“找规律”的思路相比,这种思维更酷似于“对号入座”。

     学习

      “训练”机器人让人脸识别真正“落地”

    与此同时,人工智能的发展也进入了新的阶段。人们不再满足于将计算机仅仅当成一种工具,而是在思考能否建立、模拟出人脑进行分析学习的神经网 络,让机器能够模仿人脑的机制来解释数据。通俗地说,人们想让机器具备思维的能力,如同Google资深院士Jeff Dean所言,“我们现在最需要从机器学习中取得的是‘理解力’”。

    2006年,基于这种想法,英国科学家H inton以自己此前对“人工神经网络”的研究为基础,提出了“深度学习”的概念。此后的几年里,H inton和他的N CA P团队逐渐建立了有效的深度学习算法,并且在2012年的Im ageN et比赛中完胜其他参赛团队。利用深度模型在竞赛中学习得到的特征,可以被广泛应用到其它数据集和各种计算机视觉的问题。而由Im ageN et训练得到的深度学习模型,更是推动计算机视觉领域发展的强大引擎。

    2013年,Im ageN et大规模物体检测任务挑战中最高的检测率只有22.6%。目前,香港中文大学由欧阳万里、王晓刚和汤晓鸥教授带领的D eepID团队,将此项成绩大幅提高至50 。3%,达到全球最高。而在此之前,D eepID团队还在LFW人脸识别挑战上战胜了Facebook,并在全世界范围内首次实现了机器人脸识别算法超越人眼,获得了高达99.15%的识别率。

    一旦具备“深度学习”这种能力,机器的人脸识别功能就可以变得无比强大。机器不再需要人为输入算法来指示它进行对图像的判别,而是在一种更高阶 的体系下,让机器更加自主地完成这项工作。学界广泛认为,深度学习是过去十年中人工智能领域的最大突破,在计算机视觉、语音识别、自然语音处理等领域有许 多应用。《麻省理工科技评论》还将其列入2013年10项最具突破性技术。

    应用

      从实验室进入商用刷脸需降低错误率

    近两年,深度学习和大数据两项技术的相互作用,大大提高了人脸识别的准确率。生物识别智能开始进入商用,尤其是金融领域,成为数家互联网公司竞相追捧的香饽饽。在不久的将来,人脸识别技术或将逐步可以取代密码和手机短信校验码,用于互联网金融的身份验证基础平台。

    资深专家陈继东表示,人脸识别的互联网级应用和金融级应用存在很大区别。“身份被盗用,直接导致财产的损失。”他指出,在金融行业,对人脸识别 技术的误识率要求非常高。“人脸识别的现实应用,不仅要做到在一堆照片中将同一个人识别出来,也需要将不同的人也能区分出来,这才是最难的一点。”陈继东 强调,识别率和误识率应该综合起来看,尤其是在金融行业,必须把错误率设低。

    这一点,绝非危言耸听。人脸识别从实验室进入商用,尤其是金融领域,一个大的技术难点,就是如何防伪造,比如用照片或者视频来代替真人。不过, 大量图片数据被抓取,也让人担心用户的隐私信息是否会遭到泄露。对此,与陈继东团队合作研发人工智能机器人的旷视F ace+ +市场负责人谢忆楠解释称,人脸数据的存储是经过加密处理的。即使泄露,被人拿走的图片也是焦的,黑乎乎的一片,只有算法才能还原,普通人根本看不懂。同 时,数据源也在国家的有效控制之下,一般只有具备经营资质的企业才能开通此项业务。他认为,生物识别智能进入商用,尤其是金融领域,很有必要运用多种生物 特征交叉比对验证。也就是说,除了人脸识别,还要综合运用指纹识别、声纹识别、眼纹识别等多因子生物特征,更好、更安全地服务用户。

      揭秘

      如何训练人工智能机器人

    谢忆楠介绍,所谓深度学习,打个形象的比喻就像是在“教小孩儿”。在深度学习的程序中,第一个步骤是人脸检测,即在一张照片中把人脸结构勾画出来。随后 就要在人脸上进行关键点标注,这一步相当于“训练”程序学习观察人脸部特征。“这相当于一个监督式学习,我们会告诉机器人这个人到底是不是一个人。”久而 久之,机器人会得出一些关键点参数。

    谢忆楠向南都记者举例,人的两个瞳孔就是两个关键点,瞳距在判断人脸是否为同一人的过程中所占权重较高。众多关键点之间相互联系,形成一个统一 的函数,该函数再对应不同人脸形成一个独有的数值。“每个人脸都有属于自己的数值”,谢忆楠说。以蚂可为例,它识别用户人脸是从二维图片中提取600多个 关键点,进行交叉验证和动态识别。

    原文转自新浪科技,链接:http://tech.sina.com.cn/it/2016-07-01/doc-ifxtsatm1103982.shtml?cre=techpc&mod=inf&loc=1&r=0&doct=0&rfunc=71

    科幻将成现实!俄罗斯计划20年内实现瞬间转移技术
      自从科幻迷们看见柯克船长和史波克从企业号的甲板上消失、然后在一颗行星上重新出现以来,瞬间转移技术就一直是科幻迷们的梦想。
    俄罗斯的投资者表示,既然现在的大部分日常科技都是受到几十年前科幻作品启发的产物,这个计划也并不像看上去那样遥不可及。  俄罗斯的投资者表示,既然现在的大部分日常科技都是受到几十年前科幻作品启发的产物,这个计划也并不像看上去那样遥不可及。
    俄罗斯计划利用该项目,在接下来的20年内驱动国家的经济发展。俄罗斯计划利用该项目,在接下来的20年内驱动国家的经济发展。

    新浪科技讯 北京时间7月1日消息,自从科幻迷们看见柯克船长和史波克从企业号的甲板上消失、然后在一颗行星上重新出现以来,瞬间转移技术就一直是科幻迷们的梦想。

    俄罗斯的科学家们现在正在努力将星际迷航中的瞬间转移变为现实,整个研发计划耗资数万亿卢布。

    俄罗斯的投资者表示,既然现在的大部分日常科技都是受到几十年前科幻作品启发的产物,这个计划也并不像看上去那样遥不可及。

    据相关报道称,俄罗斯政府可能到2035年之前就能完成相关技术的研发,为控制论的实现铺设好路线。

    俄罗斯政府近日宣布,将在接下来两年之内向“国家科技倡议”项目投入超过100亿卢布(约合10亿人民币)。俄罗斯计划利用该项目,在接下来的20年内驱动国家的经济发展。

    科学家已经证明了瞬间转移技术是可行的——至少在亚原子尺度上可以实现。

    2014年,荷兰的一支研究团队证明,他们可以把一个原子的特性转移到另一个原子上,相当于把信息“瞬间转移”到了三米之外。

    而其他团队则利用光子,把信息转移到了100公里之外的地方。

    由俄罗斯政府赞助的几家公司希望能研发俄罗斯自己的超级高铁。届时这一超级高铁网将把俄罗斯的西部与远东和北部地区联结起来。其中第一段位于圣彼得堡和莫斯哥之间,以波罗的海为起点,以每小时640公里的速度运输货物。

    圣彼得堡铁路创新发展中心主任阿纳托利?扎伊采夫(Anatolyi Zaitsev)表示,虽然这一项目预计将耗费210亿卢布(约合21亿人民币),但俄罗斯只需要花费一半的预算,就能实现这一技术了。(叶子)

    原文转自新浪科技,链接:http://tech.sina.com.cn/d/i/2016-07-01/doc-ifxtsatn7874373.shtml?cre=techpc&mod=inf&loc=1&r=2&doct=0&rfunc=71

    你应该关注的十个智能硬件中文网站

    不论你是智能硬件从业者,还是智能硬件爱好者,不妨统一称之为“智能硬件er”。在信息泛滥的时代,专注于智能硬件,能提供好的资讯、观点、资源的平台屈指可数。这是为您收集的值得关注的十大智能硬件中文网站。

    不论你是智能硬件从业者,还是智能硬件爱好者,不妨统一称之为“智能硬件er”。在信息泛滥的时代,专注于智能硬件,能提供好的资讯、观点、资源的平台屈指可数。雷科技小编为您收集了值得关注的十大智能硬件中文网站。

    1、 玩啥社区(http://www.wanshar.com/

    玩啥社区的定位于发现和选择科技产品,帮助用户用最高效的方式选择科技产品,同时可进行科技产品的分享、发现和讨论。另外,玩啥社区还提供每周两期的科技产品免费试用,只需提交试用报告即可免费获得科技产品。

    2、 电子发烧友论坛(http://www.elecfans.com/

    电子发烧友论坛是一个古老而传统的电子社区,主要面向电子工程师。提供一些电子资料、行业资讯以及交易对接。2006年成立的电子发烧友在智能硬件时代仍旧不失专业性,在智能硬件行业拥有一席之地。

    3、 筑梦创造(http://www.mongcz.com

    筑梦创造致力于打造专业化的创客资讯分享平台,目前开设栏目有创客社区、硬道理、聚创意、猎奇等栏目。

    4、 雷锋网(http://leiphone.com

    想必不用过多解释,在百度搜索“智能硬件”出现的第一个网站正是雷锋网。这家位于深圳的科技媒体定位在移动互联网,在智能硬件大潮中,结合深圳的地缘优势,正在越来越多地关注智能硬件,它们是创客马拉松、MakeFair等大型智能硬件活动的主力参与方,其实力可见一斑。

    5、 点名时间(http://www.demohour.com/

    点名时间是中国最大的众筹平台,与其他重酬平台不同的是,它在募集中的项目,科技项目占比超过90%,而其中又以智能硬件类项目为主。因此,如果要发现一些有潜力的项目、创业,必须关注点名时间。如果你有好的创意,点名时间将成为你的一个起点。

    6、MakerLab(http://makerlab.me/

    创客实验室是创客们的学习交流平台,它们提供高质量的产品和入门教程。一步步带你进入智能硬件开发的大门。同时,MakerLab也有自己的开发板销售,兼容Arduino的STduino,基于32位ARM cpu,让你以差不多的价格享受高性能的ARM cpu。

    7、雷科技(http://leikeji.com

    雷科技是专注于智能生活和前沿科技的科技博客,提供智能硬件资讯、产品评测、行业评测和行业数据。在广州、深圳等地开展 线下技术沙龙、智能硬件开发比赛、技术大讲堂等活动。雷科技创始团队拥有智能家居开发者、媒体从业者、运营商业内人士的背景,一些业内知名人士、智能硬件 大拿、智能硬件企业已(将)入驻该社区,雷锋网、虎嗅网、网易科技等科技媒体是其内容合作伙伴,在今日头条阅读量已超过1300万。如果你是智能硬件开发 者、从业者、产品人,抑或仅仅对智能硬件感兴趣,雷科技均值得关注。

    8、戴客网(http://www.imdaike.com

    戴客网是可穿戴设备之家,提供智能手表、智能手环、智能眼镜等产品的资讯、评测。你可以理解为它是可穿戴设备领域的ZOL或者天极网,其每天保持近10篇文章以上的更新速度,可见可穿戴设备行业依然十分之火热。

    9、极客工坊(http://www.geek-workshop.com/forum.php

    面向Arduino、树莓派等开发板的开发者。有开源项目区、开源软硬件等板块,目前拥有3万多会员,技术流社区。

    10、爱极客(http://www.igeek.com.cn

    最新的科技视频资讯、数码产品评测、好玩的IT知识。爱极客是为数不多的重视视频评测的智能硬件科技媒体。

    【本专题首发雷科技(http://leikeji.com),转载请注明出处。】

    智能硬件2016:竞争将趋白热化,创新方向将变

    尽管2016年已经过去一月有余,但是对于国人来说,不过春节的话就不能算翻开一个新篇章。而笔者在春节长假结束之后,推出《我看互联网的2016》系列行业预测文章,将根据自己对于各个熟悉行业和领域观察,做一些自己的预测和判断。这是该系列文章的第四篇。

    智能电视竞争白热化,传统厂商2016年或反攻

    智能硬件2016:竞争将趋白热化,创新方向将变

    智 能电视市场是过去一年智能硬件行业表现比较好的一个品类。以乐视、小米为代表的互联网厂商在2015年的激烈对抗,不仅使得双方大打价格战,也在内容方面 进行比拼。而在年末,两大厂商都交出了自己的成绩单以及期望。乐视致新总裁梁军在2015年12月底宣布完成300万台的预期销售目标,而小米电视CEO 王川此前在接受媒体采访时表示,小米电视在2015年的销量达到100万台。

    2015年,乐视、小米在智能电视领域的攻城掠地,也引起了海 信、TCL等国内传统电视厂商的激烈反抗,纷纷跟随互联网厂商在智能电视的内容策略,与乐视、小米展开正面竞争。可以预见的是,在2016年里,智能电视 行业的竞争会更加激烈,不仅仅是国内电视厂商在,借助于智能化的浪潮,三星、LG等国际厂商甚至吹响反攻号角。

    另外,智能电视在直面同行竞 争时,还需要警惕来自于侧翼的竞争对手。值得注意的是,与智能电视厂商一道抢占客厅娱乐市场的还有智能投影仪这样一个产品,也被称为无屏电视。尽管目前从 销量以及画面的清晰度方面,智能投影仪产品都无法与智能电视竞争,但是在便携性和价格方面却可完胜,也可以有更多的场景可以使用。目前国内有数十家智能投 影仪厂商,销量最大的应该是极米,保守估计在20万台到30万台之间,而根据业内人士估计,智能投影仪在2015年的总销量在50万到100万这个区间。 可以预见的是,在2016年,随着产品体验的进一步升级,这一产品仍有不小的增长空间。

    智能手表/手环创业时代结束

    智能硬件2016:竞争将趋白热化,创新方向将变

    在 此之前,智能手表作为智能硬件创业浪潮当中最为活跃的一个创业分支,甚至在苹果、三星等国际巨头的智能手表上市前,国内的不少创业者就率先推出了智能手表 产品,而且还针对儿童群体推出了儿童智能手表。但不得不说,在硬件科技领域,国内的创新基础依然薄弱,虽然国内的手表类产品上市较早,但却没有抢得市场红 利,最终智能手表市场主要还是被苹果和三星这两大巨头分食。

    根据国际研究机构Strategy Analytics的最新报告显示,2015年第四季度,全球智能手表销量达到810万块,同比增长316%,在这810万块智能手表中,苹果Apple Watch占比63%,出货量为510万块;三星占比16%,出货量为130万块。苹果借助其强大的品牌效应和线上线下销售网络,目前在2015年里全球 范围内也仅仅销售了1200万台,并没有达到苹果的预期销售目标,而这个销量已经占到总体市场的三分之二多,三星则紧随其后。

    不过,尽管智 能手表在销量上首次超过瑞士手表,但显而易见的是,智能手表并不能成为一个像智能手机一样普及的硬件产品,2015年全年销量规模不超过2000万台,这 要远远低于2015年全球智能手机14亿部的销量。而以目前的产品形态和体验来看,智能手表还不大可能取代智能手机成为人类的第二个“外部器官”,而其增 长速度也难以与智能手机刚刚开始普及时相比。

    最重要的还是,智能手表的生活化场景单一,没有能够取代智能手机的突出性功能,并且与手机的众多功能重合,用户没有刚需。而在2016年里,由于巨头的强势进入,智能手表领域创业已成红海,甚至原有创业者也会面临生存问题。

    相较而言,智能手环的市场表现甚至比智能手表更好一点。小米手环的数据线显示,其在2015年全年销量突破了1000万枚,不过这可能取决于其79元的低价格。而全球销量第一的Fitbit更是成为了全球第一家可穿戴设备上市公司。

    还 有,尽管在2015年里,苹果、三星、华为等大牌厂商都强势推出了其智能手表、智能手环等产品,但是这并不意味智能硬件行业迎来繁荣。尽管硬件的智能化是 一个趋势,但目前整个智能硬件行业面临的最大问题,还是没有能够在硬件联网之后,搭建更多的智能化生活场景,让消费者感受到智能化的好处,这就造成产品接 受度仍然还是较低。

    2016年,智能硬件产品方向迎来转折点

    此外,在2015年里,在京 东众筹、淘宝众筹等平台上,智能硬件新品一个又一个的推出,但如今看来都是一地鸡毛,并没有真正的爆品出现。包括诸如智能血压计、体重计等与健康概念相关 的智能硬件也未能获得预期中的爆发,还有主打安全概念的智能门锁、智能行车记录仪等等也都没有成为爆款,销量都处于不温不火的状态。而2016年里,由于 巨头的进入,风投的冷淡,智能硬件的创业浪潮很可能不复去年的繁华盛景,一些产品未获市场认可的创业公司将遭遇融资难,这将会导致智能硬件创业领域在 2016年大洗牌,不排除相当数量的初创公司倒闭消失。

    不过,智能硬件领域并非全无亮点,无人机、平衡车、智能汽车等智能交通出行工具显然 更受关注和青睐。一个最新的消息是,国内无人机领域的创业公司大疆无人机在2015年的净利润达到了2.5亿美元,这也能侧面看出过去一年无人机的受追捧 程度。此外,国内互联网巨头还都宣布了自己的智能电动汽车的计划,包括腾讯、百度、乐视等在内的互联网公司均有参与,而传统汽车厂商也在积极推出智能汽 车,这也将是未来三年内智能硬件领域最大看点。

    智能硬件2016:竞争将趋白热化,创新方向将变

    智 能硬件在2016年很可能会迎来转折点,产品创新方向开始由原来已有电子产品的智能化改造向全新智能产品的创造转变,特别是结合上VR(虚拟现实)这样的 新的技术,很可能是让智能硬件产品更快走向大众的开始。比如将VR技术运用在游戏娱乐方面,可能是成为一个智能硬件创业的主要方向,而不是之前将创新点全 部集中在的运动、健康等非强刚性需求上面。

     

    吐槽无罪,但智能硬件更需要的是足够的耐心与包容

    新闻上又说2015年是智能硬件的元年与关键性的一年。#呵呵哒#

    这种句式确实也让大家听得有些厌倦:总是这 么说,每年都是关键性的元年,为什么如今智能穿戴硬件还是不能真正走进我们的生活?话虽如此,但不管是不是元年,确是不平凡的一年。在刚刚过去的这一段时 间,智能化浪潮一浪接一浪扑面而来,由于起步阶段的大家还在慢慢摸索,所以有称赞的同时也难免会伴随着大量批评。很多产品被用户以及业内疯狂吐槽,有的从 此销声匿迹,成为智能行业的牺牲品,但更多的是在批评与吐槽中慢慢成熟。

    新生的智能硬件出现大多伴随着怀疑,但不应该轻易否定

    比如说今天的你能想象自拍杆刚出现的时候被黑成了翔?什么“有史以来最没用的发明”、“功能鸡肋”之类的帽子扣了一身,可是今天还有几个智能手机使用者不把它当做了出行聚会的必备品?

    另外似乎每一款全新概念的智能硬件刚出现的时候都会有人对它的颜值和功能实用性产生质疑,比如AppleWatch,它就曾经被人诟病“脸丑”与“密集恐惧症慎选”。国内可穿戴设备创业公司PICOOC联合创始人张悦也连用三个“没有明白”提出质疑:

    “Watch的出现证明了我们的思路没有错,但苹果没有明白手表和手机的区别、没有明白人为什么需要手表、没有明白人为什么离不开手机!总之,我感觉苹果很迷茫。”

    而我们如今再看,正是这一款曾经被黑出翔的智能手表,现在已经悄无声息地占据了智能穿戴市场的半壁江山,每年都在为苹果公司创造者巨大的收益。

    apple-watches.jpg

    根据JuniperResearch指出,AppleWatch占2015年智能手表出货量的51.5%(售出880万只)。作为对比,AndroidWear的设备占市场份额不到10%。在2015年,全球智能手表的出货量达到了1710万。

    发展速度放缓并无大碍,想要质变还需潜心积累

    最 近一段时间新兴智能硬件的发展速度确实比较迅速,但处于瓶颈阶段的它们却也许久未能取得实质性突破。然而不可否认,在这段时间里我们看到了智能硬件在做着 方方面面的尝试,我们的衣食住行、吃喝拉撒都已经开始融入了智能化的新概念,例如雾霾中的智能口罩,和家中出场率也来越高的智能马桶盖。

    除 了上述之外,不管够不够实用,有没有市场,平时只能在科幻大片里才能看到的,还有那些小说里虚构的“黑科技”确实也化身实物也大量出现在我们的视野中。如 此看来这个阶段的新一代智能硬件一定就像是刚长成型的竹子,要靠着三五年的时间拼命扎根,一旦根基够深,时机成熟,它就会突然发力,拔节而起。

    智能硬件如今并不缺少机遇,但噱头不可玩得太过

    移 动互联网是智能硬件发展的一大契机。可物联网的概念虽然传播开来,但是对消费者来说,实用依然是第一选择。而且物联网的概念略显生涩,再加上一些厂商简单 粗暴是将“智能化”诠释为数据监控和远程操控,让人一头雾水。与此同时,“黑科技”与“智能”的概念也被用得太滥,ZEALER中国更是直言:

    “从业者恨不得让一切死物发光发热,并美其名与智能化。智能化这个过去看起来很美好的概念,是不是被玩儿坏了?”

    物联网.jpg

    但 换个角度考虑,硬件的智能化不断加快,我们的所有事情都可以用手里的智能手机远程操控,这种功能虽然简单但也确实十分受用,况且这本身不就是实用性的体 现?相信只要坚持实用为王,从用户的需求为出发点进行研发,以智能手机物联网为代表的智能生活应该就距离我们并不遥远了。

    众筹当道,但产品参差不齐不能以偏概全

    新兴智能硬件的种类与应用领域确实是让人眼花缭乱,“互联网+”火起来后更是在一夜之间冒出了大量智能硬件的新概念,再加上众筹的方式很大程度解决了智能硬件的成本等问题,研发与入门的门槛大大降低,参差不齐的智能产品一时间大量涌入市场。

    我 们不可否认,在这其中确实是有一些所谓的“黑科技”根本就是在自娱自乐哗众取宠,靠炫耀稀奇古怪的功能引来一群人来看看热闹。由此你可以说它存在着巨大的 泡沫,也可以说它刚需补足华而不实,但这也只是智能硬件里的一部分,我们没有理由通过它们的表现就以偏概全,把所有的智能产品一棍子打死。

    0.jpg

    写在最后:

    新 事物的发展本来就是一个摸索与改进的过程,为黑而黑没什么意思,况且我们对他们吐槽这么多是不是也算是反映了对智能硬件所寄予的超高期待?愿景是美好的, 发展的步伐跟理想的状态确实也还存在差距,智能硬件穿戴的发展需要一定的时间。而我们应该慢慢的接受他们为我们的生活所带来的改变,不急不躁,以足够的包 容和耐心去看着智能硬件变得越来越成熟。

    科技进步与所取得的成果昭示着技术正在改变着我们的生活,新型智能硬件穿戴的到来也将会深刻地改变我们的习惯,只是它们还需要一点时间。

    【本文系硬件再发明(微信ID:hard1024)原创,首发于百略网,转自虎嗅】

    计算机将能看懂人类手势,人机交互方式或将改变

    今年的CVPR会议在拉斯维加斯举办(CVPR全称IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议,是三大计算机视觉国际级会议之一),国内计算机视觉领域的公司如百度、商汤科技、图森 科技等都参会并发表论文。学界和业界的研究表明,计算机视觉已经发展到从模拟人类行为到辅助人类生活,再到帮助人类探索未知的阶段。

    计算机将理解人类手势

    如果给人类播放一段静音的《守望先锋》游戏战斗视频,即使是新手玩家也能根据画面想象出游戏的种种音效,甚至能够轻易依据某为英雄的动作反映出一句台词——“午时已到”,并对这些音效进行简单地模拟。

    但 对于计算机来说,这并非一件易事。在CVPR 2016会议现场,来自麻省理工学院(MIT)的研究人员就展示了一向“视频生成声音(Visually Indicated Sounds,VIS)”的技术。科学家向VIS输入包括46000种声音在内的1000段视频对其进行训练,并通过深度学习算法对声音进行解构,随后系 统便会给静音视频配上一段它认为正确的音效。据研究人员现场介绍,计算机所模拟出的声音足以以假乱真,在此前的测试中便曾多次让人类信以为真。

    能够正确理解人类手部动作,同样是人工智能感知世界的重要任务。人类可以轻易地判断“OK”或“竖起”大拇指等手势所代表的意义,但对于计算机视觉来说,这项任务仍然处于比较早期的阶段。

    商汤科技高级研发工程师钱晨表示,手部姿态估计的难点,分为两部,第一部手掌整体的姿态;第二步是手指的姿态。因为手的外观和手指的姿态相关,在不知道手指 的情况下,去估计手掌的姿态并不容易,近邻搜索的方法耗时太久。而普渡大学的DeepMind技术将深度学习和近邻搜索相结合,通过深度学习,将输入映射 到低维向量和类别,快速地找出手掌的姿态参数,再通过类别差异回归算法来估计手指的姿态。手掌姿态估计比传统的直接回归精度提高很多。手部姿态估计作为整 个手势研究的组成部分,在实时估计的前提下,精度越高,手部动作识别的技术距离实用会越来越近,应用场景也会越来越广,对VR、游戏产业大有裨益。

    无人驾驶行业将迎来变革

    辅助/自动驾驶可以算是当下学界与工业界结合非常紧密、成果实践性强、讨论热度极高的一个领域。在人工智能逐渐理解人类世界之后,辅助人类的日常生活,便成为了其“理所应当”的工作。

    以色列知名公司MobileEye联合创始人Amnon Shashua认为,在2017年,高速自动续航功能将会普及,2018年到2020年,高速路上的自动驾驶将会普及,到2021年,部分都市区域会实现无人驾驶,而2023年,无人驾驶就能全部实现。

    undefined

    图森科技的辅助驾驶技术可以高效理解国内城市路况,可以对路上的三轮车、电瓶车等特殊车种进行识别

    国内专门研究辅助驾驶的图森科技CTO侯晓迪认为,辅助驾驶、自动驾驶在中国和在欧美国家的现实差别很大,学界研究的相关技术均在一定 程度上无法适用于中国的交通现状:在中国的驾驶场景中,司机不遵守交通规则的比例要远大于美国;道路线的整洁程度、道路标识是否清晰,甚至是否存在,中国 城市修路频率次数繁多;中国道路的拥挤程度也不能很好地应用国外算法;在美国,自动驾驶技术如果需要取代人类出租车司机,只需将成本控制在10美元之下, 但在中国就需要成本压得更低。

    侯晓迪称,学术圈的欧美城市路况数据集较为齐全,甚至会有很多小城市数据集,但并没有针对中国的路况数据集,初创公司打造自己数据库的难度极大;中国高精度地图水平和国际先进水平存在差距。

    原文转自网易科技,链接:http://tech.163.com/16/0701/07/BQSET3ET00097U80.html#index_wit

    索尼把自己的未来放在了机器人和虚拟现实?

    接下来的几年时间,机器人和虚拟现实会是索尼最重要的两个业务。

    周三,CEO平井一夫在公司的年度战略会议公布了公司业务的调整,他说索尼正在开发一款“和用户做情感交流的机器人”。公司还会成立一个规模100亿日元(约合人民币6.5亿元)的创新基金,投资和人工智能相关的公司。

    这是索尼时隔近 20 年又重新捡起来的新业务。1999 年索尼发售智能机器狗Aibo,到 2006 年因业绩不佳停产,期间一共卖出 15 万台。2014 年,连售后服务也停止了。

    undefined

    Aibo机器狗

    除 了机器人,游戏和网络服务被描述为是“中期计划中最强的增长推动力”,其中虚拟现实“为索尼带来了机会”。虚拟现实头盔PlayStation VR 已经发布,售价 399 美元(约合人民币 2600 元),索尼成了 Oculus 和 HTC 之后第三家做消费者版本 VR 头盔的公司。

    相 关的营收预期也被调高:下一个财年(截止到 2018 年 3 月),索尼预计该部门的利润率会在 8%—10% 之间,高于预期的 5%—6%。整体的营收在 1.8 万亿到 1.9 万亿日元(1164 亿- 1229 亿元人民币)之间,高于预期 1.4 万亿至 1.6 万亿日元。

    但为智能手机厂商提供图像传感器的半导体业务,这次的目标被调低近 30%,索尼主营业务的优先级次序正在发生变化。

    索尼自 2008 年以来就一直亏损,直到 2015 财年终于盈利。贡献主要来自游戏和网络服务,这部分的收入增长了 11%,其中最重要的是 PlayStation 4 及其相关业务。

    在这之外的业务都不怎么好,图像感应器亏损了 2.53 亿美元,手机业务亏损 5.44 亿美元。加上日本熊本大地震导致索尼部分工厂停工,索尼的销售额面临几亿美元的减少。

    VR 产品依然有很高的不确定性,目前来看它价格高昂、体验有限。索尼采取的策略是把 VR 头盔当成是 PS4 主机的配件。接下来就看几千万 PS4 用户有多少愿意再花四千块买 VR 了。

    原文转自网易科技,链接:http://tech.163.com/16/0701/07/BQSF6RSH00097U7U.html#index_wit

    超过80%语音开发者的共同选择