如果以一列高速行驶的火车来比喻人工智能,算法是火车的设计理念,算力像火车的发动机,那么数据则是驱动火车前行的燃料。三位一体的协同进步,才能使得人工智能这趟火车昂扬疾驰于时代先列。
虽然算力、算法和数据作为人工智能的三大要素早已广为人知,但是技术、资本与媒体大众的聚光灯总是集中在前两要素上,作为A.I.“血液”养分供给的数据却略显边缘化。事实上,数据在A.I.真正商业化落地中发挥着无可替代的作用。
谷歌首席架构师、谷歌人工智能团队谷歌大脑的负责人,Jeff Dean曾在公开场合这样强调数据对于A.I.算法的重要性:

以上横轴为数据量,纵轴为准确率,蓝色以及绿色线条分别代表深度学习以及传统算法。根据Jeff Dean的预判,随着数据规模的不断扩大,未来深度学习算法的精度也将不断提升。
人工智能的发展目标是让机器像人类一样学会学习。算法模型训练、提升性能、机器学习等都需要大量数据的迭代与支持,数据的采集、标注与价值挖掘是A.I.得以在实际应用场景中大展拳脚的重要工作前提。
数据服务虽然被外界认为是人工智能金字塔最底层的工作,粗粝且拙朴。但其实,大量数据的迭代更新、夯实坚守,才是筑成A.I.金字塔岿然不朽的坚实根基。
大到机场枢纽的人脸识别、小到手机应用的语音翻译……A.I.正在逐渐从抽象概念变成现实生活中的各种应用,但阶段性地来看,A.I.数据数量和质量的瓶颈还将持续制约A.I.应用落地与行业发展。当前的现实情况大多是——
A.I.产业落地过程中存在数据孤岛和数据碎片化难题,许多A.I.企业或许已经初步具备了先进的算法与优质的硬件,但产品的真正落地与的升级迭代却受制于数据燃料的瓶颈。
美国Databricks一项调查显示,96%的企业在执行A.I.项目时面临着数据相关的问题;90%的受访者表示在整个机器学习生命周期中统一数据科学和数据工程的方法将克服A.I.难题……总结下来,当前A.I.企业面对的数据瓶颈主要有以下几类:
2. 好不容易采集到了大量数据,却无法将数据标注精准,也找不到可靠的、拥有相关经验的人来标注;
3. 总要面临数据如何筛选、如何加工与使用的难题。
全新升级的讯飞A.I.服务市场,由科大讯飞集团副总裁于继栋在今年的1024开发者节上重磅发布,其中“数据标注”作为重点类目之一,正是应市场呼唤而生!
讯飞开放平台最新推出的A.I.数据资源解决方案,提供音频、视频、文本、图片等方向的资源标注及预加工处理服务,为人工智能行业提供一站式数据服务解决方案,并可根据客户特定需求,进行各方向数据深度加工,帮助提升训练算法模型,开展机器学习,提高A.I.领域的竞争力。
A.I.数据服务包括资源方案设计、数据定制、效果实施及资源运营等,持续提升资源效能和质量,进一步挖掘数据价值,支撑技术落地和业务发展。
服务内容
服务流程

