投稿须知
请将投稿文章及个人信息(作者、用户名、手机号、个人简介等)发送到邮箱tougao@iyiou.com,一经审核会有专人和您联系
我知道了
专栏申请
请将您的专栏名称、手机号、邮箱、个人简介(20字以内)等信息,发送至邮箱 tougao@iyiou.com,若有已投稿的文章可附上链接。一经审核,我们会以邮件的形式进行回复。
我知道了

Scale AI 收购 SiaSearch,谁在数据引擎风口抢跑了?

收藏
科技
作者:亿欧EqualOcean
2021-11-26 08:38
[文章导读]
谁将成为AI数据管理的头号玩家?Scale AI?格物钛?
AI

题图来自“收费图库”

在增长路上一骑绝尘的Scale AI也在寻找第二曲线了?据外媒最新消息,硅谷AI独角兽Scale AI 已完成对初创企业SiaSearch的收购,旨在提供与特斯拉相同的数据引擎能力,全面布局非结构化数据管理。业内人士透露,数据引擎领军者之争日益激烈,赛道早期布局者如格物钛等已受到资本瞩目。

Scale AI由两位90后华裔创办,5年时间估值超73亿美金,去年营收上亿成为有史以来增速最快的公司之一。数据标注是其前期核心业务,也许是意识到标注业务竞争激烈、护城河又窄的缘故,Scale开始强调新定位“AI数据平台”,剑指AI开发的下一个核心命题——非结构化数据管理,方有收购SiaSearch之举。

SiaSearch建立了一个数据管理平台,主要功能为高级驾驶辅助系统和自动驾驶系统捕捉的PB级数据搭建的搜索引擎。这家初创公司被收购前已与大众汽车和保时捷等汽车制造商合作,能够自动索引和构建车队收集的原始传感器数据。Scale AI计划融入SiaSearch技术,以提供所有AI开发人员都可以使用的完整数据引擎,使自动驾驶等技术领域受益。

“数据引擎”为何成为AI开发的香饽饽?即便是特斯拉这样的AI先驱者,数据标注团队达到千人级别,在海量的行车数据面前,千人还是杯水车薪,对此特斯拉内部开发了自动训练框架“数据引擎”(Data Engine)。在今年的特斯拉AI大会上,特斯拉AI总负责人安德鲁·卡帕西(Andrej Karpathy)展示了数据引擎的强大之处:通过数据采集、标注、模型部署等环节,在测试过程中识别出长尾情况、单独测试,未通过的数据会被送到数据容器中,对数据进行加强、重新标签、训练生成模型……如此反复直至覆盖所有场景,在大量训练数据的喂养下,自动驾驶变得越来越聪明。

对于大多数企业来说,数据就是源头,面对海量高速增长的视频、音频、图片等非结构化数据,使用一个高效协同、自动化训练的数据管理平台至关重要。风口的到来让早期布局者备受关注,其中格物钛非结构化数据平台正脱颖而出。

相较于从自动驾驶行业数据搜索起步的SiaSearch,格物钛更早布局全面数据管理,依托于数据引擎,平台的复杂场景数据检索和可视化只是基本功,清晰可溯的权限管控和版本管理、从预标注到持续迭代的全周期承载,才能更好地满足企业算法团队高效AI开发。除了自动驾驶,智慧物流、新零售、直播电商等非结构化数据暴增领域需求正旺,难怪格物钛能获得红杉、云启、真格、风和、耀途以及奇绩创坛等一众资本的青睐。那么谁将成为AI数据管理的头号玩家?Scale AI?格物钛?拭目以待。

本文来源于亿欧网,原创文章,作者:亿欧EqualOcean。
转载或合作请联系 hezuo@iyiou.com,违规转载法律必究。
文中涉及数据均已标明来源,如需数据服务可访问亿欧数据。 如您有「项目报道」或「项目对接」需求,请填写表单,我们将尽快与您取得联系。
推广
大数据数据管理人工智能科技新闻数据引擎