大数据+?星图数据发布大数据开放平台“蜂巢”
- 发布时间:2015-06-30 11:34:14 来源:创业邦 责任编辑:汤婧
《创业邦》去年年底采访大数据创业公司星图数据时,创始人谷熠曾提到数据开放的想法。时隔半年多,想法落地,变成现实,星图数据在这个月发布了大数据开放平台“蜂巢”(DataComb)。
根据谷熠的介绍,“蜂巢”将开放星图数据自有的大数据体系,并引入第三方数据源和数据开发者,面向各行业提供更丰富更优质的“大数据+”应用服务,实现多方共赢的大数据商业化生态圈。
谷熠说,Tinder 是美国目前火爆的社交应用,它的约会匹配正是基于 Facebook 开放出来的在社交关系数据基础上进行的建模计算,“稳定的海量数据源和既有社交用户的导入,让 Tinder 刚上线不到五个月的时间内,牵线男女的数量就已突破 5000 万对,同时积攒了45亿个用户评分,也以火箭般的速度加入了10亿美元俱乐部。”
此外,在 Twitter 和 Google+ 的开放数据体系中也快速成长着大量咨询智囊公司和新锐投资机构,其中不乏影响到美国大选结果和股市涨跌的优秀团队,这些新锐力量无不受益于海量数据开放,并带动了不同产业的升级跃迁。
这其实也反映出了大数据在国外的发展是公开透明的开放机制。然而,大数据在国内的发展却是表面开放,实则封闭。谷熠说,缺乏足够的数据开放,极大地制约了大数据行业的快速发展,使得大量的创业创意和数据技术难以落地实践,难以进行商业化变现。对于众多的传统行业来说,面临着想要转型升级,却缺乏足够的数据依托来驱动的窘境。因此,星图数据决定推出“蜂巢”,希望可以从实质上推动大数据市场的开放和发展,进而有效提升大数据本身和大数据团队的商业化能力,最终能够真正意义上通过“大数据+”促进各个产业的转型升级。
作为一家大数据服务公司,星图数据基于自主研发的 iNebula(数据星云)分布式大数据监测和采集系统,每天监测互联网上近 5 亿的网络页面,获取超过 5TB 的原始数据,并通过 WarpEngine(曲速引擎)数据处理引擎完成高效的数据挖掘、建模计算和机器自学习分析,生成了海量极具价值的商业数据。
谷熠说,星图数据已经在此套大数据供应链体系上自主开发了多款针对电子商务、制造业、零售业、咨询、媒体和广告的DaaS数据应用服务,在一年左右的时间里帮助了上百家的知名企业向“互联网+”转型。
“蜂巢”大数据开放平台将面向创业团队、科研院所、高校以及个人开发者提供开放的数据集市,提供海量的高质量数据资源,以促进大数据产品和行业数据应用的生产与研发;并在平台上打造数据应用商店,引入大数据产品和行业应用服务,共同为各行业企业提供一站式的全面的“大数据+”解决方案。
数据方面,“蜂巢”的数据接口集市包括自产数据接口服务和合作数据接口服务两类。
自产数据接口服务中,最典型的是电商发展监测数据服务接口。这个服务接口是基于星图数据自主研发、并拥有自主知识产权的整套大数据供应链系统,对国内 50 余家的主流电商综合类和垂直类 B2C 平台进行监测,并通过每分钟 6000 万条以上的数据吞吐能力,每天对超过 5TB 的数据进行处理、清洗、挖掘、建模计算和自学习分析,所形成的高频的、海量的、有延续性的、高价值的商业数据。
通过这项数据接口服务,使用者可以获取周度更新的,细化到行业、平台、品牌甚至单品级别的电商销售表现数据,目前覆盖的品类包含:家用电器、3C数码、个护化妆、母婴用品、运动健康和食品饮料等6大超类,近百个品类。今后,品类还将进一步丰富,直至覆盖所有线上在售的实体商品。
而合作数据接口服务中,首批开放的就包括网络视频内容的数据服务接口。通过这个服务接口,使用者可以自由调用视频详细信息、用户偏好、直播信息等网络视频数据。并且,此数据服务接口一体化涵盖PC端和手机端数据,从而全面反映网络视频行业的详细情况。
此外,“蜂巢”目前已经上线的功能还包括针对大数据+高校&科研院所的应用“数据搜索引擎”、大数据+广告&咨询的应用“数据象限”、大数据+电商企业的应用“数据矩阵”、大数据+渠道&零售的应用“天镜”、大数据+制造业的应用“原子力”、大数据+媒体的应用“图播鼠”,等。
谷熠说,继“互联网+”之后,又一个崭新的时代——“大数据+”时代已经到来。大数据开放平台“蜂巢”希望能够在未来给更多的制造业、零售业、开发者、高校和科研院所、媒体、广告和咨询等各个产业的企业与个人提供服务和帮助。为他们提供一站式的全面的“大数据+”服务。
星图数据在去年 8 月份已经完成了数百万美元的 A 轮融资,目前正在进行 B 轮融资。