聚合大数据分析和应用玩家 他们搞啥?

文章讲的是聚合大数据分析和应用玩家 他们搞啥,近年来,大数据正日益成为国家基础性战略资源,蕴藏着巨大的潜力和能量。在国家层面,发展大数据已成为提升竞争力的战略选择;在经济层面,发展大数据已成为打造新动能的关键要素;在行业层面,发展大数据已成为驱动转型发展的重要引擎;推动大数据发展已成为从政府到民间、从行业组织到企业机构的社会共识。

  在这样的背景之下,2016年9月13-14日,国内独立第三方移动数据服务平台TalkingData主办的T112016暨TalkingData智能大数据峰会在北京中国大饭店召开。峰会以“智能数据生态”为主题,可见TalkingData正在通过企业聚合的方式,让越来越多做大数据分析和应用的玩家入场。

  的确,TalkingData带领众多玩家展示了移动大数据的魅力。并且公布了部分数据--其基于大数据分析、挖掘、应用的DaaS业务收入,已经占据其总营收的八成比重,公司已经盈利,并有足够现金流。随着大数据服务的变现,他们即将联合海外空间大数据与商业智能公司。他们还想这笔生意越做越大。

  联合海外伙伴,数据分析能力开放共享

  早前,TalkingData就以大数据经营为增值点的服务战略转型,通过与上下游企业合作,改变和创新了解市场的手段。在刚刚举办的T11峰会上,TalkingData宣布了其”海外技术战略”,即通过与国外优秀的数据分析型企业达成战略合作,将核心技术引入中国,以共赢的方式,拓展国内的大数据应用市场。对此,TalkingData过去一年来还成立了专门的海外基金,用于投资硅谷先进数据分析与算法的相关公司。 TalkingData首席战略官William Plumer在公开演讲中提出,要基于全球顶尖技术打造一个大数据平台,而目前对接的海外合作伙伴,囊括人工智能、商业智能,以及空间大数据分析等品类的公司。William认为,国内外提供大数据技术的公司将基于市场拓展需要和资本力量迅速走向整合,以客户需求为导向,共同直面大数据分析挖掘与应用的各项挑战,才是当务之急。

  TalkingData的海外创业公司伙伴如何玩转大数据价值?

  1.Sentience——基于机器学习的移动和驾驶行为画像网站:http://www.sentiance.com

  Sentiance 要做的,是基于智能手机和移动可穿戴设备等的传感器数据,描绘出现实和实时的用户画像,服务于移动场景下的各种可想象和拓展的商业模型,这些丰富的用户画像,涵盖了对个体流动性、通勤特征以及驾驶模式等多样数据的建模和理解。 例如,各种方式的交通出行活动、个性化的移动画像,以及热力图,这些都将借用其平台的数据抽样和特征提取算法,生成一些对应的结构视图模型,如出行模型、用户高频造访地点的模型,抑或是常见轨迹等。 此外,现今的移动设备多内置加速计、陀螺仪等多样的运动传感器,结合这些数据,能够衍生出更多详细的、多层次的画像模型,如复杂驾驶行为的分析、驾驶员评估等,这些画像可以应用在驾驶安全管理、UBI车险评估、汽车维修方案预估,以及个性化的司机驾驶引导和辅助等等现代驾驶服务场景中。

  值得一提的是,类似的商业模式在国内也已经开始发端,并被认为是智能交通的未来场景下极富潜力的趋势型应用,而Sentiance的优势,在于多传感器的融合采集手段、优化的数据抽样算法,以及基于机器学习的建模和精准识别等。

  具体到技术和服务的提供上,可以总结如下。首先是通过专用的传感器融合平台,将实时环境感知的能力赋予B端客户,如DMP(Data-Management Platform,数据管理平台)、SME(Small and medium enterprises,中小企业信息平台),以及移动设备的应用开发者等。 这样的平台允许企业基于此绘制自己独特的用户行为画像,并向其中填充个性化的、可预测的情景感知服务。 Sentiance创立于2013年,成立之初即获得65万美元的种子轮融资。TalkingData的数据峰会上,Sentiance CTO通过视频表达对切入中国市场的期望和信心,他们希望借助TalkingData在中国广泛垂直的覆盖,推进其解决方案和情景感知平台的本地化落地。初期,他们将会把重点放在智能移动和保险业务中。

  2.PathSense:性能上精雕细琢的LBS服务网站:https://pathsense.com/

  PathSense是坐标加利福尼亚的一个10人创业团队,他们致力于做传感器软件方面的专家。借助于SDK(三款面向安卓,一款面向IOS),他们试图使移动设备的定位更加精准、迅速,且耗电量低。值得一提的是,这其实是一个连续创业的故事,在PathSense之前,他们曾创立一家名为 “Trapster(电子狗)”的公司,但却因困扰于GPS的高耗电量难题而作罢。幸运的是这个问题终于在今天得到了很好的解决。 细化开来,他们的业务包括为企业提供系统到系统、网对网的软件服务,为移动设备提供地理围栏、动作识别和高GPS定位精度等技术支持。地理围栏,是目前基于移动设备的新型LBS技术,通过不断优化的定位算法描绘出虚拟的地理边界,并以此为基础拓展应用场景,如家人定位、基于位置的广告投放等,都需要地理围栏技术的辅助。 “打造中国最好的地理围栏”,这是PathSense在TalkingData数据大会提出的豪景,但这并非无据可依,在影响LBS技术的三大关键指标——定位速度、定位精度和耗电量上,PathSense用数据展示了自身的优势。 (1)定位速度和处理速度 PathSense展示的数据显示,其定位处理速度是谷歌的2倍,这就是说减少了一半的定位延迟。而在动作识别方面,其处理速度则达到谷歌的6倍,即只花5秒就可以监测到一个用户是否在开车,而这个数字对谷歌来说是30秒。 (2)定位精度,尤其是城市定位服务 定位精度方面,PathSense声称其在高楼林立的大城市里依然能够达到98%,比如纽约、旧金山和香港,而谷歌只能达到23%,苹果则是73%。 这个数据来源于他们基于多源数据优化的定位方案,即使用移动设备内置的诸如陀螺仪、加速计、磁力计和其他种类传感器,同时还结合路径预判的算法进行位置追踪。由于只在软件激活的一瞬间进行GPS定位,而不是持续使用,他们能将电池能耗降至很低的水平,而精度却往往更高。

  3.耗电量:如上面所介绍的,由于并非持续跟踪GPS信号,PathSense的耗电量仅为谷歌的40%。 能够看得出,PathSense的产品定位是对标谷歌和苹果的,但他们并不是想与巨头的服务保持一致,而是发挥小身材团队的巧劲儿,更专注于性能、精准度和电池效率的提升。 3.GraphSQL网站:http://www.graphsql.com/company/

  GraphSQL的核心技术,是从散乱、复杂的数据中找到其所存在的内在关系,并最终以关系网络图表的方式呈现。

  这种数据挖掘与可视化的手段,让希望从海量数据中洞察关联,进而了解业务驱动因素的企业,提高他们的分析水平和效率。具体来说,GraphSQL适用于社交、兴趣推荐服务场景的大数据挖掘,有关时间、位置、行为、人际关系等由用户产生的数据,都可以借由GraphSQL挖掘有用的信息。

  GraphSQL创立于2012年,团队成员则来自Google、Teradata、IBM、SAP、Twiiter,还有大数据挖掘分析领域的各种学术界的专家。2013年企业获得了255万美元的种子投资,最新一笔未透露金额的融资发生在2016年2月。早在3年前,GraphSQL联合创始人靳若明就指出,图(Graph)数据挖掘于分析是一个重要的课题,其应用前景将十分可观。

  4.Treasure Data:对接众多大客户的商业智能工具网站:https://www.treasuredata.com/ Treasure Data提供的,是端到端、全面管理的大数据云服务,这样的模式是可靠而极简的。这家成立于2011年的创业公司,从一开始,就将产品和服务定义为覆盖数据采集、存储,以及分析的完整化平台服务,其收集多源数据,分门别类存储,并提炼数据的意义,以供商业决策。 不同于传统的云平台数据服务,Treasure Data的特点是革新了大数据分析的交付模式和技术,系统中的各个部分均是可定制化的。这意味着用户在将数据提交到另一个系统之前,不仅能看到数据并且可以进行分析,进而确保只发送那些相关性的数据。 自2011年成立之初,Treasure Data就获得280万美元的种子融资,而后财路平顺,至今累计获得7轮近5000万美元的融资总额。13年,Treasure Data创始人兼CEO Yoshikawa曾表示,Treasure Data其实并不需要筹集资金,当时他们已经拥有超80个客户,每天对7000亿行数据执行大约20万次的数据查询。典型的客户包括丰田、Facebook、雅虎和无印良品等。

  5.Dataiku网站:http://www.dataiku.com/solutions/

  Dataiku是一家致力于把堆积于企业的各类原始数据利用起来,并将其进行价值转化的商业智能服务公司。现阶段,Dataiku面向医疗健康、生物医药、零售与电商、金融与保险、公共事业、交通运输等领域提供不同种类的大数据挖掘与分析服务,例如历史数据的分析,数据管理,需求预测,客户分析等。与此同时,Dataiku还向特别针对具有地理空间属性的数据,提供空间大数据分析服务。

  Dataiku认为,尽管空间商业智能分析有着近百年的历史,但运用现代化的空间算法手段还是一个相对较新颖的领域,因而在现有的大数据服务当中,空间化的分析手段是非常重要的组成部分。

  创立于2013年2月的Dataiku公司,于2015年1月完成320万元A轮融资。在Dataiku团队看来,严肃的企业决策背后,是对更充满趣味性的数据挖掘与分析的探讨。

  6. Sisense

  网站:http://www.sisense.com/

  Sisense同样是一家将复杂的原始数据精益化,并通过图表、空间化数据表达等方式,为用户提供可视化分析服务的创业公司。Sisense的分析工具能嵌入到用户自己的软件中,挖掘业务分析所需要的数据,并做以展现。目前,Sisense的业务覆盖金融、政务、健康、零售、旅游等领域,已服务近50个国家和地区。 Sisense的历史可以追溯到2000年,其创办的初衷是希望让数据分析更简单流畅。在低调的技术沉淀过程中,Sisense有了自己的大数据分析与可视化引擎,并成功于2010年走向市场化,在纽约正式创办了商业公司。Sisense最近的一笔5000万美元D轮融资发生在2016年1月,公司建立至今,已累计筹得近1亿美元融资。 数据智能“四境界”——感知,识别,认知,预测 智能化,这是今天聊得最多的一个词。TalkingData CEO崔晓波在会上发表的演讲中,提到了基于数据的人工智能认识世界的“四境界”,他们分别是——感知,识别,认知,预测。 在崔晓波看来,感知、识别、认知、预测,将是大数据分析挖掘人工智能化的四个主要标志。接下来,企业产生的商业价值,以及人从大数据中挖掘中汲取的智慧,将与人工智能技术的发展,成正相关关系。

  感知,来自丰富移动设备所配备的各类传感器,这些传感器收集个体本身以及周边环境的信息,形成这种智能化的初级能力。数据显示,平均一部手机,就包含有13~16款内置传感器。识别,是在多品类的数据基础上所做的分类。今天,语音识别、图像识别,乃至个体姿态的识别,都在大规模发展。认知,无人驾驶汽车对复杂路况的判断、人工智能诊断病情,都属于认知的过程,但目前还处于一个早期阶段。而预测,还离我们有很远的距离。

  人们利用几十年的时间,让机器学习和标记,这使我们今天对各种各样的物体进行识别和理解。在崔晓波看来,不论人工智能未来到底有多聪明,一切都是源于数据的力量。

作者:杨璐

来源:IT168

原文链接:聚合大数据分析和应用玩家 他们搞啥?

时间: 2017-09-01

聚合大数据分析和应用玩家 他们搞啥?的相关文章

Cloudera:智能大数据分析搞定各种复杂应用

在云上,最常见的有两种工作状态,一种是上移和转移,就是把以前的工作负载从私有的平台转到云上:另外一种是Cloudera在云上生态的工作负载,在这上面有很多客户大规模的部署.Cloudera在云平台.软件及硬件方面都有很好的生态圈.Cloudera云计算工程副总裁Vikram Makhija在接受本站记者采访时这样表示. Cloudera用技术解放用户 Cloudera在Hadoop和Spark上居于领先地位,其一直专注于开源软件的商业化应用.谈到优势,Vikram Makhija认为:云提供商自

大数据分析平台产品对比之MaxCompute(原ODPS)篇

之前尝试使用过一些国内外的云产品,特别是大数据分析型产品,例如:亚马逊的EMR.Redshift,Google的Bigquery以及阿里云的ODPS,现在更名为MaxCompute,https://www.aliyun.com/product/odps.相信大多数人对亚马逊的EMR.Redshift,Google的Bigquery都比较了解.但在尝试使用ODPS后,­­ODPS感觉也是一款不错的大数据分析产品.本文主要为大家介绍关于ODPS的使用体验,同时也会与Redshift及Bigquery

《Spark大数据分析:核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问"华章计算机"公众号查看. 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都与大数据

《Spark大数据分析:核心概念、技术及实践》Scala编程

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第2节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问"华章计算机"公众号查看. Scala编程 Scala是当前热门的现代编程语言之一.它是编程语言界的凯迪拉克.它是一门强大且优美的语言.学会了它,对你的职业生涯大有裨益. 用不同的编程语言都可以编写大数据应用程序,比如Java.Python.C++.Scala等.Hadoop本身就是用Java编写的.尽管大多数的

大数据分析需要什么样的基础技能?高等数学?

问题描述 大数据分析需要什么样的基础技能?高等数学? 今天有个朋友说他手上有某大公司的数据分析职位,(我之前在游戏公司做过数据分析),所以他向我推荐这个职位,我感觉不可上手,跟我之前做的数据分析感觉根本就是两回事因为我之前搞的也就是做一些数据报表和曲线图,他介绍的偏向于大数据挖掘,可能要懂很多算法,所以..这就是这个问题所在了,我想问一下有经验的大牛们,数据分析,数据挖掘是不是需要高数基础知识,我上学时高数学得不怎么好,也忘得差不多. 解决方案 主要是概率论和数理统计,然后是人工智能和数据挖掘.

大数据分析结果告诉你:如何打造“爆款”文章?

社交媒体追踪服务分析工具BuzzSumo,2014年5月前后对社交媒体上超过1亿篇文章进行了分析,试图找出一个答案: 什么样的内容才能让用户乐于分享,获得病毒式传播? 这个大问题又内含或细分为一些小问题: ◆那些获得疯转的文章,激起了用户哪种情绪? ◆清单?图表?哪类文章更有可能被用户分享? ◆读者更喜欢分享短文章还是长文章?社交媒体上的文章,最理想的长度是怎样的? ◆"信任"是不是驱动用户分享文章的一个主要因素? ◆文章有没有附上一张图片,会对分享转发带来哪些影响? ◆有大V分享你的

《Spark大数据分析:核心概念、技术及实践》Spark Core

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问"华章计算机"公众号查看. Spark Core Spark是大数据领域最活跃的开源项目,甚至比Hadoop还要热门.如第1章所述,它被认为是Hadoop的继任者.Spark的使用率大幅增长.很多组织正在用Spark取代Hadoop. 从概念上看,Spark类似于Hadoop,它们都用于处理大数据.它们都能用商用硬

《Spark大数据分析:核心概念、技术及实践》一3.9 共享变量

 本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第3章,第3.9节,作者[美] 穆罕默德·古勒(Mohammed Guller),更多章节内容可以访问"华章计算机"公众号查看. 3.9 共享变量 Spark使用的架构是无共享的.数据分布在集群的各个节点上,每个节点都有自己的CPU.内存和存储资源.没有全局的内存空间用于任务间共享.驱动程序和任务之间通过消息共享数据. 举例来说,如果一个RDD操作的函数参数是驱动程序中变量的引用,Spark会将这

颠覆大数据分析之Storm简介

颠覆大数据分析之Storm简介 译者:吴京润    购书 之前我们已经极为简单的介绍了Storm.现在我们要对它做一个更详细的了解.Storm是一个复杂事件处理引擎(CEP),最初由Twitter实现.在实时计算与分析领域,Storm正在得到日益广泛的应用.Storm可以辅助基本的流式处理,例如聚合数据流,以及基于数据流的机器学习(译者注:原文是ML,根据上下文判断,此处应是指机器学习,下文相同不再缀述).通常情况,数据分析(译者注:原文为prestorage analytics,意义应是保存分