本篇文章2831字,读完约7分钟
应用程序可以处理大数据,但它们无法实现任何形式的预测或预测分析。
到目前为止,我们的数据管理能力日益提高,但是我们的数据分析能力却相对落后。虽然工具和过程是可用的,但科学家的数据仍然不足。在今天的文章中,我们将重点关注能够提供实用分析结论的大数据应用,并跟踪其发展和现状,从而窥探大数据技术的未来发展方向。
大数据技术的早期采用者指出了有趣的跨行业发展的可能性
根据《福布斯》杂志2012年发表的一篇文章,大数据技术的早期采用者主要来自金融服务、电信、制造业(尤其是消费品)和政府。
早期采用者将使用他们新安装的大数据基础设施(如hdfs、mapreduce和nosql数据库等)。)在初始阶段尝试各种新的应用。根据pacific crest收集的数据,早期采用者通常希望使用这些方案来处理数据中心日志信息(包括服务器、路由器和各种IoT传感器等)。)以实现网络分析和it系统性能监控。在此基础上,相当多的企业尝试使用大数据技术来分析财务数据(欺诈检测)和web数据(情感分析以实现个性化体验)。
表1大数据应用的早期实验方向
用例
早期采用率网络分析29%it系统日志分析28%传感器数据分析19%网络行为数据分析16%
基因组数据分析
9%社交媒体情绪分析6%欺诈检测6%
初步实验对于理解大数据基础架构的优势、潜力和缺点非常重要。然而,根据凯捷2014年发布的报告,水实验的成功率并不高。失败的主要原因有三个:1)数据分散在许多不同的团队中,因此比原始设计更难访问。2)数据放在遗留系统中,这使得将数据导出到大数据基础架构非常困难。3)缺乏统一清晰的全球数据管理和数据分析方案,员工难以从数据中提取信息。随着这些问题的克服,我们最近发现成功的案例越来越普遍。事实上,全世界对大数据基础架构及其附加解决方案的兴趣正在迅速增长(见图1)。
图1各行业和地区的大数据输入数据。
企业客户的持续投资给初创企业带来了相当大的风险资本支持热情
企业对大数据技术的投资正在增加。根据newvantage的调查,27%的受访公司表示,他们将在2017年前在大数据项目上投资超过5000万美元。2014年,在同一企业的调查中,这一比例仅为5.4%。
目前,包括医疗保健、保险、农业、能源、医药、教育、汽车、运输和物流在内的数万亿美元的行业正在积极探索如何使用大数据工具来解决他们面临的实际问题。例如,汽车制造商希望分析消费者的信息娱乐选择,以提供更好的车载信息娱乐体验,还需要分析车辆性能数据,以提供预防性维护建议。此外,无线运营商还想知道消费者如何使用他们的数据来更好地提供内容和实现收入。
考虑到上述企业投资和转型努力,风险投资家在为大数据初创企业提供资金方面更加活跃,如图3所示。仅在2015年,风投为大数据初创企业提供的资金总额就达到了67亿美元,超过了2014年的60亿美元。
图2截至2016年2月的大数据应用总体情况图
出于同样的原因,大数据初创企业正开始迎来一波收购浪潮。其中包括美国在线收购convertro、谷歌收购adometry、苹果收购topsy、teradata收购aster data和think big analytics、salesforce收购edgespring等等。最近,我们还见证了微软收购revolution analytics,hds收购pentaho,advance收购1010data。此外,小规模收购也在兴起,包括亚马逊对amiato的收购。
如图2所示,风险投资的主要焦点是大数据基础设施和工具。尽管基础设施和工具部署也显示出强大的生命力,但让我们在这里关注大数据应用。
大数据应用的兴起
信息技术的每个新兴领域(如商业智能、客户机/服务器计算、云计算和移动计算等)。)通常需要经历三个发展阶段:
基础设施部署。在大数据领域,这种基础架构负责存储、管理、移动和传输数据。
工具部署。在大数据领域,此类工具用于搜索和分析各种形式的大数据,并呈现处理结果。
应用程序介绍通常将基础设施和工具转化为实用功能。
在这一分阶段实施之后,许多大型企业开始部署大数据基础架构和各种工具,旨在分析收集到的海量数据。
因为我们已经进入了应用程序开发和部署阶段,所以最重要的是关注特定的软件。迄今为止,我们发现了三种主要类型的大数据应用:
浅层应用,包括执行客户流失分析和围绕通用分析工具(如dataminr和datarobot等)进行开发。)。这些应用程序由数据科学家支持,以便执行严格定义的任务流。这些应用程序通常只在操作基础上提供肤浅的分析能力。这些由分析模型和报告机制驱动的应用程序是由数据科学家和服务专家开发和维护的,他们通常来自管理咨询企业,完全了解相关的业务领域和最终用户需求。最终用户通常是业务分析师。
该应用程序可以处理大数据,但它不能实现任何形式的预测或预测分析(如socrata和zuora)。这种应用程序可能面向横向或纵向系统,这可以为最终用户(主要是业务分析师)提供理解数据和形成结论报告的能力。举个例子,纽约使用索克拉塔系统来创建财务报告。
嵌入式预测分析的应用。这些应用程序在未来将分为以下两类。
1.包括由数据科学家定期开发和更新的预测模型。这意味着应用程序提供商必须具备强大的服务能力来支持软件功能。这类应用的例子包括在线广告应用,如agileone、opower、zephyr health、duetto、dataxu和mediamath。
2.所使用的预测模型可以由应用程序本身自动构建。这类应用程序供应商包括oration和namogoo。
属于这一类别的应用程序可以横向(如agileone和namogoo)或纵向(如opower、duetto或ration)。
这三种类型的大数据应用可以被视为应用领域的先驱,现在又出现了第四种基于它们的颇有见地的应用。前面提到的第三个应用程序是最接近基于意见的应用程序,但是它们之间有重要的区别:它可以进行预测,但不能形成意见。换句话说,第三应用不能根据预测结果执行相应的操作。相反,他们依靠用户来识别特定的预测结果并执行相应的行为。
摘要
尽管仍然存在许多障碍(每项新兴技术在出现后都必须面对挑战),但大数据的早期采用者已经积极投资相关项目,并将它们部署到企业业务系统中,以解决各种关键问题。为了实现大数据的跨行业处理潜力,所有风险资本家都在积极为大数据初创企业提供帮助,希望他们的解决方案能够被大企业客户所采用。
考虑到大量大数据基础设施和部署分析工具的出现,大多数企业开始将注意力转向大数据应用。我们确定的三种特定类型涵盖了一个接一个出现的各种新的大数据应用。他们中的一些人可以提供预测结论,但他们不能实现观点和实际行动,这也是大数据应用尚未完全开发和成熟的主要标志。在未来的文章中,我们将深入讨论有洞察力的应用,即第四类和最有前途的大数据应用类型。