随着云计算技术、物联网技术的兴起,企业需要应对的数据规模越来越大、数据格式越来越复杂、数据收集速度越来越快,也使得它和传统意义的业务数据相比,有了明显的特点。今天企业对大数据分析的意义也有了新的理解。
“应对这些特点,计算机界、科技界也需要与时俱进,在技术上做一些创新和变革,使得这些数据能够成为企业真正的数据资产。我们经常也会做一些数据分析,着眼于对已经发生的事情的一些归纳、总结。现在我们探讨大数据,人们更关心数据如何创造一个未来。对于我们讲的数据的部分,不仅仅是关注过去,还关注于对未来的价值创造,这是大数据的一个新的使命,”甲骨文中国区技术总经理兼大数据和商务分析业务总经理高礼强如此说。
面对企业对大数据处理的新要求,以及大数据的新的使命,甲骨文对数据的收集、管理、分析,最后形成价值,有着自己的理解。
从数据到智慧:大数据分析的四个层次
甲骨文认为,从原始的数据到如何形成为企业的数据资本、数据的智慧,从技术处理上要经过四个环节:
第一、数据的形成。现今企业面临的数据源非常繁杂,也非常多,也传统的数据来源相比,有了革命性的变化。如何采集内、外应用系统的,以及外部合作伙伴的数据,使这些不同形态的数据最终形成一个可管理,放置在数据湖中——这样的数据的收集、获取、整理的过程,正式数据形成的过程。
第二、数据到信息。数据形成后,在数据湖中的类型是多种多样的,有关系型数据的、有非关系型数据的,即有表格形式——有行有列的,是很工整的高价值的数据,也图片、视频的形态不一的数据,如何把这些数据有序地管理起来,是数据到信息的过程。
第三、信息到知识。所有信息汇总以后,要经过数据探索的过程。因为如果数据只的累积起来,而不积极探索它、利用它、分析它,这些数据仍然只是沉睡的金矿。这个探索的过程是从信息到知识的概念。
第四、知识到智慧。探索出来的结果,我们要把它使用起来,引领企业的业务流程的改进,新业务的产生,把这些东西形成新的价值,这是大数据运用的一个更高的阶段——从知识到智慧。
基于以上四个层面,甲骨文看到企业需要这样一个大数据平台——它的能力要非常完整。正如甲骨文亚太地区大数据和分析专家团队总监Barba Jan-Haleem所说,“从甲骨文的角度,包括很多越来越多的客户的角度来看,他们会认为大数据不单单是包括非结构化数据,同一时间还会包括结构化数据,所以大数据应该是所有数据的一个全集。同一时间,针对所有数据来说,甲骨文希望给到他们的不单单是甲骨文接近40年的管理数据的经验,同时希望把结构化和非结构化数据整合在一起,让它发挥更大的价值,产生真正的数据,为客户提供业务创新的价值点。 ”
甲骨文大数据管理平台
甲骨文大数据管理平台建立了一种数据湖。这一大数据湖具备了处理不同数据的这样一种能力,形象地讲,就是不同技术的组合,它包含有传统的关系型数据库的技术,有以Hadoop为代表的新的分布式计,还有一些特殊的高并发处理能力的像NoSQL的数据库能力。这样的一个多种技术组合平台,让企业具备了处理全数据的能力。
由上图的参考架构中,我们可以看出大数据的管理是甲骨文在大数据解决方案的核心部分。在这一部分数据水库能够把全数据管理起来,可以基于甲骨文技术,可以基于甲骨文与其合作伙伴的技术,如Cloudera,更可以基于企业自己搭建Hadoop平台。甲骨文可以提供技术力量,把企业的软硬件、网络、Hadoop和不同的技术进行衔接。
另外,在数据的探索中,如何把数据变成有用的信息和知识。甲骨文大数据平台提供了多种直观、可视化的工具,有基于甲骨文收购的Endeca平台之上的Hadoop版本——Hadoop可视化探索平台,它使企业大数据探索过程简化为五步,即连接企业的大数据数据源、可视化展示大数据湖全景、数据的转换和整理过程、探索数据中的规律,相关性、发布和分享探索结果。还有Big Data Discovery大数据发现工具,其机制在业内还没有完全一致的。
甲骨文大数据平台设计三要素
事实上,在从概念到具体落实到大数据处理方案的设计、执行以及开发时,甲骨文始终遵循着三个关键点:
数据的平等性:这个平等是指甲骨文希望给客户的方案能够平等地处理各种类型的数据:结构化、非结构化、半结构化,无论这些数据是来自于数据库、传感器数据还是网络日志,还是用户的点击流。
数据的流动性:甲骨文希望客户的数据能像钱在所有的银行和客户之间一样流动起来,在商业活动中流动起来。甲骨文希望帮助客户把数据也流动起来产生价值。
数据的安全性:这一安全包括客户把数据放在甲骨文的云端、工程一体机,以及放在客户自己的硬件里面,甲骨文都希望帮客户把这个数据安全性做到最好。
这一大数据端到端的方案,除了包括数据的采集、管理、分析,甲骨文还引入了第三个功能——数据实验室。数据的采集是帮助各位获得它需要的数据,包括传感器数据、网络数据或者是机器数据、业务系统数据;数据管理是管理各种类型的数据,帮企业更好地把数据管理、存储起来;分析部分就是通过数据来改变工作场所和劳动力。那么,分析步骤之前,甲骨文为什么引入了这个数据实验?
数据实验:作用几何?
数据实验室有几点:第一是针对原始数据:第二帮助用户探索原始数据中的价值,发现原始数据中的价值后,可以把这些数据放到以前的数据仓库、数据集市里面做商务智能数据可视化或者是分析的过程。 数据实验室有点像指南针,能够以最快的时间、最小的投入来告诉你业务的方向对不对。数据分析和数据仓库、数据集市就如果GPS,它会把明确的路径显示出来告诉我们从A到B,有多远的距离——但这一方法准备前期工作的时间会比较长,如建模、数据整理等,在数据实验室中这是不需要发生的,数据实验室可以直接对原始数据进行实验。创新数据实验可以帮助企业通过类似于高级分析、机器学习或者是更新的大数据技术来实现数据的价值,然后把这些数据的价值用到人们的日常工作中——不仅只是提供可视化,还保留整个过程的自动化。
实际上,为实现这一功能,甲骨文提供了大量的组件,用户还可以根据具体的业务需求,去裁剪此大数据解决方案,来适应其直接需求。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
评估公共IaaS方案的关键特性
为了评估有前景的IaaS提供商,需要研究他们的实例类型范围,以及他们对新兴技术,数据库选项等等的支持。
-
移动互联网:企业如何在大数据的野蛮生长中掘金?
随着全球移动设备、可穿戴设备等智能设备的不断增多,我们看到大数据的数量也不断增长,而且是爆发式的增长。IDC的一份报告预测,到2020年,大数据和业务分析市场将增长至203亿美元,是2015年1120亿美元的两倍。
-
2017年数字经济新时代:除去云计算,还需要什么
据LinkedIn最近的调查结果显示,最受欢迎的职业技能都与数字技术有关,可见日益普及的数字技术将引领未来。目前,用户界面设计已成为最受欢迎的移动应用技能之一。
-
CSA云大数据战略:100个安全实践
最近,云安全联盟(Cloud Security Alliance)发表了名为“大数据安全和隐私手册”的指南,涵盖了当前企业构建基于云的大数据战略相关的一百个安全相关的最佳实践。