数据挖掘:巧用Hadoop大数据处理功能

日期: 2013-06-24 翻译:蒋红冰 来源:TechTarget中国 英文

Hadoop的大数据处理功能可用来挖掘数据、探索看起来没有关联的信息之间的关系、以及快速解决软件工程师使用传统技术正在努力解决的问题挖,对Hadoop的大数据处理功能如此之多的用途软件专业人士从来就没有感到奇怪过。

  住院的病人是否正在饱受着葡萄球菌感染的痛苦?当谈论到使用多种NoSQL和Hadoop的方法解决真实世界问题时,全球教育Hortonworks的高级主管Danielle Tomlinson,谈论了一个很有意思的案例,此案例中,通过在健康保健专业人员的徽章中使用射频识别技术,收集了关于他们卫生习惯的一些数据。“他们把一个传感器放在洗手槽中,” Tomlinson说。“他们能够看哪些医生没有在洗手站上花费足够的时间,导致疾病的传播。” 

数据挖掘:巧用Hadoop大数据处理功能 

实时解决大数据问题

  当然,Hadoop最好的一方面是它的实时处理巨大量数据的能力。一个久居数据中心深处的开发人员是如何了解高速公路上的交通如何的?据Tomlinson所说,有些城市只是追踪数百万手机用户上的GPS位置,分析那些数据,然后基于那手机在交通中的走向如何,来建立实时流量报告。那些大数的收集及大数据处理,都是在Hadoop平台完成的。

  当然,对于大多数企业Java专业人士,大数据仍然是个迷,但Hortonworks决定改变这一现象。对于那些对学习Hadoop的人来说,Hortonworks Sandbox是一个聪明的开始,因为它提供了一个个人的、便携的Hadoop环境,还有一系列交互式的Hadoop指导。所有这些都打包在一个虚拟环境中,你可以在15分钟之内得到它并运行它。

  对于那些正在寻找解决大数据问题方法的软件架构师,或者对于那些正在复习新技术的应用开发人员来说,Hortonworks Sandbox是一个很好的开始。但要注意:Hadoop会上瘾。很快,所有的问题都看起来像大数据问题,然后你就会想要使用Hadoop来解决每一个大数据处理问题。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

蒋红冰
蒋红冰

TechTarget云计算主编,主要负责云计算和虚拟化网站的内容建设。长期专注于IT前沿技术,对云计算、虚拟化、人工智能、区块链等技术都有了解;对行业趋势、市场动态有一定的洞察。

相关推荐