云存储听上去是如此简单。你只需为你所使用的支付费用,并且在任何时候,都很容易判断你使用的存储量。然而,经验丰富的IT专业人员都清楚,实施一项新技术或方法很少会如此简单。
当你部署云存储资源时,你需要制定优化存储使用的政策和程序。例如,对存储对象进行元数据标签,是很重要的,因为这将有助于实施细粒度的管理,和版本控制政策,以及降低存储成本。同时,考虑访问控制和其他安全措施对云中存储数据的影响。你应该建立管理方案,充分利用云供应商提供的工具,以及来自第三方的资源管理器,如CloudCheckr和Cloudyn。
元数据抑制浪费
云存储使一个企业能够保存越来越大量的数据,而不会产生过多的成本。然而,这可能会导致关注边际成本的思维模式,然后使用更多的存储空间。当添加存储的成本只有每十亿字节几美分时,很容易忽略存储最优化。当应对相对较小的数据集时,这很可能是一个可行的战略,但是对于大规模的存储需求,却不是。
一个更有效的计划是相对于已经存储的数据,哪些新数据应该被存储。问问自己:一个包含客户数据的分析单位,真的需要保留副本吗?这可能取决于分析单位的类型。从存储管理的角度来看,这是一种低效并且昂贵的方法。
分析师的情况则不同,他们需要了解所使用数据集的属性。他们需要事实,比如数据集的创建日期、最初的数据源和相关转换,和属性的描述,包括创建派生值的公式。与其期望由其他分析团体创建的数据恰好是他们所需要的,分析师更倾向于创建并保存自己的数据集。
元数据——与存储数据区块相关联的标签,可以在减少数据存储过剩中起到作用。 基本属性,比如数据创建日期,数据的所有者和使用数据的申请,都是潜在的元数据标签。属性公式的描述,转换描述可以在单独的文档内记载;使用标签将其链接到更具体的文档。
你可以在存储战略中包含元数据管理,促进数据重用。这有助于降低整体存储成本,或许更重要的是,它促进了共享数据的使用。这也降低了在常用方案中,使用多个版本的公式和源数据的风险。
访问控制和安全问题
精心设计的元数据可以促进数据重用,但有时这不合适。例如,机密和隐私数据,很显然,需要一个限制访问的政策。关系数据库提供了控制数据访问的大量工具, 包括细粒度,行级访问控制。控制访问的方法部分取决于数据存储在云的方式。
当数据存储在云的关系数据库中,你和本地拥有相同的访问控制选项。当你切换到一个不同模式的存储时,比如基于云的服务,类似AWS DynamoDB或SimpleDB,你需要使用这些系统内的可用访问控制机制。
当使用区块存储时,你可能需要适应粗粒度访问控制,如在文件层允许或拒绝访问。这些控制可能需要用特定方式复制或整理数据,使只有合法需求的人才能访问机密和隐私数据。
帮助管理云存储的工具
在你制定云存储战略时,评估可以协助整体管理的工具。云供应商通常提供帮助监测云存储的工具,其中一些可以在超越存储值时,向你发送警报。在其他情况下,第三方工具,比如Cloudyn或CloudCheckr,可以用来收集和分析存储数据,帮助你更好地预测存储趋势和未来需求。
将存储迁移到云,不会自动节省存储成本。主动的管理和明确的政策和程序,才能帮助你最大化在任何云存储部署上的投资回报。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
Dan Sullivan是一名作家、系统架构师和顾问,拥有超过20年关于先进的分析、系统架构、数据库设计、企业安全、商业智能的IT从业经验。他的从业范围广泛,包括金融服务业、制造业、医药、软件开发、政府、零售、天然气和石油生产、发电、生命科学和教育。
相关推荐
-
混合云优先策略解决公共云、内部部署难题
现在,多云IT环境已经成为常态。根据笔者所在公司Enterprise Strategy Group的研究表明, […]
-
存储基础知识:三大公共云中的对象存储
大部分公共云存储是基于对象存储。块和文件在数据中心占主导地位,但在云端,对象存储才是王道,因为云端需要大量相对 […]
-
混合云是云存储的重要里程碑
预计到2025年,全球存储到数据量将达到163ZB(泽字节)。尽管云计算发展迅速,但目前只有一小部分数据存储在 […]
-
应对数据大爆炸:阿里云发布新一代云存储引擎2.0
2018年1月9日,阿里云宣布推出全新一代块存储、极速型OSS、NAS Plus等高性能企业级存储产品家族,并对分布式存储引擎进行全面升级,性能比过去提升了最多50倍,给用户带来了从高速到高铁的体验。