机器学习应用增加AWS热度

日期: 2016-05-09 作者:Alan R. Earls翻译:滕晓龙 来源:TechTarget中国 英文

机器学习建模曾经是一项较为复杂的任务,一般只有优秀的数学家才能胜任。但是AWS和其他几家公司正试图让企业也能使用这项技术。

亚马逊机器学习是一个提供可视化工具和应用向导的AWS云服务,它能够帮助开发人员为机器学习用例进行建模。至此,使用简单API通过应序进行预测就变成了一件相对简单的事情了。亚马逊和它的一些竞争对手正在这一原本需要特殊编程和数学技能的挑战性领域进行比赛,以便让几乎任何人都可以使用这项技术。

“信息分析是每一家企业在2016年都计划要做的事,”一家总部位于纽约市的AWS托管服务合作伙伴企业Logicworks公司的高级副总裁兼CTO Jason McKay说。“亚马逊机器学习是AWS将原本复杂、昂贵、通常也是缓慢的应用通过使用他们自己团队开发的工具变成更易于和便于使用的服务产品的又一例证。”

这些服务所采用的算法都是亚马逊公司数据科学家和亚马逊电子商务业务长期以来一直在内部使用的,一家总部位于加州Santa Monica的AWS咨询合作伙伴CorpInfo公司的云解决方案架构师Laith Al-Saadoon解释说。这些算法每天都支持着数十亿美元的实时和批量操作预测业务。

这项服务采用了一种所用即所付的付费方式,因此也就没有前期许可或使用承诺之类的限制。用户可以根据实际资源请求来支付费用,从而避免必须做出硬件或软件的承诺,Saadoon指出。根据他的估计,学习曲线变化应当是较为平缓的。只要管理员或数据分析师理解AWS的生态系统——例如Kinesis、Redshift和关系型数据库服务——学习曲线就很少会出现比较陡峭的情况。IT团队可以通过使用亚马逊机器学习加快探索和试验的步伐,从而缩短产品上市时间,他补充说。

机器学习用例与竞争

机器学习——特别是亚马逊机器学习,比传统分析方法更迈进了一步,因为它更侧重于预测和潜在指令性结果。亚马逊机器学习并不如其他的一些机器学习选项那样成熟。例如,训练数据集的容量被限制在100GB以下,而实际批量预测数据集则被限制在1TB以下。

当然,也有很多替代选择。也许最有名的是IBM公司的Watson Analytics,它通过一个简单的“对话”界面提供了数据可视化和预测分析功能。微软公司的Azure机器学习工作室提供了可适应多种机器学习用例的现成示例库。无论如何, Saadoon都对亚马逊的这款产品情有独钟并表示,该产品的使用仅受到用户想象力的限制。

例如,大多数机构都希望更好地理解客户在他们网站上的各种用户行为,从而优化用户的访问体验或吸引用户的关注。机器学习和预测分析可以使用简单存储服务(S3)或Redshift来分析点击流数据,并对如用户更愿意点击哪里这样的问题进行针对性的分析。根据这些概率数据,管理员或数据分析师就可以把这些点击推向一个优选的最终状态,例如指向收银台。

亚马逊机器学习还可用于推荐引擎应用。“很多垂直行业都可从中受益,例如有个APP可向客户推荐可访问哪家餐厅,”Saadoon说。在这个例子中,用户可以输入她的年龄、性别和位置等信息,然后机器学习服务就可以将其数据与类似人群进行比较,从那些个体和类似数据中提取适合该类人群的业务。这一过程可以被广泛用于客户决策。

挪威的一位博主Arne Sund在他的博文中写了许多亚马逊机器学习有趣用例中的一个,将该服务应用于天气预测——或者至少预测某个城市的当地温度。他指出,Oslo的天气模式通常来自于西方,他的训练数据集中囊括了来自于诸如Stavanger和Bergen等城市的观察结果。在使用历史数据进行机器学习之后,Sund发现这项服务能够根据新数据来分析产生一个对所在城市温度大致精确的预测。

“使用亚马逊机器学习服务并使用真实生活数据来对其进行测试是非常有趣一件事,”Sund在一篇博文中写道。

小小的应用障碍

现在,用于分析的数据需要驻留在AWS资源中,Saadoon指出,“这是亚马逊机器学习所面临的一个挑战;它只能与S3相连进行对象存储,使用Redshift作文数据仓库以及提供传统SQL关系型数据库功能的关系型数据库服务。”

但是,更愿意使用其他数据源的数据分析师可以使用亚马逊弹性MapReduce和一个开源机器学习系统(例如Apache Spark)。“你可以使用这一组合连接到几乎所有的Hadoop数据源,”他说。

建立亚马逊机器学习是非常简单的,Saadoon说。对于最终用户来说,他们甚至能够使用API进行自然语言查询。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Alan R. Earls
Alan R. Earls

TechTarget资深作者

相关推荐

  • 多日志文件数据帮你追踪用户

    管理数量不断增加的服务器、应用和用户,需要使用数十个不兼容的日志文件。亚利桑那州立大学开始使用Splunk,在混杂有业务中创建统一的、相互关联的数据视图。

  • 逐条讲解:谷歌云机器学习服务

    你是否还到找寻将机器学习注入到云应用中的方法?利用本文列举的术语来探索谷歌云服务在语音到文本,图像分析等方面所 […]

  • 云机器学习仍然悬而未决

    谷歌公司的母公司Alphabet的主席Eric Schmidt在一年前召开的首届谷歌云大会上曾预测说,机器学习将在五年内成为每一家主流IPO的基本功能。

  • 评估公共云中机器学习服务

    自从科幻电影中出现了不停闪烁和嘟嘟响的电脑之后,机器学习就被视为计算的未来。今天,未来就在这里,因为机器学习——特别是在云上,变得越来越实用,对企业IT来说也越来越实惠。