一、费用构成总览
目前根据账单项目可以看到EMR费用由以下部分构成
- 实例费用(Spot、SP、On demand)
- EMR管理费
- EBS卷
- 跨区流量费(InterAZ Transfer)
其中
EC2-Instance-Spot:EMR竞价实例,费用最低,但是存在被强制回收和资源池不足而拉起时间很长的现象
EC2-Instance-Ondemand:EMR按需实例,费用最高,不会被强制回收,拉起速度也较快
EC2-Instance-SP:通过购买Saving Plan优惠政策覆盖的Ondemand实例
SP具体介绍参考下面的文档
Savings Plans – Amazon Web Services
SP的基本原理类似于直接购买一定的机器的使用量以获得优惠价,优惠价高于竞价而低于按需。SP是公司层面的优惠,而SP所适配的机型是采取折扣低的机器优先适配的原则,因此其适配是动态的,不受人为控制。
若其他部门出现使用【SP折扣后价格更低的按需的机型】的使用量增加的情况,那么SP的优惠价也会自动调整到其他部门去。
二、实例费用与EMR机器管理费
按需实例费用可以参考官网
大数据处理和数据分析 - Amazon EMR 定价 - Amazon Web Services
其中左侧为按需(on demand)时的费用
右侧是EMR集群拉起机器时所需额外支出的机器管理费
※价格会变动
而竞价(on spot)时的费用参考官网
Amazon EC2竞价型实例价格_EC2虚拟云服务器托管 - AWS云服务
※价格会变动
此外还可以直接在EMR页面中查看到具体费用
※价格会变动
三、EBS卷
EBS卷费用参照官网
高性能数据块存储 – Amazon EBS 定价 – Amazon Web Services
- 各个区域单价不同
- 按月计费,即根据月的天数不同而日单价不同,例如2月日费用则比1月高10%,因为2月有28天而1月有31天,相差近10%。
四、跨区流量费
跨区流量费具体参考以下地址
Amazon EC2实例价格_EC2虚拟云服务器托管价格 - AWS云服务
文章来源:https://www.toymoban.com/news/detail-816357.html
为了减少跨区流量费,最好的是作业运行中使用EMR集群本身的HDFS服务来对数据进行缓存,这样就能减少数据的写入写出和减少费用。文章来源地址https://www.toymoban.com/news/detail-816357.html
到了这里,关于AWS EMR集群的费用构成的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!