本篇文章给大家分享的是有关如何进行Dell EMC PowerMax细节解读,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
作为一个叫“高端存储知识”的公众号,如果不解读一下Dell EMC最新发布的PowerMax,肯定是不称职的。虽然网上已经很多帖子了,但是,很大网友还是想看看西瓜哥怎么想,怎么评价这款代替高端存储VMAX的大怪兽。
Dell EMC PowerMax
EMC推出这款新品,我其实是有一点预期的。因为DSSD退市的时候,EMC就表示其技术可能会用于下一代高端存储,因此,高端存储支持NVMe,应该是迟早的事情。
只是没有想到,EMC的步子迈得这么大。现在你去看EMC的产品页,已经找不到VMAX,甚至VMAX-AF都不见了。
当然,如果你用搜索还可以看到。说明VMAX和VMAX-AF还在销售,但是不主推了,未来的高端存储只属于PowerMax。
其实,根据Gartner 2017年Q4的数据,我统计了一下,EMC的VMAX-AF已经占据高端存储的3/4了。
也就是,高端存储形态现在基本都是全闪存形态了。
说句大实话,看趋势,你不得不佩服Gartner。Gartner在2016年在IT Market Clock for Storage的报告里,就预告了高端存储快退休了。
也就是,高端存储还有2-5年就到Replacement阶段,这个阶段,用户不应该再新购买高端存储了。16年后的2年,不正好是2018年吗?EMC的步伐看来还是踩到了点上了。
这次PowerMax采用NVMe架构,这也在Gartner的预测之中。Gartner觉得2018年NVMe后端会得到采纳,而2019年前端NVMe-oF才会来临。未来主流的NVMe-oF协议可能是FC和RoCE。PowerMax的路标好像也是这样的。
其实华为在2017上半年就推出了NVMe产品,Pure Storage在下半年推出。而PowerMax在2018年推出。论踩点,我只服EMC,O(∩_∩)O哈!
oooO ↘┏━┓ ↙ Oooo
( 踩)→┃你┃ ←(死 )
\ ( →┃√┃ ← ) /
\_)↗┗━┛ ↖(_/
好了,下面言归正传,我们来解读解读这款PowerMax。
首先,PowerMax的关键字就三个:快速,智能和效率。
和VMAX-AF对比:
1、SAS变为NVMe,性能大幅提高,因此更快了;
2、引入AI/ML,有了一定的自动运维能力,因此更智能了;
3、除了压缩,多了对重删的支持,因此效率更高了;
具体这次Dell Tech World 2018上,EMC发布了两款PowerMax,2000和8000。Power这个名字估计来自Dell服务器PowerEdge,没有办法,因为现在存储的领导基本都是Dell的人了。
我对比了一下,除了性能快外,软件特性基本和原来VMAX-AF一样,只是少了一个CloudArray的云网关功能,估计以后会补上。
CPU还是v4,没有用最新的v5。端口还是16G FC,还没有支持32G FC,25G等高速接口。这个路标好像是2019年。
指标上,我们也看到,最大支持有效容量是一样的,还是最多4PBe。按照EMC的定义,这个有效容量是包含thin,重删压缩和快照的容量。也就是说,其物理的裸容量其实不是太大的。
大家如果看过我以前的分析就可以看出,这是VMAX遗传下来的限制。因为VMAX支持的最大有效容量和内存大小有关,现在PowerMax最多的内存也是16TB,和VMAX一样,因此,其支持的最大有效容量也只能是4PB了。
下面我分别展开来讲讲这三个关键字。
一、快速
EMC号称PowerMax是世界上最快的存储,说句老实话,如果在中国,我们可以告EMC违反广告法,O(∩_∩)O哈!
不过,从指标来看,确实挺快的,比如千万IOPS,虽然全部是内存命中下测得的,没有啥参考意义。
不过,时延还是说明一定的问题。对比VMAX-AF,时延下降25%,如果用SCM,会下降一半。
快的原因不多说了,就是NVMe和SCM。
二、智能
现在你发布一款产品,不说AI都是可耻的。PowerMax也不例外。也就是以后存储也"自动驾驶"了。
发布会上,EMC堆砌了一堆数据,一句话,PowerMax能处理这么多数据,不然怎么好意思叫big data,O(∩_∩)O哈!
不过吹了这么多,真正落到的场景,主要在数据的智能布局上。也就是分析应用,然后你知道这些数据放在SCM还是Flash上更合适。不过,EMC这个特性要2019年才出来,现在只是提前宣传,因为现在还不支持SCM。
不过,这个思路不是EMC发明的,是高端存储之父Moshe Yanai发明的,他在设计的第三代高端存储Infinibox里,采用AI的方式来做Cache,号称"neural caching",我在文章AI在企业存储已有三大落地应用,你知道吗?里介绍过。
不过,目前PowerMax的缓存算法没有AI功能,我看EMC的资料说PowerMax的Cache命中率只有50%,人家Infinidat宣传自己的神经缓存算法的Cache命中率可以超过98%。也许明年PowerMax AI版本上线才能改善这个指标。
还有一个地方会用AI,就是在压缩处理部分。如果用AI分析某些数据是热数据,就先不用压缩了,因为反复压缩和解压还是浪费大量的资源的。这个也是有意义的。这个资料里面都没有提到,我是听媒体的采访才知道的。可怜我蹩脚的英语,希望没有听错。不过,这个也需要等AI版本出来才行。
一句话,智能是路标,PowerMax现在还没有比VMAX-AF聪明。
三、高效
大家知道,VMAX-AF有压缩功能,但PowerMax多了一个重删功能,因此号称可以做到5:1的数据缩减比。
效率还体现在空间的节省。
还有功耗的减低上。
不过,这块人家Pure Storage表示不服。Pure的//X采用CFM,自己做的NVMe板卡,密度更高一些,而且Pure的数据缩减自认为做得比PowerMax好,因此,空间的节省更多一些。但是,拿人家一个机柜来比就有点搞了,因为那个机柜还是很大地方空的,可以放其他设备啊。
讲完3大关键词,我想看看一些实现的细节,特别是区别于VMAX-AF的。
A、Smart RAID
首先讲讲EMC老强调的双端口NVMe,这个没啥特别的,为了可靠性和性能,NVMe SSD最好是双端口的,华为的Dorado v3用的NVMe SSD也是双端口的。一般消费级的NVMe都是单端口的。
由于是双端口,因此每个控制器(Director)都可以访问一个端口。因此,EMC还包装了一个术语Smart RAID,由于NMVe协议的并行性,因此每个控制器都可以同时访问所有的SSD,不管你是否在一个RAID组内。
其实SAS盘也是双端口的,但是由于SAS/SCSI协议没有并行能力(一个LUN只支持一个队列),因此,无法做到Active/Active的RAID组共享。
2、NVMe磁盘框的连接
EMC在PowerMax后端采用PCIe,而不是像很多Startup公司采用RoCE来连接。
由于原来的存储都没有支持PCIe的磁盘框(DAE),因此,这是全新的硬件。EMC还是设计成24个小盘,2U高度的DAE。
如果是PowerMax 2000,一个引擎(2控)可以连接两个DAE。2000最多支持4控,因此,连接方式如下:
但是如果是高端的PowerMax 8000,连接方式就奇怪了。2个引擎(4控)最多支持3个DAE,也即中间有一个DAE是两个引擎共享的。
看了一下,以为EMC也搞一个HDS和华为老吹牛的4坏3设计,即中间那个DAE的数据很安全,因为任意一个引擎(2控)故障,另外一个引擎也有线路相连,也就是可以访问?
其实不是这样。大家仔细看中间的DAE,其实分成两个部分,前14个盘位是引擎1来控制,后面10个盘位(编号15-24)是由引擎2控制。也就是各访问各的,如果引擎1故障,那么引擎1管理的盘也不能被引擎2访问。
我们看到,中间的DAE的中间4个盘位(编号13-16)是用来专门放置热备盘的,也就是说,PowerMAX的RAID机制还是VMAX那套,还是需要专门的热备盘的。
中间的DAE为什么不平分,而是前面14个盘给引擎1,后面10个盘给引擎2。估计和RAID组的设计有关。EMC一般采用8个盘一个RAID组,7+1或者8+2。不过,PowerMax支持的最大有效容量是由内存的大小决定的,因此,瓶颈并不在盘数上。我用PowerMax Studio做了一个最大配置,大家看看下半部分的DAE的盘是怎么插的(上面部分是一样的),很不规律,而且有很多盘位空的。
C、重删压缩
EMC的PowerMax这次多了重删,但压缩功能也和原来VMAX-AF不同。不过,两者都通过专门的硬件加速卡来实现的。
大家看看,引擎里面,NVMe的后端卡和数据缩减卡着两种类型的卡是新的,其他的卡都是原来VMAX-AF有的。引擎之间还是采用Infiniband连接。
这个模块不仅仅负责写入数据的重删压缩,还负责SRDF复制时候的数据压缩。
这是重删压缩特性对比。
我们看到,压缩多了一个EDC,即扩展数据压缩功能。这个功能是系统不忙的时候,去看看那些不常用的数据是否可以进一步压缩,这样可以获得更好的压缩率。这个思路其实是向Pure Storage学的。
还有,压缩的算法不同。PowerMax采用DEFLATE算法,而VMAX-AF采用LZS算法。具体区别大家百度吧,下面是无损压缩算法的发展一览表。我的数学不太好,对其差别了解不多。
不过,PowerMax的压缩有一点做得不好,估计是为了保证SRDF的兼容性,数据做远程复制的时候,先要解压,然后再用SRDF的算法进行压缩,对端收到后也多了一个解压的再压缩的过程,比较浪费资源。
说完了压缩,我们来看看重删,这个是新特性。从EMC提供的流程看,没有看到hash ID一样然后进行数据比对这个步骤。
也就是说,PowerMax和XtremIO一样,都是采用强hash算法(文档说采用SHA-2算法),不比对数据的处理方式。这个和NetApp、Huawei的思路不同。理论上有hash冲突的风险。
D、SLA服务模式
这个和VMAX一样,采用SLA来进行等级划分。不过,VMAX靠的是调整LUN的闪存百分比来调整服务等级,而PowerMax都是NVMe了,只能通过Host I/O Limit来控制前端端口的I/O来降速了。
看,全是NVMe SSD,居然也提供7.2ms时延的铜牌服务。这些主要给ISP用的,因为有些用户希望便宜的服务,需要把体验降下来,不然就卖不了贵的服务了。
E、秒级NDU
PowerMax继承了VMAX的可靠性,甚至秒级NDU能力。
原理就是升级的时候提前把代码装载到EEPROM里,然后所有控制器同时热加载,整体系统只需要10s左右就可以完成升级,业务不中断。
F、LUN归属问题
我们知道,VMAX是没有LUN归属的,也就是LUN可以被多个控制器同时读写,I/O无需转发。但是,LUN没有归属,下面某一个逻辑块还是需要有归属的,HPE 3PAR是CK,而VMAX就是TDAT。
SmartRAID的描述就提到,TDAT是有归属的。
这样设计的好处就是主机只能看到LUN,看不到TDAT,TDAT有归属就不需要锁机制,系统性能更好,而且主机可以对同一个LUN多路径负载均衡,控制器切换主机不感知,业务影响小。
好,到这里,我想到的技术要点解读都解读完了。最后给大家提一个问题,根据IDC的定义,PowerMax到底算原生型还是改良型呢?
确实,PowerMax有很多新东西,但是,我们看软件上和VMAX基本一样,特别是RAID方式和SRDF压缩的实现等等,我们都看到很多妥协。也就是还是有历史包袱的,不可能像全新设计的架构一样轻装上阵。不过,改良型也有改良型的好处,就是功能丰富,成熟度高。当然,不好的地方就是有妥协,性能无法发挥到极致。
以上就是如何进行Dell EMC PowerMax细节解读,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。