测试方法:针对不同应用来定制测试
我们的方案:针对不同应用环境定制测试规则
我们最终制定的测试方法依然保留底层测试,但是抛弃了IOMeter而改用“Anvil's Storage Utilities”。其实相比IOMeter,Anvil的一大劣势是没有指定一段测试规则中的读写操作比例,不过自带的Mixed IO随机混合读写还是能勉强挽回一些。笔者最终决定选用Anvil是因为它可以设置不同的数据压缩比,这比IOMeter只有完全随机或完全重复两种极端状态的数据模型更加靠谱。
Anvil's Storage Utilities
和显卡测试基本上只给游戏玩家看不同,SSD被用于多个领域,无论是在普通家用还是游戏或者生产力乃至数据库等环境中,都有重要的作用。因此在本次横评我们也首次采用不同的、但更加由针对性的底层测试规则以及分类PCMark的测试子项,针对这四种典型的应用环境进行分类,提高参考价值。
我们的测试方案
具体的测试规则如上表所示,值得说明的是,32KB数据长度的随机读写性能首次纳入到我们的测试中,因为除了4KB和128KB以外,16~64KB数据的读写频率也不低。之所以测试Mixed IO随机混合读写性能,原因已经说过,因为100%的读或100%的写测试是不切实际的,很多应用环境都是读写兼并的。
Anvil的随机读写性能测试界面
至于队列深度(QD),实际应用环境下是QD1居多,但仍有用到QD2~4乃至8的可能,我们也针对家用、游戏、生产力和数据库等环境设置了不同的QD测试范围,但绝对不会有99%的时间都用不到的QD32下的跑分成绩。
为了更加鲜明地反映出理论性能与真实应用性能之间的关系,在底层测试和PCMark测试中我们还加入了4TB 7200转机械硬盘的成绩作为对比参考。
SSD的“帧生成时间”:延迟和性能一致性
与“最小帧”概念对应的,我们在本次消费级SSD测试中引入了延迟测试。延迟对SSD来说本身就是一个重要的指标,它反映的是接收到指令之后到开始执行之间的这段时间,如果延迟过高,体现在实际表现来看就是顿卡。表现SSD延迟的另一种办法就是记录每秒的IOPS性能一致性。
性能一致性测试,如果采样点太过分散则说明一致性不好,某些时段的延迟可能会偏大,这和显卡测试中的帧生成时间是同样的道理
其实SSD的延迟比机械硬盘小上数十上百倍,这对实际体验已经是质的提升,相比之下不同SSD之间不到0.2ms的平均响应延迟之差对我们的体验来说无关紧要;与平均延迟相关的是最大延迟,这可能是在某个瞬间产生的,但对轻负载的家用环境下它的意义不是很大。与其关心某个瞬时的最大延迟,不如更多来关心不同情境下的延迟稳定性。
所以我们的建议是,如果两款SSD的平均速度相近,那么我们可以选择延迟表现更稳定的那个。
网友评论