ARM价值几何 Calxeda服务器评测报告:下篇
- +1 你赞过了
结果非常重要
在你跳到下面的图表之前,我们建议花一些时间来恰当地翻译一下结果。首先,我们在网站服务器模拟了每秒5到10位“繁忙”的用户。当一位用户点击网站上的某个地方时,这将产生一些请求或者数十个请求。例如,连接网站上的论坛将产生两个简单的“GET”请求,同时发布一条回复将产生一次雪崩般的56次POST和GET,这就是我们为什么以“每秒的响应数”来报告性能的原因。如果你用统计上足够大的数量来分析它们,从CPU负载点的角度来看,响应从某种程度上是与之相似的。用户行为是如此的不同,以至于在一些情况下每个数秒去执行两次用户行动,能够产生比每秒20次用户行动都还要多的处理能力和网络带宽需求。
在低并发率时,英特尔的机器充分发挥了超级提升(turbo boost)功能及其优异的高每内核性能。在更高的网站负载时,总共96个(24 x 四核SoC)ARM Cortex-A9内核的总吞吐量比低功耗32线程/16核(2 x 八核)至强高出多达50%。即使强大的2660也不能胜出ARM SoC的集群。
尽管我们在x86服务器上有数不胜数的经验,但是我们在基于ARM的服务器上几乎为零,所以我们联系了嘉协达的工程人员,并且得到了一些颇有价值的优化建议。其结果是内部交换矩阵能够用多种方式来调配。例如,从一个节点出来的连接速度被默认设置为了2.5Gbit/s,在考虑到我们通常都受制于CPU并使用每个节点低于0.5Gbit/s时,这是相当的高了。将每个节点的连接速度降至1Gbit/S将降低功耗,并仍高于足够的带宽。我们也从嘉协达的PPA(Personal Package Archive)核心更新到略新的软件核(155)。这使我们能够采用CPUfreq工具来使用动态电压和频率扩展(DVFS,P-状态)。首先让我们看看如果进行了这些节能微调,是否降低了整体吞吐量。
这些调整没有给吞吐量带来任何提升(在很多情况下,其分值还略微降低),但是这些调整可能降低功耗和/或相应时间,让我们接着探究。
最新资讯
新品评测