ARM价值几何 Calxeda服务器评测报告：下篇

结果非常重要

在你跳到下面的图表之前，我们建议花一些时间来恰当地翻译一下结果。首先，我们在网站服务器模拟了每秒5到10位“繁忙”的用户。当一位用户点击网站上的某个地方时，这将产生一些请求或者数十个请求。例如，连接网站上的论坛将产生两个简单的“GET”请求，同时发布一条回复将产生一次雪崩般的56次POST和GET，这就是我们为什么以“每秒的响应数”来报告性能的原因。如果你用统计上足够大的数量来分析它们，从CPU负载点的角度来看，响应从某种程度上是与之相似的。用户行为是如此的不同，以至于在一些情况下每个数秒去执行两次用户行动，能够产生比每秒20次用户行动都还要多的处理能力和网络带宽需求。

Webhosting throughtput—average over 24 web servers

在低并发率时，英特尔的机器充分发挥了超级提升(turbo boost)功能及其优异的高每内核性能。在更高的网站负载时，总共96个(24 x 四核SoC)ARM Cortex-A9内核的总吞吐量比低功耗32线程/16核(2 x 八核)至强高出多达50%。即使强大的2660也不能胜出ARM SoC的集群。

尽管我们在x86服务器上有数不胜数的经验，但是我们在基于ARM的服务器上几乎为零，所以我们联系了嘉协达的工程人员，并且得到了一些颇有价值的优化建议。其结果是内部交换矩阵能够用多种方式来调配。例如，从一个节点出来的连接速度被默认设置为了2.5Gbit/s，在考虑到我们通常都受制于CPU并使用每个节点低于0.5Gbit/s时，这是相当的高了。将每个节点的连接速度降至1Gbit/S将降低功耗，并仍高于足够的带宽。我们也从嘉协达的PPA(Personal Package Archive)核心更新到略新的软件核(155)。这使我们能够采用CPUfreq工具来使用动态电压和频率扩展(DVFS，P-状态)。首先让我们看看如果进行了这些节能微调，是否降低了整体吞吐量。

Webhosting throughtput Optimized—average over 24 web servers