2018年底,我启动了一个项目,名为《家里的迷你大型机:1997年开始的一个6 CPU服务器的故事》(Mini-Mainframe in Home:The Story of a 6-CPU Server from 1997)。它致力于ALR Revation6×6超级服务器,配备6个Intel Pentium Pro处理器,其成本相当于1997年一辆全新的法拉利(Ferrari)。它花了大约450天,最终跟随故事的继续,超级服务器收到了期待已久的升级-6个英特尔奔腾II Overdrive 333 MHz处理器!在那些年里,这样的功能非常强大,但是与今天的功能相比如何,您将从这篇文章中了解到性能有多大的提高。
我承认450天是一段相当长的时间,所以我将简要回顾一下前一系列文章的内容。一切都是这样开始的:投身于大型机和超级计算机的世界,我想尝试一些超级强大的系统,选择落在了ALR Revsion 6×6超级服务器上,它有6个插槽8,支持高达4 GB的RAM。对于90年代末来说,这些是可怕的数字,也是它的成本。英特尔估计,这样的系统需要一个处理器2675美元,需要6个,一个256MB的服务器内存模块需要支付3500美元,需要16个棒才能获得梦寐以求的4 GB RAM。
一个磁盘子系统还配备了7个RAID控制器和一个860G磁盘阵列、一个20千克的电源单元和服务器本身的…。因此,有可能达到27万至50万美元,如果加上历年的通胀水平,这些数字将从435美元到近80万美元不等。现在,就性能而言,任何低成本的计算机都会比这个怪物更快,但是在2020年有这样一个机会,感受那个时代的全部力量,这一事实让这些大量的数字变得微不足道,找到和组装这样一个怪物要重要得多。
在上一篇文章中,我研究了6个Intel Pentium Pro处理器的性能,频率为200 MHz,二级高速缓存为256KB,甚至将所有6个副本都超频到240 MHz。以及六款高端Intel Pentium Pro“黑色”,频率为200 MHz,具有1M二级高速缓存,可超频至233 MHz。在我的配置中,我有2 GB的标准FPM内存,16个128MB的内存模块,在初始开机自检过程中需要4分钟以上的时间进行初始化。
4G的RAM会使这个数字达到9分钟,这与加速火车或飞机起飞相当,尽管后者可以更快地做到这一点。但是后来,在我随意加载之后,六个物理内核同时到达,但是没有MMX的支持,特别是SSE指令的支持。
任何计算机的基础都是中央处理器。英特尔奔腾Pro处理器最早出现在1995年。然后是没有Pro前缀的普通奔腾,但型号名称中的这个前缀表示,这些处理器主要定位为具有特殊插槽8的服务器和工作站的解决方案。通常的英特尔奔腾安装在插槽5和7中。Pro与常规版本奔腾台式机之间的一个显著区别是Pro版本中存在二级高速缓存,它在相同的封装上工作,以处理器的核心频率工作,从而使其能够显著提高性能。
对于各种英特尔奔腾Pro型号,二级缓存大小从256 KB到1 MB不等。Pentium Pro的一级缓存为16KB,其中8KB用于数据,指令也是如此。对于随后的英特尔奔腾-II,二级高速缓存的工作频率是处理器核心频率的一半,对于所有型号,其大小为512 KB,并且它以独立微电路的形式位于墨盒上,距离CPU芯片本身一段距离。一级缓存大小增加了一倍,达到32K,这抵消了较慢的二级缓存的性能影响。
测试的处理器采用350纳米的工艺技术生产。奔腾Pro处理器内核中的晶体管总数为550万个,二级高速缓冲存储器中的晶体管数量多达1550万至3100万个,具体取决于其大小。二级缓存本身位于CPU核心附近的单独芯片上。处理器有一个自由乘法器,根据型号的不同,系统总线频率为60或66 MHz。处理器的超频取决于L2缓存的超频,这是限制因素。
Intel Pentium II OverDrive 333 MHz是一款非常有趣的处理器。可以说,这种处理器的出现要归功于美国政府,美国政府资助了一个项目,创建超级计算机来模拟核爆炸并跟踪该国核武库的状态。美国政府拨款建造这样一台超级计算机,英特尔中标,并在1997年交出了一台名为“ASCI Red”的交钥匙超级计算机。
ASCI Red由9298个200 MHz Pentium Pro处理器组成,超级计算机的所有模块都位于85个机架机柜中。RAM总量为594G,磁盘子系统由640个硬盘驱动器组成,总磁盘空间为2TB(现在考虑到这个存储量现在由单个便宜的硬盘驱动器提供)。ASCI Red是第一台突破1000GFLOPS或1万亿次浮点运算的超级计算机。它连续几年在全球最快的500台超级计算机排行榜上名列前茅。
1999年,建模任务变得更加复杂,ASCI Red的能力已经开始不足;需要升级。无论您给程序员提供什么,程序员总能找到需要更高性能的方法,特别是在对战略威慑、天气或…的可靠性进行建模的情况下。..英特尔再次中标,得益于此次活动,诞生了一款独一无二的处理器,拥有8插槽插座和奔腾II-英特尔奔腾II超速驱动的能力,频率可达333 MHz。升级后的带有9632处理器的第二代ASCI Red在LINPACK基准测试中提供了2.38TFLOPS性能。如此高质量的特性使ASCI Red将最快超级计算机的头衔保持到2000年6月。
英特尔奔腾II超速驱动是Socket 8演变的最后阶段,属于第六代英特尔处理器(P6)。该加工机是在1998年8月宣布的,尽管它的规格很具体,但建议每批1000台加工机的成本为599美元。物理上,此处理器安装在插槽8中,但实际上,我们看到“Desshuts”核心奔腾II,辅以512千字节的L2高速缓存以处理器核心频率运行,这与正常的Desshuts核心PII不同。这些处理器是唯一具有全速L2高速缓存的奔腾II处理器(当然不包括具有芯片上高速缓存的赛扬和具有256k全速高速缓存的Mobile Dixon核心),这一点与普通的Desshuts核心PII不同的是,这是唯一的具有全速L2高速缓存的Pentium II处理器(当然不包括具有芯片上高速缓存的赛扬和具有256k全速高速缓存的Mobile Dixon内核)。奔腾II过驱电压调节模块集成到奔腾II OD模块中,并将主板的供电电压(3.1-3.3V)降低到PII内核所需的2伏。
处理器乘法器锁定在5x,如果使用66.6 MHz的前端总线,则总频率为333 MHz。这款处理器有两个版本,第一个版本是SPEC-SL2KE,它配备了一个主动冷却系统,而SL3EA则配备了一个被动冷却系统。但最大的优点不仅是提高了处理器时钟速度,而且还支持MMX指令集和其他一些指令集。
由于主板支持高达X5.5的乘法器更改,这将导致366 MHz,我同时研究了使用SPEC Q0125的Intel Pentium II Overdrive 333 MHz工程样机的性能。就像这样一个处理器的主人告诉我的那样,就连这个工程样本的乘法器都被锁住了。也许这是更好的,因为购买6个这样的ES处理器将与购买任何高端现代CPU相当,但首先您需要在其他地方找到如此数量的处理器。
看来我花了一年多的时间找到并购买了6个Intel Pentium II Overdrive 333 MHz处理器,现在在世界著名的跳蚤市场(Ebay.com)平均售价为200美元,并获得了最大的ALR Revsion 6×6配置,但一如既往地完美是没有限制的。但下面会有更多关于这方面的信息。
Mendocino是自1998年以来生产的赛扬处理器内核的名称,性能为SEPP(Slot1)和PPGA(Socket 370)。1999年,英特尔放弃了插槽1的外形规格,转而采用大家熟悉的PPGA。塑料赛扬处理器的制造成本更低,使用250纳米技术制造,并具有内置的128KB二级高速缓存,以最快的处理器核心速度运行。频率范围为300~533 MHz。
赛扬·门多西诺放在哪里呢?事实上,在SMP(对称多处理器)中启动赛扬处理器是可能的,而且发烧友们这样做已经有很长时间了。赛扬的核心是功能齐全的奔腾II,如你所知,它支持SMP。这些处理器之间的区别只是在二级缓存方面,赛扬L2=128KB,但是频率可以达到更高的值,533 MHz,而奔腾II为450 MHz。
对SMP的支持是存在BR#1信号,该信号物理存在于处理器本身中,但尚未在主板上路由。一旦这个秘密被发现,SMP问题的解决方案很快就会出现。发烧友拿起了烙铁,受到这一想法启发的主板厂商ABIT和QDI甚至发布了他们的系列产品。召回基于带双插槽370的英特尔440BX芯片组的比特BP6主板就足够了。(编者按:哦,在双赛扬366以550 MHz的频率愉快地运行我的BP6的日子里,英特尔并不觉得好笑,但我觉得很好笑)。
此外,还有一个来自公司PowerLeap型号PL-ProII的适配器,它只允许您在Socket 8主板上安装Intel Socket 370赛扬处理器,它们之间的关系非常密切。
因此,理论上可以安装6台英特尔533 MHz赛扬,总共3200 MHz。当然,我不知道六个处理器是否都能工作,但机会不坏=)我有多少次没有上网,但我没有发现这样离奇想法的实现。我可以毫不费力地找到6个赛扬,但不太可能找到6个PowerLeap PL-ProII。我有一个这样的适配器,但是为了实现这个项目,以及我的其他展品的一部分,我不得不卖掉它(因此,如果有人有一个适配器,或者他们知道在哪里可以找到它,请在本文的讨论中写信给我,或者写信给我的电子邮件:[email protected](也许可以重新创建它们?)。
我们继续幻想哈哈。反过来,如果您进一步扩展想象力范围,并在PowerLeap适配器中安装另一个支持Pentium III处理器和Tualatin内核的适配器,那么谁知道输出中会发生什么,也许是这样的三明治…。。
这个想法后来变得很有趣,所以我不放弃希望这个故事的下一部分或续集有一天会出版。也许在2025年。
现在我们有了6个Intel Pentium II Overdrive 333 MHz,它们已经获得了对MMX指令的支持,并且沿着处理器阶梯又上升了一个发展阶段,我想尝试安装一个更现代的操作系统。
让我提醒您,上次我安装的操作系统与推荐的操作系统不同:Microsoft Windows NT Server 4.0 Enterprise、Microsoft Windows 2000 Advanced/Datacenter Server,它们完全阻止您运行为心爱的Windows XP编写的程序和测试。作为长期实验的结果,我们得到了这样一个操作系统:“Windows.Net Enterprise Server。Build 2600 Service Pack 2“,这看起来像是带有Windows XP内核的服务器操作系统。
这一次,我想把门槛提高得更高,瞄准的是基于Windows Vista内核的操作系统系列。理想的选择是Windows Server2008企业版(X86),但起初我决定尝试安装Windows Server2003企业版。虽然它写在纸上是关于Intel Pentium Pro系列处理器和更早的奔腾II处理器的CPU内核中的硬件错误,以及相关的内存“泄漏”和无法在上述处理器的SMP模式下工作的问题,但我决定在实践中检查这一点。
此实验的结果是可以预测的-6个Intel Pentium II Overdrive 333 MHz将不会作为运行Windows Server 2003系列操作系统的ALR革命6×6的一部分工作。只有一个CPU可见。遗憾的是,这就是一个硬件错误如何结束了这些有趣的处理器的美好未来。
下一步是安装Windows Server 2008企业版。对于最低配置的许多参数,ALR旋转6×6满足了成功安装该操作系统所需的要求。安装过程安全开始,文件开始从DVD-ROM‘a复制到SSD。
ACPI又一次抬起了它丑陋的头…。我说我的配置几乎满足了所有的最低要求,但没有提到从Windows Vista开始,这个操作系统和后续操作系统的所有内核都是ACPI兼容的,换句话说,没有硬件ACPI就什么都不能工作。而这里的答案就在于早在ACPI问世之前就发布的6×6 ALR革命的BIOS。
但仍然有机会安装,但这需要干预BIOS代码,但不幸的是,我仍然找不到BIOS程序员。回到Socket 7的日子里,当ACPI的第一个修订版开始出现时,主板制造商发布了支持这项技术的新版本的BIOS。当ACPI BIOS修订版1006发布时,我将此作为Ali Aladdin V芯片组上用于Socket 7处理器的华硕P5A主板的示例。这使得使用AMD K6-2+处理器在此主板上安装Microsoft Windows 7 x86成为可能。
此问题的替代解决方案是查找Windows Vista Server的早期版本。这个开发项目的最初项目被称为“长角牛”。
此操作系统的映像在Internet上找到(当然),刻录到DVD上,安装过程开始:
一切照常进行,文件被复制了,但是当复制过程完成并重新启动时,同样的ACPI错误正在等待着我。
同样,在花了相当长的时间之后,我决定开始搜索Windows Vista或Longhorn项目的早期版本中没有ACPI支持的操作系统内核。也许他们确实存在。如果安装了任何早期版本,那么实施SMP支持会更容易。我尝试了不同的版本:4042,5098,以及第二版的测试版。结果应该是这样的:
但是这次活动的成功仍然归功于我的测试系统对ACPI的支持。所有测试版本仍然需要ACPI支持。结果,我把这个想法放进了一个很长的抽屉里,并决定在一个经过验证的类似Windows XP的操作系统上进行所有的测试,在这个操作系统上,六台英特尔奔腾专业版感觉很棒。要解决这个问题,一个脑袋是不够的,所以可以在这篇文章的讨论中写下有价值的想法,不要害羞😉。
测试台将包括处理器:·6x Pentium II Overdrive 333 MHz L2=512 KB·6x Pentium Pro 200 MHz L2=1024 KB·6x Pentium Pro 200 MHz L2=256 KB。
性能测试是在“Windows Whistler.Net Advanced Enterprise Server,Build 2600,Service Pack 2,3 in 1”作者版中使用以下软件进行的:·Super PI mod。1.5XS(1M任务)·PiFast v.4.1·wPrime v.1.43·HWBOT Prime v.0.8.3·CPU-Z v.1.87.0·WinRAR x86 v.5.40·7-Zip v.16.04·AIDA64 5.50.3600·SiSoftware Sandra 2004 SP2·Cinebench 2003·Cinebench R10。
如果我们比较最快的奔腾Pro在200 MHz时钟频率和1M二级高速缓存下的性能,那么更换一台奔腾II Overdrive 333 MHz可以额外提供三分之一的性能。如果这样的处理器的数量与ASCI Red-9632 PC.的数量相同,那么如果我计算正确的话,结果几乎是300万%。你可以看到二级缓存大小有一些帮助,但大多数情况下,这是一个纯粹的时钟速度/体系结构测试。
在此测试中,保留了奔腾Pro和奔腾II Overdrive之间以前的性能增长动态。虽然这项测试更喜欢处理器时钟速度而不是高速缓存大小,但即便如此,与400 MHz赛扬的超驱差距也不是很大。我真的很想在这个系统里安装六个这样的赛扬。
第一个支持多线程的测试。在本文中,我决定不仅测量6台Intel Pentium II Overdrive的性能,还测试5台和4台处理器的性能,因为该系统允许使用奇偶配置,并且可伸缩性很好。
性能标准原来是6到4,6台奔腾专业版的性能相当于4台奔腾II超速驱动,更准确地说,超频到233 MHz的奔腾专业版。六个“超速驱动器”已经足够匹配四台服务器至强400 MHz的性能,或者它们的性能相当于一台AMD Athlon XP,PR等级为2100+,频率为1733 MHz,于2002年初发布。一款“普通”处理器只用了不到四年的时间就达到了6倍超速引擎的性能。
同样值得注意的是,添加一个CPU(从5个超驱到6个超驱)会导致非常线性的性能提升。ALR在处理处理器添加方面的开销非常小。
如果在过去,一对千兆赫兹的英特尔奔腾III至强的性能是令人惊叹的事情,现在,6OverDrive甚至设法超过了这对A略微超频(5%)的64位新学校的代表-AMD Athlon 64 3800+插槽939只是略快一些,尽管它们之间存在技术深渊。在这里添加处理器导致的收益比在wPrime中要少。
升级后的内存子系统没有改变,所有的66 MHz快速页面模式内存都被使用了,但是由于处理器的超强处理能力,内存数量还是增加了。
在这里,我们再次看到6到4或奇偶校验对4个“超速”到6个奔腾专业的性能的影响。较慢的内存子系统会干扰更现代的对手的存档,如果它可以超频到75 mhz…的话。也许在未来。
AIDA64 5.50.3600我在6个英特尔奔腾II Overdrive 333 MHz测试包中向您展示了测试结果。
我最喜欢的测试是缓存和内存基准测试。查看两个处理器的缓存速度是如何提高的。从左到右:奔腾II Overdrive 333 MHz和奔腾Pro 200 MHz(L2=1024KB)。有趣的是,L2 Cache的写入速度比原来的奔腾Pro快了近25%,同样它的延迟也更好。
6倍超速驱动器击败了2.8 GHz奔腾4。此外,P6架构比NetBurst更快,从而提高了时钟性能。
这两个FPU测试对多核的依赖程度较低,显著影响了ALRS分数。奔腾III FPU也得到了极大的增强(其中增加了SSE),这在这里很明显,因为VP8和Julia测试都针对这些进行了大量优化
至少在整数测试中,6倍奔腾II超驱表现良好,多媒体测试,更重的FPU,有利于PIII内核,但至少我们可以说,我们击败了一个a四安腾?
现在我们来看一下最流行的多线程粉碎测试-Cinebench!Cinebench 2003分(越多越好)。
对于这个问题,有多少个内核,哪些更适合渲染。在Tualatin-S后面有一台奔腾III-S 1400 MHz。
..