Процессоры intel пентиум 4. Процессоры Intel Pentium4 LGA775

Viber OUT 04.08.2019
Viber OUT

Через несколько дней после официального представления AMD своего последнего процессора Athlon64 FX-53, Intel решила объявить о выпуске на рынок 3,4-ГГц версии Prescott, которая позиционируется на конкуренцию с Athlon64, а не с Athlon64 FX-53, несмотря на одинаковый размер кэша.

Хотя стратегия Intel по гонке тактовых частот пока оказывалась вполне успешной, сегодня становится всё труднее находить аргументы в пользу процессора Prescott, который плохо наращивает свою производительность по сравнению с чипами AMD, использующими встроенный контроллер памяти.

Да, Intel нужна быстрая платформа со всеми выпестованными особенностями типа Socket 775, PCI Express и памятью DDR2, но на тактовую частоту процессора уповать уже не приходится. Это урок, который Intel уже пришлось выучить на серверном рынке, поскольку AMD получает всё более широкую поддержку своего семейства Opteron. И Pentium 4 Prescott не слишком хорошо соответствует репутации Intel, ведь его тепловой пакет TDP составляет более сотни ватт - при этом процессор не даёт сколько-нибудь ощутимых преимуществ по сравнению с предшественником Northwood.

Intel, конечно же, не почивает на лаврах - сегодня компания находится в процессе внедрения нового степпинга D0 ядра Prescott, который позволит процессору достичь тактовой частоты вплоть до 4 ГГц - как и упоминается в планах компании. Поскольку не все 3,4-ГГц версии Prescott имеют степпинг D0, мы решили привести таблицу, которая поможет отличить старые и новые процессоры Prescott.

По информации Intel, последний степпинг позволит увеличивать тактовую частоту из-за внесённых оптимизаций потребления энергии. Однако тепловой пакет нового процессора не изменился и остался на уровне 103 Вт максимум. Хотя процессор и кажется улучшенным по сравнению с 3,2-ГГц версией, его тепловыделение всё ещё несколько непропорционально по отношению к тактовой частоте. В любом случае, при покупке следует быть готовым к высокому тепловыделению процессора.


CPU-Z правильно определяет новый процессор Pentium 4: Model 3, Stepping 3 (CPUID 0F34h). Перед нами старый степпинг C0.


Новый процессор нагревается чуть сильнее.

Pentium 4: обзор моделей

Как вы, наверняка, знаете, Pentium 4 Prescott является ядром Pentium 4 третьего поколения. Первое, под кодовым названием Willamette, приобрела немалую популярность из-за увеличения производительности по сравнению с Pentium III Tualatin, в то же время потребляя намного больше энергии.

Второе поколение ядра под названием Northwood изготавливалось по 130-нм техпроцессу - на сегодня его по-прежнему можно называть лучшим ядром Pentium 4, поскольку процессор обеспечивает приличную производительность и неплохие возможности по "разгону". Мы уже смогли заставить несколько процессоров Northwood работать на частоте больше 4 ГГц - причём с обычными кулерами.

Сегодня на рынке присутствует большое число процессоров Pentium 4, базирующихся на ядрах Northwood или Prescott. Тактовые частоты сегодня начинаются на отметке 2,4 ГГц и заканчиваются на 3,4 ГГц, причём на этом отрезке потребитель может выбирать 20 разных моделей. Чтобы вы смогли лучше представлять себе ситуацию с процессорами Pentium 4, мы свели все модели вместе в краткую таблицу:

Процессор FSB Частота ядра Ядро HT
Pentium 4 400 МГц 2,0, 2,2, 2,4, 2,6 ГГц Northwood Нет
Pentium 4 B 533 МГц 2,4 ГГц Northwood Нет
Pentium 4 533 МГц 2,26, 2,53, 2,66, 2,8 ГГц Northwood Нет
Pentium 4 533 МГц 3,06 ГГц Northwood Да
Pentium 4 C 800 МГц 2,4, 2,6, 2,8 ГГц Northwood Да
Pentium 4 800 МГц 3,0, 3,2, 3,4 ГГц Northwood Да
Pentium 4 A 533 МГц 2,8 ГГц Prescott Нет
Pentium 4 E 800 МГц 2,8, 3,0, 3,2, 3,4 ГГц Prescott Да

Чем дальше располагается буква по алфавиту, тем лучше процессор вы получите. Однако это относится только к сравнению двух различных моделей с одинаковой тактовой частотой - типа Pentium 4 на 2,4 ГГц и FSB400 в сравнении с Pentium 4 B на 2,4 ГГц и FSB533. Pentium 4 C работает на FSB800 и поддерживает Hyper-Threading. Единственным исключением является Pentium 4 3,06 ГГц, который работает на FSB533 - и является первым процессором, поддерживающим Hyper-Threading. Буква E обозначает модели Prescott с 1-Мбайт кэшем L2, в то же время версии этого ядра с FSB533 обозначаются буквой A.

Intel вводит номера моделей

Существует много причин, по которым лучше использовать модельные номера, а не тактовые частоты. Во-первых, в номере можно учесть множество технологических деталей, типа FSB, размера кэша, частоты или дополнительных функций - Hyper-Threading и т.д. Во-вторых, исчезнет путаница между разными версиями процессоров с одинаковой тактовой частотой - в результате чего обычный покупатель легко выберет самый быстрый процессор. В-третьих, в индустрии существует множество примеров успешного использования модельных номеров - скажем та же AMD с семейством Opteron 14x, 24x и 84x. Первая цифра номера указывает поддержку числа процессоров: 1 - для одного процессора, 2 - для двухпроцессорных систем и т.д. Цифра x может быть 2, 4, 6 и 8 - что указывает на частоты 1,6, 1,8, 2,0 и 2,2 ГГц.

Наконец, мы должны подумать о процессорах Intel Pentium M, тем более что вскоре появится новая версия с техпроцессом 90-нм (Dothan). Поскольку этот чип будет существенно быстрее Banias из-за увеличенных тактовых частот, Intel будет очень трудно аргументировать покупку 3-ГГц настольного процессора Prescott, который в некоторых приложениях работает медленнее 2,0-ГГц Dothan.

По нашим источникам, тактовые частоты должны полностью исчезнуть из названий процессоров Intel. Поскольку число доступных моделей процессоров вряд ли уменьшится, такой шаг нам кажется вполне логичным. Будущая система именования процессоров будет выглядеть примерно так: процессор Pentium 4 будет дополняться номером 5xx, а линейка Celeron - номером Celeron 3xx.

Мобильные процессоры Настольные процессоры
Производительный сегмент рынка Pentium M 755 (2,0 ГГц)
Pentium M 745 (1,8 ГГц)
Pentium M 735 (1,7 ГГц)
Pentium M 725 (1,6 ГГц)
Pentium M 715 (1,5 ГГц)
Pentium 4 Extreme Edition
Массовый сегмент рынка Pentium 4 Mobile Pentium 4 560 (3,6 ГГц)
Pentium 4 550 (3,4 ГГц)
Pentium 4 540 (3,2 ГГц)
Pentium 4 530 (3,0 ГГц)
Pentium 4 520 (2,8 ГГц)
"Бюджетный" сегмент рынка Celeron M 340 (1,5 ГГц)
Celeron M 330 (1,4 ГГц)
Celeron M 320 (1,3 ГГц)
Celeron D 340 (2,93 ГГц)
Celeron D 330 (2,8 ГГц)
Celeron D 320 (2,66 ГГц)
Celeron D 310 (2,53 ГГц)

Тестовая конфигурация

Аппаратное обеспечение

Процессоры Intel (Socket 478)
200 МГц FSB
(двухканальная DDR400)
Pentium 4 Extreme Edition 3,4 ГГц (2-Мбайт кэш L3)
Pentium 4 Extreme Edition 3,2 ГГц (2-Мбайт кэш L3)
200 МГц FSB
(двухканальная DDR400)
Pentium 4 3,40 ГГц (512-кбайт кэш L2)
Pentium 4 3,20 ГГц (512-кбайт кэш L2)
Pentium 4 3,00 ГГц (512-кбайт кэш L2)

Pentium 4 2,60 ГГц (512-кбайт кэш L2)
Pentium 4E 3,20 ГГц (1-Мбайт кэш L2)
Pentium 4E 3,00 ГГц (1-Мбайт кэш L2)
Pentium 4E 2,80 ГГц (1-Мбайт кэш L2)
133 МГц FSB
(двухканальная DDR333)
Pentium 4 3,06 ГГц (512-кбайт кэш L2)
Pentium 4 2,80 ГГц (512-кбайт кэш L2)
Pentium 4 2,66 ГГц (512-кбайт кэш L2)
Процессоры AMD (Socket A)
200 МГц FSB
(двуканальная DDR400)
Athlon XP 3200+ (2200 МГц, 512-кбайт кэш L2)
Athlon XP 3000+ (2100 МГц, 512-кбайт кэш L2)
166 МГц FSB
(двухканальная DDR333)
Athlon XP 3000+ (2166 МГц, 512-кбайт кэш L2)
Athlon XP 2800+ (2083 МГц, 512-кбайт кэш L2)
Athlon XP 2700+ (2166 МГц, 256-кбайт кэш L2)
Athlon XP 2600+ (1917 МГц, 512-кбайт кэш L2)
Athlon XP 2500+ (1833 МГц, 512-кбайт кэш L2)
Процессоры AMD (Socket 940)
200 МГц FSB
(двухканальная регистровая DDR400)
Athlon 64 FX-51 (2200 МГц, 1-Мбайт кэш L2)
Процессоры AMD (Socket 754)
200 МГц FSB
(одноканальная DDR400)
Athlon 64 3400+ (2200 МГц, 1-Мбайт кэш L2)
Athlon 64 3200+ (2200 МГц, 512-кбайт кэш L2)
Память
Платформа Intel 4x Corsiar TwinX CMX256A-3200LL (XMS32005V1.1)
256 Мбайт на DIMM
CL 2,0 - tRCD 2 - tRP 2 - tRAS 6 для 133 и 200-МГц FSB
AMD Athlon 64
512 Мбайт на DIMM
AMD Athlon 64 FX 2x Mushkin PC3200 ECC Registered High Performance
512 Мбайт на DIMM
CL 2,0 - tRCD 3 - tRP 2 - tRAS 6
AMD Athlon XP 2x Corsair TwinX CMX512-3200LL (MXS32005 V1.2)
512 MB per DIMM
CL 2.0 - tRCD 3 - tRP 2 - tRAS 6 for 166 and 200 МГц FSB
Материнские платы
Платформа Intel
(Socket 478)
Asus P4C800-E Deluxe, Rev. 1.02
Чипсет Intel 875P
BIOS: 1014
Intel 82547EI Gigabit Ethernet Controller (CSA)
Платформа AMD Athlon 64
(Socket 462)
Asus K8V Deluxe, Rev. 1.12
Чипсет VIA K8T800
BIOS: 1004
3COM/Marvell 940 Gigabit Ethernet Controller
Платформа AMD Athlon 64 FX
(Socket 940)
Asus SK8N Rev: 1.03
Чипсет nVIDIA nForce3 150
BIOS: ???
Broadcom BCM5705 Gigabit Ethernet Controller
Платформа AMD Athlon XP
(Socket A)
Asus A7N8X-E, Rev. 2.0
NVIDIA nForce2 Ultra 400 Chipset
BIOS: 1007
3COM 3C905C-TX-M PCI 100 Mbit Network Controller
Системное аппаратное обеспечение
Графическая карта Asus A9800XT/DVD, Rev. 1.01
GPU: ATI Radeon 9800XT, частота чипа 412 МГц
Память: 128 Мбайт DDR-SDRAM, частота 365 МГц
Звуковая карта Terratec Aureon 7.1 Space
Жёсткие диски
(массив RAID-0)
Maxtor 6Y080M0 Serial ATA, 80 Гбайт
80 Гбайт на пластину, 7200 об/мин, кэш 8 Мбайт
Дисковая подсистема
(платформы AMD)
Promise FastTrak S150 TX2plus (Bios: 1.00.0.30)
Контроллер SATA RAID для 32-битной PCI
Дисковая подсистема
(платформа Intel)
Intel FW82801ER ICH5R / контроллер южного моста
Встроенный контролер SATA RAID
Сетевые контроллеры См. материнские платы
Программное обеспечение
Драйвер чипсета Intel Chipset Installation Utility 5.1.1.1002
NVIDIA Platform Driver 3.13
VIA Hyperion 4in1 Ver. 4.51
Графический драйвер ATI Catalyst 4.1 (7.97 / 6.14.10.6414)
Драйверы подсистемы хранения Intel Application Accelerator RAID Edition 3.5.3
Promise FastTrak S150 TX2plus Driver Ver. 1.00.0.37
Сетевые драйверы 3COM Windows Default Network Driver
Broadcom BCM5705 Driver Build 7.35a
Intel Pro Network Driver 8.3
Версия DirectX 9.0b
ОС Windows XP Professional 5.1.2600, Service Pack 1

Программное обеспечение и тесты

Тесты и настройки
OpenGL
SPEC viewperf Version 7.1.1
1280x1024 32 Bit
Serious Sam Version 1.07
The Secound Encounter 1024 x 786 - 32 bit
Graphics API: Open GL
Preferences: Quality
no Audio
Bits per Pixel: 32 Bit
Execute Addon: 32bit_HQ++-ansio8-24z.ini
Demo: Valley fo the Jaguar
Wolfenstein Version: 2.56 (Patch V 1.02)
Enemy Territory 1024 x 786 - 32 bit
timedemo 1 / demo demo4
Geometric detail = low
Texture detail = low
DirectX 8
Comanche 4 Demo Version: 1.0.1.18
1024 x 768 - 32 bit
autio = off
Unreal Tournament 2003 Version: 2206
1024 x 768 / 32 bit / Audio = off
system/benchmark.exe
Texture Detail = Normal
Character Detail = Normal
World Detail = Highest
Physics Detail = High
all = on, Decal Stay = High
Splinter Cell Version 1.2b
1024 x 786 - 32 Bit
audio = off
2_2_1_KalinatekDemo
Shdow resolution: low
Shadow detail: low
Effects quality: low
DirectX 9a
3DMark 2003 Version 3.4.0
1024 x 786 - 32 bit
Graphics and CPU Default Benchmark
X2-The Threat Version 1.0
1024x768x32
(X8R8G8B8)
Demo - bechmark
Graphic Settings: all off
AquaMark3 Version: 3.0
1024 x 768 - 32 bit
Audio = off
Advanced Measurement
Antialiasing mode: off
Anisotropy: off
Level Detail: very low
Video
Mainconcept MPEG Encoder Version: 1.4.1
1.2 GB DV to MPEG II
(720x576, Audio) converting
Pinnacle Studio 9 Version: 9.0.0
Rendering - DVD Compatible
no Audio
Xmpeg Version: 5.0.8.84
DivX 5.1.1 Pro AMD: Otimized MMX iDCT
Intel: Otimized SEE2 iDCT
DivX 5.10 Pro
Audio: off
Psychovisual Enhancements: off
Resize: 720x576
Restore Defaults
780 kbps
feedback windows: off
Windows Media Encoder 9 Version: 9.00.00.2980
436 MB AVI File convert to WMV
Windows Media server (streaming)
Microsoft Movie Maker Version 2.0.3312.0
416 MB DV to WMV
TMPGEnc Plus Version 2.521
1.2 GB DV to MPEG I
(720x576, Audio) converting
Audio
magix mp3 maker 2004 Version 4.11 Build 19593
diamond 65 minutes/44.100 KHz wave file (688,4 MB)
Format: MP3 High Quality
Lame Version 3.95
Wave 17:14 minutes (182 MB) to mp3
32 - 320 kbit
VBR = level 3
Syntrillium Version 2.1
Cool Edit Pro Amplitude Normalizing
2.6 GB wave Audio file
Applications
Sysmark 2004 Version 1.07
Winrar Version 3.30
283 MB, 246 Files
Compression = Best
Dictionary = 4096 KB
Newtek Lightwave Version 7.5c - Build 572
Render First Frame = 1
Render Last Frame = 60
Render Frame Step = 1
Rendering Bench
"variations.lws"
Show Rendering in Progress = 320x240
Ray Trace Shadows, Reflection
Refraction, Transparency = on
Multithreading = 8 Threads
Cinema 4D XL 8 Version 8.503
Maxon Computer Rendering in 1028 x 1024, "ship_dirt"
3D Studio Max 6.0 Characters "Dragon_Charater_rig"
Discreet Pixel: 1024 x 768
Rendering Single
Mathematica 5 Version 5.0.0.0
Wolframresearch MMA 40 Test
Microsoft Version 2003 (Enterprise Architect)
Visual Studio .NET C++ Compiling "Emule 0.42b"
LIUtilities Version 1.84
WinBackup 650 MB wave file
Encryption: 256 Bit DES, Password "test"
Synthetic
PCMark 2004 Pro Version: 1.1.0
CPU and Memory Tests
SiSoftware Sandra 2004 Version 2004.10.9.89
CPU Test = MultiMedia / CPU Arithmetic
Memory Test = Bandwidth Benchmark

Казалось бы не так уж и давно вышел Pentium 4 2,8 ГГц, но неугомонная компания Intel видать настолько горда способностью своего нового процессорного ядра к постоянному «разгону», что не дает нам покоя анонсами все новых и новых процессоров:). Однако сегодняшний наш герой отличается от предыдущей топовой модели не только на 200 с небольшим мегагерц — то, о чем давно мечтали некоторые особо продвинутые пользователи, наконец-то свершилось: технология эмуляции двух процессоров на одном процессорном ядре, ранее бывшая достоянием лишь сверхдорогих Xeon, наконец-то «освобождена» и отправлена в «свободное десктопное плавание». Хотите двухпроцессорный домашний компьютер? Их есть у нас! Все последующие модели Pentium 4, начиная с рассматриваемой в этом материале, будут обладать поддержкой Hyper-Threading. Однако кто-то может вполне резонно поинтересоваться: «А зачем мне двухпроцессорная машина дома? У меня же не сервер какой-нибудь!». И действительно — зачем? Именно это мы и постарались объяснить ниже. Итак: Hyper-Threading — что это такое и зачем он может быть нужен в обычных персональных компьютерах?

SMP и Hyper-Threading: «галопом по европам»

Для начала, давайте сделаем вид, что начинаем «с чистого листа» т. е. механизмы функционирования многопроцессорных систем нам неизвестны. Мы не собираемся начинать данной статьей цикл монографий, посвященных этому вопросу:), поэтому сложных моментов, связанных, к примеру, с виртуализацией прерываний и прочими вещами, трогать не будем. Фактически, нам нужно просто представлять как работает классическая SMP(Symmetric Multi-Processor)-система с точки зрения обычной логики. Нужно это хотя бы потому, что не так уж велико количество пользователей, хорошо себе представляющих как работает SMP-система, и в каких случаях от использования двух процессоров вместо одного можно ожидать реального увеличения быстродействия, а в каких — нет. Честное слово, один из авторов этого материала как-то угробил часа полтора времени, доказывая своему, скажем так, «не бедному» другу, что Unreal Tournament у него на многопроцессорной машине будет работать ничуть не быстрее, чем на обычной:). Смешно? Уверяю вас — только со стороны. Итак, представим, что у нас есть, к примеру, два процессора (остановимся на этом, самом простом примере) вместо одного. Что это нам дает?

В общем-то… ничего. Потому что в дополнение к этому нам нужна еще и операционная система, умеющая эти два процессора задействовать. Система эта должна быть по определению многозадачной (иначе никакого смысла в наличии двух CPU просто быть не может), но кроме этого, ее ядро должно уметь распараллеливать вычисления на несколько CPU. Классическим примером многозадачной ОС, которая этого делать не умеет, являются все ОС от Microsoft, называемые обычно для краткости «Windows 9x» — 95, 95OSR2, 98, 98SE, Me. Они просто-напросто не могут определить наличие более чем одного процессора в системе… ну и, собственно, дальше объяснять уже нечего:). Поддержкой SMP обладают ОС этого же производителя, построенные на ядре NT: Windows NT 4, Windows 2000, Windows XP. Также в силу своих корней, этой поддержкой обладают все ОС, основанные на идеологии Unix — всевозможные Free- Net- BSD, коммерческие Unix (такие как Solaris, HP-UX, AIX), и многочисленные разновидности Linux. Да, к слову — MS DOS многопроцессорность в общем случае тоже «не понимает»:).

Если же два процессора все же определились системой, то дальнейший механизм их задействования в общем-то (на «логическом», подчеркнем, уровне!) довольно-таки прост. Если в данный момент времени исполняется одно приложение — то все ресурсы одного процессора будут отданы ему, второй же будет просто простаивать. Если приложений стало два — второе будет отдано на исполнение второму CPU, так что по идее скорость выполнения первого уменьшиться не должна вообще никак. Это в примитиве. Однако на самом деле все сложнее. Для начала: исполняемое пользовательское приложение у нас может быть запущено всего одно, но количество процессов (т. е. фрагментов машинного кода, предназначенных для выполнения некой задачи) в многозадачной ОС всегда намного больше. Начнем с того, что сама ОС — это тоже приложение… ну и не будем углубляться — логика понятна. Поэтому на самом деле второй CPU способен немного «помочь» даже одиночной задаче, взяв на себя обслуживание процессов, порожденных операционной системой. Опять-таки, к слову об упрощениях — именно так, идеально, разделить CPU между пользовательским приложением и ОС, конечно, все равно не получится, но, по крайней мере, процессор, занятый исполнением «полезной» задачи, будет меньше отвлекаться.

Кроме того, даже одно приложение может порождать потоки (threads), которые при наличии нескольких CPU могут исполняться на них по отдельности. Так, например, поступают почти все программы рендеринга — они специально писались с учетом возможности работы на многопроцессорных системах. Поэтому в случае использования потоков выигрыш от SMP иногда довольно весо м даже в «однозадачной» ситуации. По сути, поток отличается от процесса только двумя вещами — он во-первых никогда не порождается пользователем (процесс может запустить как система, так и человек, в последнем случае процесс = приложение; появление потока инициируется исключительно запущенным процессом), и во-вторых — поток умирает вместе с родительским процессом независимо от своего желания — к примеру, если родительский процесс «глюкнул и упал» — все порожденные им потоки ОС считает бесхозными и «прибивает» уже сама, автоматически.

Также не стоит забывать, что в классической SMP-системе оба процессора работают каждый со своим кэшем и набором регистров, но память у них общая. Поэтому если две задачи одновременно работают с ОЗУ, мешать они друг другу будут все равно, даже если CPU у каждой «свой собственный». Ну и наконец последнее: в реальности мы имеем дело не с одним, не с двумя, и даже не с тремя процессами. На приведенном коллаже (это действительно коллаж, потому что со скриншота Task Manager были удалены все пользовательские процессы, т. е. приложения, запускаемые «для работы») хорошо видно, что «голая» Windows XP, сама по себе, не запустив еще ни одного приложения, уже породила 12 процессов, причем многие из них к тому же еще и многопоточные, и общее количество потоков достигает двухсот восьми штук (!!!).

Поэтому рассчитывать на то, что нам удастся прийти к схеме «по собственному CPU на каждую задачу» совершенно не приходится, и переключаться между фрагментами кода процессоры будут все равно — и физические, и виртуальные, и будь они хоть виртуальные в квадрате и по 10 штук на каждое физическое ядро:). Впрочем, на самом деле все не так грустно — при грамотно написанном коде ничего в данный момент не делающий процесс (или поток) процессорного времени практически не занимает (это тоже видно на коллаже).

Теперь, разобравшись с «физической» многопроцессорностью, перейдем к Hyper-Threading. Фактически — это тоже многопроцессорность, только… виртуальная. Ибо процессор Pentium 4 на самом деле один — вот он, стоит в сокете, сверху кулер пришлепнут:). Второго сокета — нет. А процессоров ОС видит — два. Как это? В общем-то, очень просто. Смотрим на рисунок.

Здесь нам придется все-таки немного углубиться в технические детали, потому что иначе, увы, что-либо объяснить не получится. Впрочем, те, кому оные детали неинтересны, могут данный абзац просто пропустить. Итак, классическому «одноядерному» процессору в нашем случае добавили еще один блок AS — IA-32 Architectural State. Architectural State содержит состояние регистров (общего назначения, управляющих, APIC, служебных). Фактически, AS#1 плюс единственное физическое ядро (блоки предсказания ветвлений, ALU, FPU, SIMD-блоки и пр.) представляет из себя один логический процессор (LP1), а AS#2 плюс все то же физическое ядро — второй логический процессор (LP2). У каждого LP есть свой собственный контроллер прерываний (APIC — Advanced Programmable Interrupt Controller) и набор регистров. Для корректного использования регистров двумя LP существует специальная таблица — RAT (Register Alias Table), согласно данным в которой можно установить соответствие между регистрами общего назначения физического CPU. RAT у каждого LP своя. В результате мы получили схему, при которой на одном и том же ядре могут свободно выполняться два независимых фрагмента кода т. е. де-факто — многопроцессорную систему!

Hyper-Threading: совместимость

Кроме того, возвращаясь к вещам практическим и приземленным, хотелось бы затронуть еще один немаловажный аспект: не все ОС, даже поддерживающие многопроцессорность, могут работать с таким CPU как с двумя . Связано это с таким «тонким» моментом, как изначальное определение количества процессоров при инициализации операционной системы. Intel прямо говорит, что ОС без поддержки ACPI второй логический процессор увидеть не смогут. Кроме того, BIOS системной платы также должен уметь определять наличие процессора с поддержкой Hyper-Threading и соответствующим образом «рапортовать» системе. Фактически, применительно, к примеру, к Windows, это означает, что «в пролете» у нас оказывается не только линейка Windows 9x, но и Windows NT — последняя ввиду отсутствия поддержки ACPI не сможет работать с одним новым Pentium 4 как с двумя. А вот что приятно — это то, что несмотря на заблокированную возможность работы с двумя физическими процессорами, с двумя логическими, получаемыми с помощью Hyper-Threading, сможет работать Windows XP Home Edition. А Windows XP Professional, кстати, несмотря на ограничение количества физических процессоров до двух, при двух установленных CPU с поддержкой Hyper-Threading честно «видит» четыре:).

Теперь немного о «железе». То, что новые CPU с частотой более 3 ГГц могут потребовать замены системной платы, знают, наверное, уже все — земля (а точнее — Internet) слухами полнится уже давно. К сожалению, это на самом деле так. Даже при номинальном сохранении все того же процессорного разъема Socket 478 Intel не удалось оставить в неприкосновенности потребляемую мощность и тепловыделение новых процессоров — потребляют они больше, и греются, соответственно, тоже. Можно предположить (хоть это и не подтверждено официально), что увеличение потребления по току связано не только с ростом частоты, но и с тем, что из-за ожидаемого использования «виртуальной многопроцессорности» нагрузка на ядро в среднем вырастет, следовательно, возрастет и средняя потребляемая мощность. «Старые» системные платы в некоторых случаях могут быть совместимы с новыми CPU — но только если делались «с запасом». Грубо говоря, те производители, которые делали свои PCB в соответствии с рекомендациями самой Intel относительно потребляемой Pentium 4 мощности, оказались в проигрыше по отношению к тем, кто немного «перестраховался», поставив на плату VRM с запасом и соответствующим образом ее разведя. Но и это еще не все. Кроме ОС, BIOS и электроники платы, с технологией Hyper-Threading должен быть совместим еще и чипсет . Поэтому счастливыми обладателями двух процессоров по цене одного:) смогут стать только те, чья системная плата основана на одном из новых чипсетов с поддержкой 533 МГц FSB: i850E, i845E, i845PE/GE. Несколько особняком стоит i845G — первая ревизия этого набора микросхем Hyper-Threading не поддерживает , более поздняя — уже совместима.

Ну, вот, вроде бы с теорией и совместимостью разобрались. Но не будем спешить. ОК, у нас есть два «логических» процессора, у нас есть Hyper-Threading, вау! — это круто. Но как уже было сказано выше, физически у нас процессор как был один, так и остался. Зачем же тогда нужна такая сложная «эмуляционная» технология, отбрасывая то, что можно горделиво демонстрировать Task Manager с графиками загруженности двух CPU друзьям и знакомым?

Hyper-Threading: зачем она нужна?

Против обыкновения, в этой статье мы немного больше чем обычно уделим внимания рассуждениям т. е. не технической прозе (где все в общем-то довольно однозначно трактуется и на основании одних и тех же результатов совершенно независимые люди чаще всего делают тем не менее весьма похожие выводы), а «технической лирике» — т. е. попытке понять, что же такое нам предлагает Intel и как к этому следует относиться. Я уже неоднократно писал в «Колонке редактора» на нашем сайте, и повторю здесь, что эта компания, если внимательно посмотреть, никогда не отличалась абсолютным совершенством своих продуктов, более того — вариации на те же темы от других производителей подчас получались гораздо более интересными и концептуально стройными. Однако, как оказалось, абсолютно все делать совершенным и не нужно — главное чтобы чип олицетворял собой какую-то идею, и идея эта приходилась очень вовремя и к месту. И еще — чтобы ее просто не было у других.

Так было с Pentium, когда Intel противопоставила весьма шустрому в «целочисленке» AMD Am5x86 мощный FPU. Так было с Pentium II, который получил толстую шину и быстрый кэш второго уровня, благодаря чему за ним так и не смогли угнаться все процессоры Socket 7. Так было (ну, по крайней мере, я считаю это свершившимся фактом) и с Pentium 4, который противопоставил всем остальным наличие поддержки SSE2 и быстрый рост частоты — и тоже де-факто выиграл. Сейчас Intel предлагает нам Hyper-Threading. И мы отнюдь не призываем в священной истерике биться лбом о стенку и кричать «господи помилуй», «аллах велик» или «Intel rulez forever». Нет, мы просто предлагаем задуматься — почему производитель, известный грамотностью своих инженеров (ни слова про маркетологов! :)) и громадными суммами, которые он тратит на исследования, предлагает нам эту технологию.

Объявить Hyper-Threading «очередной маркетинговой штучкой», конечно, проще простого. Однако не стоит забывать, что это технология , она требует исследований, денег на разработку, времени, сил… Не проще ли было нанять за меньшую сумму еще одну сотню PR-менеджеров или сделать еще десяток красивых рекламных роликов? Видимо, не проще. А значит, «что-то в этом есть». Вот мы сейчас и попытаемся понять даже не то, что получилось в результате, а то, чем руководствовались разработчики IAG (Intel Architecture Group), когда принимали решение (а такое решение наверняка принималось!) — разрабатывать «эту интересную мысль» дальше, или отложить в сундук для идей забавных, но бесполезных.

Как ни странно, для того чтобы понять как функционирует Hyper-Threading, вполне достаточно понимать как работает… любая многозадачная операционная система. И действительно — ну ведь исполняет же каким-то образом один процессор сразу десятки задач? Этот «секрет» всем уже давно известен — на самом деле одновременно все равно выполняется только одна (на однопроцессорной системе), просто переключение между кусками кода разных задач выполняется настолько быстро, что создается иллюзия одновременной работы большого количества приложений.

По сути, Hyper-Threading предлагает нам то же самое, но реализована аппаратно, внутри самого CPU. Есть некоторое количество различных исполняющих блоков (ALU, MMU, FPU, SIMD), и есть два «одновременно» исполняемых фрагмента кода. Специальный блок отслеживает, какие команды из каждого фрагмента необходимо выполнить в данный момент, после чего проверяет, загружены ли работой все исполняющие блоки процессора. Если один из них простаивает, и именно он может исполнить эту команду — ему она и передается. Естественно, существует и механизм принудительного «посыла» команды на выполнение — в противном случае один процесс мог бы захватить весь процессор (все исполняющие блоки) и исполнение второго участка кода (исполняемого на втором «виртуальном CPU») было бы прервано. Насколько мы поняли, данный механизм (пока?) не является интеллектуальным т. е. не способен оперировать различными приоритетами, а просто чередует команды из двух разных цепочек в порядке живой очереди т. е. просто по принципу «я твою команду исполнил — теперь уступи место другому потоку». Если, конечно, не возникает ситуации, когда команды одной цепочки по исполняющим блокам нигде не конкурируют с командами другой. В этом случае мы получаем действительно на 100% параллельное исполнение двух фрагментов кода.

Теперь давайте подумаем, чем Hyper-Threading потенциально хороша, и чем — нет. Самое очевидное следствие ее применения — повышение коэффициента полезного действия процессора. Действительно — если одна из программ использует в основном целочисленную арифметику, а вторая — выполняет вычисления с плавающей точкой, то во время исполнения первой FPU просто ничего не делает, а во время исполнения второй — наоборот, ничего не делает ALU. Казалось бы, на этом можно закончить. Однако мы рассмотрели лишь идеальный (с точки зрения применения Hyper-Threading) вариант. Давайте теперь рассмотрим другой: обе программы задействуют одни и те же блоки процессора. Понятно, что ускорить выполнение в данном случае довольно сложно — ибо физическое количество исполняющих блоков от «виртуализации» не изменилось. А вот не замедлится ли оно? Давайте разберемся. В случае с процессором без Hyper-Threading мы имеем просто «честное» поочередное выполнение двух программ на одном ядре с арбитром в виде операционной системы (которая сама представляет собой еще одну программу), и общее время их работы определяется:

  1. временем выполнения кода программы №1
  2. временем выполнения кода программы №2
  3. временными издержками на переключение между фрагментами кода программ №1 и №2

Что мы имеем в случае с Hyper-Threading? Схема становится немного другой:

  1. время выполнения программы №1 на процессоре №1 (виртуальном)
  2. время выполнения программы №2 на процессоре №2 (виртуальном)
  3. время на переключение одного физического ядра (как набора требуемых обеим программам исполняющих блоков) между двумя эмулируемыми «виртуальными CPU»

Остается признать, что и тут Intel поступает вполне логично : конкурируют между собой по быстродействию у нас только пункты за номером три, и если в первом случае действие выполняется программно-аппаратно (ОС управляет переключением между потоками, задействуя для этого функции процессора), то во втором случае мы фактически имеем полностью аппаратное решение — процессор все делает сам. Теоретически, аппаратное решение всегда оказывается быстрее. Подчеркнем — теоретически. Практикум у нас еще впереди.

Но и это еще не все. Также одним из серьезнейших… нет, не недостатков, а скорее, неприятных моментов является то, что команды, увы, не исполняются в безвоздушном пространстве, но вместо этого Pentium 4 приходится иметь дело с классическим x86-кодом, в котором активно используется прямое адресование ячеек и даже целых массивов, находящихся за пределами процессора — в ОЗУ. Да и вообще, к слову, большинство обрабатываемых данных чаще всего находится там:). Поэтому «драться» между собой наши виртуальные CPU будут не только за регистры, но и за общую для обоих процессорную шину, минуя которую данные в CPU попасть просто не могут. Однако тут есть один тонкий момент: на сегодняшний день «честные» двухпроцессорные системы на Pentium III и Xeon находятся в точно такой же ситуации ! Ибо наша старая добрая шина AGTL+, доставшаяся в наследство всем сегодняшним процессорам Intel от знаменитого Pentium Pro (в дальнейшем ее лишь подвергали модификациям, но идеологию практически не трогали) — ВСЕГДА ОДНА, сколько бы CPU ни было установлено в системе. Вот такой вот «процессорный коаксиал»:). Отойти от этой схемы на x86 попробовала только AMD со своим Athlon MP — у AMD 760MP/760MPX от каждого процессора к северному мосту чипсета идет отдельная шина. Впрочем, даже в таком «продвинутом» варианте мы все равно убегаем от проблем не очень далеко — ибо уж что-что, а шина памяти у нас точно одна — причем вот в этом случае уже везде (напоминаем, разговор идет про x86-системы).

Однако нет худа без добра, и даже из этого в общем-то не очень приятного момента Hyper-Threading может помочь извлечь какую-то пользу. Дело в том, что по идее мы должны будем наблюдать существенный прирост производительности не только в случае с несколькими задачами, использующими разные функциональные блоки процессора, но и в том случае, если задачи по-разному работают с данными, находящимися в ОЗУ. Возвращаясь к старому примеру в новом качестве — если одно приложение у нас что-то усиленно считает «внутри себя», другое же — постоянно подкачивает данные из ОЗУ, то общее время выполнения их в случае использования Hyper-Threading по идее должно уменьшиться даже если они используют одинаковые блоки исполнения инструкций — хотя бы потому, что команды на чтение данных из памяти смогут обрабатываться в то время, пока наше первое приложение будет что-то усиленно считать.

Итак, подведем итог: технология Hyper-Threading с теоретической точки зрения выглядит весьма неплохо и, мы бы сказали, «адекватно», т. е. соответствует реалиям сегодняшнего дня. Уже довольно редко можно застать пользователя с одним сиротливо открытым окном на экране — всем хочется одновременно и музыку слушать, и по Internet бродить, и диски с любимыми MP3 записывать, а может даже, и поиграть на этом фоне в какую-нибудь стрелялку или стратегию, которые, как известно, процессор «любят» ну просто со страшной силой:). С другой стороны, общеизвестно, что конкретная реализация способна иногда своей «кривизной» убить любую самую превосходную идею, и с этим мы тоже не раз встречались на практике. Поэтому закончив с теорией, перейдем к практике — тестам. Они-то и должны нам помочь ответить на второй главный вопрос: так ли хороша Hyper-Threading сейчас — и уже не в качестве идеи, а в качестве конкретной реализации этой идеи «в кремнии». Тестирование

Тестовый стенд:

  • Процессор: Intel Pentium 4 3,06 ГГц с поддержкой технологии Hyper-Threading, Socket 478
  • Материнская плата: Gigabyte 8PE667 Ultra (версия BIOS F3) на чипсете i845PE
  • Память: 512 МБ PC2700(DDR333) DDR SDRAM DIMM Samsung, CL 2
  • Видеокарта: Palit Daytona GeForce4 Ti 4600
  • Жесткий диск: IBM IC35L040AVER07-0, 7200 об/мин

Программное обеспечение:

  • OC и драйверы:
    • Windows XP Professional SP1
    • DirectX 8.1b
    • Intel Chipset Software Installation Utility 4.04.1007
    • Intel Application Accelerator 2.2.2
    • Audiodrivers 3.32
    • NVIDIA Detonator XP 40.72 (VSync=Off)
  • Тестовые приложения:
    • (с поддержкой мультипроцессорности и технологии Hyper-Threading)
    • RazorLame 1.1.5.1342 + Lame codec 3.92
    • VirtualDub 1.4.10 + DivX codec 5.02 Pro
    • WinAce 2.2
    • Discreet 3ds max 4.26
    • BAPCo & MadOnion SYSmark 2002
    • MadOnion 3DMark 2001 SE build 330
    • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
    • Croteam/GodGames Serious Sam: The Second Encounter v1.07

Вопреки обычаю, мы не будем сегодня тестировать производительность нового Pentium 4 3,06 ГГц в сопоставлении с предыдущими моделями или же с процессорами-конкурентами. Ибо это по большому счету бессмысленно. Тесты, составляющие нашу методику, не менялись уже довольно продолжительный период времени, и желающие провести необходимые сопоставления могут воспользоваться данными из предыдущих материалов , мы же сосредоточимся на основном моменте, не распыляясь на детали. А основным в этом материале, как, наверное, нетрудно догадаться, является исследование технологии Hyper-Threading и ее влияния на производительность… на производительность чего ? Не столь уж и праздный вопрос, как оказывается. Впрочем, не будем забегать вперед. Начнем с традиционных тестов, через которые мы плавно подойдем (в контексте данного материала) к основным.

Кодирование WAV в MP3 (Lame)
Кодирование VideoCD в MPEG4 (DivX)
Архивация с помощью WinAce с 4-мегабайтным словарем

Хоть сколько-нибудь явного преимущества Hyper-Threading не продемонстрировала, но надо сказать, что мы и шансов-то особых данной технологии не дали — почти все приложения «однопроцессорные», одновременно исполняемых потоков не порождают (проверено!), и, стало быть, в этих случаях мы имеем дело с обычным Pentium 4, которому чуть-чуть подняли частоту. Говорить о каких-то тенденциях на фоне таких мизерных расхождений вряд ли уместно… хотя если все же высасывать их из пальца, то они даже немного в пользу Hyper-Threading.

3ds max 4.26

Классический тест, но в то же самое время — первое из приложений в этом обзоре, которое в явном виде поддерживает многопроцессорность. Конечно, колоссальным преимущество системы с включенной поддержкой Hyper-Threading не назовешь (оно составляет порядка 3%), однако не будем забывать, что в данном случае Hyper-Threading работала далеко не в самой лучшей для себя ситуации: 3ds max реализует поддержку SMP за счет порождения потоков , причем все они используются для одной и той же цели (рендеринг сцены) и, стало быть, содержат примерно одинаковые команды, а потому и работают тоже одинаково (по одной схеме). Мы уже писали, что Hyper-Threading лучше подходит для того случая, когда параллельно исполняются разные программы, задействующие разные блоки CPU. Тем более приятно, что даже в такой ситуации технология смогла «на ровном месте» обеспечить пусть и небольшой, но прирост быстродействия. Ходят слухи, что 3ds max 5.0 дает больший выигрыш при задействовании Hyper-Threading, и учитывая рвение, с которым Intel «проталкивает» свои технологии в области ведения производителей ПО, это как минимум следует проверить. Несомненно, так мы и сделаем, но уже в более поздних материалах на эту тему.

3DMark 2001SE

Результаты в общем-то вполне закономерные, и вряд ли могут вызвать у кого-то удивление. Быть может, лучше все-таки использовать бенчмарки для 3D именно для того, для чего они предназначены — тестирования скорости видеокарт, а не процессоров? Наверное, так оно и есть. Впрочем, результаты, как известно, лишними не бывают. Несколько настораживает чуть меньший балл у системы с задействованной Hyper-Threading. Впрочем, учитывая что разница составляет около 1%, мы бы не делали из этого далеко идущих выводов.

Return to Castle Wolfenstein,
Serious Sam: The Second Encounter

Примерно аналогичная ситуация. Впрочем, мы еще не подобрались даже близко к тестам, способным хоть как-то продемонстрировать плюсы (или минусы) Hyper-Threading. Иногда (на неощутимо малую величину) задействование «псевдо-многопроцессорности» дает отрицательный результат. Однако это не те сенсации, которых мы ждем, не так ли? :) Не слишком помогает даже тестирование со звуком, который, по идее, должен обсчитываться отдельным потоком и потому давать шанс проявить себя второму логическому процессору.

SYSmark 2002 (Office Productivity и Internet Content Creation)

А вот теперь так и хочется во весь голос крикнуть: «Ну, кто сомневался в том, что Hyper-Threading реально способна повысить быстродействие на реальных задачах?!». Результат: +16—20% — действительно ошеломляет. Причем что самое интересное — ведь SYSmark пытается эмулировать именно ту схему работы, которую Intel считает самой «удачной» для технологии Hyper-Threading — запуск различных приложений и одновременная работа с ними. Причем в процессе исполнения своего скрипта, SYSmark 2002 поступает вполне грамотно с точки зрения имитации работы пользователя, «отправляя в background» некоторые приложения, которые уже получили свое «долгосрочное задание». Так, например, кодирование видео происходит на фоне исполнения прочих приложений из скрипта Internet Content Creation, а в офисном подтесте действует вездесущее антивирусное ПО и декодирование речи в текст с помощью Dragon Naturally Speaking. По сути — первый тест, в котором созданы более или менее «вольготные» условия для технологии Hyper-Threading, и она тут же показала себя с наилучшей стороны! Впрочем, мы решили не полагаться во всем на тесты, написанные не нами, и провели «для закрепления эффекта» несколько показательных собственных экспериментов. Экспериментируем с Hyper-Threading

Одновременное выполнение рендеринга в 3ds max и архивирования в WinAce

Вначале на фоне заведомо более длительного процесса архивирования была отрендерена стандартная тестовая сцена в 3ds max. Затем на фоне рендеринга специально растянутой сцены было выполнено стандартное тестовое архивирование файла в WinAce. Результат сравнивался со временем окончания последовательного выполнения тех же самых стандартных тестов. К полученным цифрам применялись два корректирующих коэффициента: для выравнивания времени исполнения заданий (мы полагаем, что эффект ускорения от параллельного выполнения двух приложений может быть корректно подсчитан только при условии одинаковой продолжительности выполняемых заданий) и для «снятия» эффекта от неравномерности выделяемых процессорных ресурсов для foreground-/background-приложений. В итоге мы «насчитали» положительный эффект ускорения на 17% от использования технологии Hyper-Threading.

Итак, впечатляющие результаты SYSmark получили подтверждение в тесте с соседством двух реальных программ. Конечно же, ускорение не двукратное, да и тесты в пару мы выбирали сами, исходя из наиболее благоприятной, по нашему мнению, ситуации для задействования Hyper-Threading. Но давайте задумаемся над этими результатами вот в каком разрезе: процессор, производительность которого мы сейчас исследуем — в общем-то, за исключением поддержки Hyper-Threading — просто давно привычный Pentium 4. Фактически, столбик «без Hyper-Threading» — это то, что мы могли бы видеть если бы эту технологию не стали переводить в десктопы . Несколько другое чувство сразу же возникает, правда? Давайте все-таки не будем жаловаться (по отечественной традиции) на то, что «все не так хорошо, как могло бы быть», а просто подумаем о том, что нам вместе с новым процессором дали еще один способ ускорить выполнение некоторых операций.

Фоновое архивирование в WinAce + проигрывание фильма
Рендеринг в 3ds max + фоновое проигрывание музыки

Методика выполнения теста совершенно тривиальна: в пару к просмотру фильма, сжатого предварительно в формат MPEG4 при помощи кодека DivX, фоном запускалось архивирование в WinAce (разумеется, в случае пропуска кадров и подтормаживания при просмотре, данный тест не имел бы практического смысла, но нареканий на качество просмотра не было). Аналогично, во время рендеринга обычной тестовой сцены в 3ds max фоном проигрывалась (через WinAmp) музыка из файла формата MP3 (и отслеживались не замеченные ни разу в итоге «заикания» звука). Обратите внимание на естественное распределение ролей «главное-фоновое» в каждой паре приложений. В качестве результата, как обычно, бралось время архивации и полного рендеринга сцены соответственно. Эффект от Hyper-Threading в цифрах: +13% и +8%.

Достаточно реальная ситуация, именно такие мы и старались воспроизвести. Вообще (и об этом будет сказано далее) Hyper-Threading не настолько очевидна, как кажется. Простой подход «в лоб» («у нас в ОС видны два процессора — давайте относиться к ним как к двум процессорам») не дает ощутимого эффекта, и возникает даже некоторое чувство обманутости. Однако, возвращаясь к вышесказанному, попробуем оценивать результаты с несколько других позиций: задачи, которые в обычной ситуации исполняются за одно время, в случае задействования Hyper-Threading, выполняются за меньшее время . Кто попробует возразить, что «нечто» хуже, чем «ничто»? В этом-то вся и суть — отнюдь не панацею нам предлагают, а «всего лишь» средство ускорить уже имеющееся процессорное ядро, кардинальных изменений не претерпевшее. Получается? Да. Ну и какие, по большому счету, могут быть еще вопросы? Конечно, до обещанных в пресс-релизе 30% в большинстве случаев оказывается далеко, однако не стоит делать вид, что в жизни случается, сопоставив пресс-релиз компании X с пресс-релизом компании Y, убедиться, что в первом обещаний меньше и они более «сбыточные». :)

Тестирование в CPU RightMark 2002B

Новая версия CPU RM поддерживает многопоточность (соответственно, и Hyper-Threading), и, естественно, мы не могли не воспользоваться возможностью протестировать новый процессор с помощью этого бенчмарка. Оговоримся, что пока это только первый «выход» CPU RM в тестах многопроцессорных систем, поэтому можно сказать что исследование было «обоюдосторонним» — мы тестировали Hyper-Threading как частный случай SMP на системе с Pentium 4 3,06 ГГц, а эта система, в свою очередь, тестировала наш бенчмарк:) на предмет валидности результатов, и, соответственно, правильной реализации в нем поддержки мультипоточности. Без преувеличения скажем, что результатами остались довольны обе стороны:). Несмотря на то, что пока CPU RM все еще «не полностью многопроцессорный» (несколько потоков создаются только в блоке рендеринга, Math Solving блок остается однопоточным), полученные нами результаты явственно свидетельсвуют о том, что поддержка SMP и Hyper-Threading присутствует, и польза от их наличия видна невооруженным глазом. Кстати, реализация многопоточности в блоке «решателя» в общем-то задача намного менее тривиальная, чем в блоке рендеринга, поэтому если у кого-то из читателей будут некие идеи по этому поводу — мы ждем ваших комментариев, идей, и предложений. Напоминаем, что проект CPU RightMark — это бенчмарк с открытыми исходными текстами, так что интересующиеся программированием могут не только воспользоваться им, но и вносить предложения по поводу усовершенствования кода.

Перед тем как перейти к диаграммам, остановимся поподробнее на методике. По подписям столбцов, легко заметить, что тестировалась производительность системы в целых двенадцати (!) вариантах. Однако ничего страшного в этом нет, и разобраться достаточно просто. Итак, изменяемыми были следующие факторы:

  1. Тесты проводились со включенной Hyper-Threading и с отключенной.
  2. Использовались установки CPU RM для количества создаваемых потоков: один, два, и четыре.
  3. Использовались установки CPU RM для используемого типа инструкций в расчетном модуле: SSE2 и «классические» x87 FPU.

Объясним последнее. Казалось бы, отказываться от использования SSE2 на Pentium 4 — полный, извините, бред (о чем мы уже неоднократно писали раньше). Однако в данном случае чисто теоретически это было неплохим шансом проверить функционирование и результативность технологии Hyper-Threading. Дело в том, что инструкции FPU использовались только в расчетном модуле , в модуле же рендеринга по-прежнему оставалась включенной поддержка SSE. Таким образом, те, кто внимательно читал теоретическую часть, наверняка уже поняли «где собака зарыта» — мы принудительно заставили разные части бенчмарка использовать разные вычислительные блоки CPU ! По идее, в случае принудительного отказа от SSE2, Math Solving блок CPU RM должен был оставлять «нетронутым» блоки исполнения SSE/SSE2 инструкций, что давало возможность на полную катушку воспользоваться ими блоку рендеринга того же CPU RM. Вот теперь самое время перейти к результатам, и посмотреть насколько правильными оказались наши предположения. Также заметим, что с целью увеличения валидности и стабильности результатов, была изменена еще одна установка: количество фреймов (по умолчанию — 300) было увеличено до 2000.

Тут, собственно, комментировать практически нечего. Как мы уже говорили выше, блок «решателя» (Math Solving) остался нетронутым, поэтому на его производительность Hyper-Threading не оказывает никакого влияния. Однако в то же время отрадно… что не вредит! Ведь мы уже знаем, что теоретически возникновение ситуаций когда «виртуальная многопроцессорность» может мешать работе программ — возможно. Однако один факт советуем крепко запомнить: посмотрите, как сильно влияет на производительность блока «решателя» отказ от использования SSE2! Мы еще вернемся к этой теме чуть позже, и в весьма неожиданном ключе…

И вот — долгожданный триумф. Легко заметить, что как только количество потоков в блоке рендеринга становится больше одного (в последнем случае использовать возможности Hyper-Threading, мягко говоря, трудновато:) — сразу же это обеспечивает данной конфигурации одно из первых мест. Также заметно, что именно два потока являются оптимальными для систем с Hyper-Threading. Правда, быть может, кто-то вспомнит скриншот Task Manager, которым мы «стращали» вас выше, поэтому сделаем оговорку — два активно работающих потока. В общем-то, это очевидно и вполне логично — раз у нас два виртуальных CPU, то наиболее правильно создать ситуацию, когда и потоков тоже будет два. Четыре — уже «перебор», потому что за каждый из виртуальных CPU начинают «драться» по несколько потоков. Однако даже в этом случае системе со включенной Hyper-Threading удалось обогнать «однопроцессорного» конкурента.

Об удачах всегда принято говорить подробно и со вкусом, и естественно, еще подробнее и вкуснее о них говорить когда они — твои собственные. Констатируем, что «эксперимент с переходом на инструкции FPU» также безусловно удался. Казалось бы, отказ от SSE2 должен был сильнейшим образом ударить по производительности (быстренько вспоминаем разгромные результаты Math Solving Speed с применением инструкций FPU на первой диаграмме этого раздела). Однако что мы видим! — во второй строчке, на самом верху, среди чемпионов — именно такая конфигурация! Причины опять-таки понятны, и это очень радует, потому что их понятность позволяет сделать вывод о предсказуемости поведения систем с поддержкой технологии Hyper-Threading. «Минусовый» результат блока Math Solving на системе с включенной Hyper-Threading «компенсировал» своим вкладом в общую производительность блок рендеринга, которому полностью отдали на откуп исполняющие блоки SSE/SSE2. Причем компенсировал настолько хорошо, что по результатам такая система оказалась в первых рядах. Остается пожалуй только еще раз повторить то, о чем неоднократно шла речь выше: в полную силу возможности Hyper-Threading проявляются в тех ситуациях, когда активно работающие программы (или потоки) используют разные исполняющие блоки CPU. В данной ситуации эта особенность проявилась особенно сильно, поскольку мы имели дело с хорошо, тщательно оптимизированным кодом CPU RM. Однако главный вывод состоит в том, что в принципе Hyper-Threading работает — значит, будет работать и в других программах. Естественно, тем лучше, чем больше их разработчики будут уделять времени оптимизации кода.

Выводы

…В очередной раз, к радости всего прогрессивного человечества, Intel выпустила новый Pentium 4, производительность которого еще выше чем у предыдущего Pentium 4, но это еще не предел, и скоро мы увидим еще более быстрый Pentium 4… М-да… Не то что бы это неправда — действительно, так и есть. Однако мы уже договорились, что не будем рассматривать в данной статье производительность вышеуказанного Pentium 4 3,06 ГГц в связке с другими процессорами по той самой причине, что… см. выше по тексту. Нас, видите ли, интересует Hyper-Threading. Вот такие мы привередливые — не важны нам предсказуемые результаты повышения еще на 200 МГц частоты работы давно знакомого и предсказуемого процессорного ядра, подавай нам «свежатинку», ранее не рассматриваемую. И как уже наверное догадались прозорливые читатели, выводы наши будут посвящены опять-таки этой самой навязшей в зубах технологии и всему что с ней связано. Почему? Наверное, потому, что все остальное вы отлично знаете сами..

И раз уж речь идет о Hyper-Threading, давайте для начала определим для себя главное: как к ней относиться? Что она из себя представляет? Не претендуя на истину в последней инстанции, сформулируем общее мнение, которое возникло у нас на основании результатов тестов: Hyper-Threading — это не SMP . «Ага!!!» — закричат поклонники альтернативы. «Мы так и знали!!!» — завопят они что есть мочи. «Hyper-Threading — это нечестный SMP!!!» — крики сии еще долго будут разноситься по бескрайним просторам Рунета… Мы же, как умудренные саксаулами аксакалы (или наоборот? :), возразим: «Ребята, а кто, собственно, обещал?». Кто произнес эту крамольную аббревиатуру? SMP, напомним — это Symmetric Multi-Processing, сиречь многопроцессорная архитектура. А у нас, пардон, процессор всего один . Да, он снабжен некой, простонародно выражаясь, «фичей», которая позволяет делать вид, что вроде бы оных процессоров два. Однако делает ли кто-то секрет из того, что на самом деле это не так? Вроде бы этого мы не заметили… Стало быть, мы имеем дело именно с «фичей», и не более того. И относиться к ней стоит именно таким образом, и никак иначе. Поэтому давайте не будем ниспровергать никем не возводимых идолов, и спокойно подумаем, имеет ли данная фича какой-то смысл.

Результаты тестов свидетельствуют, что в некоторых случаях — имеет. Фактически, то, о чем мы чисто теоретически рассуждали в первой части статьи, нашло свое практическое подтверждение — технология Hyper-Threading позволяет увеличить коэффициент полезного действия процессора в определенных ситуациях. В частности — в ситуациях, когда одновременно исполняются разнородные по характеру приложения. Зададим сами себе вопрос: «Это — плюс?». Наш ответ: «Да, это — плюс». Является ли он всеобъемлющим и глобальным? Похоже, что нет — ибо эффект от Hyper-Threading наблюдается исключительно в некоторых случаях. Однако так ли это важно если мы рассматриваем технологию в целом? Понятно, что появление CPU, способного в два раза быстрее делать все то, что делалось ранее — это громадный прорыв. Однако как говорили еще древние китайцы «упаси нас Господи жить в эпоху перемен». Intel не стал инициировать начало такой эпохи, просто добавив своему процессору возможность кое-что делать быстрее. Классический западный принцип, не очень хорошо воспринимаемый в нашем «шаролюбивом» обществе: «Вы можете получить нечто получше, если заплатите несколько больше».

Возвращаясь к практике: Hyper-Threading нельзя назвать «бумажной» технологией, ибо при определенных комбинациях она дает вполне ощутимый эффект. Добавим — даже намного больший эффект, чем иногда наблюдается при сравнении, к примеру, двух платформ с одним процессором на разных чипсетах. Однако следует четко понимать, что эффект этот наблюдается не всегда, и существенно зависит от… наверное, самым приемлемым термином будет «стиль». От стиля работы пользователя с компьютером. Причем именно здесь проявляется то, о чем мы сказали в самом начале: Hyper-Threading — это не SMP . «Классический SMP-стиль», где пользователь рассчитывает на реакцию столь же классической «честной» многопроцессорной системы, здесь не даст желаемого результата.

«Стиль Hyper-Threading» — это сочетание процессов, не побоимся этого слова, «развлекательных» или «служебных» с процессами «рабочими». Вы не получите существенного ускорения от CPU с поддержкой этой технологии в большинстве классических многопроцессорных задач, или если по привычке запускаете только одно приложение в один момент времени. Но вы скорее всего получите уменьшение времени исполнения многих фоновых задач , исполняемых в качестве «довеска» к обычной работе. Фактически, Intel просто еще раз напомнила всем нам, что операционные системы, в которых мы работаем — многозадачные . И предложила способ ускорения — но не столько одного какого-то процесса самого по себе, сколько комплекса выполняемых одновременно приложений . Это интересный подход, и, как нам кажется, достаточно востребованный. Теперь он обрел свое имя. Не мудрствуя лукаво, хочется сказать: просто хорошо, что эта оригинальная идея пришла кому-то в голову. Тем более неплохо, что он смог ее воплотить в конкретный продукт. В остальном, как и всегда — время покажет.

[эта] песня вам не скажет «до свидания!»

Как мы и обещали нашим нетерпеливым читателям, новая серия старого блокбастера «Intel vs. AMD» наконец вызрела в нашей тестовой лаборатории, и мы готовы представить ее на ваш беспристрастный суд. Сразу же скажем, что хотя «блокбастерность» темы предполагает моря крови, жгучую ненависть и не менее жгучую любовь, мы в данном случае решили страстей не накалять. И то правда: сначала мы страсти накалим, потом некоторые читатели возбудятся и начнут их накалять еще больше… и пошло-поехало, готов новый повод для многостраничного флейма в конференции. Мы же теперь будем блокбастеры «снимать» исключительно камерные и спокойные — авось, что и выйдет, может, и читателя переучить удастся, и не станет он при одном упоминании «сравнения процессоров от Intel и AMD» сразу же хвататься за кинжал и делать зверское выражение лица.

С другой стороны, мы решили, что кроме сломанных копий, поруганных чувств и прочих событий со знаком «минус», должны все-таки даже такие «дежурно-обязательные» статьи и какую-то пользу приносить. Поэтому именно на них мы будем отлаживать всяческие мелкие вкусности: частичные изменения и дополнения к методике, новый взгляд на старые тесты, новые формы представления результатов и прочие действительно полезные вещи.

Что же касается основных героев, то ими стали, как нетрудно догадаться, процессоры Pentium 4 3,2 ГГц и Athlon XP 3200+. С последним вы уже знакомы , ну а первый… первый отличается от другого уже знакомого вам процессора — Pentium 4 3,0 ГГц — исключительно возросшей на 200 МГц частотой. Не такое уж фундаментальное событие, чтобы отмечать его с большой помпой или вдаваться в ненужные детали, поэтому ограничимся констатацией факта и фотографиями. Тем более, что есть и еще один «герой», тестирование которого мы решили совместить с сегодняшним. Это — долгожданный чипсет VIA Apollo KT600. Вот о нем, пожалуй, поговорим более подробно…

VIA Apollo KT600: «революционер с подагрой»

Честно говоря, чипсеты VIA Technologies для платформы Socket A в последнее время вызывают у автора просто смех. Местами переходящий даже в истерический… Однако, представим сегодняшнего новичка в сравнении с его предшественниками, причем характеристики, данные нами в квадратных скобках, были заявлены на момент анонса соответствующих чипсетов, но плавно испарились из их описания с течением времени. Очень получается интересное сравнение…

Возможности VIA KT600 VIA KT400A VIA KT400
Северный мост
Процессоры AMD Athlon XP AMD Athlon XP AMD Athlon XP
Частота FSB 266/333/400 МГц 266/333 МГц 266/333 МГц
Тип памяти DDR266/333/400 DDR266/333/400 DDR266/333
Максимально памяти 4 ГБ 4 ГБ 4 ГБ
AGP AGP 4X/8X AGP 4X/8X AGP 4X/8X
Официальный южный мост VT8237 VT8235CE /VT8237 VT8235
Шина связи с северным мостом 8X V-Link (533 МБ/с) 8X V-Link (533 МБ/с) 8X V-Link (533 МБ/с)
Интегрированный звук VIA Vinyl Six-TRAC six-channel AC"97 audio VIA AC"97 audio
Интегрированный модем MC"97 MC"97 MC"97
Интегрированный сетевой контроллер VIA MAC 10/100 Мбит Ethernet VIA MAC 10/100 Мбит Ethernet VIA MAC 10/100 Мбит Ethernet
Устройства PCI 6 6 6
IDE 2 канала Serial ATA для 2 SATA-устройствИнтерфейс SATAlite для 2 дополнительных SATA-устройств (требуется внешний PHY-контроллер)Parallel ATA (до 4 устройств) Parallel ATA (до 4 устройств)
VIA RAID RAID 0, RAID 1 и RAID 0+1 по протоколам SATA150 и ATA133 — —
USB 8 портов 6 портов 6 портов
Super I/O LPC Super I/O LPC Super I/O LPC Super I/O
I/O APIC Да Да Да
Управление питанием ACPI/APM/PCI/PM ACPI/APM/PCI/PM ACPI/APM/PCI/PM

Итак, мы видим, что в лице KT400A мы, наконец, обрели то, что должны были обрести с выходом KT400, плюс «виниловый AC"97» и слегка обновленный южный мост. А от VIA KT600 мы можем получить в дополнение к возможностям KT400A поддержку 400-мегагерцовой FSB новых Athlon XP и новый южный мост с функциональностью Serial ATA. Впрочем, честно говоря, нам так и хочется отказаться от официальной точки зрения VIA Technologies на взаимно-однозначное соответствие южных и северных мостов этой компании и сказать откровенно: никак это на самом деле с реальностью не соотносится . Можно даже смело спорить, что половина системных плат, которые начнут продаваться через месяц-два, совершенно независимо от чипсета будут оборудованы и «виниловым аудио», и Serial ATA, и всем таким прочим. Просто потому, что у производителей плат на чипсетах VIA всегда считалось «шиком» использовать для них самый последний южный мост — и сама VIA с этим бороться то ли не могла, а то ли и не хотела. Таким образом, можно смело сказать, что VIA KT400A не отличается от KT400 вообще ничем (ах, ну да, он вроде бы быстрее работает… простите, а нельзя было обеспечить это с самого начала?), а KT600 отличается от двух предыдущих «эпохальным достижением» в виде поддержки 400 МГц FSB. Впрочем, заявлены еще три «фирменных технологии», которым все же стоит уделить хотя бы пару строк.

Технология FastStream64. Которая, по идее, за счет использования расширенного (надо понимать — просто увеличенного в размерах) массива буферов предвыборки должна уменьшать задержки доступа и повышать скорость работы с памятью. Причем заявлена эта технология была еще для KT400A и предполагалась она чем-то вроде ответа на nForce2. Эх, если бы мы не знали уже результатов тестов… Поэтому скажем вкратце — наверное, задумка была хорошая. Наверное. Насчет остального — читайте тестовую часть.

VIA Vinyl Six-TRAC Audio. Представляет собой в интересующем нас отношении старый кодек VT1616 с новым названием VIA Vinyl Six-TRAC, подключаемый по стандартному AC"97-интерфейсу. Собственно, в описании чипсета этому маркетинговому прорыву делать абсолютно нечего, так как южный мост для «поддержки» Vinyl Audio не переделывался и прекрасно будет работать с любым другим отвечающим стандарту кодеком, как в случае первой основанной на KT600 материнской платы в нашей лаборатории.

Интегрированная поддержка Serial ATA с RAID. Фактически, VT8237 — ответ VIA на южный мост Intel ICH5R, в котором нашлось место и увеличению портов USB 2.0 до восьми, и соответствующему уровню поддержки Serial ATA: два порта на два SATA-устройства с возможностью организации RAID-массива нулевого или первого уровня, а также уровня 0+1 (последнего продукты конкурентов пока не обеспечивают). Было бы странно, если бы VIA этого не сделала: как-никак, раньше она обычно по функциональности южных мостов Intel стабильно опережала — так нужно же было в этот раз хотя бы не отстать?

А теперь, извините, нескромный вопрос: вам еще не надоела эта нескончаемая модификация KT400? Нам — уже надоела. Поэтому приводим напоследок блок-схему последней версии — KT600, и вперед, к тестам. По поводу блок-схемы загадаем читателям загадку: как вы думаете, на ней есть хоть одно принципиальное отличие от варианта для… VIA Apollo KT266? Правильно угадавшим разрешается взять с полки пирожок…

Исследование производительности

Тестовый стенд:

  • Процессоры:
    • Intel Pentium 4 3,2 ГГц (16x200) с включенной технологией HT, Socket 478
    • AMD Athlon XP 3200+ (11x200 МГц = 2,2 ГГц), Socket 462
  • Материнские платы:
    • ASUS P4C800 Deluxe (версия BIOS 1007 beta 013) на чипсете i875P
    • ASUS P4PE Black Pearl (версия BIOS 1006 beta 001) на чипсете i845PE
    • ASUS A7N8X rev2.00 (версия BIOS 1005) на чипсете NVIDIA nForce2 Ultra 400
    • ASUS A7V600 (версия BIOS 1001) на чипсете VIA KT600
  • Память: 2x256 МБ PC3200(DDR400) DDR SDRAM DIMM TwinMOS, CL 2
  • Видеокарта: NVIDIA GeForce FX 5800 Ultra
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин (использовался мост IDE—SATA SABR2000HV)

Программное обеспечение:

ОС и драйверы:

  • Windows XP Professional SP1
  • DirectX 9.0a
  • Intel Chipset Software Installation Utility 5.00.1012
  • Intel Application Accelerator 2.3
  • VIA Hyperion 4.47
  • VIA VT6420 RAID Driver 0.96
  • NVIDIA UDP 2.42
  • NVIDIA Detonator XP 42.82 (VSync=Off)
  • Silicon Image Driver 1.0.0.33

Тестовые приложения:

  • MadOnion 3DMark2001 SE build 330
  • Futuremark 3DMark03 Pro
  • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
  • Croteam/GodGames Serious Sam: The Second Encounter v1.07
  • SPECviewperf 7.1
  • RazorLame 1.1.5.1342 + Lame codec 3.93.1
  • VirtualDub 1.5.1 + DivX codec 5.05a Pro
  • WinAce 2.2
  • WinRAR 3.0
  • 3ds max 5.1 + Splutterfish Brazil Renderer 1.0
  • Adobe Photoshop 7.0
  • CPU RightMark 2 RC3
  • CacheBurst32 0.90.91

Результаты тестов

Синтетические и игровые 3D-приложения

3DMark2001 SE

Очень симпатичные «ступеньки»: одноканальные системы в обоих случаях проигрывают, Pentium 4 в каждой паре впереди — наихудший результат, таким образом, у Athlon XP на VIA KT600. И, пожалуй, раз уж мы сейчас «делаем вид» для читателей, что результаты остальных тестов нам «пока» неизвестны, то показатели этого чипсета чрезвычайно удивляют, и удивляют весьма неприятно — где же достойное соперничество с продуктом NVIDIA? С другой стороны, уже привычно, но все же впечатляет разница между производительностью одного и того же Pentium 4 3,2 ГГц на i845PE и i875P — здесь мы наблюдаем тот самый относительно редкий случай, когда более быстрая подсистема памяти дает реально ощутимый прирост. В лучшем варианте (с nForce2 Ultra 400) Athlon XP проигрывает Pentium 4 на i875P около 7%: не смертельно, хотя и нельзя сказать, что несущественно. А мы скажем вот так: проигрыш порядка 6—9% — из разряда тех, которые вряд ли отвратят от Athlon XP симпатизирующего AMD человека, вполне могут слегка «повернуть» в сторону Pentium 4 «сугубого нейтрала» и уж конечно вызовут радостное улюлюканье в стане сторонников Intel. Вот такого порядка проигрыш. К какой группе относитесь вы — это уж сами решайте…

3DMark03

Диаграмма с результатами общего балла собственно графического теста примерно похожа на предыдущую, но здесь разница между участниками заметно меньше: увеличена зависимость от видеокарты. При этом «старый» 3DMark2001 SE уже, видимо, оказывается для NVIDIA GeForce FX «легким и ненапряжным» тестом, позволяя себя проявить платформам.

А вот показатели CPU Marks вообще практически совпадают с относительными цифрами 3DMark2001 SE, что лишний раз подтверждает процессорозависимость старого теста.

Return to Castle Wolfenstein и Serious Sam

Здесь уже налицо сильная зависимость скорости от «предрасположенности» движка к тому или иному процессорному ядру: в случае с Return to Castle Wolfenstein Pentium 4 даже на куда более медленном i845PE держится наравне с быстрейшим вариантом Athlon XP, а в Serious Sam 2 примерный паритет и на одно-, и на двухканальных решениях. Вспоминая прошлое двух линеек процессоров, не знаешь: то ли радоваться тому, что топовая модель Intel наконец дотянула до конкурента в этой «AMD-шной» игре, то ли расстраиваться из-за явного застоя в стане настольных процессоров соперника.

SPECviewperf 7.1

К игровым приложениям этот тест отнести, конечно, нельзя, да и вообще актуальность его результатов для рядового пользователя под вопросом, но все же и от «3D-синтетики» есть своя польза. Картина в двух подтестах (мы традиционно взяли те, в которых различия между платформами наиболее четко видны) весьма интересная. Начнем с drv-09: он явно тяготеет к системам с быстрой памятью, а поскольку вычислительная мощность обоих процессоров, требуемая в этом случае, примерно одинакова, то имеем четкое разделение на две пары. Подтест же dx-08 демонстрирует явное тяготение к определенной процессорной архитектуре — точнее сказать, явную антипатию к определенной процессорной архитектуре. Причем, как ни странно, дело тут не только в пресловутом длинном конвейере и прочих общеизвестных недостатках Pentium 4: как не понравился движку этого подтеста (точнее, его предшественника) увеличенный кэш Northwood , так с тех пор Athlon XP и выигрывает в нем у самых быстрых систем с Pentium 4. Хотелось бы, конечно, справедливости ради и для контраста, привести результаты другого подтеста, в котором аналогичного рода «обструкции» со стороны программного кода подвергся Athlon XP, однако, видимо, «не в этой версии» SPECviewperf.

Компрессия данных

MP3 (кодек Lame)

Скорость кодирования аудиопотока при помощи кодека Lame, как мы давно установили, зависит при одинаковой процессорной архитектуре исключительно от частоты ; от производительности же подсистемы памяти она практически не зависит. Забавно, что на платформе Socket A вдруг совершенно неожиданно проиграл nForce2. Здесь, наверное, самое время еще раз окунуться в историю и вспомнить, что еще во времена первого nForce тестирование Lame на нем принесло, мягко говоря, странные результаты. Частичная несовместимость алгоритма кодека и механизма DASP? Предположение, как говорится, ничем не хуже других, так как доказать его справедливость (равно как и ошибочность) практически нереально.

MPEG4 (кодек DivX)

Совершенно другая ситуация в случае с кодированием видеопотока при помощи кодека DivX. Этот пакет, наоборот, достаточно чувствителен к скорости подсистемы памяти, что лучше всего видно… да уж… лучше всего это видно на примере нашего сегодняшнего «мальчика для битья» — VIA KT600. Как это уже однажды, кажется, звучало — «нам остается надеяться только на то, что плата повредилась умом в процессе транспортировки»:) — иначе кроме определения «тормоз» к этому чипсету не подходит ничего. Но не будем о грустном. Кто тут победитель? Можно смело сказать, что на этот раз — уж точно Pentium 4. Конечно, в связке с i875P: ему удалось обогнать Athlon XP на nForce2 на 10% — и это уже бесспорный выигрыш, без «всяких яких». Хотя, наверное, поклонники AMD все равно скажут, что это мелочь. :)

Архивирование (WinAce и WinRAR)

Два разных приложения, но такие одинаковые результаты. Если не обращать внимание на разницу в абсолютных величинах, то ситуация почти идентичная: у архиваторов очень велика требовательность к подсистеме памяти (смотрите, как изменяются показатели одних и тех же процессоров в зависимости от чипсета), и Pentium 4 3,2 ГГц достаточно существенно выигрывает у Athlon XP 3200+. Нет, все-таки 800-мегагерцовую шину ему дали не зря — помогает она Pentium 4, очень неплохо помогает. Явно больше, чем 400 МГц FSB помогает топовой модели AMD.

Профессиональные графические пакеты

3ds max 5.1

Мы наконец обновили как версию, так и тестовую сцену, причем в последней по максимуму используются именно возможности 3ds max 5.1 (специфическое освещение и пр.). И вот — первые результаты. Ну, про VIA KT600 мы лучше, в соответствии с традицией, «…или ничего»:), да и вообще одноканальные чипсеты тут не блеснули, отстав на несколько процентов в почти нечувствительном к скорости памяти тесте. Если же сравнить показатели тестового стенда на nForce2 с результатами платформы Socket 478, то ничего нового мы не увидим: как выигрывал Pentium 4 в 3ds max, начиная с версии 4.26, так и выигрывает по сей день. Причина уже объяснялась 1000 и 1 раз: именно начиная с этой версии под Pentium 4 стали «затачивать» движок рендеринга. На всякий случай мы проверили и скорость рендеринга нашей старой тестовой сцены: относительные показатели совпали с точностью до нескольких процентов.

Photoshop 7.0

А вот и новичок — ранее в Photoshop мы процессоры не тестировали, поэтому уделим немного внимания методике. Фактически, это скрипт («Action», в терминологии Photoshop), который написан в соответствии с рекомендациями, приведенными на странице. Сделать такой тест мы мечтали давно, на страницу эту попали, не скроем, совершенно случайно (просто один из друзей прислал ссылку, зная, что мы занимаемся изучением производительности компьютерных систем), но написанное на ней нас впечатлило: просто, доступным языком, логично. Мы решили, что, наверное, так можно описать только правильный способ тестирования в Photoshop:). Скрипт же, приведенный на страничке, не был взят не по каким-то идеологическим причинам, а просто потому, что автор, видимо, рассчитывал на машины довольно медленные. Во всяком случае, на наших тестовых системах он исполнялся слишком быстро, а это плохо с точки зрения повторяемости результатов и точности измерений.

Однако вернемся к результатам: ничего особенного, надо сказать. Pentium 4 явно лучше, но отнюдь не на такую величину, чтобы это вызвало охи и ахи у нормального человека. Топовый Athlon XP проигрывает ему порядка 12% — на nForce2, разумеется (мы ведь уже договорились, что KT600 у нас выступает «вне конкурса»:)).

CPU RightMark

Решение уравнений

То есть просчет физической модели. Те, кто интересуется (или просто пользуется) пакетом CPU RM, наверняка знают, что «Решатель» этого пакета имеет два типа оптимизации: под команды обычного FPU и под SSE2. На диаграмме присутствуют результаты обоих вариантов (разумеется, работа с SSE2 возможна только у Pentium 4 — поддержки этого набора команд у Athlon XP просто нет). Хорошо заметно, что при использовании команд x87 FPU процессор Intel проигрывает, однако уже не так сильно, как раньше — сказывается все больший разрыв в частоте со все еще «равнорейтинговым» Athlon XP. Ну а при использовании SSE2 Pentium 4 вырывается далеко вперед. Интересно другое: насколько сильно растет его производительность при переходе на SSE2 — +44%! Почти в полтора раза! Наверное, именно это и является решающим доводом для производителей ПО, оптимизирующих под Pentium 4 свои программы: вот так вот «на ровном месте» получить полуторный прирост — такого, кажется, еще ни один процессор не позволял… Впрочем, при желании можно, конечно, посмотреть на ситуацию и с другой стороны: еще ни один процессор не был настолько слаб на стандартном x86-коде, из-за чего приходится прикладывать дополнительные усилия, чтобы раскрыть его потенциал (да и то это не всегда возможно/удобно).

Рендеринг

Здесь нас больше интересовал прирост от использования «виртуального второго процессора», то есть технологии Hyper-Threading, так как эта часть теста специально оптимизирована в расчете на новую инициативу Intel. И вот ведь что забавно: именно Hyper-Threading и помогает в этом тесте выиграть Pentium 4! При однопоточном режиме работы модуля рендеринга, правда, Athlon XP 3200+ тоже проигрывает, но там разница не так уж и велика (для синтетического теста, во всяком случае). Но стоит только модулю распараллелить свою работу на два потока — сразу же «скрытый ресурс» Pentium 4 высвобождается, и тот начинает работать быстрее. Насколько? Тоже интересный вопрос — примерно на 16%. Очень неплохая цифра для фактически «дармовой» прибавки, особенно с учетом замедления работы в этом случае у «классического» процессора AMD.

Низкоуровневые тесты кэша и памяти

Скорость чтения/записи

Ранее для определения «чистой скорости» подсистемы памяти мы использовали бенчмарк Cachemem, но необходимость запуска из-под DOS и немалый «возраст» этого программного продукта заставляли нас постоянно искать какую-нибудь приемлемую альтернативу. И сейчас, кажется, эта альтернатива найдена — ей стал тест (что приятно — отечественной разработки). Итак, скорость чтения. Не пугайтесь — но это все-таки правда: скорость чтения Pentium 4 при использовании команд SSE (она при их использовании просто самая большая) чуть ли не в три раза превышает аналогичный показатель Athlon XP на nForce2! Впрочем, сдается нам, дело тут уже не столько в скорости собственно подсистемы памяти, сколько в скорости процессорной шины. VIA KT600 — нет, на это без слез смотреть нельзя… А вот со скоростью записи все совсем не так плачевно — тут платформа AMD вполне «на уровне». Что, кстати, заставляет задуматься: а почему это, интересно, как только чтение меняется на запись, наш «супербыстрошинный» Pentium 4 вдруг так резко сдает позиции?

Латентность

Если кратко — иногда меньше, иногда больше, но всегда выигрывает система на базе nForce2. AMD, воистину, нужно благодарить Бога за то, что NVIDIA до сих пор не делает чипсетов для Pentium 4:). Единственный раз чипсеты Intel показали свое превосходство в тесте на латентность при чтении с малым шагом, но, в общем-то, это как раз самый «синтетический» тест, эмулирующий наиболее невероятные для реальных приложений условия. В остальном же выигрывает… нет, даже не Athlon XP (и не Pentium 4) — выигрывает NVIDIA nForce2.

В заключение, сводная таблица производительности топовых сочетаний продуктов обоих лагерей:

Разница в процентах Pentium 4 3,2 ГГц (i875P) vs.
Athlon XP 3200+ (nForce2 Ultra 400)
3DMark2001 +7,0
3DMark03 +6,0
3DMark03/CPU +13,5
RtCW/800x600 +21,6
RtCW/1280x1024 +1,8
SS2/800x600 +1,9
SS2/1280x1024 -13,5
SPECviewperf/drv-09 -2,2
SPECviewperf/dx-08 -33,6
MP3/Lame +12,6
MPEG4/DivX +9,6
WinAce +19,9
WinRAR +29,3
3ds max +9,2
Photoshop +11,7
CPU RM/Solving +30,3
CPU RM/Rendering/2threads +33,5
Memory read +187,8
Memory write +32,8

Выводы

Коль скоро мы анонсировали сравнение именно двух конкурирующих процессоров , то и выводы будем строить, исходя из основной задачи. В таком случае — они довольно-таки очевидны, и будут примерно совпадать с выводами многих предыдущих статей на схожую тему; различия же в формулировках объясняются, скорее, не тем, что нам захотелось сказать что-то новое, а тем, что мы уже немного подзабыли, в каких именно выражениях мы озвучивали эту же мысль в прошлые разы:). Pentium 4 3,2 ГГц все же выигрывает у Athlon XP 3200+. Проигрыш для последнего нельзя назвать смертельным, а поклонники или «сочувствующие» AMD, как мы уже отмечали выше, вполне могут назвать его «несущественным» или «непринципиальным». Справедливости ради — и такая трактовка тоже возможна, ибо строгого числового определения понятия «несущественный» и «непринципиальный» не имеют, а чисто эмоционально данные эпитеты по отношению к величине разрыва между двумя флагманами от двух компаний не вызывают реакции мгновенного отторжения.

Нам бы хотелось только напомнить, что все усовершенствования, которые можно было «выжать» из текущего ядра Athlon XP, уже, по всей видимости, «выжаты»: частота FSB «задрана» до предела (можно практически с полной уверенностью утверждать, что выше ее в серийных процессорах поднять нельзя), размер кэша второго уровня доведен до 512 КБ (вряд ли имеет смысл наращивать его дополнительно, даже при наличии такой возможности), да и частота ядра столько времени «крутится» подле отметки 2,2 ГГц, что вряд ли осилит рывок еще хотя бы на 100 МГц. По итогу на сегодняшний день это позволило AMD получить процессор, более или менее сопоставимый по характеристикам быстродействия с Pentium 4 3,2 ГГц. Что не может не радовать. С другой стороны, у Pentium 4 «на носу» ядро Prescott с мегабайтным кэшем второго уровня, усовершенствованной Hyper-Threading и прочими явно способствующими увеличению скорости добавками. Бороться с любыми будущими процессорами Intel AMD сможет, исходя из вышесказанного, уже только одним способом — выходом в свет долгожданного Athlon 64.

Что же касается третьего героя сегодняшнего обзора, то выводы по VIA KT600 мы пока делать поостережемся. Очень уж слабо выглядит этот новейший чипсет в сравнении с, как это изящно названо на сайте VIA, «двухканальными решениями конкурентов». В ближайшем будущем мы ожидаем сравнения между собой KT400, KT400A и KT600, чтобы разобраться хотя бы с игроками одной команды, и надеемся, что к тому времени у нас будет больше ясности с производительностью нового продукта компании.

За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.

Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).

  • . Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
  • Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
  • Системная шина. В Pentium 4 используется совершенно новая 128-битная с двумя 64-битными линиями. Частота новой шины() составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
  • Арифметико-логическое устройство ( или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
  • первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
  • Математический (). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 . К примеру, в процессорах используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
  • SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

В целом, архитектура была нацелена для работы на высоких частотах, где в полную силу смог бы заработать длинный конвейер.

Willamette

Впервые это ядро «засветилось» в роадмэпе () Intel еще в 1998 году. Предполагалось, что оно должно прийти на смену и покорить частоту 1 ГГц. Но процессоры на этом ядре были анонсированы только в 2000 году как Pentium 4. Выпущенные года, процессоры устанавливались в разъём Socket 423 и выпускались в корпусе тип FC-PGA2. Процессоры для Socket 423 не пользовались популярностью, так как Intel сразу заявила, что этот разъем является переходным, кроме того системы на базе Pentium 4 стоили очень дорого (сами процессоры в момент анонса стоили $644 и $819 за Pentium 4 1,4 и 1,5 ГГц соответственно). Так как процессор изготавливался с использованием 180 нм техпроцесса, то на кристалле удалось разместить лишь 256 Кбайт кэша L2. Большинство экспертов расценило 1,4 и 1,5 ГГц версии промежуточными - процессор Athlon набирал всё большую популярность, и превосходил по быстродействию Pentium III, а дальнейшее усовершенствование архитектуры Pentium III тогда было ещё не возможно. Терять свою долю рынка Intel не была намерена, поэтому она и выпустила эти процессоры («сырая» технология производства не позволила тогда выпустить более быстрые модели). Несмотря на непопулярность 1,4 и 1,5 ГГц версий, Intel года анонсирует 1,3 ГГц версию Pentium 4, которая стоила $409. В различных тестовых испытаниях эти процессоры проигрывали как Pentium III, так и Athlon`ам (а в некоторых случаях и `ам), работавшим на более низких частотах. Однако уже в апреле 2001 года выходит Pentium 4 с частотой 1,7 ГГц, а в августе этого года выходит 2 ГГц версия, а так же «новые-старые» процессоры для Socket 478, который просуществовал более чем 2 года, в этом же месяце выходит новый чипсет от Intel (i845). Новый чипсет теперь поддерживал память стандарта PC133 SDRAM, что позволило значительно снизить цены на системы на базе Intel Pentium 4, однако использование данного типа памяти несколько уменьшало быстродействие (иногда весьма существенно) системы. Intel для увеличения продаж активно продвигала данный процессор - его рекламу можно было увидеть как по телевизору, так и в газетах/журналах. Продажи Pentium 4 увеличивались, процессор начинал пользоваться всё большей популярностью. Вскоре многие производители системной логики представили свои чипсеты для Pentium 4 с поддержкой памяти , а в начале года Intel выпускает свои чипсеты с поддержкой данного типа памяти. Процессор начинает замещать собой Pentium III, а по производительности он фактически сравнялся с Athlon`ом. Intel, державшая пальму первенстве в течение 16 лет, а затем довольно быстро потерявшая её, сейчас вновь начинает отвоёвывать своё. А начавшиеся проблемы с отсутствием производственных мощностей у AMD и выпуск Pentium 4 на ядре Northwood закрепили лидирующие позиции Intel, правда, ненадолго.

Процессоры Pentium 4 на ядре Willamette
Тактовая частота ядра (ГГц) Дата анонса процессора для Socket 423 Дата анонса процессора для Socket 478 Начальная стоимость процессора ($)
1,3 3 января 2001 409 - ?
1,4 20 ноября 2000 644 27 сентября 2001
1,5 819 27 августа 2001
1,6 2 июля 2001 294
1,7 23 апреля 2001 352
1,8 2 июля 2001 562
1,9 27 августа 2001 375 375
2,0 562 562

Northwood

Первые процессоры на данном ядре анонсированы года. Ядро мало чем отличается от своего предшественника, разве что использованием более совершенного тех процесса - 130 нм, что позволило разместить на кристалле 512Кб кэша L2 и снизить тепловыделение процессора. Переход на новый техпроцесс позволил ещё больше наращивать тактовую частоту (до 3,4ГГц). Чтобы отличать процессоры на ядре Northwood от аналогичных моделей на ядре Willamette, было решено в конце названия новых процессоров приписывать букву «A» (например Pentium 4 2,0A построен на ядре Northwood).

Prescott

Mobile Pentium 4

Первые версии Pentium 4 для ноутбуков и лэптопов были анонсированы года, были построены на ядре Northwood и носили имя Mobile Pentium 4-M. От настольных версий эти процессоры отличались заниженным напряжением питания (1,2-1,3 В) и поддержкой технологии . Частота системной шины у всех процессоров составляла 400 МГц. Были выпущены модели с частотами 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0; 2,2; 2,4; 2,5; 2,6, TDP у последней модели составляет 35 Вт.

Prescott 2M

Первые слухи о новом ядре Prescott 2 появились в начале 2005 года. Предполагалось, что оно будет иметь 2 Мбайт кэша L2 и частоту FSB равную 266 МГц (эффективная частота 1066 МГц). Процессоры на основе этого ядра были анонсированы . От ядра Prescott это ядро отличается только наличием 2 Мбайт кэш-памяти L2. Новые процессоры получили и новую маркировку: 6x0. 21 февраля 2005 года были анонсированы модели Pentium 4 630, 640, 650, 660 с частотами 3,0; 3,2; 3,4; 3,6 ГГц, позднее была представлена модель 670, работающая на частоте 3,8 ГГц.

Cedar Mill

Анонс процессоров, построенных на новом ядре, запланирован на вторую половину января . Ядро Cedar Mill представляет собой одноядерную модификацию ядра известного под кодовым именем . Cedar Mill изготовлен с использованием новейшей 65 нм технологии. По сути, ядро представляет собой ядро Prescott 2M, даже не изменилась серия процессора, процессоры без поддержки технологии виртуализации Vanderpool имеют маркировку вида 6x1, с поддержкой Vanderpool имеют маркировку вида 6x3. Процессоры первоначально будут иметь частоту от 3,0 ГГц до 3,8 ГГц. Более подробно о причине выхода Cedar Mill рекомендуется читать здесь .

Ядро Cedar Mill является последним в линейке Pentium 4. Следующие поколения процессоров, в частности Conroe, будут продвигаться под новым брэндом, название которого, пока, не анонсировано.

Tejas, Jayhawk и другие

Intel возлагала на архитектуру NetBurst большие надежды. В 2001-2003 в роадмэпах Intel встречались такие ядра, как Tejas, который должен был использовать шину 1066 МГц и работать на частотах от 4,4 до 9,2 ГГц и должен был бы быть поступить в продажу во второй половине 2004 года и называться Pentium 6. Nehalem, как предполагалось, этот процессор должен был использовать системную шину 1200 МГц и работать на частотах свыше 10 ГГц, и должен был поступить в продажу в 2005 году. Jayhawk, процессор серии Xeon, который должен был иметь кэш L1 для данных объемом 24 Кб и для 16 тысяч микроопераций. Однако все эти процессоры в 2004 году были отменены.

Intel предполагала с помощью процессоров основанных на архитектуре NetBurst достичь частоты в 10ГГц, но, не дойдя и до 4 ГГц, эта архитектура столкнулась с неразрешимыми до сих пор (и похоже уже никогда) тепловыми проблемами. Данная проблема подтолкнула Intel к разработке новой архитектуры и к закрытию всех проектов по разработке ядер на архитектуре NetBurst.

Взглянув назад, Pentium 4 оставляет двойственное впечатление. С одной стороны это был одни из самых популярных процессоров, его продвижение в , и, как следствие, огромная популярность в народе, позволили Intel надолго занять большую часть рынка. С другой стороны Pentium 4 имел не самую удачную архитектуру. Он так ни разу и не закрепил своё лидирующее положение в плане производительности, по уровню TDP (тепловыделение) он практически всегда проигрывал конкурентным процессорам AMD Athlon, впрочем также, как и по стоимости. А архитектура Pentium III, которую когда-то Intel посчитала менее перспективной, чем NetBurst вновь появилась в процессорах .

Технические характеристики различных ядер

Данные относящиеся ко всем моделям

  • Разрядность : 32
  • Разрядность внешней шины: 128

Willamette

  • Дата анонса первой модели: 20 ноября 2000 года
  • Тактовые частоты (ГГц): 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0
  • Эффективная частота системной шины (FSB) (МГц): 400
  • Размер кэша L2(Кбайт): 256
  • Напряжение питания: 1,7 В или 1,75 В
  • Количество транзисторов (млн.): 42
  • Площадь кристалла (кв. мм): 217
  • Максимальное TDP (расчетное тепловыделение): 75,3 Вт
  • Техпроцесс (нм): 180
  • Разъём: Socket 423, позже Socket 478
  • Корпус: 423-контактный FC-PGA2 или 478-контактный mPGA
  • Поддерживаемые технологии: IA32, SSE2

Northwood

  • Дата анонса первой модели: 7 августа 2001 года
    • Процессоры с частотой FSB равной 400МГц: 1,6; 1,8; 2,0; 2,2; 2,4; 2,5; 2,6; 2,8
    • Процессоры с частотой FSB равной 533МГц: 2,26; 2,4; 2,53; 2,67; 2,8; 3,06
    • Процессоры с частотой FSB равной 800МГц: 2,4; 2,6; 2,8; 3,0; 3,2; 3,4
  • Эффективная частота системной шины (FSB) (МГц): 400, 533, 800
  • Размер кэша L1: 8Кбайт (для данных)+12 тысяч операций
  • Размер кэша L2(Кбайт): 512
  • Напряжение питания: 1,475-1,55 (в зависимости от модели)
  • Количество транзисторов (млн.): 55
  • Площадь кристалла (кв. мм): 146, позже 131
  • Максимальное TDP (расчетное тепловыделение): 89 Вт
  • Техпроцесс (нм): 130
  • Разъём: Socket 478
  • Корпус: 478-контактный mPGA
  • Поддерживаемые технологии: IA32, MMX, SSE, SSE2, HT (не все модели)

На момент начала продаж процессорные решения серии Intel Pentium 4 позволяли создавать наиболее производительные настольные вычислительные системы. Спустя 8 лет это семейство чипов устарело и было снято с производства. Именно об этом легендарном модельном ряде ЦПУ и пойдет в этом материале речь.

Позиционирование процессора

На самом старте продаж данные процессоры принадлежали к наиболее быстродействующим решениям. На подобную их принадлежность указывали передовая на тот момент архитектура полупроводникового кристалла NetBurst, существенно возросшие тактовые частоты и прочие значительно улучшенные технические характеристики. Как результат, владельцы персональных компьютеров на их базе могли решать любые по уровню сложности задачи. Единственная сфера, в которой эти чипы не применялись - это серверы. В таких высокопроизводительных вычислительных машинах использовались процессорные решения серии XEON. Также не совсем оправданно применение в составе офисных ПК Intel Pentium 4. Ядра такого чипа в этом случае не до конца нагружались и с экономической точки зрения такой подход был целиком и полностью не оправдан. Для ниши “Интел” выпускала менее производительные и более доступные ЦПУ серии Celeron.

Комплектация

В двух типичных вариантах поставки можно было встретить процессор Intel Pentium 4. Один из них был нацелен на небольшие компании, которые специализировались на сборке системных блоков. Также такой вариант поставки подходил для домашних сборщиков персональных компьютеров. В прайс-листах он обозначался ВОХ, а в него производитель включал следующее:

    Чип в защитной упаковке из прозрачного пластика.

    Фирменную систему теплоотвода, которая состояла из специальной термопасты и кулера.

    Талон с гарантийными обязательствами.

    Краткое руководство по назначению и использованию процессорного решения.

    Наклейка с логотипом модели чипа для передней панели системного блока.

Второй вариант поставки в каталогах компьютерных комплектующих обозначался TRAIL. В этом случае из списка поставки исключалась система охлаждения и ее необходимо было дополнительно приобретать. Подобный вид комплектации наиболее оптимально подходил для крупных сборщиков персональных компьютеров. За счет большого объема продаваемой продукции они могли позволить покупать системы охлаждения по более низким оптовым ценам и такой подход был оправдан с экономической точки зрения. Также такой вариант поставки пользовался повышенным спросом среди компьютерных энтузиастов, которые приобретали улучшенные модификации кулеров и это позволяло еще лучше разогнать такой процессор.

Процессорные разъемы

Процессор Intel Pentium 4 мог устанавливаться в один из 3-х видов процессорных разъемов:

Первый разъем появился в 2000 году и был актуальным до конца 2001 года. Затем ему на смену пришел PGA478, который вплоть до 2004 года занимал ведущие позиции в перечне продукции компании “Интел”. Последний сокет LGA775 появился на прилавках магазинов в 2004 году. В 2008 году его сменил LGA1156, который был нацелен на применение чипов с более передовой архитектурой.

Сокет 423. Семейства поддерживаемых чипов

Производители процессоров в лице компаний “Интел” и АМД в конце 1999 года - начале 2000 года постоянно расширяли перечень предлагаемых чипов. Только у второй компании была вычислительная платформа с запасом, которая базировалась на сокете PGA462. А вот “Интел” все возможное на тот момент из процессорного разъема PGA370 “выжала” и ее нужно было предлагать рынку компьютерных технологий что-то новое. Этим новым и стал рассматриваемый чип с обновленным процессорным разъемом в 2000 году. Intel Pentium 4 дебютировал одновременно с анонсом платформы PGA423. Стартовая частота процессоров в этом случае была установлена на отметке 1,3 ГГц, а наибольшее ее значение достигало 2,0 ГГц. Все ЦПУ в этом случае принадлежали к семейству Willamette, изготавливались по технологии 190 нм. Частота системной шины была равна реальным 100 МГц, а ее эффективное значение составляло 400 МГц.

Процессорный разъем PGA478. Модели ЦПУ

Через год в 2001 году вышли обновленные процессоры Intel Pentium 4. Socket 478 - это разъем для их установки. Как было уже отмечено ранее, этот сокет был актуальным вплоть до 2004 года. Первым семейством процессоров, которые в него могли быть установлены, стал Willamette. Наивысшее значение частоты для них было установлено на 2,0 ГГц, а начальное - 1,3 ГГц. Техпроцесс у них соответствовал 190 нм. Затем появилось в продаже семейство ЦПУ Northwood. Эффективное значение частоты в некоторых моделях в этом случае было увеличено с 400 МГц до 533 МГц. Частота чипов могла находиться в пределах от 2,6 ГГц до 3,4 ГГц. Ключевое же нововведение чипов этого модельного ряда - это появление поддержки технологии виртуальной многозадачности HyperTraiding. Именно с ее помощью на одном физическом ядре обрабатывалось сразу два потока программного кода. По результатам тестов получался 15-процентный прирост быстродействия. Следующее поколение чипов “Пентиум 4” получило кодовое название Prescott. Ключевые от предшественников в этом случае заключались в улучшенном технологическом процессе, увеличении кеш-памяти второго уровня и повышение тактовой частоты до 800 МГц. При этом сохранилась поддержка HyperTraiding и не увеличилось максимальное значение тактовой частоты - 3,4 ГГц. Напоследок необходимо отметить то, что платформа PGA478 была последней вычислительной платформой, которая не поддерживала 64-битные решения и могла выполнять лишь только 32-разрядный программный код. Причем это касается и системных плат, и процессорных решений Intel Pentium 4. Характеристики компьютеров на базе таких комплектующих являются целиком и полностью устаревшими.

Завершающий этап платформы Pentium 4. Сокет для установки чипов LGA775

В 2006 году производители процессоров начали активно переходить на 64-разрядные вычисления. Именно по этой причине Intel Pentium 4 перешел на новую платформу на основе разъема LGA775. Первым поколением процессорных устройств для нее называлось точно также, как и для PGA478 - Prescott. Технические спецификации у них были идентичны предыдущим моделям чипов. Ключевое отличие - это повышение максимальной тактовой частоты, которая в этом случае могла уже достигать 3,8 ГГц. Завершающим же поколением ЦПУ стало Cedar Mill. В этом случае максимальная частота понизилась до 3,6 ГГц, но при этом техпроцесс улучшился и энергоэффективность улучшилась. В отличие от предшествующих платформ, в рамках LGA775 “Пентиум 4” плавно перешел из сегмента решений среднего и премиального уровня в нишу процессорных устройств бюджетного класса. На его место пришли чипы серии Pentium 2, которые уже могли похвастаться двумя физическими ядрами.

Тесты. Сравнение с конкурентами

В некоторых случаях достаточно неплохие результаты может показать Intel Pentium 4. Processor этот отлично подходит для выполнения программного кода, который оптимизирован под один поток. В этом случае результаты будут сопоставимы даже с нынешними ЦПУ среднего уровня. Конечно, сейчас таких программ не так уж и много, но они все еще встречаются. Также этот процессор способен составить конкуренцию нынешним флагманам в офисных приложениях. В остальных случаях этот чип не может показать приемлемый уровень производительности. Результаты тестов будут приведены для одного из последних представителей данного семейства “Пентиум 4 631”. Конкурентами для него будут процессоры Pentium D 805, Celeron Е1400, Е3200 и G460 от “Интел”. Продукция же АМД будет представлена Е-350. Количество ОЗУ стандарта DDR3 равно 8 Гб. Также данная вычислительная система доукомплектована адаптером GeForce GTX 570 с 1 Гб видеопамяти. В трехмерных пакетах Maya, Creo Elements и Solid Works в актуальных версиях 2011 года рассматриваемая модель “Пентиум 4” показывает достаточно неплохие результаты. По результатам тестов в этих 3-х программных пакетах была выведена средняя оценка по сто балльной шкале и силы распределились следующим образом:

“Пентиум 4 631” проигрывает процессорам с более продвинутой архитектурой и более высокими тактовыми частотами G460 и Е3200, у которых 2 физических ядра. Но при этом обходит полноценную двухъядерную модель D 805 на аналогичной архитектуре. Результаты же Е-350 и Е1400 были предсказуемые. Первый чип ориентирован на сборку ПК, в которых на первый план выходит энергопотребление, а удел второго - это офисные системы. Совершенно по-другому распределяются силы при кодировании медиафайлов в программах Lame, Apple Lossless, Nero AAC и Ogg Vorbis. В этом случае на первый план уже выходит количество ядер. Чем их больше, тем лучше выполняется задача. Опять-таки, по усредненной сто балльной шкале силы распределились следующим образом:

Даже Е-350 с приоритетом на энергоэффективность обходит “Пентиум 4” модели 631. Продвинутая архитектура полупроводникового кристалла и наличие 2-х ядер все-таки дают о себе знать. Изменяется картина при тестировании процессоров в архиваторах WinRAR и 7-Zip. Результаты чипов по той же самой шкале распределились так:

В этом тесте множество факторов оказывает влияние на конечный результат. Это и архитектура, это и размер кеша, это и тактовая частота, это и количеств ядер. Как результат, типичным середнячком получился тестируемый “Пентиум 4” в исполнении 631. Эталонная же система, производительность которой соответствовала 100 баллам, базировалась на ЦПУ Athlon II Х4 модели 620 от АМД.

Разгон

Внушительным увеличением уровня производительности мог похвастаться Intel Pentium 4. Разгон этих процессорных устройств позволял достичь значений тактовой частоты в 3,9-4,0 ГГц при улучшенной воздушной системе охлаждения. Если же заменить воздушное охлаждение на жидкостное на базе азота, то вполне можно рассчитывать на покорение значения в 4,1-4,2 ГГц. Перед разгоном компьютерная система должна быть укомплектована следующим образом:

    Мощность блока питания должна быть минимум 600 Вт.

    В компьютере должна быть установлена продвинутая модель системной платы, на которой можно осуществлять плавное регулирование различных параметров.

    Кроме основного кулера, на процессоре в системном блоке должны находиться дополнительные 2-3 вентилятора для осуществления улучшенного теплоотвода.

Мультипликатор частоты в этих чипах был заблокирован. Поэтому простым поднятием его значения разогнать ПК невозможно. Поэтому единственный способ увеличения производительности - это увеличение реального значения тактовой частоты системной шины. Порядок же разгона в этом случае следующий:

    Уменьшаются значения частот всех компонентов ПК. В этот список лишь только не попадает лишь только системной шины.

    На следующем этапе увеличиваем рабочее значение частоты последней.

    После каждого такого шага необходимо проверить стабильность работы компьютера с помощью прикладного специализированного софта.

    Когда простого повышения частоты уже недостаточно начинаем повышать напряжение на ЦПУ. Его максимальное значение равно 1,35-1,38 В.

    После достижения наибольшего значения напряжения частоту чипа повышать нельзя. Это и есть режим максимального быстродействия компьютерной системы.

В качестве примера можно привести модель 630 процессора “Пентиум 4”. Ее стартовая частота равна 3 ГГц. Номинальная же тактовая частота системной шины составляет в этом случае 200 МГц. Значение последней можно на воздушном охлаждении повысить вплоть до 280-290 МГц. В результате ЦПУ будет работать уже на 4,0 ГГц. То есть прирост производительности составляет 25 процентов.

Актуальность на сегодняшний день

На сегодняшний день целиком и полностью устарели все процессоры Intel Pentium 4. Температура их функционирования, энергопотребление, технологический процесс, тактовые частоты, размер кеш-памяти и ее организация, количество адресуемой ОЗУ - это далеко не полный перечень тех характеристик, которые указывают на то, что это полупроводниковое решение устарело. Возможностей такого чипа лишь достаточно для решения наиболее простых задач. Поэтому владельцам таких компьютерных систем необходимо их обновлять в срочном порядке.

Стоимость

Несмотря на то что в 2008 году выпуск рассматриваемых ЦПУ был прекращен, их все еще можно купить в новом состоянии со складских запасов. При этом необходимо отметить то, что в исполнении LGA775 и с поддержкой технологии НТ можно приобрести чипы Intel Pentium 4. Цена на них находится в пределах 1300-1500 рублей. Для офисных систем это вполне адекватный уровень стоимости. Процессорные решения, которые находились в использовании, можно найти на различных торговых площадках в интернете. Цена в этом случае начинается с отметки в 150-200 рублей. Полностью же собранный персональный компьютер бывший в употреблении можно купить по цене от 1500 рублей.



Рекомендуем почитать

Наверх