Скорость числовых операций. Комплектация этого полупроводникового решения

Faq 13.03.2019
Faq

Почти каждый год на рынок выходит новое поколение центральных процессоров Intel Xeon E5. В каждом поколении попеременно меняются сокет и технологический процесс. Ядер становится всё больше и больше, а тепловыделение понемногу снижается. Но возникает естественный вопрос: «Что даёт новая архитектура конечному пользователю?»

Для этого я решил протестировать производительность аналогичных процессоров разных поколений. Сравнивать решил модели массового сегмента: 8-ядерные процессоры 2660, 2670, 2640V2, 2650V2, 2630V3 и 2620V4. Тестирование с подобным разбросом поколений является не совсем справедливым, т.к. между V2 и V3 стоит разный чипсет, память нового поколения с большей частотой, а самое главное - нет прямых ровесников по частоте среди моделей всех 4-х поколений. Но, в любом случае, это исследование поможет понять в какой степени выросла производительность новых процессоров в реальных приложениях и синтетических тестах.

Выбранная линейка процессоров имеет много схожих параметров : одинаковое количество ядер и потоков, 20 MB SmartCache, 8 GT/s QPI (кроме 2640V2) и количество линий PCI-E равное 40.

Для оценки целесообразности тестирования всех процессоров, я обратился к результатам тестов PassMark .

Ниже привожу сводный график результатов:

Так как частота существенно отличается, сравнивать результаты не совсем корректно. Но несмотря на это, с ходу напрашиваются выводы:

1. 2660 эквивалентен по производительности 2620V4
2. 2670 превосходит по производительности 2620V4 (очевидно, что за счёт частоты)
3. 2640V2 проседает, а 2650V2 бьёт всех (также из-за частоты)

Я поделил результат на частоту и получил некое значение производительности на 1 ГГц:

Вот тут уже результаты получились более интересные и наглядные:

1. 2660 и 2670 - неожиданный для меня разбег в рамках одного поколения, 2670 оправдывает только то, что общая производительность у него весьма высока
2. 2640V2 и 2650V2 - весьма странный низкий результат, который хуже чем у 2660
3. 2630V3 и 2620V4 - единственный логический рост (видимо как раз за счёт новой архитектуры...)

Проанализировав результат я решил отсеять часть неинтересных моделей, которые не имеют ценности для дальнейшего тестирования:

1. 2640V2 и 2650V2 - промежуточное поколение, и не очень удачное, на мой взгляд - убираю из кандидатов
2. 2630V3 - отличный результат, но стоит необоснованно дороже 2620V4, учитывая аналогичную производительность и, к тому же - это уже уходящее поколение процессоров
3. 2620V4 - адекватная цена (сравнивая с 2630V3), высокая производительность и, самое главное - это единственная модель 8-ядерного процессора последнего поколения с Hyper-threading в нашем списке, поэтому однозначно оставляем для дальнейших тестов
4. 2660 и 2670 - отличный результат в сравнении с 2620V4. На мой взгляд, именно сравнение первого и последнего (на данный момент) поколения в линейке Intel Xeon E5 представляет особый интерес. К тому же у нас на складе остались достаточные запасы процессоров первого поколения, поэтому для нас это сравнение весьма актуально.

Стоимость серверов на базе процессоров 2660 и 2620V4 может отличаться почти до 2 крат не в пользу последних, поэтому сравнив их производительность и выбрав сервер на процессорах V1 - можно существенно сократить бюджет на покупку нового сервера. Но об этом предложении я расскажу после результатов тестирования.

Для тестирования было собрано 3 стенда:

1. 2 x Xeon E5-2660, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
2. 2 x Xeon E5-2670, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
3. 2 x Xeon E5-2620V4, 8 x 8Gb DDR4 ECC REG 2133, SSD Intel Enterprise 150Gb

PassMark PerformanceTest 9.0

При отборе процессоров на тесты я уже пользовался результатами синтетических тестов, но сейчас интересно сравнить эти модели более детально. Сравнение сделал группами: 1-ое поколение против 4-го.

Более подробный отчёт о тестировании позволяет сделать некоторые выводы:

1. Математика, в т.ч. и с плавающей точкой, в основном зависит от частоты. Разница в 100 МГц позволила 2660 опередить 2620V4 в расчётных операциях, в шифровании и компрессии (и это не смотря на существенную разницу в частоте памяти)
2. Физика и вычисления с использованием расширенных инструкций на новой архитектуре выполняются лучше, не смотря на низкую частоту
3. Ну и, разумеется, тест с использованием памяти прошёл в пользу процессоров V4, так как в данном случае соревновались уже разные поколения памяти - DDR4 и DDR3.

Это была синтетика. Посмотрим что покажут специализированные бенчмарки и реальные приложения.

Архиватор 7ZIP


Тут результаты перекликаются с предыдущим тестом - прямая привязка к частоте процессора. При этом не важно, что установлена более медленная память - процессоры V1 уверенно берут первенство частотой.

CINEBENCH R15

CINEBENCH - это бенчмарк для оценки рабочих характеристик компьютера для работы с профессиональной программой для создания анимации MAXON Cinema 4D.

Xeon E5-2670 вытянул по частоте и побил 2620V4. А вот E5-2660, имеющий не столь видимое преимущество по частоте, проиграл процессору 4-го поколения. Отсюда вывод - этот софт использует полезные дополнения новой архитектуры (хотя возможно всё дело в памяти...), но не на столько, чтобы это было решающим фактором.

3DS MAX + V-Ray

Для оценки производительности процессоров при рендеринге в реальном приложении я взял связку: 3ds Max 2016 + V-ray 3.4 + реальная сцена с несколькими источниками света, зеркальными и прозрачными материалами, и картой окружения.

Результаты получились схожи с CINEBENCH: Xeon E5-2670 показал самое низкое время рендеринга, а 2660 не смог обойти 2620V4.

1С: SQL/File

В заключение тестирования прилагаю результаты тестов gilev для 1С.

При тестировании базы с файловым доступом уверенно лидирует процессор E5-2620V4. В таблице приведены средние значения 20 прогонов одного и того же теста. Разница между результатами каждого стенда в случае с файловой базой была не больше 2%.

Однопоточный тест базы SQL показал весьма странные результаты. Разница получилась незначительной, учитывая разную частоту у 2660 и 2670, и разную частоту у DDR3 и DDR4. Была попытка оптимизировать настройки SQL, но результаты оказались хуже, чем было, поэтому я решил тестировать все стенды на базовых настройках.

Результаты многопоточного теста SQL оказались ещё куда более странными и противоречивыми. Максимальная скорость 1 потока в МБ/с была эквивалентна индексу производительности в предыдущем однопоточном тесте.

Следующим параметром была максимальная скорость (всех потоков) - результат получился практически идентичным у всех стендов. Так как результаты разных прогонов сильно колебались (+-5%) - иногда они были у разных стендов с существенным отрывом как в одну так и в другую сторону. Одинаковые средние результаты многопоточного теста SQL наводят меня на 3 мысли:

1. Такая ситуация вызвана неоптимизированной конфигурацией SQL
2. SSD стал узким местом системы и не позволил процессорам разогнаться
3. Разницы между частотой памяти и процессоров под эти задачи почти нет (что крайне маловероятно)

Также оказался необъяснимым результат по параметру «Рекомендуемое кол-во пользователей». Средний результат у 2660 оказался выше всех - и это при низких результатах всех тестов.
По этому вопросу также буду рад увидеть Ваши комментарии.

Выводы

Результаты нескольких разносторонних вычислительных тестов показали, что частота процессора в большинстве случаев оказалась важней поколения, архитектуры и даже частоты памяти. Безусловно есть современный софт, который использует все улучшения новой архитектуры. Например, транскодирование видео иногда производится в т.ч. с использованием инструкций AVX2.0, но это специализированное ПО - а большинство серверных приложений по прежнему привязаны к количеству и частоте ядер.

Разумеется я не заявляю, что разницы между процессорами нет совсем никакой, я лишь хочу отметить, что для определённых приложений нет смысла в «плановом» переходе на новое поколение.

Если Вы со мной не согласны или у Вас есть предложения для тестирования - стенды пока не разобраны, и я буду рад произвести тестирование Ваших задач.

Экономическая выгода

Как я уже писал в начале статьи - мы предлагаем линейку серверов на базе процессоров Xeon E5 первого поколения, которые по стоимости существенно бюджетней серверов на E5-2620V4.
Это такие же новые серверы (не путать с б/у) с гарантией 3 года.

Ниже привожу ориентировочный расчет.

Итог банален: судить о производительности любого центрального процессора только по одному параметру нельзя. Лишь совокупность характеристик дает понимание того, что это за чип. Сузить круг рассматриваемых процессоров очень просто. Из современных у AMD - это чипы FX для платформы AM3+ и гибридные решения A10/8/6 6000-й и 7000-й серий (плюс Athlon X4) для FM2+. У Intel - процессоры Haswell для платформы LGA1150, Haswell-E (по сути, одна модель) для LGA2011-v3 и новейшие Skylake для LGA1151.

Процессоры AMD

Повторюсь, сложность выбора процессора заключается в том, что моделей в продаже очень много. Элементарно путаешься в этом многообразии маркировок. Вот есть у AMD гибридные процессоры A8 и A10. В обе линейки входят только четырехъядерные чипы. Но в чем же разница? Об этом и поговорим.

Начнем с позиционирования. Процессоры AMD FX - топовые чипы для платформы AM3+. На их основе собираются игровые системные блоки и рабочие станции. Гибридные процессоры (со встроенным видео) А-серии, а также Athlon X4 (без встроенной графики) - чипы среднего класса для платформы FM2+.

Серия AMD FX делится на четырехъядерные, шестиядерные и восьмиядерные модели. Все процессоры не имеют встроенного графического ядра. Следовательно, для полноценной сборки потребуется либо материнская плата со встроенным видео, либо дискретный 3D-ускоритель.

Впервые процессоры компании AMD появились на рынке в 1974 году, вслед за презентацией Intel своих первых моделей типа 8080 и являлись их первыми клонами. Однако, уже в следующем году была представлена модель am2900 собственной разработки, представлявшая собой микропроцессорный комплект, который стала выпускаться не только самой компанией, но и такими как Motorola, Thomson, Semiconductor и другими. Стоит отметить, что на основе этого комплекта был изготовлен и советский микротренажер мт1804.

Процессоры AMD Am29000

Следующее поколение - Am29000 - полноценные процессоры, соединившие все компоненты комплекта в одно устройство. Представляли собой 32-разрядный процессор, базирующийся на архитектуре RISC, имеющий кеш 8 Кб. Выпуск начался в 1987 году и закончился в 1995.

Помимо собственных разработок, компанией AMD выпускались и процессоры, изготовленный по лицензии Intel и имевшие аналогичную маркировку. Так, модели Intel 8088 соответствовал Am8088, Intel 80186 - Am80186 и так далее. Некоторые модели подвергались модернизации и получали собственную маркировку, незначительно отличавшуюся от оригинальной, например Am186EM - улучшенный аналог Intel 80186.

Процессоры AMD C8080A

В 1991 году была представлена линейка процессоров, предназначенных для настольных компьютеров. Серия получила обозначение Am386 и использовала в своей работе микрокод, разработанный для Intel 80386. Для встраиваемых систем аналогичные модели процессоров были запущены в производство лишь в 1995 году.

Процессоры AMD Am386

Но уже в 1993 году была представлена серия Am486, предназначенная для установки только в свой, 168-пиновый разъем типа PGA. Кеш составлял от 8 до 16 Кб в модернизированных моделях. Семейство встраиваемых микропроцессоров получило обозначение Elan.

Процессоры AMD Am486DX

Серия K

В 1996 году начался выпуск первого семейства серии K, получивший обозначение K5. Для установки процессора использовался универсальный разъем, получивший название Socket 5. Некоторые модели этого семейства были разработаны для установки в Socket 7. Процессоры обладали одним ядром, частота работы шины составляла 50-66 Мгц, тактовая частота составляла 75-133 Мгц. Кеш составлял 8+16 Кб.

Серия процессоров AMD 5k

Следующее поколение серии K - семейство процессоров K6. При их производстве начинают присваиваться собственные имена ядрам, на которых они базируются. Так, для модели AMD K6 соответствующее кодовое имя Littlefood, AMD K6-2 - Chomper, K6-3 - Snarptooth. Стандартом для установки в систему был разъем типа Socket 7 и Super Socket 7. Процессоры имели в своем составе одно ядро и работали на частотах от 66 до 100 Мгц. Кеш первого уровня составлял 32 Кб. Для некоторых моделей имелся и кеш второго уровня, размером 128 или 256 Кб.

Семейство процессоров AMD K6

С 1999 начинается выпуск моделей Athlon, входящих в серию K7, получивших широкое распространение и заслуженное признание многих пользователей. В этой же линейке находятся и бюджетные модели Duron, а также Sempron. Частота шины составляла от 100 до 200 Мгц. Сами же процессоры имели тактовую частоту от 500 до 2333 Мгц. Обладали 64 Кб кеша первого уровня и 256 или 512 Кб кеша второго уровня. Разъем для установки обозначался как Socket A или Slot A. Выпуск закончился в 2005 году.

Серия AMD K7

Серия K8 представлена в 2003 году и включает в себя уже как одноядерные, так и двухъядерные процессоры. Количество моделей весьма разнообразно, поскольку были выпущены процессоры как для настольных компьютеров, так и мобильных платформ. Для установки используются различные разъемы, наиболее популярные из которых Socket 754, S1, 939, AM2. Частота шины составляет от 800 до 1000 Мгц, а сами процессоры обладают тактовой частотой от 1400 Мгц до 3200 Мгц. Кеш L1 составляет 64 Кб, L2 - от 256 Кб до 1Мб. Примером успешного использования являются некоторые модели ноутбуков Toshiba, базирующихся на процессорах Opteron, имеющих кодовое имя, соответствующее кодовому имени ядра - Santa Rosa.

Семейство процессоров AMD K10

В 2007 году начался выпуск нового поколения процессоров K10, представленного всего тремя моделями - Phenom, Athlon X2 и Opteron. Частота шины процессора составляет 1000 - 2000 Мгц, а тактовая частота может достигать величины 2600 Мгц. Все процессоры имеют в своем составе 2, 3 или 4 ядра в зависимости от модели, а кеш составляет 64 Кб для первого уровня, 256-512 Кб для второго уровня и 2 Мб для третьего уровня. Установка производится в разъемы типа Socket AM2, AM2+, F.

Логическое продолжение линейки K10 получило название K10.5, включающая в свой состав процессоры, имеющие 2-6 ядер в зависимости от модели. Частота шины процессора составляет 1800-2000 Мгц, а тактовая частота 2500-3700 Мгц. В работе используется 64+64 Кб кеша L1, 512 Кб кеша L2 и 6 Мб кеша третьего уровня. Установка производится в Socket AM2+ и AM3.

AMD64

Помимо представленных выше серий, компания AMD производит процессоры, базирующиеся на микроархитектуре Bulldozer и Piledriver, изготовленные по 32 нм техпроцессу и имеющие в своем составе 4-6 ядер, тактовая частота которых может достигать 4700 Мгц.

Процессоры AMD a10

Сейчас большой популярностью пользуются модели процессоров, разработанные для установки в сокет типа FM2, в том числе гибридные процессоры семейства Trinity. Связано это стем, что предыдущая реализация Socket FM1 не получила ожидаемого признания из-за относительно низкой производительности, а также ограниченной поддержкой самой платформы.

Само ядро состоит из трех частей, включающих в себя графическую систему с ядром Devastrator, пришедшим из видеокарт Radeon, процессорной части из х-86 ядра Piledriver и северного моста, отвечающего за организацию работы с оперативной памятью, поддерживая практически все режимы, вплоть до DDR3-1866.

Наиболее популярные модели этого семейства - A4-5300, A6-5400, A8-5500 и 5600, A10-5700 и 5800.

Флагманские модели серии A10 работают с тактовой частотой 3 — 3,8 Ггц, а при разгоне способны достигать значения 4,2 Ггц. Соответствующие значения для A8 - 3,6 ГГц, при разгоне - 3,9 Ггц, A6 - 3,6 Ггц и 3,8 Ггц, А4 - 3,4 и 3,6 Ггц.



Рекомендуем почитать

Наверх