Синтетические тесты
CineBench
Сравнение процессоров кросс-платформенным тестовым пакетом CINEBENCH — тест широко используется для оценки производительности процессоров Intel и AMD. В его основе лежит популярное анимационное программное обеспечение CINEMA 4D немецкой компании MAXON, которое активно используется студиями всего мира для создания 3D-контента. Тест CPU включает в себя рендеринг определённой сцены в режиме многопоточности (используются все ядра процессора). Рендеринг — процесс получения изображения по модели с помощью компьютерной программы. По результату теста процессора просто вычислить его скорость — чем быстрее процессор обсчитывает рендер, тем больше баллов он получает.
CineBench R23 CPU Single | CineBench R23 CPU Multi | |
Intel Pentium Silver N6000 | 679 | 1911 |
AMD Ryzen 7 5700U | 1263 | 10021 |
Intel Core i5-1145G7 | 1388 | 4769 |
Intel Core i5-1135G7 | 1343 | 4990 |
AMD Ryzen 5 3550H | — | — |
Intel Core i7-1255U | 1776 | 7385 |
Intel Core i7-1260P | 1739 | 9170 |
Geekbench
Geekbench — это мультиплатформерное приложение для бенчмаркинга (сравнения эффективности), которое позволяет проводить тестирование памяти и процессора. Одним из главных достоинств этой программы является то, что она позволяет проводить все необходимые тесты лишь одним кликом. После всего этого вы получите подробный отчет о том, что происходит в вашей системе.
Geekbench 5.4 Tryout для Windows x86 (64-разрядная версия) | |
Одноядерный Счет | Многоядерный Счет |
905 | 3236 |
3DMark
3DMark Fire Strike — это красивое популярное приложение с поддержкой API DirectX 11 для тестирования компьютеров с высокопроизводительными игровыми видеокартами в среде Windows. Результаты 3DMark Fire Strike помогают оценить сравнительную производительность видеокарты и её пригодность для работы в самых требовательных компьютерных играх.
3DMark Fire Strike Score: Graphics | 3DMark Time Spy: Graphics | |
Intel Iris Xe Graphics :96Us | 5401 | 1589 |
AMD Radeon RX Vega 8 4000 Серия | 4462 | 1329 |
AMD Radeon RX Vega 8 3000 Серия | 2901 | 790 |
AMD Radeon R5 (Stoney Ridge) | 881 | 262 |
Intel UHD Graphics 630(GT2) | 1311 | 368 |
Nvidia GeForce MX450 | 5573 | 1792 |
Проблемы с разгоном ?!!
К сожалению, мы столкнулись с некоторыми препятствиями при попытке разогнать эти процессоры. Несмотря на то, что мы полностью обновили наш испытательный стенд с использованием последних версий BIOS, драйверов, обновлений Windows и Ryzen Master, ни один из методов разгона, которые мы пробовали, не повлиял на производительность. Независимо от того, использовали ли мы Ryzen Master или изменение значений в BIOS, мы конечно смогли увеличить множитель для всех ядер, но производительность осталась неизменной.
Возможно, вы думаете, что мы подняли напряжение слишком высоко или что проблема была в охлаждении, а система дросселировала, но это не так — Ryzen Master сообщал точное число — даже при использовании множителя 1.4c Vcore и 42.5x для всех ядер температура процессора никогда не превышала 75 ° C с использованием AMD Wraith Cooler. Вообщем излишне говорить, что нам придется копать дальше в этом направлении.
Тестирование 1С Предприятие 8.3
Если рассуждать с точки зрения среднего бизнеса, то важнейшее преимущество 32-ядерных процессоров состоит в том, что старый кластер из 2-х или 4-х серверов вы сегодня можете заменить на 1 машину, совмещающую в себе и сервер приложения и сервер баз данных, а виртуализация даст дополнительную гибкость и удобство построения отказоустойчивого кластера. Если смотреть с точки зрения Cloud-провайдеров, то 32-ядерный CPU можно «нарезать» на 32 виртуальные машины для малого бизнеса, с жёсткой привязкой ядер и сдавать в аренду тем пользователям, кто ведёт свой учёт в облаке. Два разных подхода требуют двух разных тестов, и начнём мы как раз со второго.
Мелкие потребители 1С Предприятия используют самый простой, но в то же время быстрый способ хранения данных: в файлах
Как правило, их нагрузка является 1-поточной, и пользователю важно, чтобы программная платформа быстро обработала его запрос на выставление счёта или формирование отчётности. Для тестирования подобных конфигураций применяется известный тест Гилева, который в своей сути является 1-поточным, но показывает максимальную скорость при использовании 2 процессорных ядер на систему
И если вы сдаёте в аренду VPS под 1С Предприятие, то «Тест Гилёва» — это первое, что запустит ваш будущий клиент, чтобы оценить скорость сервиса.
Об авторе методики тестирования: Вячеслав Гилев, руководитель лаборатории тюнинга 1С, компании ООО «ЦТП», сайт gilev.ru |
И хотя Вячеслав Гилёв многократно высказывался о том, что виртуализация — лучший способ замедлить работу 1С, в наших тестовых условиях, когда на сервере используется 1 виртуалка для снятия показаний скорости, различий в скорости с «чистым железом» нет, и более того, под VMware у нас оно работает даже быстрее. Есть мнение, что 1С Предприятие сильно нагружает дисковую подсистему, и для устранения бутылочного горлышка использовал Ramdisk от компании SoftPerfect и сравнил его с самым простым 30-долларовым NVME SSD от компании DEXP на контроллере Phison E12. Разницы по скорости не было, а это лишний раз подтверждает, что для современного сервера приложений скорости типичного NVME накопителя достаточно, чтобы удерживать параметр IOWait на уровне, когда он не влияет на производительность. Другими словами, покупать дорогой RAID-контроллер ради роста производительности приложения уже нет смысла: проще использовать NVME накопители, а освободившийся бюджет направить на более производительный процессор.
На скриншоте выше вы видите типичный вывод результатов «теста Гилева»: очки, набранные вашей системой (столбик слева) сравниваются со значениями, которые по мнению Вячеслава Гилева характеризуют работу сервера, как плохую, удовлетворительную, хорошую или просто замечательную. Тест оценивает не только аппаратную, но и программную составляющую сервера, поэтому для чистоты эксперимента мы использовали все значения программного обеспечения, установленные по умолчанию. Если ваша система набирает в тесте Гилева более 40 очков — вы можете собой гордиться, а мы гордимся тем, что превзошли его максимальную оценку «замечательно».
Гипервизор |
VMware ESXi 6.7U3 |
Клиентская платформа |
VM, 8 vCPU, 8 Gb Windows Server 2016 1C Предприятие 8.3.13.1690 |
Серверная платформа |
VM, 32 vCPU, 8 Gb Windows Server 2016 1C Предприятие 8.3.13.1690 сервер Microsoft SQL Server Developer |
С настройками по умолчанию в тесте Гилёва на процессорах EPYC 7532 вы получаете оценку «замечательно», и имейте в виду, что тюнинг программной платформы и базы данных может дать вам ещё больше.
Второй тест так же является 1-поточным, но в качестве хранилища данных используется Microsoft SQL Server и сервер 1С Предприятия, установленные на отдельной виртуальной машине на том же хосте. До начала тестирования я убедился, что наибольшие показатели получаются, если выделить каждой виртуальной машине по 32 vCPU. В этом тесте лидирует новый EPYC 7532, и забегая вперёд, скажу что и в других базах данных он раскрыл себя с лучшей стороны.
Многопоточность 1С мы будем измерять с помощью теста Fragster.ru, на 2-уровневой конфигурации «Сервер 1С + сервер SQL». Разработчики поясняют, что мерилом является производительность каждого потока в очках, и значение в 400-500 — это тот нижний порог, при котором работа всё ещё терпима. Учитывая, что речь идёт об одновременных потоках, которые обрабатывает сервер, число пользователей, которые могут быть обслужены данной конфигурацией, может быть и в 4-5 раз больше, в зависимости от структуры работы вашей компании.
Результат говорит сам за себя: для сервера 1С Предприятие лучшим выбором будет EPYC, а не Threadripper, причём вы можете существенно сэкономить, выбрав процессоры первого поколения.
Тестирование
AMD Ryzen 3 3100 предлагается как в BOX-версии с простенькой системой охлаждения в комплекте (Wraith Stealth, чушка алюминия без трубок и медного основания) за чуть дороже, а также в Tray-версии, иногда именуемой как OEM, без кулера. В нашем случае рассматривается Tray-версия.
Источник изображения Techpowerup
В первую очередь стоит разобраться с пресловутым вопросом ”а что там под крышкой?”. Доподлинно неизвестно, но скорее всего там термопаста. Явно на это намекают температуры работы даже в стоковом режиме. При 65-ваттном уровне TDP (и это честные TDP), с охлаждением в виде Ice Hammer IH-4400 A температуры работы 75 градусов в стоке. Да, это не СЖО на компонентах EK, но это нормальный башенный кулер на тепловых трубках с 120-мм пропеллером на 2000 оборотов. С BOX-овым кулером результат около 80 градусов.
Такие температуры работы – следствие одной из двух причин: либо AMD как минимум для Ryzen 3 3100 (хотя проблеме нагрева подвержены и Ryzen 3 3300X) берёт кристаллы просто ужасающего качества, либо под крышкой «терможвачка». Судя по имеющемуся потенциалу, и немалому, и слишком резкому росту температур от повышения напряжения – более вероятен второй вариант.
Как привило процессоры Ryzen любого поколения разгонять смысла вообще нет. Слишком тяжко даются эти мегагерцы, а фактический прирост производительности в связи с хитрыми механизмами boost оказывается преступно мал. В случае с многоядерными Ryzen грамотнее использовать специализированные планы питания и другие хитрости оптимизации работы процессора, ведущие и к росту частот, и к падению напряжения, а с ним и нагрева и потребления. К слову, не так давно AMD обновила пакет драйверов для чипсетов, интегрировав правильные планы питания прямо в Windows.
К моему удивлению, с AMD Ryzen 3 3100 всё получилось совершенно иначе. Потенциал есть! А по Ryzen-овским меркам даже впечатляющий, но без поднятия напряжения кина не будет.
Итак, в стоковом виде Ryzen 3 3100 «бустит» до 3,9 ГГц по всем ядрам при напряжении 1,15 В. Удалось получить 4,3 ГГц при 1,315 В. В таком режиме TDP возрастает до ~80 Вт, а температуры работы в стресс-тестах до 80 градусов. Возможны даже 4,4 ГГц при 1,33 В с температурами работы уже под 84-85 градусов. Возможно, процессор способен на дальнейший разгон, но система охлаждения требуется уже совсем выдающегося класса. Температуры с ростом напряжения растут по экспоненте, а для взятия 4,5 ГГц напряжение нужно задирать существенно выше.
Как итог, 4,3-4,4 ГГц – это «потолок» для большинства систем. Большие частоты работы требуют весомых инвестиций в материнскую плату и охлаждение. После 4,3 ГГц овчинка выделки не стоит. Благо, на 4,3 ГГц способен каждый экземпляр – утверждение на основе доброго десятка обзоров этого процессора. BOX-овая система охлаждения на такие подвиги неспособна. 80 градусов в стоке и под сотню в разгоне – увы, процессор получился горячеват.
Как представитель серии Ryzen 3000, обозреваемый процессор получил обновленный контроллер памяти DDR4-3200, способный на большее. В нашем случае запустился 2х 8 ГБ комплект памяти в режиме DDR4-3333 при обычных таймингах 16-18-18-36 CR1. Согласно тестам памяти в AIDA64, задержки доступа к кэшу L1 и L2 вполне типичные, L3 – тоже типичные, и это очень удивительно, припоминая топологию. Те же 10-12 наносекунд показывал Core i5-10400F в недавнем обзоре. Подкачали только задержки доступа к оперативной памяти в 70+ нс, но для Ryzen это обыденность.
Подводя промежуточный итог, AMD Ryzen 3 3100 в изначальном виде способен работать при 3,9 ГГц по всем ядрам, способен разгоняться до 4,3-4,4 ГГц, имеет низкие задержки доступа к кэшам и обычные по меркам Ryzen к оперативной памяти, саму память разгонять может. Фактические потребление адекватное – ~65 Вт в стоке и ~80-85 Вт в режиме разгона. Ложке дёгтя в этой бочке мёда место нашлось – это температуры работы. Вероятно, AMD применяет под крышкой пластичный термоинтерфейс, препятствующий быстрому переходу тепла от кристалла к медной крышке CPU и далее к кулеру.
3
Тесты процессоров AMD Ryzen и Intel в видеомонтаже и рендеринге.
Хочу напомнить, компания AMD оффициально заявляла, что архитектура Zen2, на которой построены процессоры Ryzen тетьего поколения, на 21% производительней предыдущей архитектуры Zen+ в однопоточном режиме.
И правда, последнее время инженеры добились многого, и приблизились по показателям к конкуренту Intel, а те знают толк в колоссальной производительности на одном ядре
Но нам важно, как все мощные ядра покажут себя в рендеринге, и какой процессор выгоднее будет купить по схеме цена-качество. Сколько необходимо будет потратить денег, на единицу времени рендеринга
Самые популярные профессиональные программы для видеомонтажа это Final Cut Pro и Davinci Resolve, использующие фактически один и тотже движок, и конечно же Adobe Premiere Pro. Для первой необходимо будет установить Хакинтош, а для второй и третьей – Windows 10, для того чтобы задействовть все потоки процессоров.
В Давинчи лучше всего показал себя Ryzen Threadripper 2950x, 2920x был практически наравне с R9 3900x, i9-9900k оказался таким же медленным, что и R7 3700x.
В примьере дела обстоят подругому: i9-9900k сровнялся по скорости рендера с R9 3900x, в самым быстрым оказался Threadripper 2950x и его младший брат Threadripper 2920х, который недалеко ушёл от 1920x, хоть его и нет на графике, количество ядер, как оказалось, зарешало.
Разница в рендере между Threadripper 1920x vs 1950х продемонстрирована на видеоролике в шапке статьи.
Тактовые частоты и разгон
Далее следует вопрос о тактовых частотах. Тактовая частота процессора, обычно выражаемая в гигагерцах, указывает, сколько операций одно ядро может выполнить за секунду. Разумеется, чем выше показатель, тем лучше, однако не стоит забывать, что высокие тактовые частоты означают, что ЦП будет выделять больше тепла.
Когда дело доходит до игр, показатель тактовой частоты как правило более важен, чем количество ядер/потоков, поэтому процессоры Intel чаще всего имеют небольшое преимущество над AMD, когда речь идет о «сырой» игровой производительности.
Базовые тактовые частоты новейших процессоров Ryzen находятся в диапазоне 3,6–3,9 ГГц, а частоты разгона — от 3,9 до 4,7 ГГц, хотя показатели «на бумаге» вряд ли являются хорошим способом оценки производительности процессора.
Здесь мы неизбежно подходим к вопросу о разгоне – процессе увеличения тактовой частоты компонента компьютера сверх штатных режимов с целью увеличения скорости его работы. И, в отличие от процессоров Intel Core, множители всех моделей Ryzen разблокированы и могут быть свободно разогнаны. С другой стороны, возможности разгона не настолько хороши, как конкурирующие высокопроизводительные модели Intel Core.
Имея это в виду, стоит ли вообще заботиться о разгоне процессора Ryzen?
По большей части разгон предназначен для заядлых энтузиастов аппаратного обеспечения, и в основном привлекает людей, которым нравится процесс настройки параметров процессора, чтобы увидеть, сколько дополнительной производительности можно выжать из устройства без каких-либо сбоев.
Скачок в производительности в игре, который вы увидите при разгоне процессора среднего уровня, на самом деле не так уж и заметен, и он действительно того не стоит, если вы обладаете ограниченным бюджетом или пытаетесь получить лучшее соотношение цены и качества. Дело в том, что в таком случае придется потратить дополнительные средства на кулер!
Блок питания для Threadripper + Vega 64.
От выбора блока питания зависит многое, самое главное это сохранность вложенных средств в комплектующие. У качественного БП должен быть и хороший запас мощности при обилии железок внутри системного блока, а также адаптивная защита от перегрузов, сверхтоков и короткого замыкания
Немаловажно тихое и продуктивное охлаждение всех силовых компонентов, ведь при финальном рендеринге большого проекта компьютер будет долгое время работать в максимальной нагрузке. Модульность блока питания приветствуется при кабельменеджменте, и разъёмов должно хватить для подпитки процессора, видеокарты (или несколько) и рейд-массива из HDD
Я нашёл наиболее разумный вариант: Corsair RMx на 850 Ватт.
Посмотреть на AliExpress
AMD Ryzen 3 Matisse 3300X
AMD Ryzen 3 3300X — старший из двух «братьев» Matisse с четырьмя ядрами и восемью потоками. В отличие от младшего Ryzen 3 3100 с двумя CCX-модулями, 3300X имеет сгруппированное расположение ядер в одном единственном CCX. Это способствует более быстрым обмену информацией как между ядрами, так и c IOD-модулем (северным мостом).
К тому же, Ryzen 3 3300X работает на более высокой частоте «из коробки»: 3.8 – 4.3 ГГц против 3.6 – 3.9 ГГц у модели 3100. Разницу в частоте, впрочем, не сложно нивелировать ручным разгоном, благо множитель у обоих процессоров разблокирован. Но благодаря единому CCX, неразогнанный 3300X все равно опережает по производительности в играх разогнанный 3100.
Прогрессивный 7-нанометровый техпроцесс положительно сказался на тепловыделение Ryzen 3 3300X. Если вам не требуется прям стопроцентно бесшумный ПК, то можно сэкономить на покупке отдельного башенного кулера и ограничиться комплектным Wraith Stealth. К тому же, Ryzen 3 3300X, на пару с 3100 — самые доступные процессоры с поддержкой высокоскоростной шины PCI-E 4.0. Это дает возможность использовать на полную новейшие видеокарты серии Radeon RX 5000 и твердотельные накопители M.2 со скоростью до 64 Гбит/с.
Как итог, AMD Ryzen 3 3300X — один из самых приятных хардверных сюрпризов 2020 года, который благодаря современной архитектуре Zen 2 с высокой производительностью на такт опережает в играх более многоядерный старый Ryzen 5 2600, хотя последний все еще очень хорош в профессиональных рабочих приложениях. Единственным достойным конкурентом для 3300X, пожалуй, является его старший брат Ryzen 5 3500X с шестью ядрами Zen 2, но без многопоточности SMT. В одних играх предпочтительнее восемь виртуальных потоков, в других — шесть физических ядер.
Конфигурация тестового стенда
- процессоры AMD Ryzen 3 3100 и 3300X;
- кулер Noctua NH-U12S chromax.black ;
- материнская плата ASRock B550 Extreme4;
- оперативная память Patriot Viper Steel DDR4 2x8Gb PVS416G360C7K;
- видеокарта PowerColor Radeon RX 5700 XT Red Dragon;
- системный диск Patriot Viper VP4100 VP4100-1TBM28H 1 ТБ;
- дополнительный диск Patriot P210 P210S1TB25 1 ТБ;
- блок питания Chieftec PowerPlay Platinum GPU-850FC;
- корпус Chieftec SCORPION 3 черный;
- монитор AOC CQ32G1 32 «.
Выводы
Благодаря большому объему кеша L3 и оптимизированным аппаратным инструкция, процессоры AMD Ryzen 3 3100 и 3300X камня на камне не оставили от Core i3-10100, уже не говоря про 9100F без многопоточности, в бенчмарках, имитирующих работу профессиональных приложений. В играх же, где важна прежде всего производительность на такт, ситуация немного иная: даже с разогнанной до 3600 МГц оперативной памятью, младший Ryzen 3 3100 находится примерно на одном уровне с i3-10100. Причем настройки графики в большинстве игр были нарочно установлены минимальными, чтобы оценить зависимость фреймрейта именно от процессора, а не видеокарты. Но стоит учитывать, что 3100 стоит дешевле, чем i3-10100 (а гипотетический удешевленный 10100F без интегрированной графики пока что даже не анонсирован). Зато старший Ryzen 3 3300X существенно обогнал всех конкурентов. К примеру, в CSGO он достиг отметки в почти полтысячи FPS, что с учетом недавнего появления на рынке 360-герцовых мониторов не так уж и бесполезно. По плечу Ryzen 3 3300X, не в последнюю очередь благодаря поддержке PCI-E 4.0, раскрыть потенциал видеокарт от Radeon RX 5500 XT до 5700 XT.
ElasticSearch 7.6.0
Если мы говорим, что 32 ядра нужны для обработки Big Data, то Elastiс — лучший тому пример. Написанный на Java, — этот стек для работы со статистическими данными и логами приложений, является одним из самых востребованных инструментов среди DevOps и Data Science специалистов.
Гипервизор |
VMware ESXi 6.7U3 |
Тестовая виртуалка |
VM, 64 vCPU, 30 Gb Ubuntu Linux 18.04 LTS JAVA Runtime 11 ElasticSearch 7.6.0 |
Из встроенных тестов пакета Rally я выбрал http_logs, поскольку этот тест достаточно большой: 32 Гб данных в развёрнутом виде, и примерно столько же занимают результаты тестирования. За основу измерений мы берём две метрики, первая из которых — добавление документов в индекс.
При тестировании в реальных приложениях какие-то результаты, выбивающиеся из общего тренда, просто не поддаются логическому объяснению. Отчасти это вина разработчиков, которые ставят своей целью написать приложение, а не точный бенчмарк. Отчасти, на погрешность влияют накапливающиеся задержки в программном стеке, и если смотреть на задержки, приняв результаты этого же процессора за единицу, то разброс становится просто колоссальным.
Компания AMD постоянно подчёркивает, что новая архитектура процессоров epyc rome даёт до 40% больше скорости в Java приложениях по сравнению с первым поколением epyc, и в тесте range мне есть чем их порадовать: преимущество почти 10-кратное, но явного победителя в битве между новым серверным и старым игровым процессором нет.
То, чего нет у EPYC!
Очень интересно, что в материнской плате ASRockRack X399D8A-2T используется традиционный сине-серый текстовый BIOS, который (ой, я не могу сдержать эмоции), поддерживает разгон процессора и памяти, а ещё может похвастаться профилями для сохранения настроек оверклокинга. Имеющийся Watchdog таймер перезагрузит ваш сервер, если тот зависнет во время работы от переразгона. Конечно, кто-то скажет, что разгон в сервере — это несерьёзно, но не спешите тушить свечи: в мире есть целый пласт серверов, в которых частота CPU имеет определяющее значение при выборе. Их задача — отработать 8 часов в день, а потом они, как правило, перегружаются или отдыхают. Это — серверы для HFT (High-Frequency Trading), задача которых зарабатывать деньги на бирже методом высокочастотной торговли, то есть выставлением заявок в промежуток времени, пока сервер биржи запрашивает повторный сетевой пакет от клиента, подавшего ордер на покупку/продажу. Такие машины, как правило, устанавливаются в тех же дата-центрах, что и серверы биржи, и их задача с точки зрения оборудования — добиться минимальной задержки в выставлении заявок на покупку/продажу. В таких серверах активно применяется разгон, жидкостное охлаждение, процессоры с частотами 5 ГГц и выше и даже платы FPGA.
Кроме этого, у нас есть целый ряд некритичных задач, таких как рендеринг или расчёт моделей для нейронных сетей, где в случае сбоя можно продолжить задачу с того же шага. Да и вообще не будем забывать, что у геймеров процессоры годами работают в разогнанном режиме, без зависаний, а некоторые вообще не представляют себе компьютер без разгона. Для всех этих случаев материнская плата ASRockRack X399D8A-2T готова, ну а если не хочешь — не разгоняй!
Про EPYC же следует сказать, что если у вас процессор нового, второго поколения, то он отличается от первого возможностью настройки NUMA-конфигураций памяти с привязкой к отдельным группам ядер или всему сокету сразу. Так же вам могут быть доступны настройки задержек памяти, но это зависит от воли производителя материнской платы, и встречается крайне редко.
ThreadRipper и EPYC: различия в контроллерах памяти
У всех трёх рассматриваемых процессоров большие различия в работе с оперативной памятью. У процессоров ThreadRipper второго поколения используется 4-канальный контроллер, у EPYC первого поколения — 8 канальный. И там и там физически контроллер памяти находится на каждом из 4 кристаллов ССХ (Core Complex) с ядрами и кэшпамятью. Получается, что каждые 8 ядер в EPYC первого поколения используют имеют прямой доступ не более чем к двум каналам памяти, и задача гипервизора — правильно адресовать выделенный под виртуальную машину объём памяти, чтобы виртуальные процессоры и виртуальная память обслуживались одним кристаллом процессора.
У процессоров Threadripper 2990WX всё гораздо хуже: два кристалла вообще не имеют собственных контроллеров памяти и обращаются к ней через соседние, что приводит к появлению задержек. Более того, по диаграмме видно, что если вы планируете задействовать все 32 ядра процессора, то в EPYC первого поколения вам лучше установить все 8 модулей памяти, а в Threadripper 2990WX хватит и четырёх. Естественно, что чем масштабнее ваше приложение осуществляет обмен данными с ОЗУ, тем заметнее будет разница между настольным и серверным процессорами AMD, но на практике это нужно далеко не всем.
Кардинальное изменение в новых процессорах EPYC Rome состоит в том, что межпроцессорный коммутатор, шину PCI Express, контроллеры памяти и всю остальную обвязку производитель вынес с кристаллов с ядрами в отдельный центральный чип, так называемый блок ввода/вывода. Таким образом, у вас каждое процессорное ядро получило доступ ко всем 8 каналам памяти, что не только упростило работу гипервизору, но и повысило производительность. Теоретически, одного этого шага должно быть достаточно, чтобы EPYC Rome выигрывал во всех тестах у процессоров с архитектурой Zen 1 и тем же числом ядер, но не будем торопиться (спойлер — многое зависит от архитектуры тестируемого приложения и объема данных).
Скорость числовых операций
Экстремальная нагрузка
Для разных задач требуются разные сильные стороны CPU. Система с малым количеством быстрых ядер и низкими задержками памяти отлично подойдёт для подавляющего числа игр, но уступит системе с большим количеством медленных ядер в сценарии рендеринга.
Мы считаем, что для бюджетного игрового компьютера подходит минимум 4/4 (4 физических ядра и 4 потока) процессор. При этом часть игр может загружать его на 100%, подтормаживать и фризить, а выполнение любых задач в фоне приведёт к просадке ФПС.
В идеале экономный покупатель должен стремиться минимум к 4/8 и 6/6. Геймер с большим бюджетом может выбирать между 6/12, 8/8 и 8/16. Процессоры с 10 и 12 ядрами могут отлично себя показывать в играх при условии высокой частоты и быстрой памяти, но избыточны для подобных задач. Также покупка на перспективу — сомнительная затея, поскольку через несколько лет много медленных ядер могут не обеспечить достаточную игровую производительность.
Подбирая процессор для работы, изучите, сколько ядер используют ваши программы. Например, фото и видео редакторы могут использовать 1-2 ядра при работе с наложением фильтров, а рендеринг или конвертация в этих же редакторах уже использует все потоки.
Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне (максимальное значение в таблице), так и без (минимальное). Типичный результат указан посередине, чем больше заполнена цветная полоса, тем лучше средний результат среди всех протестированных систем.
Аппаратные спецификации
AMD пока не раскрывает все детали о своих новых процессорах – она поделилась лишь основными их параметрами. Тем не менее, даже по ним можно судить, что чипы схожи по большинству характеристик и отличаются в первую очередь своими тактовыми частотами, что и обеспечивает разницу в стоимости.
Ryzen 3 3300X и 3100 получили по четыре ядра с поддержкой двух потоков информации на каждое, но частота 3300X варьируется от 3,8 до 4,3 ГГц, тогда как младший 3100, открывающий серию Matisse, выдает от 3,6 до 3,9 ГГц. В каждом процессоре есть в общей сложности 18 МБ кэш-памяти – она складывается из 2 МБ кэша второго уровня (по 512 КБ на ядро) и 16 МБ кэша L3.
Несмотря на разницу в тактовых частотах, уровень тепловыделения (TDP) у обоих процессоров идентичный – 65 Вт. Это самый низкий показатель в серии Ryzen 3000, но такой же TDP есть и у более производительных чипов в линейке – Ryzen 5 3500X, Ryzen 5 3600, Ryzen 7 3700X и Ryzen 9 3900.
Процессоры AMD Ryzen 3000
Процессор | Ядра / потоки | Тактовая частота, ГГц | Кэш L3, МБ | TDP, Вт | Стоимость, $ |
---|---|---|---|---|---|
Ryzen 9 3950X | 16 / 32 | 3,5 — 4,7 | 64 | 105 | 749 |
Ryzen 9 3900X | 12 / 24 | 3,8 — 4,6 | 64 | 105 | 499 |
Ryzen 9 3900 | 12 / 24 | 3,1 — 4,3 | 64 | 65 | 449 |
Ryzen 7 3800X | 8 / 16 | 3,9 — 4,5 | 32 | 105 | 399 |
Ryzen 7 3700X | 8 / 16 | 3,6 — 4,4 | 32 | 65 | 329 |
Ryzen 5 3600X | 6 / 12 | 3,8 — 4,4 | 32 | 95 | 249 |
Ryzen 5 3600 | 6 / 12 | 3,6 — 4,2 | 32 | 65 | 199 |
Ryzen 5 3500X | 6 / 6 | 3,6 — 4,1 | 32 | 65 | 159 |
Ryzen 3 3300X | 4 / 8 | 3,8 — 4,3 | 16 | 65 | 120 |
Ryzen 3 3100 | 4 / 8 | 3,6 — 3,9 | 16 | 65 | 99 |
Оба процессора основаны на архитектуре Zen 2 и производятся по 7-нанометровому процессу – у AMD нет своих заводов, и выпуском ее чипов занимается тайваньская TSMC. Новые чипы в дополнение к перечисленному оснащены контроллерами интерфейса PCI-Express 4.0 и оперативной памяти DDR4-3200 в двухканальном режиме.
Результаты тестов
Начнём с Cinebench R20. Здесь по традиции скорость тем выше, чем больше вычислительных ядер. Число ядер увеличилось на 33%, а производительность на 30%. При увеличении числа ядер на 50% рост производительности составил от 43% до 48%.
При переходе с 3300X на 3600 производительность растёт на 43%, с 3600 на 3700X на 30%, с 3700X на 3900X на 48%, с 3900X на 3950X на 27%. На некоторые значения влияет тактовая частота, но в целом результаты ожидаемые.
Если смотреть на максимальную одноядерную производительность в режиме Turbo, можно заметить, что частоты не всегда такие же, как при всех загруженных ядрах. 3300X имеет частоту на 100 МГц выше по сравнению с 3600, поэтому превосходит последний в многопоточных нагрузках. Можно увидеть разницу в 100-200 МГц между Ryzen 7 и 9, прирост производительности соответствующий.
Результаты архивирования в 7-zip интересны тем, что здесь нет полной поддержки одновременной многопоточности (SMT), по крайней мере в процессорах с максимальным числом ядер. Прирост производительности составляет 35% при переходе с 3300X на 3600, 28% с 3600 на 3700X, 39% с 3700X на 3900X и всего 16% с 3900X на 3950X. 16-ядерный 32-поточный 3950X проявляет себя не лучшим образом, поэтому посмотрим на результаты разархивирования. В нем SMT задействуется лучше.
Здесь результаты похожи на Cinebench R20. Когда число ядер увеличивается на 50% с 3300X до 3600 и с 3700X на 3900X, рост производительности примерно такой же.
Blender умеет использовать все ядра, вплоть до 64 в Threadripper 3990X. В результате производительность растёт пропорционально. 3900X тратит на обработку на 33% меньше времени по сравнению с 3700X, однако разница при переходе с 3950X на 3900X оставляет всего 22%. Если для вас время = деньги, 3950X имеет смысл, но, по сравнению с 3900X, прирост производительности уменьшается.
Переходим к компиляции кода. Это совсем другой вид нагрузки, хотя результаты получаются похожие. Мы видим прирост производительности в 45% при переходе с 3300X на 3600 и только 23% при обновлении на 3700X.
При сравнении 3700X и 3900X разница составляет 47%, а переход на Ryzen 9 3950X даёт ещё 21%. Для продуктивной работы 3900X предлагает лучшее сочетание цены и скорости.
Процессор AMD Ryzen 9 3900X
Бенчмарк DaVinci Resolve Studio 16 интересен смешанной нагрузкой. Процессоры не нагружены от начала и до конца на 100%, как и в любом связанном с видео программном обеспечении. Самая большая разница в производительности наблюдается при переходе с 3300X на 3600, в остальном прирост наблюдается небольшой.
Adobe Premiere Pro показывает примерно линейную зависимость от роста числа ядер. При увеличении количества ядер на 50% прирост производительности составляет около 20%, а увеличение численности ядер на 33% дает 10% производительности. 3950X предлагает наименьший прирост, но в абсолютном выражении это самый быстрый процессор.
Adobe Photoshop стал первым приложением в наших тестах с высокой нагрузкой на ядра, где они используются не очень хорошо. Разница между 3300X и 3950X составляет только 17% при четырехкратной разнице в количестве ядер.
Такую же картину мы видим в After Effects, хотя переход с 3300X на 3600 даёт двузначной прирост в скорости. В этом приложении 6-ядерный 12-поточный процессор является наиболее подходящим.
Серверная платформа для Threadripper?
В мире есть только одна исключительно серверная материнская плата под ThreadRipper первых двух поколений, выпускаемая компанией ASRock Rack. Этот производитель любит эксперименты, и делает например, Mini ITX плату под LGA3647, или серверные платы на Socket AM4. Именно на платах ASRock Rack работают серверы Hetzner с процессорами Ryzen. К сожалению, сделка ASRock Rack и Hetzner находится под NDA, но складывая те крупицы информации, которые удалось собрать, я предполагаю, что использовалась именно эта материнская плата с минимальными изменениями, характерными для крупного заказчика.
ASRock Rack X399D8A-2T — это ATX платформа с двумя 10-гигабитными портами на самом современном контроллере для 10GBase-T, Intel X550-T2. Эта материнская плата имеет IPMI мониторинг на базе чипа ASpeed AST2500 с выделенным 1-гигабитным сетевым портом, 8 слотов DIMM с поддержкой ECC, два слота M.2 под NVME/SATA, 8x SATA и 5 слотов PCI-E 3.0 формата x16 со скоростями (3 x16 + 2 x8). Во многом материнка повторяет рассмотренную нами ASRockRack EPYCD8-2T для EPYC 7000, но это и понятно: здесь одинаковое расположение слотов памяти, PCI и выводов на задней панельке.
В вопросах охлаждения тоже как-то не густо: самый низкий кулер под Threadripper, который можно встретить в свободной продаже — это Supermicro SNK-P0063AP4 или Dynatron A26 высотой 2U, чуть покачественнее и повыше — Noctua NH-U9 TR4-SP3 под 4U. Учитывая, что Threadripper 2990WX имеет TDP равное 250 Вт, имеет смысл искать платформу с жидкостным охлаждением, и это не пустые слова: для того, чтобы Threadripper 2990WX в нашем тестовом стенде не перегревался и выходил на свои максимальные частоты, мне пришлось не просто использовать жидкостную систему охлаждения с 360-мм радиатором, но и разместить тестовый стенд в помещении с температурой воздуха +10 градусов Цельсия.
С оперативной памятью ситуация следующая: процессоры Ryzen Threadripper поддерживают только небуферизованную память. Они имеют 4-канальный контроллер DDR4, и в серверной материнской плате ASRock Rack X399D8A-2T её частота ограничена 2666 МГц. Буферизованные модули RAM данными процессорами не поддерживаются, а потому большие объёмы ОЗУ в серверах с Threadripper вам недоступны. В списке совместимых модулей DIMM находятся модели объёмом 8 и 16 ГБ, а суммарно на материнскую плату можно поставить до 256 ГБ ОЗУ. Это очень мало для виртуализации, но достаточно для контейнеров или отдельных приложений, требующих высокую процессорную мощность. Как подтверждение того, можем посмотреть на серверы, которые использует CloudFlare, имеющие 256 ГБ ОЗУ.
Во всём остальном возьмите Threadripper, напишите на его крышке фломастером «ЙА EPYC!» и работайте с ним как с «эпиком», а в различиях мы сейчас разберёмся.
Поддержка со стороны VMware
Процессоры ThreadRipper официально и вовсе не поддерживаются гипервизором ESXi, и вряд ли когда будут, ведь vMware даже не сертифицировала серверный EPYC 3000. Это не значит, что VSphere не запустится на ThreadRipper 2990x — ещё как пойдёт. Я протестировал его работу, и даже миграция виртуалок без остановки между хостами ESXi на EPYC и Threadripper работала без проблем. Платформой ASRock X399D8A-2T поддерживаются функции SR-IOV и PCI-E Passthrough, и вы можете например отдать SATA-контроллер гостевой операционной системе для виртуальной СХД.
Всё прекрасно, придраться не к чему, внутри гостевых систем с настройками по умолчанию работает TurboBoost, но само осознание, что уверенности с несертифицированной конфигурацией тебе никто не гарантирует, плотно врезается в подсознание.