Что быстрее 16 ядер или 16 потоков
Перейти к содержимому

Что быстрее 16 ядер или 16 потоков

  • автор:

Изучаем влияние технологии Hyper-Threading на производительность в играх — большой тест

Прочитав комментарии к предыдущему тесту, было решено сделать дополнение. Оно касается технологии многопоточности. Сейчас посмотрим, как сильно влияет на производительность в играх отключение HT (Hyper-Threading) с разным количеством активных ядер.

Hyper-Threading — это технология от Интел позволяющая на одном ядре процессора обрабатывать сразу два потока данных. В процессорах АМД так же присутствует подобная технология, но носит другое название — Simultaneous MultiThreading (SMT).

реклама

Сегодня дополняем прошлое тестирование данными следующих конфигураций процессора — 8с/8t, 6c/6t и 4c/4t (ядра/потоки). Большинство результатов в режимах 8c/16t, 6c/12t и 4c/8t были взяты из прошлого теста. Они никак не изменились за эти несколько дней т.к конфигурация оборудования, игровые настройки и игровые сохранения, служившие стартом для тестирования, остались прежними. Иными словами, данные полностью актуальны. Исключением стала лишь Watch Dogs Legion. В этой игре тест пришлось полностью переделать со всеми вариантами активных ядер + HT т.к. внутри игры изменилось время суток, а вернуться в игровой момент из прошлого теста возможности не было.

Во время тестирования частота процессора, как и в прошлом тесте, была зафиксирована на отметке 5.0 ГГц, частота кольцевой шины на отметке 4,6 ГГц. Память от G.Skill с XMP профилем 4000 МГц 19-19-19-39 1,35v работала в разгоне путем максимального возможного снижения таймингов при безопасном вольтаже для B-die чипов 1,45v. Изменяемыми параметрами сегодня были количество активных ядер — 8, 6 и 4, и включение/отключение технологии HT.

реклама



Тестовая конфигурация и методика тестирования

Настройки графики во всех играх подбирались таким образом, чтобы исключить упор в видеокарту.

реклама

Методика тестирования была следующая. Для теста выбирался определенный отрезок игры или игрового бенчмарка, он прогонялся не менее пяти раз, а значения 0,1%, 1% и средний fps замерялись программой MSI Afterburner. На графиках представлены средние значения по результатам всех прогонов. Я также буду выкладывать серии скриншотов из каждой игры с разным количеством активных ядер. Это нужно для того, чтобы вы могли сами оценить нагрузку на ядра в каждом случае.

  • Процессор — i7 10700k@5.0 ГГц 1,318v
  • ОЗУ — G.Skill Trident Z 2x16GB DDR4 F4-4000C19D-32GTZKK (4000 МГц, 16-16-16-34, 1,45v)
  • Материнская плата — MSI MPG Z490 GAMING PLUS
  • Охлаждение — Noctua NH-D15S
  • Видеокарта — ASUS TUF Gaming GeForce RTX 3080 V2 OC Edition 10GB LHR
  • Накопитель — SSD WD Blue 3D NAND 1TB WDS100T2B0B
  • Блок питания — Cooler Master V1000 1000Вт
  • Операционная система — Windows 10 Pro 22H2

The Witcher 3: Wild Hunt

Первой игрой на сегодня будет Ведьмак 3. Тест будет проходить в DX11.

реклама

Разрешение 1080р, пресет «Запредельный» за исключением настройки NVIDIA HairWorks.

10700K@5.0 4c/8t

Хорошо видно, что в данной игре отключение HT ведет к потере производительности. В случае с шести и четырьмя ядрами к довольно существенной.

Лидером стали 8 ядер / 16 потоков, на втором месте с отставанием 2% по среднему fps оказались 6 ядер / 12 потоков и на третье место с отставанием по среднему fps в 4% вышли 8 ядер / 8 потоков. Конфигурации 6c/12t и 8с/8t показали примерно одинаковую производительность в том числе и по показателям 1% и 0,1%.

Также почти равную производительность выдали 6 ядер / 6 потоков и 4 ядра / 8 потоков с незначительным перевесом 6c/6t.

Хочу отметить, что 4 ядра / 4 потока не просто показали худший результат, игра на четырех потоках постоянно и очень сильно фризила. Это хорошо видно по показателю 1% и 0,1%, а также по графику времени кадров на скриншоте.

Расстановка сил между всеми конфигурациями следующая. (За 100% здесь и далее будет браться результат 8c/16t)

Теперь посмотрим, как отключение HT повлияло на производительность в этой игре относительно количества активных ядер.

В случае с 8-ми активными ядрами отключение HT понизило средний fps всего на 4%. На 6-ти и 4-х ядрах падение больше — в районе 20%.

Horizon Zero Dawn

Следующей игрой в тесте будет Horizon Zero Dawn. Несмотря на то, что тестирование в этой игре проводилось во встроенном бенчмарке, данные я собирал с помощью MSI Afterburner. Делалось это для того, чтобы все показатели во всех играх были получены при помощи одного и того же средства.

Разрешение 1080р, пресет «Приоритет качества»

В данной игре 8 ядер без HT показали лучшую производительность опередив 8 ядер / 16 потоков по среднему fps на 4%.

Видимо Horizon Zero Dawn не слишком требовательна к количеству ядер/потоков процессора (во всяком случае в бенчмарке) и все конфигурации показали хороший результат по среднему fps. Немного портит картину лишь результат 4c/8t и 4c4t по 0,1%. С 4-мя ядрами как с HT так и без в бенчмарке наблюдались редкие фризы, их-за чего показатель 0,1% откровенно плох.

В процентном соотношении разница между конфигурациями выглядит следующим образом.

Стоит отметить, что отключение HT ведет к более существенному снижению 1% и 0,1%, чем среднего fps.

Посмотрим в процентах, как отключение HT повлияло на производительность в Horizon Zero Dawn.

В этой игре в случае с 8-ми активными ядрами отключение HT повысило средний fps на 4%. На 6-ти и 4-х ядрах уже наблюдается падение производительности, на 3% и 11%.

Cyberpunk 2077

Это первая игра на сегодня с трассировкой лучей, соответственно в ней будет два теста — RT on и RT off.

Для теста вместо бенчмарка был выбран определенный отрезок игры.

1. Разрешение 1080р, пресет «Средний», плотность толпы «Высокая».

2. Разрешение 1080р, пресет «Средний», плотность толпы «Высокая» + RT ультра + DLSS производительность.

10700K@5.0 8c/16t RT + DLSS

10700K@5.0 8c/8t RT + DLSS

10700K@5.0 6c/12t RT + DLSS

10700K@5.0 6c/6t RT + DLSS

10700K@5.0 4c/8t RT + DLSS

10700K@5.0 4c/4t RT + DLSS

Без RT бесспорным лидером стали 8 ядер с технологией HT, т.е. со всеми 16-ю потоками. На втором и третьем месте расположились 6 ядер / 12 потоков и 8 ядер / 8 потоков, отставание по среднему фпс составило 10% и 13% соответственно. Как видно из теста, Киберпанк любит потоки, предпочитая 6 ядер с HT чистым 8-ми ядрам.

Похожую производительность показали конфигурации 6c/6t и 4с/8t. По среднему fps немного вперед вышли 6 ядер без технологии многопоточности, хотя показатели 1% и 0,1% примерно равны.

4 ядра без HT ожидаемо показали худший результат.

Хочется отметить, что на конфигурациях 4c/4t и 4c/8t наблюдались микрофризы. Особенно в первом случае.

Переходим к тесту с RT

После включения технологии трассировки лучей расстановка сил не изменилась. По-прежнему лидирует полноценная версия процессора, 6 ядер / 12 потоков на втором месте, на третьем 8 ядер / 8 потоков, а на 4-х ядрах опять наблюдаются микрофризы как с HT, так и без.

Похожую производительность показали конфигурации 6c/6t и 4с/8t с небольшим преимуществом первой.

Общий результат выглядит так.


Отключение HT, как c RT так и без, только снижает производительность процессора в этой игре с любым количеством ядер.

Посмотрим на снижение производительности по среднему fps после отключения HT для 8-ми, 6-ти и 4-х ядер в процентах.

Как видно на графике, в Cyberpunk 2077 чем меньше активных ядер у процессора, тем сильнее снижается его производительность после отключения технологии Hyper-Threading. На 8-ми ядрах fps, как с RT так и без, снизился на 13%, на 6-ти — 18% и 15%, на 4-х — 28% и 23%. При этом стоит отметить, без RT снижение получилось чуть больше.

Watch Dogs Legion

Еще одна игра с трассировкой лучей. Посмотрим, что покажут в ней различные варианты ядер/потоков.

В данной игре был выбран тестовый отрезок вместо внутриигрового бенчмарка.

1. Разрешение 1080р, пресет «Очень высокий».

2. Разрешение 1080р, пресет «Очень высокий» + RT + DLSS качество.

10700K@5.0 8c/16t RT + DLSS

10700K@5.0 8c/8t RT + DLSS

10700K@5.0 6c/12t RT + DLSS

10700K@5.0 6c/6t RT + DLSS

10700K@5.0 4c/8t RT + DLSS

10700K@5.0 4c/4t RT + DLSS

В данной игре отключение HT негативно повлияло на производительность во всех случаях.

В тесте без трассировки лидером стали 8 ядер с HT, что вполне ожидаемо. А вот между конфигурациями процессора 8c/8t и 6c/12t, а также 6c/6t и 4c/8t получилась интересная картина. Производительность каждой пары оказалась идентична, разница на уровне погрешности.

А теперь посмотрим на результат теста с RT.

Тест с трассировкой лучей полностью повторяет результат теста без трассировки, за исключением просевшей производительности от дополнительной нагрузки. Лидер остался прежний, а между 8c/8t и 6c/12t, а также 6c/6t и 4c/8t, практически полный паритет.

Нужно отметить, что на 4-х ядрах / 8-ми потоках были редкие микрофризы, а на 6-ти ядрах без HT, несмотря на равную производительность, этого не наблюдалось. На 4-х ядрах без HT фризы были достаточно сильные.

Общая картина выглядит так.


Теперь посмотрим на снижение производительности по среднему fps после отключения HT для 8-ми, 6-ти и 4-х ядер в процентах.

Наименьшее падение производительности после отключения HT было на 8-ми ядрах — 7-9%, а на 6-ти и 4-х ядрах падение оно уже больше — 21-24%.

Shadow of the Tomb Raider

Последней игрой сегодня будет Shadow of the Tomb Raider.

Для теста использовался третий отрезок внутриигрового бенчмарка, замер проводился с помощью MSI Afterburner.

1. Разрешение 1080р, пресет «Низкий».

2. Разрешение 1080р, пресет «Низкий» + RT + DLSS производительность.

10700K@5.0 8c/16t RT + DLSS

10700K@5.0 8c/8t RT + DLSS

10700K@5.0 6c/12t RT + DLSS

10700K@5.0 6c/6t RT + DLSS

10700K@5.0 4c/8t RT + DLSS

10700K@5.0 4c/4t RT + DLSS

В данной игре лучший результат по среднему fps показали 8 ядер с отключенной технологией HT, хотя по 1% и 0,1% наблюдается небольшое отставание от 8 ядер с HT. На втором месте конфигурация 8c/16t, на третьем 6c/12t. В противостоянии 6c/6t и 4c/8t по среднему fps побеждают 6 ядер.

Посмотрим на результат теста с RT.

После активации RT поменялся лидер, теперь это 8 ядер, но уже с включенной технологией HT, а 8 ядер / 8 потоков показывают производительность близкую к 6 ядрам / 12 потокам.

После отключения HT, в отличие от теста без RT, производительность снизилась во всех случаях.

На 4 ядрах / 4 потоках наблюдались редкие микрофризы с включенным RT.

Разница между конфигурациями выглядит следующим образом.


Если рассмотреть противостояния 8c/8t vs 6c/12t и 6c/6t vs 4c/8t, то можно заметить, что несмотря на более высокий средний фпс у первых, у них т то же время сильнее просадка по 1% и 0,1%. Это говорит о том, что хоть в целом кадров было больше, но они были менее стабильными.

Посмотрим, как повлияло отключения HT на производительность 8-ми, 6-ти и 4-х ядер в процентах.

Как и в Cyberpunk 2077, чем меньше активных ядер у процессора, тем сильнее снижается его производительность после отключения технологии HT. Исключением стали лишь 8 ядер / 8 потоков в тесте без RT. Там производительность немного подросла.

На 8-ми ядрах средний fps без RT увеличился на 1%, c RT упал на 5%. На 6-ти упал на 8% и 12%, на 4-х упал на 20% и 25%. Здесь, в отличие от Киберпанка, в тесте без RT снижение получилось меньше, чем с RT.

Выводы

Можно однозначно сказать, что отключение HT в более новых и действительно тяжелых для процессора играх, только снижает производительность. Это и не удивительно, ведь эти игры создавались уже с расчетом на многопоток. В более старых играх ситуация немного другая и отключение HT может слегка поднять производительность по среднему fps. Но есть один момент, при этом весьма вероятно снижение показателей редких и очень редких событий и мы имеем картину, когда в среднем кадров больше, но они менее стабильны. При этом ядер в любом случае должно быть не менее восьми, иначе, как показали тесты, после отключения HT производительность только снизится. Я не буду говорить о действительно старых или более легких для процессора играх, там все может быть иначе.

Интересно, что 8 ядер / 8 потоков в целом показывают близкую производительность к 6 ядрам / 12 потокам. В двух играх fps был примерно равен, в двух 8 ядер / 8 потоков немного быстрее и в одной слегка медленнее. Однако стоит отметить, что медленнее 8 ядер оказались как раз в самой тяжелой для процессора игре — Cyberpunk 2077. А это значит, что потоки действительно важны для тяжелых проектов.

Не менее интересно противостояние 6 ядер / 6 потоков и 4 ядер / 8 потоков. Производительность довольна близка, но перевес все же оказался на стороне 6 ядер.

Сколько ядер процессора нужно для современных игр?

Сколько ядер процессора нужно для современных игр?

8, 12, 16 — сколько ядер нужно сейчас для игрового компьютера? Какое влияние на производительность оказывают виртуальные потоки? Какая загрузка процессора в той или иной игре и есть ли еще задел на будущее? Многие задавали себе такие вопросы во время выбора процессора. Сегодня попробуем разобраться в них.

Чтобы понять все описанное ниже, стоит чуть-чуть коснуться архитектуры процессоров Zen 2.

Процессоры семейства Zen 2 состоят из чиплета с вычислительными ядрами CCD (Core Complex Die) и чиплета ввода/вывода (cIOD). ССD в свою очередь состоит из двух ССX (Core Complex), один CCX несет в себе до четырех процессорных ядер с поддержкой технологии SMT. Именно комбинация ядер в ССХ позволяет менять количество ядер в процессоре, конечно же, если речь идет о процессорах Zen 2 c числом ядер до 8.

Если в процессоре используется 12–16 ядер, в таком случае используются уже два CCD с тремя активными ядрами в каждом CCX и четырьмя активными ядрами для 16-ядерного процессора Ryzen R9 3950X.

Чтобы тестирование было максимально приближено к младшим процессорам, использоваться будут два процессора серии Zen 2:

Ryzen 9 3900X

Ryzen 7 3700X

2 CCD, 4 ССХ по 3 ядра в каждом

1 ССD, 2 ССХ по 4 ядра в каждом

Путем отключения ядер и технологии SMT в тестировании принимают участие почти все процессоры семейства Zen 2, доступные в продаже, без перекоса по объему кеша третьего уровня и работы шины Infiniti Fabric.

Чиплеты

Конфигурация CCХ

L3-кеш, Мбайт

SMT

Количество потоков

Процессор

Во время тестирования все получившиеся процессоры разогнаны в ручном режиме с фиксацией тактовой частоты для всех ядер на отметке 4200 МГц.

Тестовая конфигурация

  • Процессор — AMD Ryzen 9 3900X и Ryzen 7 3700X;
  • Материнская плата — MSI B450m Mortar;
  • Видеокарта — AMD RX 5700 XT;
  • Память — G.Skill Sniper X 3600MHz 19-20-20-40 G.Skill (F4-3600C19D-32GSXWB) 2 × 16 Гб c разгоном до 3666 MHz с таймингами 16-18-20-36 CR1 ;
  • Накопитель № 1 — M.2 Samsung 970 Pro 512 Гб;
  • Накопитель № 2 — SATA-III SanDisk Ultra II 960 Гб SDSSDHII-960G-G25;
  • Блок питания — ASUS ROG Thor Platinum 1200 Вт.

Во всех протестированных играх установлены максимальные настройки качества графики, сглаживание отключено и выставлено разрешение 720p, чтобы минимизировать 100 % загрузку видеокарты. Для тестирования была установлена операционная система Windows 10 со всеми обновлениями.

Тестирование

PlayerUnknown’s Battlegrounds

Для комфортной игры с приемлемым количеством FPS нужно минимум 8 виртуальных потоков. С увеличением количества потоков до 12 максимальный FPS увеличивается незначительно, но вот плавность игры меняется в лучшую сторону.

Tom Clancy's The Division 2

Игра достаточно хорошо оптимизирована под многоядерные процессоры. Активация технологии SMT у 4-ядерного процессора дает прибавку производительности почти на 20 %. Связано это с тем, что загрузка процессора на протяжения всего тестового отрезка находится в пределах 90-100 %, и это без активности каких-либо фоновых программ. Дальнейшее наращивание количества потоков свыше шести уже не так сильно отражается на производительности.

Counter-Strike Global Offensive

Игра достаточно хорошо оптимизирована под многоядерные процессоры. Активация технологии SMT у 4-ядерного процессора дает прибавку производительности почти на 20 %. Связано это с тем, что загрузка процессора на протяжения всего тестового отрезка находится в пределах 90-100 %, и это без активности каких-либо фоновых программ. Дальнейшее наращивание количества потоков свыше шести уже не так сильно отражается на производительности.

Даже у 4-ядерного процессора есть задел на будущее, потому что его загрузка редко превышала 60 %.

Fortnite

Еще один достаточно популярный онлайн-шутер. Однако в данном случае игра на 4-ядерном процессоре уже не выглядит так однозначно хорошо. Наличие технологии SMT положительно влияет на производительность. Наибольший ее рост наблюдается при переходе от 4 к 6 ядрам, дальнейшее увеличение потока не оказывает практически никакого эффекта на производительность.

На протяжении всего тестового отрезка загрузка 4-ядерного процессора находится в пределах 90 %, что во время активных игровых действий может вызывать фризы и подергивания.

Grand Theft Auto V

После недавней бесплатной раздачи данная игра снова набирает популярность.
Grand Theft Auto V, как и любая игра с открытым миром, любит много ядер. 4-ядерный процессор еще справляется. Это и не удивительно, так как эта игра 2015 года. Однако его загрузка на протяжении всего тестового отрезка близка к 100 %. Увеличение количества ядер более 6 уже не так сильно скажется на производительности, как переход от 4 ядер.

Kingdom Come Deliverance

Kingdom Come: Deliverance — масштабная ролевая игра с открытым миром, которая перенесет вас в Богемию XIV. Игра не отличается хорошей оптимизацией, но даже здесь наблюдается значительный рост производительности от перехода с 4 ядер до 6, особенно по очень редким событиям, которые и отражают основную плавность геймплея.

Metro Exodus

Metro Exodus — одна из тех игр, где вкладываться лучше всего в видеокарту. Разница в производительности при переходе с четырех полноценных ядер на 24-поточный процессор во время игры практически отсутствует, единственное отличие — значительно быстрее запуск самой игры и загрузка уровней.

Если по производительности разницы практически нет, то уровень загрузки между процессорами с разным количеством ядер меняется очень значительно. Имея даже 4-ядерный процессор, можно пройти игру без какого-либо дискомфорта.

Red Dead Redemption 2

Еще одна игра, где изменение количества ядер процессора практически никак не отражается на производительности. Большую часть времени именно видеокарта будет ограничивающим фактором.

Shadow of the Tomb Raider

Данная игра отлично реагирует на рост количества ядер и потоков — чем больше ядер, тем больше производительности. Разница в производительности наблюдается не только при переходе от 4 ядер к 6, но также и при переходе к 8 ядрам и даже 12. Технология SMT проявила себя в данной игре с лучшей стороны.

Данная игра отлично реагирует на рост количества ядер и потоков — чем больше ядер, тем больше производительности. Разница в производительности наблюдается не только при переходе от 4 ядер к 6, но также и при переходе к 8 ядрам и даже 12. Технология SMT проявила себя в данной игре с лучшей стороны.

Выводы

Так называемая Эра 4-ядерных процессоров даже с технологией (SMT и HT) неминуемо подходит к концу, и покупать сейчас процессор для современных игр необходимо минимум c наличием 6 реальных ядер, а лучше 12 виртуальными потоками.

В то же время, если мы говорим про игры, переплачивать за 8/16 или даже 16/32 монстры совершенно не имеет никакого смысла, лучше вложить эти средства в более мощную видеокарту.

Как можно было видеть, загрузка даже 6-ядерного процессора с технологией SMT редко в каких игровых проектах превышала 50 %, что гарантирует некий задел на будущее. А загрузка видеокарты даже в разрешении 720p достаточно часто приближалась к отметке 100 % — именно она в повседневных условиях и будет ограничивающим фактором в производительности.

Поэтому если стоит выбор купить мощнее процессор или видеокарту, то он очевиден.
Производительность в играх ограничивается не только процессором и видеокартой, важную роль играет оптимизация. Если ее нет или она не очень хорошая, как, например, в протестированном Kingdom Come Deliverance, увы, производительность будет соответствующая, и неважно, сколько ядер у процессора или насколько мощная видеокарта.

Ядра или потоки: выясняем что важнее для процессора

Сергей Коваль

Ядра или потоки: выясняем что важнее для процессораВ описании современных процессоров указаны количества ядер и потоков. Что обозначают эти цифры, на какие показатели следует ориентироваться при покупке процессора.

В спецификации каждого процессора обязательно присутствует информация о количестве ядер и потоков. Правила «чем больше, тем лучше», в этой ситуации никто не отменял, но давайте выясним, в каких задачах виртуальные ядра способны дать ощутимый прирост производительности, а в каких останутся бесполезными.

Зачем процессору несколько ядер?

Процессор – это вычислительный центр любого компьютера, планшета, смартфона и даже игровой консоли. Именно процессор принимает команды пользователя, вводимые в различных приложениях и программах, обрабатывает их и распределяет задачи между другими узлами системы – видеокартой , оперативной памятью , твердотельным диском.

Вот поэтому процессор – это мозговой центр каждого компьютера, отвечающий за его вычислительные способности и скорость работы.

Первые процессоры были едиными устройствами, которые принимали команды и выполняли их в строгой очередности. Одно ядро позволяло выбирать процессор при покупке только по показателям частоты. А недостаток производительности на первых порах компенсировали созданием двух- и многопроцессорных конфигураций. В таких сборках команды пользователя на ввод обрабатывал первый процессор, а остальные операции по возможности равномерно распределялись между остальными. Для сборки таких систем использовались двухпроцессорные материнские платы или конфигурации на несколько сокетов.

Следующим шагом производители создали многоядерную архитектуру, позволяющую на площади, казалось бы, небольшого микрочипа размещать несколько вычислительных центров, которые по сути являлись самостоятельными процессорами. Так в продаже появились двух-, четырех- и восьмиядерные устройства, которые обрабатывали сразу несколько потоков информации.

Позже корпорация Intel в линейке процессоров Pentium внедрила техническую возможность выполнения одним ядром двух команд за такт, что стало началом новой эпохи в компьютерных технологиях – гиперпоточности процессоров. А сейчас специалисты компании активно работают над новой технологией реализации четырех потоков на одном ядре, и уже в ближайшее время подобные процессоры будут представлены публике.

Чем отличаются ядра и потоки

Ядро – это самостоятельный вычислительный блок в архитектуре процессора, способный выполнять линейную последовательность задач за определенный период времени. Если нагрузить одно ядро несколькими последовательностями задач, то оно будет попеременно переключаться между ними, обрабатывая по одной задаче из каждого потока. В масштабах системы это приводит к замедлению работы программ и сервисов.

Поток – это программно-выделенная область в физическом ядре процессора. Такая виртуальная реализация позволяет разделять ресурсы ядра и работать параллельно с двумя разными последовательностями команд. Таким образом операционная система воспринимает поток, как отдельный вычислительный центр, следовательно, ресурс ядра используется более рационально, и скорость вычислений увеличивается.

Стоит ли ожидать удвоения производительности?

Виртуальное разделение вычислительной мощности процессора на потоки называется гиперпоточностью. На практике это не физическое увеличение количества ядер, следовательно, и вычислительный потенциал процессора остается постоянным.

Гиперпоточность – это инструмент, позволяющий процессору более оперативно выполнять команды операционной системы и распределять вычислительный ресурс.

Таким образом, удвоенное количество потоков по отношению к ядрам способно повысить эффективность процессора за счет одновременного выполнения нескольких задач каждым ядром. Но прирост, даже по заверениям лидера рынка в производстве процессоров Intel будет находиться в пределах 30%.

А вот об увеличении энергопотребления и чрезмерном нагреве волноваться не стоит. Так как виртуальное разделение выполнено на производстве, то компанией просчитаны все рабочие параметры, такие как мощность и TDP, указанные в спецификации.

Что выбирать: ядра или потоки?

Поскольку ядра – это физические «мозговые центры», занимающиеся вычислениями, то за общую производительность центрального процессора отвечают именно они. Поэтому количеством ядер, ну и еще частотой процессора определяется его производительность.

Но и количество потоков также заслуживает внимания. Разберем на примере:

Двухъядерный процессор с двумя потокам нагружается операционной системой четырьмя параллельными последовательностями команд, например, от открытых игр и программ. Команды так и останутся в четырех «очередях», и ядра будут попеременно производить вычисления из каждой. При этом производительность ядра зачастую избыточна для обработки одной команды. Поэтому часть вычислительного потенциала ядра, а значит и процессора останется в резерве.

Если же взять аналогичный процессор с двумя ядрами, но уже на четыре потока, то все четыре очереди будут задействованы одновременно, по максимуму загружая ядра. Следовательно, задачи будут решены быстрее, а простоя вычислительных мощностей удастся избежать.

На практике это дает нам возможность одновременно запускать несколько программ: работать с документами, слушать музыку, общаться в мессенджерах и выполнять поиск в браузере. При этом программы будут работать эффективно, быстро, без торможений и зависаний.

В производственных масштабах для комплектации рабочих станций или серверов также следует отдать предпочтение большему количеству потоков при равных числах ядер. За исключением особых случаев, таких как работа с 1С, когда решающую роль играет тактовая частота, и ряда других приложений, активно использующих TCP/IP стек. В этих случаях распараллеливание вызывает существенную задержку при обработке пакетов.

Таким образом, чем больше ядер будет в процессоре, тем выше его производительность и скорость выполнения различных задач. А удвоенное количество потоков позволяет повысить эффективность процессора и задействовать его технический потенциал на полную.

Какой процессор нужен игровому ПК? Часть 2 — массовая платформа AMD AM4

Напомню, что в первой части цикла «Какой процессор нужен игровому ПК?» мы рассмотрели производительность чипов для массовых платформ Intel LGA1200 и LGA1700. При помощи несложных экспериментов нам удалось установить зависимость изменения FPS в играх от различных характеристик ЦП. Также мы протестировали несколько наиболее популярных процессоров с различными видеокартами. Какие-то результаты оказались довольно прогнозируемыми, а какие-то — новыми и даже неожиданными.

Во второй части, как нетрудно догадаться, изучена игровая производительность современных чипов AMD. Сравнивая массовые платформы процессорных гигантов, мы сразу же сталкиваемся с первым серьезным различием: «красные» предлагают потребителю процессоры разных поколений — Zen, Zen 2 и Zen 3 — в рамках одной платформы, тогда как у «синих» платформа успела поменяться несколько раз. Пусть с некоторыми оговорками и нюансами, но выпущенные еще в 2017 году материнские платы поддерживают новинки AMD, представленные совсем недавно. Смотрится эпично? Еще как! Особенно на фоне того, что Intel успела обновить сразу три (а по факту — четыре) актуальные массовые платформы: LGA1151-v1, LGA1151-v2, LGA1200 и LGA1700.

На протяжении всего времени процессоры Ryzen становились лучше и быстрее — об этом мы и поговорим сегодня.

 Какой процессор нужен игровому ПК? Часть 2 — массовая платформа AMD

Какой процессор нужен игровому ПК? Часть 2 — массовая платформа AMD

⇡#Микроархитектура, кеш, ядра или частота?

Платформа AM4 и первое поколение процессоров Ryzen появились в марте 2017 года — новая микроархитектура Zen предложила на 52 % больше операций за такт (IPC), нежели ядра Bulldozer для платформы AM3+. Раньше было как? Были 6- и 8-ядерные процессоры серии FX, конкурирующие в играх лишь с двухъядерными чипами Core. На этом фоне массовые 4-ядерники Intel, по сути, соревновались друг с другом, предлагая пользователю те самые «+5 % роста в год». С появлением платформы AM4 все изменилось, и «красные» первыми предложили массовые модели сначала 8-ядерных, а затем 12- и 16-ядерных версий центральных процессоров.

Ну а Intel все это время только отвечала на решительные действия «красных». Вероятнее всего, только в 13-м поколении процессоров Core чипмейкер впервые предложит больше ядер (с некоторыми оговорками, правда), чем есть у AMD.

На протяжении всего жизненного цикла платформы AMD рекомендовала «камни» Ryzen для игр. Чипы поколений Zen, Zen+ и Zen 2 чипмейкер позиционировал как устройства, способные одновременно тянуть и игровую нагрузку, и прочие ресурсоемкие задачи. Кристаллы Zen 3 серьезно прибавили в игровой производительности, а внедрение технологии 3D V-Cache позволило AMD замахнуться на звание создателя самых быстрых игровых процессоров современности.

В чипах Ryzen за все время менялась не только микроархитектура, но и тактовая частота, число ядер, а также объем кеш-памяти. Давайте посмотрим, что из этого вышло спустя пять с лишним лет с момента появления платформы AM4 в продаже.

⇡#Микроархитектура

В апреле 2018 года AMD представила серию процессоров Ryzen 2000 — в них микроархитектура Zen была переведена с 14-нм техпроцесса на 12-нм. Так появились чипы Zen+, но со временем некоторые чипы Ryzen 1000 тоже были переведены на другой техпроцесс. Сама же технология 12LP блеснула в другом: она позволила поднять производительность транзисторов, одновременно понизив их токи утечки. Иными словами, чипы с микроархитектурой Zen стали быстрее за счет увеличения тактовой частоты. В том же Ryzen 7 2700X она увеличилась на 11-15 % относительно показателей Ryzen 7 1800X.

Процессоры Zen 2 появились летом 2019 года. Новые кристаллы предложили +15 % к росту IPC, а еще — больше ядер и кеша. Впервые для массовых компьютерных платформ были представлены 12- и 16-ядерные модели, а в 6- и 8-ядерных чипах увеличилась кеш-память — с 16 до 32 Мбайт.

Спустя год «красные» представили процессоры Ryzen 5000 и долгожданную микроархитектуру Zen 3. Удельная производительность одного ядра в новинке в пересчете на такт выросла на 19 %. Ускорение относительно Zen 2 серьезное, и именно оно позволило AM4 стать полноценной игровой платформой. «Полноценной» — значит на 100 % конкурентоспособной по отношению к Skylake и Cypress Cove от Intel.

Это показывают и результаты тестирования. За три с лишним года «красным» удалось увеличить быстродействие своих чипов на 32-39 % благодаря одним только микроархитектурным улучшениям. Так показывает наш небольшой эксперимент, в котором использовались 6-ядерные Ryzen 5 5600X, Ryzen 5 3600 и Ryzen 5 2600, работающие на одинаковой частоте — 4 ГГц.

Когда осмысляешь результаты этого эксперимента, приходит понимание, почему в 2022 году среди процессоров AMD есть смысл рассматривать только чипы с микроархитектурой Zen (а также Zen+, Zen 2 и Zen 3). Напомню, что для платформы AM4 выпущены в том числе и кристаллы серий А и Athlon, основанные на микроархитектуре Bulldozer. А это — -52 % к первому поколению Zen.

* Набор игр, тестовые сцены, настройки качества графики, а также таблицы с подробными результатами тестирования приведены на последней странице. Это относится ко всем графикам в статье, если не указано иное.

В стендах использовалась память стандарта DDR4-3466 и видеокарта GeForce RTX 3090 (ускоритель не поддерживает технологию Re-Size BAR.). Тестирование (здесь и далее) проводилось в шести играх (Total War Saga: TROY, GTA V, Marvel’s Guardians of the Galaxy, HITMAN 3, Far Cry 6, Cyberpunk 2077) в разрешении Full HD с использованием качества графики, приближенного к максимальному, но без использования трассировки лучей и современных методов апскейлинга.

⇡#Ядра и потоки

Процессоры Ryzen, по сути, развязали «ядерную войну». В ресурсоемких приложениях Ryzen 7 1800X стоимостью $499 легко конкурировал с Core i7-6900K за $1 089. Чтобы вы понимали: в Intel при отсутствии какой-либо конкуренции не стеснялись продавать зажиточным геймерам 6-ядерный Core i7-6850K (для HEDT-платформы LGA2011-v3) за 617 долларов США. Знаменитый четырехъядерный Core i7-7700K стоил 339 долларов в те времена, а за 10-ядерный Core i7-6950X просили 1 723 доллара США в партии от 1000 штук. С появлением чипов Zen и конкуренции «синим» пришлось стать скромнее, а те же 6-ядерники стали массовыми процессорами. Я бы даже сказал, народными.

Естественно, большое число ядер и потоков в процессоре хорошо сказывается на быстродействии компьютера в ресурсоемких задачах. Только с появлением платформы LGA1700 у таких чипов, как Ryzen 9 5950X и Ryzen 9 5900X, появились достойные конкуренты на этом поприще. В играх же от дополнительных ядер особого толка нет: двухкратное увеличение числа ядер и потоков не приводит к пропорциональному росту FPS.

Я использовал 12-ядерный Ryzen 9 5900X, в котором поочередно отключали ядра в блоках CCD и технологию SMT. Чип работал на фиксированной частоте 4 ГГц. К сожалению, достать Ryzen 9 5950X не получилось, но справедливости ради стоит отметить, что поведение этого процессора легко прогнозируется и без дополнительных тестов. Между 12- и 16-ядерниками Zen 3 в играх смело можно ставить знак равенства. Интересно другое.

Во-первых, разница между схемой 6/12 (ядра/потоки) и 12/24 составляет всего 4-7 %. Процессор с восемью ядрами и 16 потоками оказывается быстрее всего на 2-3 %. И вновь констатируем факт: современным играм вполне достаточно шести быстрых ядер и 12 потоков. Тем не менее, во-вторых, отключение технологии SMT в случае с нашим набором игр приводит к увеличению фреймрейта в некоторых приложениях: схема 12/12 опережает вариант 12/24 на 3-5 %. Лидерство — символическое, и подобное мы видели в первой части статьи. С одной лишь разницей: с Ryzen 9 5900X этот эффект заметен чуть лучше.

В остальном же мы наблюдаем довольно привычную картину. Переход со схемы 6/12 на схему 6/6 ощутимо снижает кадровую частоту в шести выбранных играх — на 7 % в среднем. Получается, здесь SMT, наоборот, приносит только пользу игровому компьютеру. Например, отключение шести дополнительных потоков серьезно обваливает FPS в Cyberpunk 2077 — в игре про приключения молодого авантюриста Ви фреймрейт сдулся аж на 17-24 %. Мы «магическим» образом обронили четверть производительности видеокарты.

В то же время формат 4/8 все ближе подбирается к 6/6. В случае с Ryzen 9 5900X разница составила 4-5 % в пользу шести ядер. Интересно, что в случае с Core i9-12900K в аналогичных условиях схема 6/6 опережает вариант 4/8 всего на 1 %. Полагаю, со временем 8-поточные 4-ядерные процессоры обойдут 6-ядерные чипы без поддержки SMT или Hyper-Threading.

Четырехъядерные процессоры Zen 3 без поддержки SMT, как и модели с меньшим числом ядер, очень тяжело в 2022 году считать игровыми. Быть может, именно поэтому среди современных десктопных решений AMD таких моделей на момент написания статьи у AMD нет. Зато в продаже находится полно чипов с формулой 4/4 и 4/8 на базе микроархитектуры первой и второй итераций. Уверен, вы прекрасно понимаете, что в случае с Zen и Zen 2 ситуация усугубится еще сильнее — в этом вы убедитесь во второй части статьи.

⇡#Тактовая частота

Переход от Zen (Zen+) к Zen 2 и Zen 3 сопровождался заметным ростом тактовой частоты вычислительных ядер. Так, 8-ядерный Ryzen 7 1800X при загрузке всех ядер работает на частоте 3,7 ГГц. В Ryzen 7 2700X, который использует ту же микроархитектуру, но произведен по более тонкому техпроцессу, частота увеличилась еще на 250 МГц. В Ryzen 7 3800X этот параметр был увеличен до 4,15 ГГц, а в Ryzen 7 5800X — до 4,5 ГГц.

Модельный ряд чипов AMD и Intel искусственно раздут — тоже мне секрет Полишинеля. Производительность процессоров с одинаковыми характеристики схожа, так как они работают со схожей тактовой частотой. Например, в продаже вы найдете 6-ядерные модели Ryzen 6 3600, Ryzen 5 3600X и Ryzen 5 3600XT. В разных условиях работы частота этих чипов различается всего на 200-300 МГц, а остальные характеристики и вовсе одинаковые. Выходит, в играх один процессор окажется быстрее другого в среднем на 3-4 %. А потому между Ryzen 5 5600X и Ryzen 5 5600, а также между Ryzen 5 5800X и Ryzen 5 5700X смело можно ставить знак равенства. Покупать следует более доступную модель.

Уже известно, что процессоры Ryzen 7000 (они же — Raphael), выход которых запланирован на конец этого года, получат микроархитектуру Zen 4. Она обеспечит рост IPC на 8-10 % относительно показателей Zen 3. При этом число ядер новых чипов не изменится — для массовой платформы AM5 «красные» предложат максимум 16 ядер и поддержку технологии SMT. Тактовая частота ядер увеличится, и в Boost-режиме некоторые из них будут автоматически разгоняться до 5,5 ГГц, а может, и чуточку больше. Если озвученная AMD информация окажется правдой, то процессоры Ryzen 7000 будут заметно быстрее своих предшественников в играх.

⇡#Кеш-память

Среди процессоров AMD есть схожие модели с разным объемом кеш-памяти, при этом в чипах Ryzen этот параметр серьезно влияет на быстродействие компьютеров в играх. Ниже на графике представлены результаты тестирования Ryzen 5 5600X (32 Мбайт кеш L3) и Ryzen 5 5600G (16 Мбайт) — оба процессора работали на одинаковой частоте 4 ГГц. Версия Zen 3 с увеличенным вдвое кешем третьего уровня оказалась быстрее в среднем на 11-17 %.

Заметная разница, на мой взгляд. Уменьшенный объем кеша в некоторых чипах AMD приводит нас к интересным противостояниям внутри самой экосистемы Zen. Например, Ryzen 5 3600 стоит меньше Ryzen 5 5600G. При этом у 6-ядерника Zen 2 вдвое больше кеша третьего уровня, но менее производительная микроархитектура в сравнении с Zen 3. Что же выбрать? В случае с дискретной графикой игровая производительность этих чипов почти одинакова, подробнее их сравнение можно изучить в соответствующем разделе обзора.

Со временем процессоры, произведенные по технологии 3D V-Cache, станут отдельным классом устройств, предназначенных именно для игр. Такие чипы получат дополнительный кристалл SRAM-памяти, монтируемый над имеющимся в процессорном кристалле L3-кешем и объединенный с ним сквозными соединениями.

Первой ласточкой стал 8-ядерный Ryzen 7 5800X3D — последний высокопроизводительный чип, выпущенный для платформы AM4 на данный момент. В сравнении с Ryzen 7 5800X восьмиядерник с 3D V-Cache получил сразу втрое больше L3-кеша. А в сравнении с Ryzen 7 5700G — вшестеро, 96 Мбайт! Да, внедрение дополнительного кристалла приводит к заметному снижению тактовой частоты чипа, но в играх Ryzen 7 5800X3D все равно серьезно опережает Ryzen 7 5800X. Перед вами самый быстрый игровой «камень» AMD, выпущенный когда-либо, и, возможно, самый быстрый игровой процессор вообще.

К сожалению, достать Ryzen 7 5800X3D у меня не получилось — на момент проведения тестов этот 8-ядерник не продавался в российских магазинах. Однако наши тесты показывают, что чип с 3D V-Cache опережает Ryzen 7 5800X, Ryzen 9 5900X и Ryzen 9 5950X в среднем на 11-16 %.

⇡#Оперативная память

В первой части цикла, посвященной массовым платформам Intel, я не затрагивал тему выбора оперативной памяти. В случае с AM4 этот вопрос необходимо разобрать более тщательно.

Процессоры Zen первого поколения оказались крайне капризными в вопросах выбора оперативной памяти. В статье «Память для AMD Ryzen: влияние на производительность и правильный выбор», вышедшей в 2017 году, мы отмечали, что подобрать подходящую DDR4 SDRAM для Ryzen 1000 очень непросто, так как контроллер памяти этих процессоров ужасно привередлив, и на высоких частотах с ним могут сработаться очень немногие модули памяти. Фактически на заре появления платформы AM4 память, работающую в режиме выше DDR4-2400, подбирать приходилось по специальному рецепту, ориентируясь на списки совместимого оборудования, полупроводниковые кристаллы некоторых марок и ранги. Даже сейчас нужна определенная сноровка, чтобы заставить чипы Ryzen 1000 и Ryzen 2000 работать с ОЗУ стандарта DDR4-3600.

С выходом Zen 2 и Zen 3 ситуация с совместимостью заметно улучшилась. Платформа AM4 стала зрелой, заметные болячки исчезли. Однако даже сейчас наиболее эффективно процессоры Ryzen работают с памятью стандартов DDR4-3600, DDR4-3733, DDR4-3800 и иногда DDR4-4000. Использование памяти с эффективной частотой выше этих значений не приводит к увеличению FPS, и даже, наоборот, оказывает негативное влияние, если не разгонять шину Infinity Fabric.

Секрет прост: создание процессоров по технологии чиплетов привело к тому, что ядра процессора и контроллер памяти разделены. Связь чиплетов друг с другом обеспечивает хорошо знакомая нам шина Infinity Fabric — ее частота для Ryzen 3000 и Ryzen 5000 по умолчанию составляет 1800 МГц. Частоты Infinity Fabric и ОЗУ не привязаны друг к другу, но частота шины должна быть либо равна реальной частоте оперативной памяти, либо меньше нее. Вот и получается, что при использовании комплектов ОЗУ, работающих на эффективной частоте выше 3600 МГц, тактовый генератор контроллера памяти начинает работать в режиме 2:1, то есть его частота уменьшается вдвое. Как итог, более быстрая (по частоте) оперативная память работает неэффективно — и это хорошо проиллюстрировано в статье «Какая оперативная память необходима игровому компьютеру в 2020 году (и в 2021-м — тоже)».

Частоту Infinity Fabric реально увеличить самостоятельно, но здесь возможны сложности. Например, магазинные образцы Ryzen 5 5600X и Ryzen 7 5800X, используемые для этой статьи, спокойно, то есть в режиме 1:1, завелись с памятью DDR4-3800, но не более. До этого ко мне попадали версии чипов Zen 3, работающих в режиме 1:1 только при эффективной частоте памяти 3666 МГц — и это очень мало для таких ЦП в 2022 году. А вот Ryzen 5 5600G, предоставленный «Регардом», заработал в режиме 1:1 даже с памятью DDR4-4000. Как видите, мы сталкиваемся со своего рода лотереей.

Для проведения следующего эксперимента я взял комплект оперативной памяти Thermaltake TOUGHRAM Z-ONE RGB, поддерживающий режим DDR4-4600 при наборе основных задержек 19-26-26-45. Как мы уже выяснили, такая высокая эффективная частота для платформы AM4 нам не нужна. Уменьшив ее до 3800 МГц, я в то же время заметно снизил тайминги — как первичные, так и вторичные/третичные.

Маневры с настройкой ОЗУ себя полностью оправдали. Если Ryzen 5 5600X с «мозгами» DDR4-3466 уступает Core i5-12400F в среднем 5-9 %, то после установки другой памяти и ее настройки в роли догоняющего выступил уже 6-ядерник Alder Lake.

Большая часть тестов проводилась с оперативной памятью DDR4-3466, с включением стандартного XMP-профиля. Во-первых, потому, что здесь мы сравниваем различные поколения чипов Zen. А во-вторых — потому, что даже в 2022 году наибольшей популярностью пользуется память с эффективной частотой 3000-3600 МГц. А разгоном и настройкой таймингов занимаются единицы энтузиастов. Если вы хотите приобщиться к этому весьма интересному занятию, то я категорически рекомендую прочитать статью «Как выбрать и настроить память для Ryzen 5000, чтобы не профукать 15 % FPS на ровном месте».

⇡#История одного ПК

Есть один неоспоримый факт: сегодняшний материал в это непростое время не появился бы без поддержки наших партнеров. Вторая часть вышла при поддержке компаний Thermaltake, MSI и компьютерного магазина «Регард». Именно они предоставили нам все необходимые комплектующие для тестирования. Перечень всего железа вы найдете в разделе «Методика тестирования и стенд». Я же расскажу вам историю одного ПК — тестового стенда, который в самом производительном и дорогом варианте оснащен 12-ядерным Ryzen 9 5900X, GeForce RTX 3090 и материнской платой на базе чипсета B550. Полный перечень устройств выглядит следующим образом:

  • центральный процессор AMD Ryzen 9 5900X;
  • система жидкостного охлаждения Thermaltake TOUGHLIQUID 360 ARGB Sync;
  • материнская плата MSI MAG B550M MORTAR;
  • оперативная память Thermaltake TOUGHRAM Z-ONE RGB (DDR4-4600, 19-26-26-45);
  • видеокарта MSI GeForce RTX 3090 SUPRIM X 24G;
  • твердотельный накопитель Intel 760p SSDPEKKW020T8X1 2 Тбайт;
  • блок питания Thermaltake Toughpower iRGB PLUS 850W Gold, 850 Вт;
  • корпус Thermaltake Divider 500 TG Air Snow Mid Tower.

Подробно про MSI GeForce RTX 3090 SUPRIM X 24G я рассказывал в первой части статьи. А еще на нашем сайте есть большой обзор этой видеокарты. Так что не вижу смысла повторяться. Давайте познакомимся с остальными комплектующими, из которых был собран тестовый стенд, и начнем с корпуса.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *