Gtx 970 проблемы с памятью
Скандал вокруг NVIDIA GeForce GTX 970, а точнее, вокруг объёма и скорости работы её видеопамяти, длится уже несколько недель. Давно выяснилось, что на полной скорости в этом видеоадаптере работают только первые 3,5 Гбайт видеопамяти, тогда как полугигабайтный остаток функционирует куда медленнее, хотя формально и позволяет получить доступ ко всем 4 гигабайтам, установленным на борту. Дело дошло даже до подачи коллективного иска с формулировкой «за введение в заблуждение с помощью недобросовестной рекламы». Очевидно, пришла пора для извинений со стороны NVIDIA. И они были принесены.
Как выразил в своём заявлении главный исполнительный директор NVIDIA, Жэнь-Сунь Хуан, «мы создали новую архитектуру памяти в Maxwell. Новой возможностью стало использование усечённых конфигураций с полным объёмом видеопамяти — так, чтобы, к примеру, GeForce GTX 970 не была ограничена 3 Гбайт памяти, а располагала бы дополнительным гигабайтом. GeForce GTX 970 — четырёхгигабайтная карта. Но верхняя половина дополнительного гигабайта сегментирована и имеет меньшую пропускную способность. Это хороший дизайн, поскольку мы смогли оснастить GeForce GTX 970 дополнительным гигабайтом памяти, а наши инженеры-разработчики программного обеспечения могут сделать использование верхних 512 Мбайт видеопамяти как можно более редким».
То самое узкое место в архитектуре GeForce GTX 970
«К сожалению, мы не смогли правильно передать этот нюанс нашей маркетинговой команде и независимым обозревателям в момент анонса. Все 4 Гбайт памяти на борту GeForce GTX 970 доступны и их наличие полезно для достижения уровня производительности, удовлетворяющего вас. Как и ранее, наши разработчики продолжат улучшать производительность в играх, и обновления можно будет регулярно получать через GeForce Experience. Но эта новая возможность Maxwell должна была быть описана в деталях с самого начала. Мы не позволим этому случиться снова и наша следующая работа будет выполнена лучше». Таким образом, NVIDIA окончательно признала поражение в вопросе с видеопамятью GeForce GTX 970 и обещала, что впредь подобного не повторится. Мы надеемся, что компания сдержит своё обещание.
Несмотря на указание игре использовать «неограниченную память», фактически используемый ее объем составил 2.1 Гбайт. Среднее количество кадров в секунду ушло далеко за 60. Переходим на уровень выше.
При смене разрешения производительность упала, и существенно – до 38 к/с. Для стратегии с элементами 3D показатель низкий. Лучше держаться минимума в 40-45 к/с. Общий объем используемой памяти достиг всего 2.6 Гбайт. Становится понятно, что основная нагрузка приходится на возможности GPU, а не объем памяти.
Видеокарта AMD под схожей нагрузкой показала 35 к/с и использовала на 200 Мбайт больше.
Сколько бы не улучшалось качество, задействовать более 3.3 Гбайт не удалось. А производительность тем временем опустилась до 20 к/с, что находится ниже нормального значения. Radeon R9 290X показала результат в 19.2 к/с, и независимо от объема задействованной или пустой памяти такое количество кадров неприемлемо для игры.
Far Cry III
- DirectX 11;
- MSAA – Anti-Aliasing 8;
- Alpha to coverage – enhanced;
- SSAO – Method SSAO;
- Field of view – 110;
- Overall quality – ultra.
Far Cry III не предъявляет высоких требований к объему памяти на видеокартах Nvidia, всего 1.6 Гбайт в Full HD разрешении при максимальных настройках. При этом производительность не такая высокая – 45.5 к/с.
реклама
Модель AMD по непонятной причине старается закэшировать и занять почти весь объем своей памяти, но со временем разгружает ее. И, несмотря на то, что 4 Гбайт вполне достаточно для игры, с производительностью в Far Cry III у Radeon R9 290X большие проблемы, всего 36 к/с. Поэтому быстро переходим в 2К.
Разница между Full HD и 2K небольшая и составляет 600 Мбайт, итоговый задействованный объем – 2.2 Гбайт. Производительность снизилась до 27.7 к/с, что делает из игры почти пошаговую стратегию. Еще хуже шли дела у видеокарты AMD: 25 к/с ничем не лучше 27.7 к/с у продукта Nvidia. А что творилось с задействованной памятью, не поддается объяснению. Думаю, это нюансы объемного игрового мира Far Cry III, который, по замыслу разработчиков, должен сразу загружаться в буфер видеокарты.
Мы продолжаем эксперимент и переходим в разрешение 5120 х 1440.
Вот он, первый случай, когда превышен объем быстрой памяти на GeForce GTX 970. И что же мы видим? В первые секунды теста несколько скачков за предел в 3.5 Гбайт и интенсивный обмен данными с оперативной памятью. Скорость резко падает до 1-2 к/с и потом восстанавливается до 14 к/с. Далее видеокарта старается уместить все данные в 3.4 Гбайт.
Модель AMD, наоборот, легко вмещает все данные в память и не позволяет частоте кадров упасть так низко. В среднем она быстрее GeForce GTX 970, демонстрируя 18 к/с.
Crysis 3
- Antialiasing MSAA – High 8x;
- Texture resolution – Very high;
- System spec – Very high;
- Motion Blur amount – Low.
Увы, но MSAA 8x и самые качественные текстуры в Full HD занимают не более 2.1 Гбайт памяти. Это автоматически позволяет раскрыться GPU GM204 полностью. Средняя скорость в игре – 42 к/с. В разрешении 1920 х 1080 видеокарта Radeon R9 290X держится на втором месте, показывая 40 к/с.
Но как только мы начнем увеличивать разрешение и повышать нагрузку, Hawaii начнут лидировать.
Почти 3 Гбайта и всего 25.6 к/с. Становится понятно, что GeForce GTX 970 не под силу тянуть 2К разрешение на максимальных настройках. Radeon R9 290X лучше справляется с нагрузкой, показывая 27 к/с.
У перехода на следующую ступень разрешения вряд ли есть смысл, поскольку общая производительность будет слишком низкой, но проверить это стоит.
реклама
В 5120 х 1440 задействовано 3.8 Гбайт памяти, но к этому моменту скорость вывода кадров снизилась до такой степени, что игра превратилась в показ слайдов. Ситуацию бы не спасло и наличие у GeForce GTX 970 полноценной системы памяти с 4 Гбайтами, и причина здесь кроется в характеристиках.
Да и Radeon R9 290X полностью израсходовала всю память. Средняя скорость при этом составила 14 к/с, что лучше, чем у представителя Nvidia с его 8 к/с.
Battlefield 4
- Поле зрения – 105 (Hor+120);
- Поле зрения (открытый прицел) – включено;
- Поле зрения техники – 97 (Hor+111);
- Уровень размытия в движении – 0;
- Разрешение – 100%;
- Качество графики – ультра.
реклама
На начальном этапе игра использует более 2 Гбайт памяти. Настройки, напомним, выставлены в максимальные за исключением разрешения, оно оставлено по умолчанию 100%. А скорость отрисовки составила впечатляющие 83 к/с. Думаю, такими темпами мы легко дойдем до теоретического лимита в 3.5 Гбайт и приемлемой производительности.
У видеокарты AMD ситуация схожая: объем задействованной памяти аналогичен, но количество кадров в секунду меньше – 76.
2.7 Гбайт, лучше, но недостаточно. Средняя производительность 53.4 к/с – это отличный результат с учетом максимальных настроек и 2К разрешения. У конкурента идентичный объем используемой памяти, но немного меньшая скорость – 50 к/с.
реклама
Как хитро, согласно теоретическим расчетам должно было быть задействовано более 3.5 Гбайт памяти, но грамотная оптимизация драйверов снижает результат до 3.4 Гбайт и никаких проблем. Для сравнения, оптимизация Radeon R9 290X достигнута на более высоком уровне, потому что 33 к/с можно считать условно комфортными, а 27 к/с у GeForce GTX 970 – уже нет.
Зато посмотрите, насколько меньше задействовано памяти в игре у видеокарты AMD. 2.6 Гбайт против 3.4 Гбайт, назвать это погрешностью нельзя. Компании Nvidia стоит пересмотреть свои настройки в драйверах и попытаться нагнать конкурента.
Заключение
Суматоха вокруг GeForce GTX 970 кому-то явно была на руку. Технические характеристики видеокарты подобраны таким способом, чтобы в 99.9% случаев удовлетворять запросам современных игр. А в тех случаях, когда объем памяти недостаточен, начинает сказываться нехватка производительности GM204. Иными словами, если бы теоретически не было «проблемы 3.5 Гбайт», пользователи вряд ли бы заметили какие-то изменения.
реклама
Но одно мы выяснили точно – для разрешения 4К в 80% игр будет мало и GeForce GTX 980 А объем видеопамяти 2 Гбайта для Full HD с максимальными настройками – это нижний порог, и на графические ускорители среднего ценового диапазона нужно устанавливать минимум 4 Гбайта (при наличии 256-битной шины).
С другой стороны, сам факт сокрытия или непреднамеренного обмана производителем покупателей не приносит дивидендов компании Nvidia. Боюсь, на данном этапе она может потерять заработанные очки доверия. И, на мой взгляд, лучшим способом решения проблемы являются официальные извинения.
GeForce GTX 970: три кластера SMM из шестнадцати отключено
Разумеется, NVIDIA пришлось объясняться перед пользователями: кому понравится ситуация, когда две одинаковые (в части подсистемы памяти) видеокарты работают по-разному, и, разумеется, с преимуществом в пользу более дорогой модели. И нет ли тут специального маркетингового ограничения, побуждающего пользователя задуматься о приобретении GeForce GTX 980. Вкратце объяснение NVIDIA звучит так: в силу иной конфигурации вычислительных блоков (13 активных кластеров из 16) эта часть GPU имеет меньше связей с контроллерами памяти, и в итоге весь четырёхгигабайтный массив видеопамяти пришлось разделить на две неравные области, объемом 3,5 и 0,5 Гбайт, выставив у первой области более высокий приоритет доступа, поскольку большинство игр всё же обычно не требует больше 2 — 3 Гбайт. При необходимости задействуются оба сегмента памяти, но некоторые утилиты сторонних разработчиков якобы могут отображать только 3,5 Гбайт.
Производительность падает почти одинаково
По словам NVIDIA, проблем с доступом к дополнительному сегменту памяти на GeForce GTX 970 нет, и доказательством этому должна служить вышеприведённая таблица с результатами тестов двух графических карт в двух режимах — с расходом видеопамяти менее 3,5 Гбайт и, соответственно, более этого значения. В обоих случаях наблюдается существенное падение производительности при использовании экстремальных режимов, но в процентном соотношении, считает компания, GeForce GTX 970 ведёт себя ничуть не хуже старшего собрата. Тем не менее, наши коллеги с ресурса WCCFtech считают, что платить за подключение второго сегмента памяти на GeForce GTX 970 всё же приходится. В итоге несложных подсчётов было установлено, что если бы подсистема GeForce GTX 970 вела бы себя так же, как в GeForce GTX 980, то чистая производительность у одной из самых популярных графических карт наших дней была бы выше — примерно на 2 — 5 %.
Расплата за сегментированность памяти: те самые 2 — 5 %
По всей видимости, сегментация всё же сказывается, и со вторым, меньшим сегментом видеопамяти, графический процессор работает не столь быстро или эффективно, как с первым, основным. К сожалению, информации, предоставленной NVIDIA, недостаточно, чтобы понять, насколько эта проблема может проявляться в других сценариях или, к примеру, проявляться не в падении производительности, а в худшей равномерности частоты кадров. Для этого необходимо специальное отдельное исследование. К счастью, проблема затрагивает сравнительно небольшую часть пользователей — в основном владельцев мониторов с экстремальным разрешением 3840 × 2160 или выше. Но им в любом случае есть смысл подождать появления карт NVIDIA с 8 Гбайт видеопамяти на борту или же обратиться в сторону AMD Radeon R9 290X с таким же объёмом памяти, который уже доступен на рынке. Или подождать новинок на базе GM200 и Fiji.
Пропускная способность падает с 150 ГБ/с до 19,88 ГБ/с
Из-за этой особенности работы могут падать не только показатели в синтетических тестах, но и реальная производительность. Пользователи сообщают о существенных проседаниях частоты кадров в видеоиграх при выходе за пределы 3 ГБ.
nVidia уже отреагировала на эту ситуацию и пояснила проблему. Ответ сводится к утверждению «это не баг, это фича». Как было сказано выше, в GTX 980 и GTX 970 стоит одинаковое количество видеопамяти — 4 гигабайта. Но есть особенности реализации из-за конфигурации потоковых мультипроцессоров: память поделена на два сегмента, основные быстрые 3,5 ГБ и остаток 0,5 ГБ. Приоритет отдаётся первой части, но если приложение использует больше 3,5 ГБ, то будут заметные проседания производительности как у 980, так и 970. При этом обе модели показывают примерно один и тот же показатель падения частоты кадров в секунду. nVidia даже проиллюстрировала это в виде таблички.
GTX 980 | GTX 970 | |
---|---|---|
Shadow of Mordor | ||
Конфигурация <3.5GB = 2688x1512 Very High | 72 к/с | 60 к/с |
Конфигурация >3.5GB = 3456x1944 | 55 к/с (−24 %) | 45 к/с (−25 %) |
Battlefield 4 | ||
Конфигурация <3.5GB = 3840x2160 2xMSAA | 36 к/с | 30 к/с |
Конфигурация >3.5GB = 3840x2160 135% res | 19 к/с (−47 %) | 15 к/с (−50 %) |
Call of Duty: Advanced Warfare | ||
Конфигурация <3.5GB = 3840x2160 FSMAA T2x, Supersampling off | 82 к/с | 71 к/с |
Конфигурация >3.5GB = 3840x2160 FSMAA T2x, Supersampling on | 48 к/с (−41 %) | 40 к/с (−44 %) |
Как видно, падения частоты кадров есть у обоих видеоускорителей, но у GTX 970 проседания выше всего на 1—3 %. Проблема с последними 500 МБ проявляется в основном у владельцев 4K-мониторов или систем с несколькими дисплеями. Маловероятно, что широкий потребитель сможет выйти за пределы 3,5 ГБ. Похоже, что тем, кто сталкивается с этой неприятной особенностью работы, придётся смириться с ситуацией.
Также над днях была анонсирована видеокарта GTX 960. Это более бюджетное решение относительно предыдущих продуктов девятисотой серии. Целевая аудитория ускорителя за 200 долларов — игроки в MOBA-игры, к примеру, Dota 2 и League of Legends. Это хорошо заметно по промо-материалам и адресуемым вопросам: в видеоролике показано, что в LoL вентиляторы не шумят, поскольку для них нет работы.
GTX 960 построена на основе видеопроцессора GM206, который представляет из себя точную половинку GM204 с теми же архитектурой и распределением ресурсов. Вообще, карта является уполовиненной версией GTX 980: у неё 1024 ядер CUDA вместо 2048 и 2 ГБ памяти GDDR5 вместо 4 ГБ. Разрядность шины памяти — всего лишь 128 бит, что несколько мало для современной карточки — даже у 250-долларовой 8800 GT из 2007 года шина была 256-битной.
Читайте также: