Как подключить cuda к visual studio 2019

Обновлено: 06.01.2025

Что необходимо для работы с CUDA

Для работы с CUDA необходимо иметь:

графический процессор (видеокарту), поддерживающий архитектуру CUDA;
драйвер для этого устройства от NVIDIA;
компилятор языка C;
комплект средств разработки CUDA (CUDA Toolkit).

Пункты 1-3 у меня были, включая компилятор из набора Visual Studio 2008.

CUDA Toolkit можно скачать здесь. Вместе с ним поставляются многочисленные примеры, которые находятся в папке

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v6.0

В папке 0_Simple\template находится заготовка для стандартного CUDA-проекта.

Как создавать проекты CUDA в Visual Studio и запускать примеры из книги

В VS при создании нового проекта выбираем тип NVIDIA/CUDA 6.0 и из шаблонов: CUDA Runtime 6.0.

После этого VS формирует заготовку проекта, содержащую единственный исходный файл kernel.cu . Он нам не нужен. Вместо него вставляем пример из книги:

Расширение файла .CU имеет значение! Только в таких файлах можно пользоваться CUDA-расширениями языка C++.

Чтобы настроить подсветку синтаксиса в файлах .CU как в C++, нужно в окне Tools -> Options -> Text Editor -> File Extension указать расширение .cu и в списке Editor: — Microsoft Visual C++. После перезапуска VS получим подсветку синтаксиса.

Для исправления нужно добавить квалификатор __device__ в конструктор структуры:

Решение проблемы "Видеодрайвер nVidia перестал отвечать и был успешно восстановлен"

Обзор возможных способов решения этой проблемы приведен здесь. В моем случае помог следующий рецепт.

Необходимо настроить в системном реестре два параметра:

TdrLevel – управляет восстановлением. По умолчанию равен "3", что означает „TdrLevelRecover – Recover on timeout”, т. е. автоматическое восстановление по истечению времени задержки ( TdrDelay ). Значение "0" соответствует „TdrLevelOff – Detection disabled”, т. е. отключению детектирования ошибок драйвера.
TdrDelay – время задержки (в секундах), иначе: время реагирования на бездействие драйвера. Значение по умолчанию равно "2". При отключении детектирования ошибок ( TdrLevel = 0 ) значение TdrDelay игнорируется.

Желательно не отключать проверку ошибок, а увеличить время задержки, установив его равным 3-м или более секундам. Значение подбирается экспериментально: можно начать с 10, и постепенно уменьшать время задержки.

Ключи TdrLevel и TdrDelay устанавливаются в редакторе реестра, в ветке HKLM\System\CurrentControlSet\Control\GraphicsDrivers . Возможно, что их придется создать. Ключи имеют тип REG_DWORD, не забудьте указать галочку «десятичная система счисления» при редактировании параметра.

Изменения в реестре вступят в силу после перезагрузки системы.

В результате получим:

Дмитрий Храмов
Компьютерное моделирование и все, что с ним связано: сбор данных, их анализ, разработка математических моделей, софт для моделирования, визуализации и оформления публикаций. Ну и за жизнь немного.

ВЧасть 1В этой серии я рассказал о том, как вы можете модернизировать аппаратное обеспечение своего ПК, добавив в него видеокарту, совместимую с CUDA Toolkit, например графический процессор Nvidia. В этой части 2 рассматривается установка CUDA, cuDNN и Tensorflow в Windows 10. В данной статье предполагается, что на вашем компьютере уже установлен CUDA-совместимый графический процессор; но если у вас этого еще нет,Часть 1из этой серии поможет вам настроить аппаратное обеспечение, готовое к этим шагам.

Предполагая, что Windows уже установлена на вашем ПК, дополнительные части программного обеспечения, которые вы установите в рамках этих шагов: -

Microsoft Visual Studio
инструментарий NVIDIA CUDA
NVIDIA cuDNN
питон
Tensorflow (с поддержкой GPU)

Visual Studio является обязательным условием для CUDA Toolkit

Выбор и загрузка Visual Studio Express

На момент написания этой статьи самой последней версией Visual Studio (которая является бесплатной) является Visual Studio Express Community Version 2017, показанная на рис. 2. Предыдущие версии Visual Studio можно бесплатно получить, присоединившись к «Visual Studio Dev Essentials”И затем ищите нужную версию Visual Studio.

Установка Visual Studio Express

После того, как вы загрузили Visual Studio Express, его установка проста. На рис. 3 показан исполняемый файл, который вы получаете в качестве загрузки.

Рисунок 3: Исполняемый файл сообщества Visual Studio

Когда вы нажимаете опцию «сохранить файл» на рис. 3, появляется окно на рис. 4, где вы можете установить параметры установки (или просто оставить их, как они есть по умолчанию, как я).

Рисунок 4: окно установки для Visual Studio Community 2017

Во время установки Visual Studio предложит вам whetherхочу продолжить без нагрузки». Я нажал «продолжить», поскольку не собирался использовать рабочие нагрузки вообще.

Рис. 5. Я не добавил рабочие нагрузки при запросе Visual Studio

Может потребоваться перезагрузка компьютера после установки Visual Studiod

Эти шаги установки CUDA основаны наРуководство по установке Nvidia CUDA для Windows, Набор инструментов CUDA (бесплатный) можно загрузить с веб-сайта NvidiaВот,

На момент написания по умолчанию предлагается версия CUDA Toolkit версии 10.0, как показано на рис. 6. Однако вам следует проверить, какую версию CUDA Toolkit вы выбрали для загрузки и установки, чтобы обеспечить совместимость с Tensorflow (в будущемШаг 7этого процесса). Когда вы идете наВеб-сайт Tensorflow, последняя доступная версия Tensorflow (1.12.0) требуетCUDA 9.0не CUDA 10.0. Чтобы найти CUDA 9.0, вам нужно перейти к «Legacy Releases» в нижней правой части рисунка 6.

Рис. 6. По умолчанию (самая последняя) версия CUDA для Windows - cuda_10.0.130_411.31_win10.exe. Для CUDA 9.0 выберите «Legacy Releases»

Шаг 3.1: Загрузка CUDA 9.0 из архива инструментария CUDA

Выбрав «Legacy Releases», вы попадете в архив CUDA Toolkit. На основеУстановка TensorflowВ соответствии с указаниями, требуемая версия CUDA - 9.0, как показано на Рис. 7.

Рис. 7. Список заархивированных выпусков CUDA, доступных для скачивания - CUDA Toolkit 9.0 (сентябрь 2017 г.)

Шаг 3.2: Установка CUDA 9.0

CUDA 9.0 поставляется как базовая установка и четыре патча; Сначала необходимо установить базовую версию CUDA 9.0, а затем патчи. Варианты базовой установки, которые я выбрал, показаны на рис. 8.

Рис. 8. Параметры, выбранные для базовой установки CUDA 9.0 для базового установщика Windows

Запуск только что загруженного базового установщика приведет к появлению окна CUDA Setup Package, как показано на рисунке 9.

Рис. 9. Пакет установки CUDA для базового установщика CUDA

Рис. 10. Варианты установки базового установщика CUDA 9.0 - я выбрал вариант Express

Рис. 11 дает возможность выбрать место установки; Я выбрал расположение по умолчанию, которое для CUDA:

Рис. 11. Установка базы CUDA 9.0 - выбор места установки CUDA

На рисунке 12 ниже показаны установки CUDA, основанные на Visual Studio, ранее установленной вШаг 1,

Рисунок 12: Базовый процесс установки CUDA 9.0 - окно, показывающее установки, основанные на Visual Studio

Нажатие «Далее» в окне, показанном на рис. 12 выше, дает окно окончательной установки, показанное как рис. 13 ниже, где установщик NVIDIA отмечен как завершенный.

Рис. 13: Окончательное окно установки для базового установщика CUDA 9.0

На момент написания этой книги было четыре патча CUDA (а также базовый установщик), так что давайте пойдем и загрузим их. Они показаны на фиг.14.

Рисунок 14: Загрузка и установка дополнительных четырех патчей для CUDA 9.0

Когда четыре исправления загружены, их можно установить так же, как и базовый установщик - с окнами установки, обеспечивающими руководство по процессу.

После установки базового установщика CUDA 9.0 и его четырех исправлений следующим шагом будет поиск совместимой версии CuDNN. Основываясь на информации на веб-сайте Tensorflow, для поддержки Tensorflow с графическим процессором требуется версия cuDNN по адресуминимум 7,2,

Шаг 5.1: Загрузка cuDNN

Для того, чтобыскачать CuDNNВы должны зарегистрироваться, чтобы стать участником программы разработчиков NVIDIA (которая бесплатна).

Рис. 15: Создание бесплатной учетной записи для загрузки cuDNN.

Когда вы создаете учетную запись, входите в систему и заполняете некоторые другие необходимые сведения о том, почему вы используете учетную запись, вы получаете страницу загрузки, показанную на рис. 16.

Рис 16: страница загрузки cuDNN с выбором cuDNN v.7.4

Поскольку я скачал CUDA 9.0, соответствующая версия cuDNN - это версия 7.4.2. Выбор cuDNN версии 7.4.2 разрешает загрузку в виде zip-файла с именем следующим образом:

Шаг 5.2: Распаковка файлов cuDNN и копирование в папки CUDA

инструкциина нвидииобеспечить поддержку установки windows cuDNN, как и инструкции на веб-сайте Tensorflow; Я воспроизвел эти инструкции в дистиллированном виде, основываясь на своей реализации. В моем случае я загрузил названный выше файл cuDNN .zip в папку с следующим путем на моем ПК (ваш путь, без сомнения, будет другим).

В приведенных ниже инструкциях я ссылаюсь на путь к папке «C: \ Users \ жо \ Documents \ cuDNN_downloads \»(Упоминается чуть выше) как« », Такой, что zip-файл теперь находится в пути:

Я разархивировал файл cuDNN «.zip», в который я его скачал, поэтому структура разархивированной папки, которая будет содержать необходимые файлы cuDNN, теперь: -

В разархивированных подкаталогах папки cuDNN находятся три файла, которые нужно скопировать в каталоги CUDA Toolkit. Это cudnn64_7.dll, cudnn.h и:

1. cudnn64_7.dll

cudnn64_7.dll можно найти по следующему пути в загруженных файлах cuDNN:

Предполагая, что вы установили CUDA 9.0 по пути по умолчанию (как я сделал вШаг 2.3), а именно следующий путь по умолчанию:

Вы можете скопироватьcudnn64_7.dllфайл прямо в папку CUDAбункерПуть к папке (примечание: вам не нужно создавать какие-либо новые подпапки):

2. cudnn.h

Как и в случае с файлом cudnn64_7.dll, приведенным выше, после загрузки и разархивирования папки cuDNN файл заголовкаcudnn64.hможно найти в пути:

Опять же, предполагая, что вы установили CUDA 9.0 в путь по умолчанию, как я сделал вШаг 2.3скопироватьcudnn.hнепосредственно в папку CUDA по следующему пути (новые подпапки не нужны):

3. cudnn.lib

.Lib файлcudnn.libможно найти в загруженном пути cuDNN:

Скопируйте cudnn.lib непосредственно в папку CUDA по следующему пути:

Шаг 5.3: Проверка того, что переменные среды CUDA установлены в Windows

Наконец,инструкции на нвидииубедитесь, что вы ранее установили переменную среды CUDA следующим образом:

В Windows 10 переменные среды можно найти, выбрав:

Панель управления->Система и безопасность->система->Расширенные настройки системы,

Откроется окно «Свойства системы» (рис. 17), в котором следует выбрать кнопку «Переменные среды».

Рис. 17. Кнопка «Переменные среды» (в окне «Свойства системы») для настройки и проверки путей CUDA

Когда появится окно «Переменные среды», в «системных переменных» (в нижней половине окна) нажмите «Путь» и нажмите кнопку «Изменить». Появится новое окно под названием «Редактировать переменную среды», как показано на рисунке 18 ниже.

При проверке переменных среды я обнаружил процесс установки, который определяет путь установки CUDA -Шаг 3.2см. рис. 11 - уже добавлены два пути к CUDA. Эти пути показаны на рисунке 18 ниже, поэтому я обнаружил, что мне не нужно добавлять дополнительный путь CUDA.

Рис. 18. Пути по умолчанию, ранее созданные в процессе установки CUDA 9.0

Теперь, когда CUDA и cuDNN установлены, пришло время установить Python для последующей установки Tensorflow. На момент написания самой последней доступной версии Python 3 является Python 3.7, ноВерсии Python 3, необходимые для Tensorflow: 3.4, 3.5 или 3.6, Python 3.6 можно загрузить для Windows 10 сВот, Когда вы запустите установщик Python для окон, появится окно настройки на Рис. 19.

Рис. 19: экран установки Python 3.6; Я выбираю все дополнительные функции на этом экране (pip и IDLE оба используются в последующих шагах)

Из вариантов, показанных на рис. 19 выше, во время установки Python я решил выбрать все из них. Эти параметры полезны: установщик Python «pip» используется наШаг 7.2этого руководства по установке Tensorflow. Кроме того, я использую IDE (интегрированную среду разработки для написания и запуска кода Python) под названием «IDLE» вШаг 8,

В «Расширенных настройках» (показанных на Рис. 20 ниже) я выбрал установку Python для всех пользователей (которая не была отмечена по умолчанию); это дает более полезную системную установку.

Рис. 20. Дополнительные параметры, доступные при установке Python 3.6

Tensorflowпредоставляет инструкциидля проверки правильности добавления каталогов установки CUDA, cuDNN и (необязательно: CUPTI) в переменные среды PATH. Поскольку три файла cuDNN были скопированы в подпапки CUDA, я не обновил существующий путь переменных среды CUDA.

Шаг 7.1: вызов командной строки с правами администратора

На этом этапе выполняется общесистемная установка Tensorflow, а не установка для каждого пользователя. Общесистемная установка Tensorflow требует прав администратора, поэтому, соответственно, командная строка должна запускаться с правами администратора.

Откройте командную строку, запустив ‘CMD’В строке поиска, а затем щелкните правой кнопкой мыши в командной строке, чтобы выбрать« Запуск от имени администратора ». Это открывает Администратор: Командная строка, как показано на рисунке 21.

Рис. 21. Запуск командной строки от имени администратора из панели поиска Windows 10

Шаг 7.2: Общесистемная установка Tensorflow через Python pip

После открытия командной строки общесистемная команда установки для Tensorflow с поддержкой GPU выглядит следующим образом:

Команда «pip3» (в отличие от «pip») требуется, так как установка выполняется в Python 3. Выполнение этой команды в командной строке показано на рисунке 22.

Рисунок 22: Команда установки Pip для Tensorflow с поддержкой GPU

Перейдите в меню «Пуск» в Windows и найдите среду IDE с именем «idle», которая будет установлена как часть вашей установки на python, если вы выбрали, как я сделал вШаг 6, Окно Python должно появиться с надписьюОболочка Python 3.6.x, По приглашению (обозначается как «>>>») импортируйте пакет Tensorflow. Это проверит, что Tensorflow был установлен (как вы можете импортировать его). Команда для оболочки IDLE для импорта пакета tenorflow выглядит следующим образом:

Чтобы проверить поддержку CUDA для вашей установки Tensorflow, вы можете запустить в командной строке следующую команду:

Наконец, чтобы убедиться, что графический процессор доступен для Tensorflow, вы можете протестировать, используя встроенную служебную функцию в TensorFlow, как показаноВот:

Требуется несколько минут, чтобы вернуть результат из этого; когда он закончен, он возвращаетсяПравда, а затем приглашение>>>`появляется снова. Импортирование тензорного потока и эти тесты показаны на рис. 24 в оболочке Python IDLE.

Рис. 24. Использование IDLE Python IDE для проверки того, что Tensorflow был построен с CUDA и доступен ли графический процессор

Это были шаги, которые я предпринял для установки Visual Studio, CUDA Toolkit, CuDNN и Python 3.6, и все с конечной целью установки Tensorflow с поддержкой GPU в Windows 10. На сегодняшний день моя работа по машинному обучению и глубокому обучению на основе GPU была в Linux Машины с Ubuntu; к тому же, большая часть онлайновой поддержки сообщества машинного обучения фокусируется на Ubuntu

Для машинного обучения основным недостатком использования Windows является то, что необходимо создавать больше объектов из исходного кода (например, используяCmake), чем в Linux, а также для установки дополнительного программного обеспечения для процессов сборки, таких как Visual Studio. Например, если бы выустановить Caffe2в Windows нет встроенных двоичных файлов, и сборка Windows находится в тестовом и бета-режиме. Я установил CUDA и cuDNN на Windows 10 более любопытно, чем что-либо еще, просто чтобы посмотреть, насколько это было просто (или иначе).

Как я намекал вЧасть 1Теперь, когда CUDA, cuDNN и Tensorflow успешно установлены в Windows 10, и я проверил доступ Tensorflow к графическому процессору, я собираюсь смести всю операционную систему Windows 10, чтобы произвести новую установку Ubuntu 18.04 LTS. Эта новая установка Ubuntu будет рассмотрена в части 3 этой серии.

Инструменты Visual Studio для сценариев ИИ можно устанавливать в 64-разрядных операционных системах Windows.

Установка Visual Studio Tools for AI

Это расширение работает с Visual Studio 2015 и Visual Studio 2017 выпуска Community или более высокого уровня.

Выберите Сервис > Расширения и обновления.

В диалоговом окне Расширения и обновления выберите Online (Онлайн) с левой стороны.

В поле поиска в правом верхнем углу введите "tools for ai" (средства ИИ).

В результатах выберите Visual Studio Tools for AI (Средства Visual Studio для ИИ).

Подготовка локального компьютера

Перед обучением моделей глубокого обучения на локальном компьютере убедитесь в том, что установлены требуемые компоненты. В их число входят последние версии драйверов и библиотек для GPU NVIDIA (если применимо). Убедитесь также в том, что установлены среда и библиотеки Python, такие как NumPy и SciPy, и соответствующие платформы глубокого обучения, такие как Microsoft Cognitive Toolkit (CNTK), TensorFlow, Caffe2, MXNet, Keras, Theano, PyTorch и Chainer, которые планируется использовать в проекте.

Краткие сведения о программном обеспечении в следующих подразделах взяты с домашних страниц соответствующих продуктов.

Драйвер GPU NVIDIA

Платформы глубинного обучения используют GPU NVIDIA, чтобы повысить скорость, точность и масштаб обучения искусственного интеллекта. Если на компьютере установлены видеоадаптеры NVIDIA, ознакомьтесь со страницей скачивания драйверов NVIDIA или попробуйте обновить операционную систему, чтобы установить последнюю версию драйвера.

CUDA — это платформа параллельных вычислений и модель программирования, разработанная компанией NVIDIA. Она существенно увеличивает производительность вычислений благодаря использованию возможностей GPU. В настоящее время для платформ глубинного обучения требуется набор инструментов CUDA 8.0.

Перейдите на этот сайт, скачайте и установите CUDA.
Установите библиотеки CUDA времени выполнения, а затем добавьте путь к двоичным файлам CUDA в переменную среды %PATH% или $Path.
В Windows путь по умолчанию — "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin".

cuDNN

cuDNN (CUDA Deep Neural Network library, библиотека CUDA для глубинных нейронных сетей) — это GPU-ускоренная библиотека примитивов для глубинных нейронных сетей от NVIDIA. Для новейших платформ глубинного обучения требуется cuDNN v6.

Перейдите на страницу NVIDIA Developer, чтобы скачать и установить последнюю версию пакета.
Добавьте каталог, содержащий двоичный файл cuDNN, в переменную среды %PATH% или $Path.
В Windows можно скопировать файл cudnn64_6.dll в каталог "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin".

Более ранние платформы глубинного обучения, такие как CNTK 2.0 и TensorFlow 1.2.1, требуют библиотеки cuDNN v5.1. Можно одновременно установить несколько версий cuDNN.

Python

Python является основным языком программирования для приложений глубинного обучения. Требуется 64-разрядный дистрибутив Python. Для обеспечения максимальной совместимости рекомендуется версия Python 3.5.4.

Установка Python в Windows

Мы рекомендуем установить средство запуска Python только для себя и добавить Python в переменную среды %PATH%.
Обязательно установите pip — систему управления пакетами, которая позволяет устанавливать программные пакеты, написанные на Python, и управлять ими.

Платформы глубинного обучения требуют pip для установки.

Затем необходимо проверить, правильно ли установлен Python 3.5, и обновить систему pip до последней версии, выполнив в терминале следующие команды:

Windows

macOS

Python в Visual Studio

Python полностью поддерживается в Visual Studio благодаря расширениям. Получите дополнительные сведения об установке Инструментов Python для Visual Studio.

NumPy и SciPy

NumPy — это пакет обработки массивов общего назначения, который предназначен для эффективной работы с большими многомерными массивами произвольных элементов и в то же время позволяет работать с небольшими многомерными массивами без значительного снижения быстродействия.

SciPy (произносится "сай пай") — это программное обеспечение с открытым кодом для математических, научных и инженерных вычислений, которое зависит от NumPy. Начиная с версии SciPy 1.0.0 предлагается официальный предварительно собранный пакет wheel для Windows.

Чтобы установить NumPy и SciPy, выполните в терминале следующую команду:

gohlke/pythonlibs/ ) до последних официальных версий пакетов.

Microsoft Cognitive Toolkit (CNTK)

Microsoft Cognitive Toolkit — это единый набор средств глубинного обучения, который описывает нейронные сети как ряд вычислительных шагов в виде направленного графа. CNTK поддерживает языки программирования Python и BrainScript.

В настоящее время CNTK не поддерживает macOS.

Сведения об установке пакета CNTK для Python см. в этой статье.

TensorFlow

TensorFlow — это библиотека ПО с открытым кодом для числовых вычислений с использованием графов потоков данных. Подробные инструкции по установке см. здесь.

Начиная с версии 1.2 TensorFlow больше не предоставляет поддержку GPU в macOS.

Caffe2

Caffe2 — это простая, модульная, масштабируемая платформа глубинного обучения. Она построена на основе платформы Caffe и призвана обеспечить максимальное быстродействие и модульность.

В настоящее время готовый пакет wheel на Python для Caffe2 отсутствует.

Сведения о том, как выполнить сборку на основе исходного кода, см. здесь.

MXNet

Apache MXNet (инкубатор) — это платформа глубинного обучения, призванная обеспечить максимальную эффективность и гибкость. Она позволяет сочетать символическое и императивное программирование для достижения максимальной эффективности и продуктивности.

Чтобы установить MXNet, выполните в терминале следующую команду:

Keras

Keras — это высокоуровневый API для нейронных сетей, написанный на Python, который может работать поверх CNTK, TensorFlow или Theano. Главной целью при его разработке являлось обеспечение быстрого проведения экспериментов. Минимальная задержка на пути от идеи к результату — ключевой фактор успешного исследования.

Чтобы установить Keras, выполните в терминале следующую команду:

Theano

Theano — это библиотека Python, которая позволяет эффективно определять, оптимизировать и вычислять математические выражения с многомерными массивами.

Чтобы установить Theano, выполните в терминале следующую команду:

PyTorch

PyTorch — это пакет Python, который представляет две высокоуровневые возможности:

тензорные вычисления (как и в случае с NumPy) с эффективным ускорением на базе GPU;
построение глубинных нейронных сетей на основе ленточной системы autograd.

Чтобы установить PyTorch, выполните в терминале следующую команду:

Windows

Официального пакета wheel пока нет. Можно загрузить сторонний пакет из Anaconda или Калифорнийского университета.

Распакуйте его в домашнем каталоге, например C:\Users\test\pytorch.

Добавьте каталог C:\Users\test\pytorch\Lib\site-packages в переменную среды %PYTHONPATH%.

macOS

Двоичные файлы macOS не поддерживают CUDA. Если требуется CUDA, выполните установку из источника.

Linux

Этот пакет поддерживает как GPU, так и ЦП.

Наконец, установите torchvision в ОС, отличных от Windows:

Chainer

Chainer — это платформа глубинного обучения на основе Python, призванная обеспечить гибкость. Она предоставляет интерфейсы API автоматической дифференциации на основе подхода define-by-run (динамические вычислительные графы), а также высокоуровневые объектно-ориентированные интерфейсы API для построения и обучения нейронных сетей.

Чтобы включить поддержку CUDA, установите CuPy:

В Windows требуется версия 2015 среды Visual Studio или Microsoft Visual C++ Build Tools для компиляции CuPy с использованием CUDA 8.0.

Приступая к работе, нужно убедиться, что на вашем рабочем месте, будь то компьютер или ноутбук, присутствует дискретная видеокарта NVIDIA с чипом восьмого поколения G80 (NVIDIA GeForce 8).

Чтобы убедиться, что все условия выполнены, нужно подробно разобрать вопрос с видеокартами восьмого поколения, так сказать, какие модели нам подходят. Сейчас вряд ли у кого-то на компьютере можно обнаружить видеокарту GeForce 8800 GTX или старее, так как данную модель выпустили аж в 2006 году, но тем не менее не будет лишним узнать о том, какие GPU поддерживают CUDA . Полный перечень всех видеокарт можно увидеть на официальной странице NVIDIA :

С аппаратной частью разобрались, теперь переходим к программной.

CUDA Toolkit можно установить на Windows, Linux и Mac OSX.

Ссылки на установки по каждой из операционных систем приведены ниже:

Также потребуется стандартный компилятор языка C. Лучше всего использовать Visual Studio 2008 и последующих версий. В связке с Visual Studio при установке Toolkit автоматически прописываются пути в переменной PATH. Выглядит это примерно следующим образом (если вдруг у кого-то автоматически не настроилось):

(Название переменной = Путь)

CUDA_BIN_PATH = С :\Programs\CUDA toolkit 2.0\bin
CUDA_INC_PATH = С :\Programs\CUDA toolkit 2.0\include
CUDA_LIB_PATH = С :\Programs\CUDA toolkit 2.0\lib
NVSDKCUDA_ROOT = С :\Programs\CUDA SDK 2.02.0811.0240

Чтобы при создании нового проекта на Visual Studio появился раздел CUDA нужно выполнить следующие действия.

Зайти в Tools > Options > Projects and Solutions > VC++ Directories
вкладка Executable files добавить новый параметр и ввести :

D:\Programs\CUDA SDK 2.02.0811.0240\bin ,

либо $( CUDA _ BIN _ PATH ) ;

вкладка Include files добавить новый параметр и ввести:

D:\Programs\CUDA toolkit 2.0\include , либо $(CUDA_INC_PATH)

добавить новый параметр и ввести:

D:\Programs\CUDA SDK 2.02.0811.0240\common\inc ,

либо $(NVSDKCUDA_ROOT)\common\inc

вкладка Library files добавить новый параметр и ввести :

D:\Programs\CUDA toolkit 2.0\lib , либо $(CUDA_LIB_PATH)
добавить новый параметр и ввести :

D:\Programs\CUDA SDK 2.02.0811.0240\common\lib ,

либо $( NVSDKCUDA _ ROOT )\ common \ lib

В конечном итоге при создании проекта появится вкладка NVIDIA , в которой будут подразделы с актуальными версиями CUDA :

Итак, мы вооружились всем необходимым и можем приступать к работе.

Помимо работы на локальном компьютере существует возможность работать и вне среды Visual Studio или ей подобной, то есть через удаленное подключение с использованием SSH-клиента. Выбор SSH-клиента уже остается за вами. В данном учебном пособии будут приведены скриншоты из PuTTY 0.70 версии и из WinSCP версии 5.13.

Чтобы проверить, что на вашем компьютере все настроено правильно, нужно через терминал запустить команду:

Данная команда должна отобразить всю информацию по CUDA на вашем устройстве. Должно быть примерно так :

Built on Tue_Jan_10_13:28:28_CST_2017

Cuda compilation tools, release 8.0, V8.0.61

nvcc:NVIDIA (R) Cuda compiler driver означает , что компилятор CUDA nvcc присутствует в вашей системе .

Cuda compilation tools, release 8.0, V8.0.61 указывает релиз и версию CUDA Toolkit.

Читайте также: