cuda — все вопросы

2ответа
4 голоса
Эмулятор устройства GPU
Я новичок в изучении CUDA, и я искал хороший эмулятор для запуска моих программ CUDA, поскольку мой ноутбук не поставляется с графической картой. Я слышал о mcuda и gpuocelot, но у них, похоже, у
1ответ
4 голоса
Алгоритм пересечения двухмерных отрезков с использованием графического процессора
Я ищу алгоритм, который проверяет, пересекаются ли 2 отрезка линии с помощью графического процессора. Сегменты линии в 2D. В то время как в Интернете обсуждается много алгоритмов для этого, все те,
1ответ
4 голоса
Эффективность функции Маллока в CUDA
Я пытаюсь перенести некоторые коды процессора в CUDA. Моя карта CUDA основана на архитектуре Fermi, и поэтому я могу использовать функцию malloc () в устройстве для динамического распределения памят
1ответ
4 голоса
cublas cublasZgemm () медленнее, чем ожидалось
Согласно nvidia . cublasZgemm в 6 раз быстрее Intel MKL. Однако на моем ПК (i7 2600, Nvidia gtx560, ОС: linux 64bit) cublasZgemm немного медленнее, чем MKL. Я использую numpy.dot (), который
1ответ
4 голоса
Почему CUDA не позволяет нам использовать всю память SM в качестве кэша L1?
В устройстве CUDA каждый SM имеет 64 КБ встроенной памяти , расположенной рядом с ним. По умолчанию он разделен на 48 КБ общей памяти и 16 КБ кэша L1 . Для ядер, для которых сложно определить сх
3ответа
4 голоса
Драйвер не может найти совместимое графическое оборудование
Я был установлен CUDA 4 на мой ноутбук (Dell - Vostro 3500) и начал писать Программы CUDA. Но я получил ошибку: драйвер не совместим с этой версией CUDA. Поэтому я решил обновить драйвер GPU (G
3ответа
4 голоса
Определение детерминанта с помощью CUDA [закрыто]
Существует ли какая-либо библиотека или свободно доступный код, который вычислит определитель small (6x6) матрица двойной точности целиком на GPU?
3ответа
4 голоса
Может ли Nsight Eclipse профилировать код C ++?
у нас есть код C ++, который мы хотим профилировать с помощью Nividia Nsight Eclipse (версия для Linux) перед добавлением в него кода CUDA. Идея состоит в том, чтобы сначала профилировать C ++, наход
4ответа
4 голоса
Мой GTX680 действительно работает
Я пытаюсь протестировать свой GTX680 на производительность вычислений, так как у меня есть некоторые сомнения в его производительности. Мне было интересно, может ли кто-нибудь также протестировать н
1ответ
4 голоса
умножение двух переменных с плавающей запятой на CUDA
У меня действительно интересная проблема, но я решаю ее в течение 3 часов, и я просто не могу понять, что происходит и почему это не работает. Я попытался Google, но безрезультатно. Я пишу програ
1ответ
4 голоса
Читать уже выделенную память /вектор в Thrust
Я загружаю простую переменную в память графического процессора с помощью Mathematica: mem = CUDAMemoryLoad[{1, 2, 3}] И получите следующий результат: CUDAMemory["<135826556>", "Integer3
1ответ
4 голоса
выделить два массива, вызывающих cudaMalloc один раз
Распределение памяти - одна из самых трудоемких операций в графическом процессоре, поэтому я хотел выделить 2 массива, вызвав cudaMalloc один раз, используя следующий код: int numElements = 50000;
1ответ
4 голоса
синхронизация доступа к памяти устройства с хост-потоком
Возможно ли ядру CUDA синхронизировать записи в отображенную на устройстве память без какого-либо вызова на стороне хоста (например, из cudaDeviceSynchronize )? Когда я запускаю следующую программу,
1ответ
4 голоса
Время ядра увеличивается для того же числа частиц
Я пытаюсь запустить свой код на графическом процессоре NVIDIA K10. Я использую 5.0 CUDA Driver и 4.2 CUDA runtime. Проблема заключается в том, что время, которое занимает ядро, увеличивается с итера
1ответ
4 голоса
Ошибка ссылки CUDA: в файле * .cu указано внешнее решение, но внешнее
Использование Cuda 5.0, VS2010 Этот проект прекрасно компилируется и связывается в VS2012, но VS2012 не поддерживает отладку Nsight, поэтому я также работаю в VS2010. Итак, у меня есть файл проек
1ответ
4 голоса
Ошибка ссылки CUDA: в файле * .cu указано внешнее решение, но внешнее
Использование Cuda 5.0, VS2010 Этот проект прекрасно компилируется и связывается в VS2012, но VS2012 не поддерживает отладку Nsight, поэтому я также работаю в VS2010. Итак, у меня есть файл проек
1ответ
4 голоса
C ++ ключевые слова в коде CUDA C
Я использую CUDA для ускорения некоторых частей C-программы. Эта программа использует некоторые ключевые слова C ++ в качестве идентификаторов, поэтому она не компилируется как C ++. Теперь, когда я
2ответа
4 голоса
Поэлементное векторное умножение с CUDA
Я собрал элементарное ядро ​​в CUDA для умножения поэлементного вектора на вектор двух комплексных векторов. Код ядра вставлен ниже (multiplyElementwise). Это работает нормально, но так как я заме
1ответ
4 голоса
cuda: функция встроенного устройства и различные файлы .cu
Два факта: CUDA 5.0 позволяет вам компилировать код CUDA в разные объектные файлы для последующего связывания. Архитектура CUDA 2.x больше не работает автоматически. Как обычно в C /C ++, я реали
1ответ
4 голоса
cudaDeviceReset v. cudaFree
Есть несколько вопросов относительно правильного использования cudaDeviceReset(), но я не смог найти ответ на следующий вопрос . В документе cudaDeviceReset() сказано, что он explicitly destroys
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132