cuda

cuda 编程（三） helloworld 打印 blockIdx和threadIdx.x threadIdx.y2022-03-11 13:06:06

#include <stdio.h> #include <iostream> using namespace std; __global__ void hello_from_gpu() { const int b = blockIdx.x; const int tx = threadIdx.x; const int ty = threadIdx.y; // cout<<b<<endl; printf("Hel
Ubuntu+Yolov5+TensortRT加速部署2022-03-09 21:31:34

Ubuntu+Yolov5+TensortRT加速部署 0.前序测试机器Ubuntu18.04 GPU: 3060, CUDA11.4, CUDA10.2均可 1.软件下载 Nvidia驱动安装，历史版本下载 CUDA下载安装 CUDNN下载安装 OpenCV3.4.4下载 Anaconda下载Linux版本 or Python安装 Pytorch安装 Yolov5安装 TensorRT安装 2.软件
tensorflow物理机环境部署2022-03-09 17:01:01

官网推荐跑tensorlow用docker环境，不过老板要求用物理机，咱就搞就是了参考官网英文文档 https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions 首先说下我的环境，centos7.8,1070ti显卡 1、 [root@node14 maintenance-item-match]# una
Ubuntu 18.04 配置 tensorflow-gpu 机器学习环境2022-03-09 14:33:34

1. 安装python 3.7 sudo apt install python3.7 sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.7 2 %python3 指向 python 3.7 sudo update-alternatives --config python3 % if multiple python3 exists, enter the default number such as 2
【高性能计算】CUDA编程之OpenCV的应用（教程与代码-4）2022-03-06 15:01:10

imread命令将返回以蓝色、绿色和红色（BGR格式）开头的三个通道处理视频的main函数中需要做的第一件事是创建VideoCapture对象。 GPUCUDA模块中的函数都定义在cv::cuda命名空间中，将设备上配置给图像数据用的显存块作为其参数。gettickcount函数返回启动系统后经过的时间（以毫秒为
VS2019+CUDA10.2+tensorRT7.0+opencv4.12环境配置2022-03-06 14:06:12

为了在windows上运行yolo-tensorrt项目进行了VS2019+CUDA10.2+tensorRT7.0+opencv4.12的环境配置 1.1 首先安装VS2019 进入VS官网下载社区版2019 1.2 安装CUDA和CUDNN 注意：我之前为了配置python的深度学习环境，安装过CUDA，但是精简安装，最好还是重新安装。版本CUDA10.2+cuDNN v7
fatal error: third_party/gpus/cuda/include/cuda_fp16.h: 没有那个文件或目录2022-03-05 10:32:56

https://github.com/northeastsquare/bts 打开目录 "tensorflow/include/tensorflow/core/util/gpu_kernel_helper.h" 然后编辑，把 #include "third_party/gpus/cuda/include/cuda_fp16.h" 替换成 #include "cuda_fp16.h" 然后，再编辑 "tensorflow/incl
PyTorch消除训练瓶颈提速技巧2022-03-03 19:01:45

PyTorch消除训练瓶颈提速技巧 1. 硬件层面 CPU的话尽量看主频比较高的，缓存比较大的，核心数也是比较重要的参数。显卡尽可能选现存比较大的，这样才能满足大batch训练，多卡当让更好。内存要求64G，4根16G的内存条插满绝对够用了。主板性能也要跟上，否则装再好的CPU也很难发挥出全部性
cuda编程 pycuda2022-03-03 09:31:21

CUDA】grid、block、thread的关系及thread索引的计算 https://hujingshuang.blog.csdn.net/article/details/53097222 目录例子1例子2 例子1 import torch print(torch.version.cuda) # 11.0 print(torch.__version__) # 1.7.0 import numpy import pycuda.autoinit import pycud
深度学习环境安装所需软件介绍cuda+cudnn+driver+anaconda+keras+tensorFlow+Pycharm+Jupyer(下载地址+配图)2022-03-02 20:01:10

英伟达(NVIDIA)显卡驱动我们平时用的电脑都配有显卡，要么是集成显卡，要么是独立显卡；集成显卡是不支持gpu加速的，独立显卡分为A卡和N卡，即AMD和NVIDIA； A卡是不支持gpu加速的，只有部分N卡才支持gpu加速，可以查询是自己的显卡是否在支持的列表中如果不知道自己的显示是什么型号可
RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changi2022-03-02 16:02:13

最近在训练网络模型时，出现以下错误： /home/xw/anaconda3/envs/openmmlab/lib/python3.7/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env varia
【Python】Win10 Nvidia GPU 、tensorflow深度学习环境2022-03-02 00:01:28

文章目录 1流程步骤2详细1、查看有无独显2、查看有无NAVIDIA驱动2.1、有独显无驱动2.2 、安装NAVIDIA显卡驱动 3、安装CUDA3.1、查看cuda版本支持3.2、下载对应显卡驱动版本的cuda3.3、下载对应版本的cudnn 随着人工智能的发展，越来越多人都想往人工智能方向发展，可是人
Ubuntu 20.04 系统下（子系统）深度学习环境配置 ( Pytorch + GPU )2022-03-01 23:03:52

Ubuntu 20.04 系统下（子系统）深度学习环境配置 ( Pytorch + GPU )
TensorRT安装与测试2022-02-28 17:03:36

TensorRT安装与测试环境：Windows11;CUDA11.1;cudnn8.0.5;1.下载CUDA2.安装CUDA2.安装cudnn3.CUDA安装测试4.TensorRT安装环境：Windows11;CUDA11.1;cudnn8.0.5; 1.下载CUDA 确定并下载自己使用的CUDA版本 CUDA下载链接：https://developer.nvidia.com/cuda-toolkit 2.安装C
绕过sudo安装pytorch(GPU)2022-02-28 11:05:46

最近几天走了n多弯路大概做一下总结 1.如果是n卡的话就nvidia-smi 看一下driver版本根据driver版本再选择cuda版本 (学校的没有公用cuda 装了几次新版才发现这个问题具体版本的下载地址百度/Google一下都能找到因为没有sudo 所以要把路径都放到自己的文件夹里也不要尝
YOLOv4安装和训练2022-02-25 14:02:32

环境 Windows：10YOLOv4OpenCV：4.5.3Visual Studio 2019：16.11CUDA：11.2.0_460.89_win10cudnn：11.2-windows-x64-v8.1.1.33 硬件 NVIDIA GeForce RTX 3070 Ti OpenCV 4.5.3网址：https://sourceforge.net/projects/opencvlibrary/files/4.5.3/ OpenCV 4.5.3下载链接：https://nchc.dl.s
tensorflow 安装GPU版本，CUDA与cuDNN版本对应关系，RTX3050Ti （notebook）2022-02-24 23:59:26

前言安装Tensorflow-gpu 与 keras的时候，一定先要注意版本的对应，不然很容易出错，在看的时候，建议先看完整篇文章再上手。一、环境+配置本机环境显卡：RTX3050Ti（notebook） Windows10专业版 NVIDIA 511.65 网上查到的可行版本（跟本人所使用的有所偏差） python3.7.0+CUDA11.6.0+cuD
当数据和要加载的模型不在同一个cuda上时的处理方法2022-02-23 15:03:02

问题： c = F.relu(policy_model.Q.c1(exp_list[i][k].unsqueeze(0)))error: *** RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:1 and cuda:2! (when checking argument for argument weight inmethod wrapper__cudnn_
虚拟人生成，Stylegan3 安装配置攻略2022-02-23 11:32:59

Stylegan是由英伟达(皮衣刀客老黄家的)实验室发布的虚拟人脸生成算法，可以无中生有，生成非常逼真的虚拟人，按现在流行的说法是数字人。AI通过学习大量的高清人脸图片之后，就能生成几十亿现实世界中不存在的人脸。 Stylegan1出现的时候已经让人惊掉下巴了，第三代自然是更加牛~，至
Ubuntu20.04配置TensorRT2022-02-22 23:32:49

linux20.04 + CUDA11.3 + cudnn8.2 + TensorRT8.0.1.6 nvidia-smi显示的CUDA版本和nvcc -V得到的CUDA版本会不一致，nvidia-smi显示的是支持的最高的 1.安装CUDA，从官网下载，可下在run的和deb的，按照提示的命令安装，安装完成后/usr/local/cuda*路径下 2.安装cudnn，从官网下载，下载tar
ModuleNotFoundError: No module named ‘pycuda‘2022-02-22 14:58:57

环境：ubuntu 16.04 可通过以下指令直接安装： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pycuda --no-binary :all: 如果通过上述命令安装过程出现如下问题： ERROR: Could not build wheels for pycuda, which is required to install pyproject.toml-based projec
python调用英伟达GPU加速方法2022-02-20 13:58:57

调用GPU的本质其实是调用CUDA的dll 如果你对CUDA编程不熟悉，可以参考以下文章 CUDA并行编程概述 - DearXuan的主页https://www.dearxuan.top/2021/11/15/CUDA%E5%B9%B6%E8%A1%8C%E7%BC%96%E7%A8%8B%E6%A6%82%E8%BF%B0/ 生成CUDA dll 调用显卡的方法是调用CUDA的dll，因此首先要使用
tensorflow-gpu安装版本选择2022-02-16 11:02:33

cuda版本选择查看显卡支持的cuda版本桌面右键-》NVIDIA控制面板-》左下角系统信息-》组件-》找到NVCUDA.DLL找到支持的cuda最高版本 tensorflow-gpu版本选择 https://tensorflow.google.cn/install/source#gpu 然后下载对应的cuda cudnn tensorflow-gpu版本即可
Nvidia CUDA Software Gets Ported to Open-Source RISC-V GPGPU Project2022-02-15 14:00:45

IT要改成Internal Turn(内卷)的缩写了。:-) Nvidia CUDA Software Gets Ported to Open-Source RISC-V GPGPU Project | Tom's Hardware (tomshardware.com) RISC-V has been one of the hottest topics in the world of computing, as the Instruction Set Architecture (ISA) al
GNU Octave, GNU Scientific Library, Intel IPP, CUDA简介2022-02-14 22:33:48

GNU Octave The Octave syntax is largely compatible with Matlab. The Octave interpreter can be run in GUI mode, as a console, or invoked as part of a shell script. Powerful mathematics-oriented syntax with built-in 2D/3D plotting and visualization tools

首页 < 2 3 4 5 6 7 8 > 尾页

ICode9

cuda 编 程（三） helloworld 打印 blockIdx和threadIdx.x threadIdx.y2022-03-11 13:06:06

Ubuntu+Yolov5+TensortRT加速部署2022-03-09 21:31:34

tensorflow物理机环境部署2022-03-09 17:01:01

Ubuntu 18.04 配置 tensorflow-gpu 机器学习环境2022-03-09 14:33:34

【高性能计算】CUDA编程之OpenCV的应用（教程与代码-4）2022-03-06 15:01:10

VS2019+CUDA10.2+tensorRT7.0+opencv4.12环境配置2022-03-06 14:06:12

fatal error: third_party/gpus/cuda/include/cuda_fp16.h: 没有那个文件或目录2022-03-05 10:32:56

PyTorch消除训练瓶颈 提速技巧2022-03-03 19:01:45

cuda编程 pycuda2022-03-03 09:31:21

深度学习环境安装所需软件介绍cuda+cudnn+driver+anaconda+keras+tensorFlow+Pycharm+Jupyer(下载地址+配图)2022-03-02 20:01:10

RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changi2022-03-02 16:02:13

【Python】Win10 Nvidia GPU 、tensorflow深度学习环境2022-03-02 00:01:28

Ubuntu 20.04 系统下（子系统）深度学习环境配置 ( Pytorch + GPU )2022-03-01 23:03:52

TensorRT安装与测试2022-02-28 17:03:36

绕过sudo安装pytorch(GPU)2022-02-28 11:05:46

YOLOv4安装和训练2022-02-25 14:02:32

tensorflow 安装GPU版本，CUDA与cuDNN版本对应关系，RTX3050Ti （notebook）2022-02-24 23:59:26

当数据和要加载的模型不在同一个cuda上时的处理方法2022-02-23 15:03:02

虚拟人生成，Stylegan3 安装配置攻略2022-02-23 11:32:59

Ubuntu20.04配置TensorRT2022-02-22 23:32:49

ModuleNotFoundError: No module named ‘pycuda‘2022-02-22 14:58:57

python调用英伟达GPU加速方法2022-02-20 13:58:57

tensorflow-gpu安装版本选择2022-02-16 11:02:33

Nvidia CUDA Software Gets Ported to Open-Source RISC-V GPGPU Project2022-02-15 14:00:45

GNU Octave, GNU Scientific Library, Intel IPP, CUDA简介2022-02-14 22:33:48

cuda 编程（三） helloworld 打印 blockIdx和threadIdx.x threadIdx.y2022-03-11 13:06:06

PyTorch消除训练瓶颈提速技巧2022-03-03 19:01:45