ICode9

精准搜索请尝试: 精确搜索
  • cuda 编 程(三) helloworld 打印 blockIdx和threadIdx.x threadIdx.y2022-03-11 13:06:06

    #include <stdio.h> #include <iostream> using namespace std; __global__ void hello_from_gpu() { const int b = blockIdx.x; const int tx = threadIdx.x; const int ty = threadIdx.y; // cout<<b<<endl; printf("Hel

  • Ubuntu+Yolov5+TensortRT加速部署2022-03-09 21:31:34

    Ubuntu+Yolov5+TensortRT加速部署 0.前序 测试机器Ubuntu18.04 GPU: 3060, CUDA11.4, CUDA10.2均可 1.软件下载 Nvidia驱动安装 , 历史版本下载 CUDA下载安装 CUDNN下载安装 OpenCV3.4.4下载 Anaconda下载Linux版本 or Python安装 Pytorch安装 Yolov5安装 TensorRT安装 2.软件

  • tensorflow物理机环境部署2022-03-09 17:01:01

    官网推荐跑tensorlow用docker环境,不过老板要求用物理机,咱就搞就是了 参考官网英文文档 https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions 首先说下我的环境,centos7.8,1070ti显卡 1、 [root@node14 maintenance-item-match]# una

  • Ubuntu 18.04 配置 tensorflow-gpu 机器学习环境2022-03-09 14:33:34

    1. 安装python 3.7 sudo apt install python3.7 sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.7 2 %python3 指向 python 3.7 sudo update-alternatives --config python3 % if multiple python3 exists, enter the default number such as 2

  • 【高性能计算】CUDA编程之OpenCV的应用(教程与代码-4)2022-03-06 15:01:10

    imread命令将返回以蓝色、绿色和红色(BGR格式)开头的三个通道处理视频的main函数中需要做的第一件事是创建VideoCapture对象。 GPUCUDA模块中的函数都定义在cv::cuda命名空间中,将设备上配置给图像数据用的显存块作为其参数。gettickcount函数返回启动系统后经过的时间(以毫秒为

  • VS2019+CUDA10.2+tensorRT7.0+opencv4.12环境配置2022-03-06 14:06:12

    为了在windows上运行yolo-tensorrt项目进行了VS2019+CUDA10.2+tensorRT7.0+opencv4.12的环境配置 1.1 首先安装VS2019 进入VS官网下载社区版2019 1.2 安装CUDA和CUDNN 注意:我之前为了配置python的深度学习环境,安装过CUDA,但是精简安装,最好还是重新安装。版本CUDA10.2+cuDNN v7

  • fatal error: third_party/gpus/cuda/include/cuda_fp16.h: 没有那个文件或目录2022-03-05 10:32:56

    https://github.com/northeastsquare/bts 打开目录 "tensorflow/include/tensorflow/core/util/gpu_kernel_helper.h" 然后编辑,把 #include "third_party/gpus/cuda/include/cuda_fp16.h" 替换成 #include "cuda_fp16.h" 然后,再编辑 "tensorflow/incl

  • PyTorch消除训练瓶颈 提速技巧2022-03-03 19:01:45

    PyTorch消除训练瓶颈 提速技巧 1. 硬件层面 CPU的话尽量看主频比较高的,缓存比较大的,核心数也是比较重要的参数。 显卡尽可能选现存比较大的,这样才能满足大batch训练,多卡当让更好。 内存要求64G,4根16G的内存条插满绝对够用了。 主板性能也要跟上,否则装再好的CPU也很难发挥出全部性

  • cuda编程 pycuda2022-03-03 09:31:21

    CUDA】grid、block、thread的关系及thread索引的计算 https://hujingshuang.blog.csdn.net/article/details/53097222 目录例子1例子2 例子1 import torch print(torch.version.cuda) # 11.0 print(torch.__version__) # 1.7.0 import numpy import pycuda.autoinit import pycud

  • 深度学习环境安装所需软件介绍cuda+cudnn+driver+anaconda+keras+tensorFlow+Pycharm+Jupyer(下载地址+配图)2022-03-02 20:01:10

    英伟达(NVIDIA)显卡驱动 我们平时用的电脑都配有显卡,要么是集成显卡,要么是独立显卡; 集成显卡是不支持gpu加速的,独立显卡分为A卡和N卡,即AMD和NVIDIA; A卡是不支持gpu加速的,只有部分N卡才支持gpu加速, 可以查询是自己的显卡是否在支持的列表中 如果不知道自己的显示是什么型号可

  • RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changi2022-03-02 16:02:13

    最近在训练网络模型时,出现以下错误: /home/xw/anaconda3/envs/openmmlab/lib/python3.7/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env varia

  • 【Python】Win10 Nvidia GPU 、tensorflow深度学习环境2022-03-02 00:01:28

    文章目录 1流程步骤2详细1、查看有无独显2、查看有无NAVIDIA驱动2.1、有独显无驱动2.2 、安装NAVIDIA显卡驱动 3、安装CUDA3.1、查看cuda版本支持3.2、下载对应显卡驱动版本的cuda3.3、下载对应版本的cudnn 随着人工智能的发展,越来越多人都想往人工智能方向发展,可是人

  • Ubuntu 20.04 系统下(子系统)深度学习环境配置 ( Pytorch + GPU )2022-03-01 23:03:52

    Ubuntu 20.04 系统下(子系统)深度学习环境配置 ( Pytorch + GPU )

  • TensorRT安装与测试2022-02-28 17:03:36

    TensorRT安装与测试 环境:Windows11;CUDA11.1;cudnn8.0.5;1.下载CUDA2.安装CUDA2.安装cudnn3.CUDA安装测试4.TensorRT安装 环境:Windows11;CUDA11.1;cudnn8.0.5; 1.下载CUDA 确定并下载自己使用的CUDA版本 CUDA下载链接:https://developer.nvidia.com/cuda-toolkit 2.安装C

  • 绕过sudo安装pytorch(GPU)2022-02-28 11:05:46

    最近几天走了n多弯路 大概做一下总结 1.如果是n卡的话就nvidia-smi 看一下driver版本 根据driver版本再选择cuda版本 (学校的没有公用cuda 装了几次新版才发现这个问题 具体版本的下载地址百度/Google一下都能找到 因为没有sudo 所以要把路径都放到自己的文件夹里 也不要尝

  • YOLOv4安装和训练2022-02-25 14:02:32

    环境 Windows:10YOLOv4OpenCV:4.5.3Visual Studio 2019:16.11CUDA:11.2.0_460.89_win10cudnn:11.2-windows-x64-v8.1.1.33 硬件 NVIDIA GeForce RTX 3070 Ti OpenCV 4.5.3网址:https://sourceforge.net/projects/opencvlibrary/files/4.5.3/ OpenCV 4.5.3下载链接:https://nchc.dl.s

  • tensorflow 安装GPU版本,CUDA与cuDNN版本对应关系,RTX3050Ti (notebook)2022-02-24 23:59:26

    前言 安装Tensorflow-gpu 与 keras的时候,一定先要注意版本的对应,不然很容易出错,在看的时候,建议先看完整篇文章再上手。 一、环境+配置 本机环境 显卡:RTX3050Ti(notebook) Windows10专业版 NVIDIA 511.65 网上查到的可行版本 (跟本人所使用的有所偏差) python3.7.0+CUDA11.6.0+cuD

  • 当数据和要加载的模型不在同一个cuda上时的处理方法2022-02-23 15:03:02

    问题: c = F.relu(policy_model.Q.c1(exp_list[i][k].unsqueeze(0)))error: *** RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:1 and cuda:2! (when checking argument for argument weight inmethod wrapper__cudnn_

  • 虚拟人生成,Stylegan3 安装配置攻略2022-02-23 11:32:59

    ​ Stylegan是由英伟达(皮衣刀客老黄家的)实验室发布的虚拟人脸生成算法,可以无中生有,生成非常逼真的虚拟人,按现在流行的说法是数字人。AI通过学习大量的高清人脸图片之后,就能生成几十亿现实世界中不存在的人脸。 ​ Stylegan1出现的时候已经让人惊掉下巴了,第三代自然是更加牛~,至

  • Ubuntu20.04配置TensorRT2022-02-22 23:32:49

    linux20.04 + CUDA11.3 + cudnn8.2 + TensorRT8.0.1.6 nvidia-smi显示的CUDA版本和nvcc -V得到的CUDA版本会不一致,nvidia-smi显示的是支持的最高的 1.安装CUDA,从官网下载,可下在run的和deb的,按照提示的命令安装,安装完成后/usr/local/cuda*路径下 2.安装cudnn,从官网下载,下载tar

  • ModuleNotFoundError: No module named ‘pycuda‘2022-02-22 14:58:57

    环境:ubuntu 16.04 可通过以下指令直接安装: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pycuda --no-binary :all: 如果通过上述命令安装过程出现如下问题: ERROR: Could not build wheels for pycuda, which is required to install pyproject.toml-based projec

  • python调用英伟达GPU加速方法2022-02-20 13:58:57

    调用GPU的本质其实是调用CUDA的dll 如果你对CUDA编程不熟悉,可以参考以下文章 CUDA并行编程概述 - DearXuan的主页https://www.dearxuan.top/2021/11/15/CUDA%E5%B9%B6%E8%A1%8C%E7%BC%96%E7%A8%8B%E6%A6%82%E8%BF%B0/ 生成CUDA dll 调用显卡的方法是调用CUDA的dll,因此首先要使用

  • tensorflow-gpu安装版本选择2022-02-16 11:02:33

    cuda版本选择 查看显卡支持的cuda版本 桌面右键-》NVIDIA控制面板-》左下角系统信息-》组件-》找到NVCUDA.DLL找到支持的cuda最高版本 tensorflow-gpu版本选择 https://tensorflow.google.cn/install/source#gpu 然后下载对应的cuda cudnn tensorflow-gpu版本即可  

  • Nvidia CUDA Software Gets Ported to Open-Source RISC-V GPGPU Project2022-02-15 14:00:45

    IT要改成Internal Turn(内卷)的缩写了。:-) Nvidia CUDA Software Gets Ported to Open-Source RISC-V GPGPU Project | Tom's Hardware (tomshardware.com) RISC-V has been one of the hottest topics in the world of computing, as the Instruction Set Architecture (ISA) al

  • GNU Octave, GNU Scientific Library, Intel IPP, CUDA简介2022-02-14 22:33:48

    GNU Octave The Octave syntax is largely compatible with Matlab. The Octave interpreter can be run in GUI mode, as a console, or invoked as part of a shell script.  Powerful mathematics-oriented syntax with built-in 2D/3D plotting and visualization tools

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有