首页 > 其他分享> 文章详细

win11+RTX3060搭建tensorflow深度学习环境

2021-12-30 14:34:57 阅读：695 来源： 互联网

标签：卷积 gpu cuDNN RTX3060 conda cuda GPU win11 tensorflow

文章目录

win11+RTX3060搭建tf2.6深度学习环境

win11+RTX3060搭建tf2.6深度学习环境

1.所需软件

cuda
cudnn cudnn下载需要注册账号
anaconda
tf2.6.2

2.安装cuda

cuda简介：

CUDA是NVIDIA发明的一种并行计算平台和编程模型。
它可以通过利用图形处理器(GPU)的能力来显著提高计算性能。

CUDA的开发有以下几个设计目标:
1.为标准编程语言(如C)提供一小组扩展，以实现并行算法的直接实现。
2.使用CUDA C/ c++，程序员可以专注于算法的并行化，而不是把时间花在算法的实现上。
3.支持异构计算，应用同时使用CPU和GPU。
    应用程序的串行部分运行在CPU上，并行部分被卸载到GPU上，
    这样CUDA就可以增量地应用到现有的应用程序上。
    CPU和GPU被视为具有各自内存空间的独立设备。
    这种配置还允许在CPU和GPU上进行同步计算，而无需争夺内存资源。

cuda支持的GPU有数百个内核，这些内核可以同时运行数千个计算线程。
这些核心拥有共享的资源，包括一个寄存器文件和一个共享的内存。
片上共享内存允许运行在这些核心上的并行任务共享数据，而无需通过系统内存总线发送数据

安装步骤：双击一直下一步就行

测试：打开cmd,执行命令nvcc -V和nvidia-sim 查看对应信息

3.配置cudnn

cudnn简介：

1.cuDNN 8 的新功能
    cuDNN 8 针对 A100 GPU 进行了优化，可提供高达 V100 GPU 5 倍的开箱即用性能，并且包含适用于对话式 AI 和计算机视觉等应用的新优化和 API。
    它已经过重新设计，可实现易用性和应用集成，同时还能为开发者提供更高的灵活性。
 
2.cuDNN 8 的亮点包括
    已针对 NVIDIA A100 GPU 上的峰值性能进行调优，包括全新 TensorFloat-32、FP16 和 FP32
    通过重新设计的低级别 API，可以直接访问 cuDNN 内核，从而实现更出色的控制和性能调优
    向后兼容性层仍然支持 cuDNN 7.x，使开发者能够顺利过渡到新版 cuDNN 8 API
    针对计算机视觉、语音和语言理解网络作出了新优化
    已通过新 API 融合运算符，进而加速卷积神经网络
    cuDNN 8 现以六个较小的库的形式提供，能够更精细地集成到应用中。开发者可以下载 cuDNN，也可从 NGC 上的框架容器中将其提取出来。
 
3.主要特性

    3.1 为所有常用卷积实现了 Tensor Core 加速，包括 2D 卷积、3D 卷积、分组卷积、深度可分离卷积以及包含 NHWC 和 NCHW 输入及输出的扩张卷积
    3.2 为诸多计算机视觉和语音模型优化了内核，包括 ResNet、ResNext、SSD、MaskRCNN、Unet、VNet、BERT、GPT-2、Tacotron2 和 WaveGlow
    3.3 支持 FP32、FP16 和 TF32 浮点格式以及 INT8 和 UINT8 整数格式
    3.4 4D 张量的任意维排序、跨步和子区域意味着可轻松集成到任意神经网络实现中能为任意 CNN 架构上融合的运算提速
    3.5 数据中心采用 Ampere、Turing、Volta、Pascal、Maxwell 和 Kepler GPU 架构以及配备移动 GPU 的 Windows 和 Linux 支持 cuDNN。

安装：解压后将各文件夹下的文件复制到cuda安装路径下的对应文件夹里

4.conda添加新环境并下载tf2.6

# 相关配置
# conda配置国内清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
# 显示下载源
conda config --set show_channel_urls yes
# 查看conda的配置
conda config --show  

# pip配置国内清华源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 创建并激活环境
conda create tf2_6 python=3.9
conda activate tf2_6

# 安装tf-gpu-2.6.2
pip install tensorflow-gpu==2.6.2

5.测试gpu

import tensorflow as tf

print(tf.__version__) #2.6.2

print(tf.test.is_gpu_available()) # 为True表示安装成功

注意：目前没有手动配置环境变量，如果后续代码有问题可能需要配一下

参考文献

https://cloud.tencent.com/developer/article/1914694
https://tensorflow.google.cn/install/gpu
https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/
https://docs.microsoft.com/en-us/windows/ai/directml/gpu-accelerated-training

标签：卷积,gpu,cuDNN,RTX3060,conda,cuda,GPU,win11,tensorflow
来源： https://blog.csdn.net/qq_33534428/article/details/122235888

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9