ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

使用pycharm 跑通tasn-mxnet代码

2021-05-14 20:00:41  阅读:281  来源: 互联网

标签:nccl mxnet tasn 0.0 跑通 环境 报错 安装


 

环境 ubuntu16.04 、python3  、mxnet for cuda10.1 、nccl for cuda10.1

        由于本电脑以前安装的cuda是10.1版本,不能使用该论文给出的mxnet安装包,因为在其配置文件中会报错显示找不到cuda8.0的配置文件,首先我在本地环境安装mxnet-cu10.1 安装,安装过程中无报错,但是在python环境下import mxnet,会显示段错误(核心已转储)的错误,发现可能是因为mxnet的终端显示安装路径在python3下的sitepackage,但是在python3下只有distpackage,在使用mxnet时找不到其路径。解决办法是我下载了anaconda 的,新建环境mxnettest,在该环境下安装mxnet-cu101成功。同时个人认为跟mxnet版本有问题,在ubuntu本地环境下sudo pip mxnet-cu101是2.8版本,在anaconda下配置了清华镜像,显示安装的是2.6版本。

安装nccl我是用的是在网上下载的安装包同样是安装在了anaconda的环境里面,然后测试时下载nccltest,集体步骤见https://github.com/NVIDIA/nccl

至此环境全部配完。

开始运行代码

注意修改train.sh文件里面的路径,NCCL我写的是./usr/lib/x86_64-linux-gnu因为我搜索整个电脑发现libncclso10.1文件在这个下面,cuda 我写的是./usr/local/cuda-10.1/lib64/

第一个报错是运行train.sh报错显示没有mxnet 模块原因是因为.bash的编译环境是bin/bash,因此我在anaconda的base 的环境里面吧mxnet-cu101和nccl装了一遍,接着再运行,在evaluate里面会报错float  subscribable等的错误信息,原因是self.sum_metric此时的0.0,不是[0.0 0.0 0.0 0.0 0.0 .0.0]数组,由于找不出导致这个的原因,我在代码里面加了两行代码

标签:nccl,mxnet,tasn,0.0,跑通,环境,报错,安装
来源: https://blog.csdn.net/lemon1999123/article/details/116795042

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有