ICode9

精准搜索请尝试: 精确搜索
  • docker中安装Nsight,分析cuda计算对GPU的利用效率2022-07-19 23:34:48

        最近刚开始接触CUDA,性能分析的时候免不了要使用Nsight工具,docker中又没有安装,就需要在自己的环境中配置了。 1. 运行docker   2. NSight安装准备 官方对Nsight的支持文档中,需要执行deviceQuery命令确定系统上的CUDA驱动程序和运行时版本,Ubuntu系统的deviceQuery在: cd /usr

  • 工具 | CTP、SimNow、NSight、快期2021-07-10 15:00:36

    CTP API 官网(非交易时间禁止访问):http://www.sfit.com.cn CTP的全称是综合交易平台(Comprehensive Transaction Platform),由交易系统、风控系统和结算系统组成。 交易者使用CTP对外开放的交易系统API接收交易所的行情数据和执行交易指令。 CTP API从v6.3.15版开始引入强制看穿式

  • 使用nvidia-nsight编译器开发C/C++2021-05-23 12:02:36

    安装nsight sudo apt install openjdk-8-jre-headless sudo apt install nvidia-nsight 启动 进入后,先在左侧菜单栏右键单击创建项目,然后在项目的基础上创建你要编译的C/C++程序即可。

  • Nsight Compute内存访问常用Metrics含义理解2020-11-27 13:31:54

    Nsight Compute 软件Source模块提供了精确到源代码行号的metrics参数,用于辅助性能调优,本篇基于访问共享内存的矩阵转置核函数的实现,记录一下对常用metrics含义的理解。 Metrics含义 Memory L1 Transcations Global:实际全局内存加载至L1缓存的内存交换次数,粒度128bytes Memor

  • NSight Compute 用户手册(上)2020-11-08 17:02:14

    NSight Compute 用户手册(上) 非交互式配置文件活动              从NVIDIA Nsight Compute启动目标应用程序              启动NVIDIA Nsight Compute时,将出现欢迎页面。单击快速启动打开连接对话框。如果未显示“连接”对话框,则可以使用主工具栏上的“

  • Nvidia中的Java开发Eclipse-Nsight2019-12-01 09:12:54

    我刚刚安装了用于Linux的Cuda工具包5.0,并且想知道是否可以在Nsight中进行Java开发.我有一个带有Java前端的Cuda项目,这将使管理起来容易得多. 毕竟,Nsight基于Eclipse,并且保留两个几乎相同的IDE几乎没有意义.解决方法:这是在Nsight中安装Eclipse Java Developer Tools的方法: >转

  • c-无法使用cuda进入__global__函数2019-10-13 04:05:49

    我已经在Nsight上编写了一个可以编译并可以执行的代码,但是第一次启动无法完成. 奇怪的是,当我在调试模式下运行它时,它可以完美运行,但是速度太慢. 这是进入访问GPU的函数之前的代码部分(我认为这里找不到错误): void parallelAction (int * dataReturned, char * data, unsigned

  • c-CUDA和本征成员“已被声明”错误2019-10-11 12:08:21

    我只是CUDA和Nsight的初学者,并且想通过线性代数运算(例如CUBLAS)利用出色的GPU性能.我在Eigen的帮助下编写了很多自定义代码,并且有很多矩阵乘法运算,因此我想保持我的代码不变,只需在GPU上进行这些运算即可. 我已经使用Visual Studio Nsight创建了一个示例项目,它运行良好,但是当

  • 在C项目中包含静态cuda库2019-10-10 10:10:09

    我有一个模板化的静态CUDA库,我想将其包含在一个普通的c项目中.当我包含库的标头时,编译器崩溃并说“它无法解析特定于CUDA的符号”.当然,g编译器无法解释这些符号.我知道这个问题,但是我不知道如何使用nsight IDE解决此问题. 我在cuda / nvcc库和c / g项目中都使用了nsight. 控制

  • c – 即使在cudaSetDevice之后,第一个cudaMalloc(K40对K20)的速度也很慢2019-09-28 05:08:44

    我理解CUDA会在第一次API调用期间进行初始化,但花费的时间太多了.即使经过单独的cudaSetDevice 测试程序: 使用CUDA 7.0(compute_35)Visual Studio 2012 NSight 4.5构建相同的程序,然后在2台单独的机器上运行(无需重建) 在第一个cudaMalloc之前,我称之为“cudaSetDevice” 在我的电

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有