图解NCHW与NHWC数据格式_田海立@CSDN-CSDN博客_nchw
流行的深度学习框架中有不同的数据格式,典型的有NCHW和NHWC格式。本文从逻辑表达和物理存储角度用图的方式来理解这两种数据格式,最后以RGB图像为例来加深NHWC和NCHW数据存储格式的理解。
一、基本概念
深度学习框架中,数据一般是4D,用NCHW或NHWC表达,其中:
N - Batch
C - Channel
H - Height
W - Width
二、逻辑表达
假定N = 2,C = 16,H = 5,W = 4,那么这个4D数据,看起来是这样的:
人类比较直接的理解方式是3D,上图中从三个方向上理解,C方向/H方向/W方向。然后是N方向上,就是4D。
上图中红色标准的数值是这个数据里每个元素的数值。
三、物理存储
无论逻辑表达上是几维的数据,在计算机中存储时都是按照1D来存储的。NCHW和NHWC格式数据的存储形式如下图所示:
3.1 NCHW
NCHW是先取W方向数据;然后H方向;再C方向;最后N方向。
所以,序列化出1D数据:
000 (W方向) 001 002 003,(H方向) 004 005 ... 019,(C方向) 020 ... 318 319,(N方向) 320 321 ...
3.2 NHWC
NHWC是先取C方向数据;然后W方向;再H方向;最后N方向。
所以,序列化出1D数据:
000 (C方向) 020 ... 300,(W方向) 001 021 ... 303,(H方向) 004 ... 319,(N方向) 320 340 ...
四、RGB图像数据举例
表达RGB彩色图像时,一个像素的RGB值用3个数值表示,对应Channel为3。易于理解这里假定N=1,那么NCHW和NHWC数据格式可以很直接的这样表达:
NCHW是
先在一个Channel面上把W方向|H方向上元素存储起来 // R
然后再在另一个Channel切面上把W方向|H方向上元素存储起来 // G
最后一个Channel切面上把W方向|H方向上元素存储起来 // B
这样看起来,就是先把R通道的每个像素都存储;然后存储G通道;再然后B通道。
NHWC是
先把3个Channel上元素存储起来 // 也就是一个像素的RGB
然后再在W方向|H方向上元素存储起来
这样看起来,就是顺序地取像素的RGB数值存储起来
五、不同框架支持
目前的主流ML框架对NCHW和NHWC数据格式做了支持,有些框架可以支持两种且用户未做设置时有一个缺省值:
TensorFlow:缺省NHWC,GPU也支持NCHW
Caffe:NCHW
PyTorch:NCHW
————————————————
版权声明:本文为CSDN博主「thl789」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/thl789/article/details/109037433
标签:...,存储,NCHW,NHWC,方向,数据格式 来源: https://blog.csdn.net/haima1998/article/details/123046426
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。