对输入而言,小方块的内部局部性表现不是很好,因为几次向量加载都会发生缓存不命中;而外部局部性表现则较好,因为在reduce维度滑动使用的内存是连续的。这种表现和NCHW中卷积核的表现一样,整体来看都是对高速缓存比较友好的内存布局。对卷积核而言,如果没有进行数据重排,则其实NHWC的情况和NCHW中输入的情况类似,小块内和小块外的局部性都较差,因为都是列访问模式,访存局部性本身就差。但是由于卷积参数本身固定,因此可以离线对B矩阵进行数据重排,使得列访问的不连续通过重排变成连续,此时B矩阵小块内和小块reduce维度的访问都是访存友好的。
还有一种“矩阵褐铁矿”:大的立方体晶体由大量结晶取向一致的细小晶体相互堆砌重叠所组成,这些小方块晶体纹路相互平行,排布整齐划一,有点蜂巢[9]的那个意思。
从先期公布的预告图来看,银河E8整体车身轮廓与银河之光原型车颇为相似,前脸视觉效果较宽,延续了银河之光的LED头灯、C字型日间行车灯带等元素,点亮后的全新方块矩阵式Logo也很抢眼。相较原型车,量产版车型回归正常的后视镜,预计将采用隐藏式门把手,车顶**的部件预示着该车有望配备激光雷达以保障更先进的驾驶辅助相关功能。
方块滚轮是有许多正常的方块矩阵组成的整体旋转的空心圆筒。每个方块之间的间隔较大很容易跳空,想要快速通过的话建议大家从左路开始进入圆筒,顺着流向向斜右方跳跃前进是最快的,到了最后一个圆筒时,能踩弹板的话尽量去踩,可以直接弹射到重点。
旋转的动画还有一种优化方案,把所有要旋转的方块当一个整体,绕某个轴旋转,这样只需要更新下每个方块的世界矩阵即可,具体代码如下