GF100架构规格与工作流程简述
● GF100架构规格与工作流程简述
GF100图形处理器基于大量可扩展的图形处理集群(GPC)、流式多处理器(SM)以及存储器控制器。GF100拥有4个GPC、16个SM群组以及6个存储器控制器。我们希望能够推出在GPC、SM以及存储器控制器等方面具有不同配置的GF100产品,以满足不同价位的市场需求。
因为每个SM群组内含32个流处理器,因此从NVIDIA的原设计来看,完整的原生GF100芯片应该拥有32×16=512个流处理器,而首发的旗舰型号GTX480或许出于功耗和发热的考虑而将其中一组SM关闭,即为480个流处理器。据此也可以猜测GTX480并不是GF100家族的终极型号,火力全开的GF100显卡很可能会在不久工艺制程进一步更新后问世。
GF100拥有48个ROP单元,它们可用于像素混合(Pixel Blending)、抗锯齿以及原子存储器操作。ROP单元每8个一组,共有6组。每一组均由一个64位存储器控制器来进行控制。存储器控制器、2级高速缓存、以及ROP群组全都密切关联,扩展一个单元就会自动地扩展其它部件。
GPU能够通过主接口来读取CPU指令。GigaThread引擎能够从系统内存中获取指定的数据并将其拷贝到显存中。GF100采用了6个64bit GDDR5显存控制器(共384bit),便于显存高带宽存取。GigaThread 引擎会为各个SM群组创建和分派线程块。单个SM反过来会将多个Warp调度至多个CUDA核心以及其它执行单元。当图形流水线中出现工作膨胀现象时,例如在Tessellation(曲面细分)以及光栅化阶段之后,GigaThread引擎还能够将工作重新分配至SM。
● GPU中的GPU 图形处理集群自给自足
GF100的图形架构由大量叫做“图形处理集群”(GPC)的硬件模块构成。一个GPC包含一个Raster引擎以及最多四个SM。
GPC是GF100的主要高级硬件模块。它拥有两项重要的创新:一个用于三角形设置、光栅化以及Z坐标压缩(Z-cull)的可扩展Raster引擎,一个用于顶点属性提取与Tessellation(曲面细分)的可扩展PolyMorph引擎。Raster引擎驻留在GPC当中,而PolyMorph引擎则驻留在SM中。
如其名称所示,GPC囊括了所有主要的图形处理单元。它代表了顶点、几何、光栅、纹理以及像素处理资源的均衡集合。除了ROP功能以外,GPC可以被看作是一个自给自足的GPU,而一颗GF100拥有四个GPC!
网友评论