ag百家乐刷水攻略

你的位置:AG百家乐是真的么 > ag百家乐刷水攻略 > AG百家乐网站 英伟达GeForce 6000系列里面

AG百家乐网站 英伟达GeForce 6000系列里面

发布日期:2024-05-11 08:53    点击次数:103

AG百家乐网站

本文由半导体产业纵横(ID:ICVIEWS)编译自Chips and Cheese

是时候来聊聊英伟达GeForce 6系列显卡了。

2025 年发轫,显卡领域就吵杂超卓。英特尔的 Arc B580 标明,制造一款显存(VRAM)跨越 8GB 的中端显卡仍是可行的。AMD 的 RDNA 4 持续了 AMD 永久以来的一种作念法,即在追求高端居品之后,又以为终究不太值得。英伟达在 2025 年也推出了新一代居品,他们的 5000 系列显卡照旧发布,但市面上却一直莫得现货。不外,数字越大越好,是以面前是时候来聊聊英伟达 GeForce 6 系列显卡了。

每一代游戏玩家都对更高质料的图形成果有所需求。莫得东谈主比英伟达更明晰这少许,因此英伟达 GeForce 6000 系列显卡旨在以饱胀高的帧率提供接近电影级的画质,以支撑交互式游戏体验。GeForce 6000 显卡,简称 GeForce 6 系列,在联想时研究到了图形渲染的高度并行性。与此同期,它们在可编程性方面完了了浩瀚飞跃,为完了复杂的游戏内殊效开辟了令东谈主欣喜的新可能。

玄虚

图形渲染触及在蓄意最终像素心绪之前,将过头坐标从三维空间调整到二维屏幕空间,这一进程被称为光栅化。这两个阶段实质上都是并行任务,而况能很好地适配领有广博实施单位阵列的硬件。因此,英伟达GeForce 6 系列是一种大畛域并行处理的建造。它领有广博的固定功能图形硬件,但该显卡的信得过实力在于其一系列过头着色器中枢和像素着色器中枢。这些可编程组件实施由游戏提供的着色器设施,而不是实施预设功能。它们还充任基本的构建模块,使英伟达梗概针对不同的功耗、价钱和性能指标进行膨胀。英伟达 GeForce 6000 系列中最高端的芯片 NV40 配备了 6 个过头着色器中枢和 16 个像素着色器中枢。

摘自英伟达发表于电气与电子工程师协会(IEEE)的论文

一台高度并行的机器需要一个高带宽的内存子系统来为其提供数据支撑。英伟达 GeForce 6 系列居品最高可配备 256 位的 GDDR3 动态就地存取存储器,这使得它的内存总线宽度比典型的台式机中央处理器要宽得多。该显卡具有一个可被总计像素着色器中枢和过头着色器中枢分享的二级纹理缓存,这使得得回到的纹理数据梗概在短期内被重迭使用。英伟达那时并未裸露缓存的大小,但他们的指标是在有好多未射中情况同期发生时达到 90% 的射中率,而不是像中央处理器缓存那样时常追求 99% 的射中率。该显卡通过流行的加快图形接口(AGP)与主机系统进行通讯,但也能支撑行将推出的外设部件互连高速形式。

过头着色器中枢(Vertex Shader Core)

过头着色器设施将坐标从三维空间调整到二维屏幕空间。这听起来可能是一项肤浅的任务,无非即是进行相机矩阵乘法和透视除法运算。但可编程的过头着色器带来了新的手段。举例,一个过头着色器不错对纹理进行采样,并将其用作置换贴图。除了支撑纹理造访以外,英伟达 GeForce 6000 的过头着色器中枢还支撑分支、轮回和函数调用。在信得过的中央处理器以外,往日在其他建造上,这些功能中的大部分都是难以思象的,这展示了显卡发展的令东谈主欣喜之处。

过头着色器的实施从一个领有 512 个条方针教导就地存取存储器中提真金不怕火教导驱动。英伟达使用来自驱动设施体式的 128 位过头教导,这些教导会被调整为 123 位的里面体式。因此,该教导就地存取存储器的容量大要为 8 千字节。DirectX 9 的过头着色器 3.0 形式礼貌至少要有 512 个教导插槽,而况英伟达的过头着色器中枢教导集架构与 DirectX 9 的高档着色器说话教导精熟契合。由于存在教导限定,着色器设施不会像中央处理器设施那样时常因教导缓存未射中而导致性能弃世。此外,造访教导就地存取存储器不像缓存那样需要进行标签比较,从而精真金不怕火了功耗。

从梅萨(Mesa)代码中揣测出的英伟达 GeForce 6000 过头着色器教导布局

DirectX 9过头着色器的高档着色器说话教导大致可分为标量教导和矢量教导两类。标量教导包括诸如求平常根倒数之类的特殊运算。矢量教导时常触及像乘加这么的基本运算,而况对由四个32位值构成的128位矢量进行操作。英伟达GeForce 6000的过头着色器活水线针对这种缔造进行了高度优化,而况具有孤苦的矢量活水线和标量活水线。每条教导集架构教导都同期指定了一个标量运算和一个矢量运算,使得过头着色器中枢梗概在一个教导流中从两个维度诈欺并行性。DirectX 9着色器设施指定的矢量提供了矢量级别的并行性。英伟达的编译器发现的任何标量+矢量双教导放射契机都能提供额外的并行性。

并行性的第三个起原是多线程,它起到了掩饰延伸的作用。矢量运算插槽不错给与纹理采样教导。过头着色器对内存的造访相对来说仍不常见,是以过头着色器中枢并莫得一个与其纹理得回单位绑定的一级纹理缓存。英伟达展望,一个着色器设施需要20到30条教导来掩饰纹理得回延伸,而仅靠单个线程很难完了这少许。因此,每个过头着色器中枢最多不错追踪三个线程,并在它们之间进行切换以掩饰延伸。

教导输入可来自寄存器或常量就地存取存储器。两者都由 128 位矢量要求构成,以匹配矢量实施宽度。寄存器文献分为输入寄存器、输出寄存器和临时寄存器。输入寄存器和输出寄存器各有 16 个要求,从着色器设施的角度来看,它们划分为只读和只写。临时寄存器文献支撑读写操作,有 32 个要求。DirectX 9 的过头着色器 3.0 轨范允许一个着色器设施最多可寻址 32 个寄存器,但英伟达可能会在多个线程之间分享寄存器文献。淌若是这么,一个过头着色器设施应使用不跨越 10 个临时寄存器,以完了最大占用率。

像素着色器中枢(Pixel Shader Core)

像素着色器,或称为片断着色器,承担了广博忙绿的使命,因为渲染一个场景时常触及处理的像素数目远多于过头数目。相应地,英伟达 GeForce 6000 显卡最多可领有 16 个像素着色器中枢。像素着色器中枢本身和过头着色器中枢相似具有高度可编程性,具备分支支撑等诸多特质。关联词,像素着色器中枢的构建神气大不疏浚,以诈欺像素层面时常存在的更高并行性。

英伟达 GeForce 6000 的像素着色器使用 128 位教导,不外由于硬件各别,其编码与过头着色器所使用的编码有很大区别。英伟达取舍支撑多达 65536 条像素着色器教导,远远跨越了 DirectX 9 礼貌的最低 512 个教导插槽的轨范。使用总计教导插槽将花费 1 兆字节的存储空间,因此像素着色器中枢可能会使用教导缓存。

“片断处理器每条活水线有两个 32 位浮点数着色器单位,片断会先经过这两个着色器单位和分支处理器,然后再轮回复返总计这个词活水线以实施下一组教导。”——《英伟达 GeForce 6 系列 GPU 架构》,作家埃米特・基尔加里夫(Emmet Kilgariff)和拉姆迪马・费尔南多(Ramdima Fernando)

英伟达的过头着色器中枢的运行神气很像带有三向同步多线程功能来掩饰延伸的中央处理器,而像素着色器中枢则在多个线程间选拔单教导多数据实施模子。这种并行性,时常被称为单教导多线程,是在通过使用多重量矢量在单个线程内完了的单教导多数据的基础上应用的。英伟达并非追踪三个孤苦的线程,而是将好多像素着色器调用分组为一个矢量,并在硬件中有用地轮回处理这些 “线程”。这种形式使英伟达梗概以低资本同期处理数千个 “线程”,因为澌灭矢量中的线程必须实施疏浚的教导,且不可采用与其他线程不同的孤苦实施旅途。唯有正在处理的数据是不同的。

对于这种单教导多线程线程模子,ag真人百家乐怎么赢设施员必须钟情教导不对带来的性能损耗。淌若一个矢量内的不同线程在条件分支上取舍了不同的标的,像素着色器中枢将实施分支的两个标的,同期屏蔽掉非行为线程。这与过头着色器中枢的多教导多数据实施模子酿成了显著对比,过头着色器中枢的实施模子即使在澌灭中枢中运行的线程分支标的不同期,也允许无损耗的分支操作。英伟达提议在跨越 1000 个像素的区域内保抓分支的一致性,或者大要 256 个 2x2 像素的四边形区域,这显露着矢量长度会非常长。

同期处理如斯多的任务对于掩饰延伸至关蹙迫,但这也给芯片里面存储带来了压力。DirectX 9 允许像素着色器寻址 32 个临时寄存器,这些寄存器的宽度依然为 128 位。要同期处理 256 个线程,每个像素着色器中枢将需要 128 千字节的寄存器文献容量,而这在将来几年内的GPU中都难以完了。英伟达 GeForce 6000 使用的是较小的寄存器文献,其大小未知。英伟达显露,淌若像素着色器设施使用四个或更少的 128 位寄存器,就不错让同期处理的线程数目达到最大值。大致估算一下,256 个线程,每个线程使用四个寄存器,将需要 16 千字节的寄存器文献容量。

像素着色器中枢的两个 128 位矢量单位在不同的活水线阶段挨次陈设。每个周期,这两个单位都不错实施四次 32 位浮点数运算,不外唯有位于下方的阿谁单位不错进行乘加运算。位于上方的单位梗概处理特殊函数运算以及纹理地址蓄意。纹理运算在这两个实施单位阶段之间发出。32 位浮点数运算的峰值婉曲量为每个周期 12 次运算。举例,通过在上方阶段发出一次矢量 32 位浮点数乘法运算,鄙人方阶段发出一次 32 位浮点数乘加运算,就不错达到这一婉曲量。

从着色器设施的角度来看,上方和下方的矢量单位合起来每个周期不错完成两次矢量运算。与过头着色器中枢比拟,像素着色器的法例 “双教导放射” 布局使得上方的单位梗概将其运算收尾传递给下方的单位。因此,两条相互依赖的教导不错完了 “双教导放射”。除了对两个矢量单位的教导进行交叉编排外,英伟达的编译器还不错将作用于矢量元素不同子集的运算打包到一条教导中,这擢升了单个线程内矢量单位的诈欺率。半精度浮点数运算致使不错进一步擢升婉曲量。对于图形渲染而言,完满的 32 位精度时常并非必需,尤其是在处理像素心绪的时候。像素着色器中枢中的两个矢量实施单位都能以双倍速率实施半精度浮点数运算。使用半精度浮点数还能使这些数值对寄存器文献的占用减少一半,这反过来也不错擢升占用率,进而更好地掩饰延伸。

输入寄存器未画图出来,但总计的着色器设施都会使用输入寄存器,并将其蓄意收尾写入输出寄存器。纹理采样是像素着色的一个蹙迫部分,因此与过头着色器中枢比拟,像素着色器中枢有一条经过优化的纹理采样旅途:每个中枢都有一个一级纹理缓存,由芯片级的二级纹理缓存提供支撑。

杰出像素着色

像素着色器设施时常输出像素心绪,但心绪践诺上仅仅一些数值。英伟达 GeForce 6000 强劲的大畛域并行蓄意智商大部分蚁合在其像素着色器阵列中,而且其领有的高浮点运算智商(每秒十亿次浮点运算,GFLOPs)对于非像素联系的任务来说也非常出色。此外,像素处理活水线的机动性使得富饶创造力的设施员实在不错诈欺它完成任何事情。

举例,光辉追踪是一种与光栅化在实质上迥然相异的图形渲染形式,它触及到在场景中追踪光辉的旅途。由于对蓄意智商的要求,光辉追踪在很猛进度上局限于离线应用。关联词,英伟达GeForce 6系列的可编程像素着色器梗概胜任及时渲染的任务,至少对于肤浅场景来说是如斯。

来自斯坦福大学对于布鲁克(Brook)应用设施编程接口(API)的展示内容

其可能性不仅限于不同的图形渲染时期。可编程着色器的强劲功能鼓励了一些新应用设施编程接口的发展,这些接口并非告成面向图形领域。斯坦福大学的布鲁克(Brook)应用设施编程接口针对 GPU 上的通用蓄意。它的编程模子与 GPU 针对并行任务进行优化的神气精熟相连。要老到这么一种模子可能需要一些时辰来适当,尤其是因为大多数设施员一直以来学习的都是串行实施模子。但从事高度并行和高度王法的数据处理的研究东谈主员和其他开辟东谈主员应该温顺这些应用设施编程接口。

费事仍然存在

在 GPU 上运行任何并行任务仍然存在要紧隔断:着色器设施通过绑定的纹理来造访内存;与 CPU 端的内存分派比拟,纹理的大小有限;与完满规格的 IEEE 754 形式完了比拟,浮点精度时常不及;着色器在不使清爽停顿的情况下只可实施很短的时辰;在着色器实施时代无法修改纹理等等。

开辟东谈主员还必须在 CPU 和 GPU 的内存空间之间传输数据,以便为 GPU 提供数据并得回收尾。后者可能会出现问题,因为 GPU 经过优化,是为了将像素着色器的输出当作一帧图像呈面前屏幕上,然后赶快用后续的一帧覆盖它。从 GPU 将数据复制回 CPU 可能会遭受主机接口的限定。

英伟达无疑建壮到了这些局限性,而况正在竭力照顾这些问题。GeForce 6 系列除了支撑 AGP 接口外,还将支撑行将推出的 PCI Express 形式。PCI Express 加多的带宽使 GPU 更接近成为一个易于使用的并行加快器。

结语

GeForce 6 系列的像素和过头着色器活水线比以往任何时候都愈加机动,这标明英伟达正郑重对待可编程着色器。对于现时的游戏使命负载而言,GeForce 6 系列引入的好多功能可能看起来有些多余。很难思象有东谈主会编写一个包含轮回、函数调用和分支,且长度达数百条教导的着色器设施。GeForce 6 系列的功能标明,英伟达在基本图形渲染以外的特质方面伸开竞争。这是开脱固定功能硬件这一更大趋势的一部分,而况对 GPU 的发展有着令东谈主欣喜的真谛。也许很快,咱们就不会再称这些显卡为 GPU 了,因为它们能作念的远不啻渲染图形。

尽管英伟达 GeForce 6000 系列显卡具有可编程性,但其仍然非常凝视图形处明智商。英伟达的着色器教导集架构依旧与 DirectX 9 轨范精熟联系,这确保了游戏中的着色器设施能在该硬件上精采运行。而且这款硬件相当强劲;高端的 GeForce 6000 芯片领有跨越 2 亿个晶体管。这收获于国外贸易机器公司先进的 130 纳米制程工艺才得以完了。要提供如斯强劲的处明智商,也需要可靠的供电支撑,因此高端显卡使用了一双莫仕(Molex)联络器。莫仕联络器是经落伍辰教练的形式联络器,其粗针脚和电线梗概可靠地为各式外围建造供电而不会溶化。

总之,GPU正以惊东谈主的速率发展。2005 年是令东谈主欣喜的一年。图形渲染时期正与国度经济都头并进,向着 2008 老大进,毫无疑问,每个东谈主都在期待着阿谁光明的将来。

*声明:本文系原作家创作。著述内容系其个东谈主不雅点,自身转载仅为分享与接洽,不代表自身赞叹或招供,如有异议,请筹商后台。

思要得回半导体产业的前沿洞见、时期速递、趋势领悟AG百家乐网站,温顺咱们!



首页| AG真人百家乐下载 | ag百家乐刷水攻略 | ag真人百家乐怎么赢 |

Powered by AG百家乐是真的么 @2013-2022 RSS地图 HTML地图