- 追加された行はこの色です。
- 削除された行はこの色です。
#author("2023-05-26T11:06:24+09:00","default:pbcglab_user","pbcglab_user")
#author("2024-06-06T12:20:24+09:00","default:pbcglab_user","pbcglab_user")
*スペック表 [#z083a289]
詳しくは[[NVIDIAのページ:http://www.nvidia.com/object/geforce_family.html]]参照.
***GeForce RTX 40 Series (Ada Lovelace) [#ra12c272]
| | RTX4090 | RTX4080 | RTX4070 Ti | RTX4070 |
| コア名 | AD102 | AD103 | AD104 | AD104 |
| CUDAコア数 | 16384 | 9728 | 7680 | 5888 |
| プロセッサクロック(GHz) | 2.23 | 2.21 | 2.31 | 1.92 |
| ブーストクロック(GHz) | 2.52 | 2.51 | 2.61 | 2.48 |
| Shader | 83TFLOPS | 49TFLOPS | 40TFLOPS | 29TFLOPS |
| Tensorコア数 | 512 | 304 | 240 | 184 |
| RTコア数 | 128 | 76 | 60 | 46 |
| メモリ速度(Gbps) | 21 | 22.4 | 21 | 21 |
| 標準メモリ | 24GB GDDR6X | 16GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X |
| メモリインタフェース幅 | 384bit | 256bit | 192bit | 192bit |
| メモリバンド幅(GB/s) | 1008 | 716.8 | 504 | 504 |
| TDP(W) | 450 | 320 | 285 | 200 |
| 推奨システム電力(W) | 850 | 750 | 700 | 650 |
| 補助電源コネクタ | 8pin x3 | 8pin x3 | 8pin x2 | 8pin x2 |
| | RTX4090 | RTX4080 SUPER | RTX4080 | RTX4070 Ti SUPER | RTX4070 Ti | RTX4070 SUPER | RTX4070 | RTX4060 Ti | RTX4060 |
| コア名 | AD102 | AD103 | AD103 | AD104 | AD104 | AD104 | AD104 | AD106 | AD107 |
| CUDAコア数 | 16384 | 10240 | 9728 | 8448 | 7680 | 7168 | 5888 | 4352 | 3072 |
| プロセッサクロック(GHz) | 2.23 | 2.29 | 2.21 | 2.34 | 2.31 | 1.98 | 1.92 | 2.31 | 1.83 |
| ブーストクロック(GHz) | 2.52 | 2.55 | 2.51 | 2.61 | 2.61 | 2.48 | 2.48 | 2.54 | 2.46 |
| Shader | 83TFLOPS | 52TFLOPS | 49TFLOPS | 44TFLOPS | 40TFLOPS | 35TFLOPS | 29TFLOPS | 22TFLOPS | 15TFLOPS |
| Tensorコア数 | 512 | 320 | 304 | 264 | 240 | 224 | 184 | 136 | 96 |
| RTコア数 | 128 | 80 | 76 | 66 | 60 | 56 | 46 | 34 | 24 |
| メモリ速度(Gbps) | 21 | 23 | 22.4 | 21 | 21 | 21 | 21 | 18 | 17 |
| 標準メモリ | 24GB GDDR6X | 16GB GDDR6X | 16GB GDDR6X | 16GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X | 8/16GB GDD | 8GB GDDR6 |
| メモリインタフェース幅 | 384bit | 256bit | 256bit | 256bit | 192bit | 192bit | 192bit | 128bit | 128bit |
| メモリバンド幅(GB/s) | 1008 | 736 | 716.8 | 504 | 504 | 504 | 504 | 288 | 272 |
| TDP(W) | 450 | 320 | 320 | 285 | 285 | 220 | 200 | 165 | 115 |
| 推奨システム電力(W) | 850 | 750 | 750 | 700 | 700 | 650 | 650 | 550 | 550 |
| 補助電源コネクタ | 8pin x3 | 8pin x3 | 8pin x3 | 8pin x2 | 8pin x2 | 8pin x2 | 8pin x2 | 8pin x1 | 8pin x1 |
注1) レイトレ用のRTコアは第3世代,Tensorコアは第4世代~
注2) CUDA Capabilityは8.9~
注3) 補助電源コネクタは450W以上(4070Ti&4070は300W以上)のPCIe Gen5ケーブルでもOK~
注4) RTX4070についてはボードを作っているメーカーのモデルによっては8pinx1の場合あり
注1) レイトレ用のRTコアは第3世代,Tensorコアは第4世代~
注2) CUDA Capabilityは8.9~
注3) 補助電源コネクタは450W以上(4070Ti&4070は300W以上)のPCIe Gen5ケーブルでもOK~
注4) RTX4070についてはボードを作っているメーカーのモデルによっては8pinx1の場合あり
***GeForce RTX 30 Series (Ampare) [#tdc1df9f]
| | RTX3090 Ti | RTX3090 | RTX3080 Ti | RTX3080 | RTX3070 Ti | RTX3070 | RTX3060 Ti | RTX3060 |
| CUDAコア数 | 10752 | 10496 | 10240 | 8960/8704 | 6144 | 5888 | 4864 | 3584 |
| プロセッサクロック(GHz) | 1.67 | 1.4 | 1.37 | 1.26/1.44 | 1.58 | 1.50 | 1.41 | 1.32 |
| ブーストクロック(GHz) | 1.86 | 1.7 | 1.67 | 1.71 | 1.77 | 1.73 | 1.67 | 1.78 |
| Shader | 40TFLOPS | 36TFLOPS | 34TFLOPS | 30TFLOPS | 22TFLOPS | 20TFLOPS | 16TFLOPS | 13TFLOPS |
| Tensorコア数 | 336 | 328 | 320 | 272 | 192 | 184 | 152 | 112 |
| RTコア数 | 84 | 82 | 80 | 68 | 48 | 46 | 38 | 28 |
| メモリ速度(Gbps) | 19.5 | 19.5 | 19 | 19 | 19 | 14 | 14 | 15 |
| 標準メモリ | 24GB GDDR6X | 24GB GDDR6X | 12GB GDDR6X | 12/10GB GDDR6X| 8GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 | 12GB GDDR6 |
| メモリインタフェース幅 | 384bit | 384bit | 384bit | 384/320bit | 256bit | 256bit | 256bit | 192bit |
| メモリバンド幅(GB/s) | 936 | 936 | 912 | 760 | 608 | 448 | 448 | 360 |
| TDP(W) | 450 | 350 | 350 | 350/320 | 290 | 220 | 200 | 170 |
| 推奨システム電力(W) | 850 | 750 | 750 | 750 | 750 | 650 | 600 | 550 |
| 補助電源コネクタ | 8pin x3 | 8pin x2 | 8pin x2 | 8pin x2 | 8pin x2 | 8pin x1 | 8pin x1 | 8pin x1 |
注1) レイトレ用のRTコアは第2世代,Tensorコアは第3世代~
注2) RTX3090は3スロット占有,他は2スロット~
注3) CUDA Capabilityは8.6~
注4) RTX3090Tiの補助電源コネクタは450W以上のPCIe Gen5ケーブルでもOK~
***GeForce RTX 20 Series (Turing) [#zbaf209a]
| | RTX2080 Ti | RTX2080 SUPER | RTX2080 |
| CUDAコア数 | 4352 | 3072 | 2944 |
| プロセッサクロック(MHz) | 1350 | 1650 | 1515 |
| ブーストクロック(MHz) | 1545(FEは1635) | 1815 | 1710(FEは1800)|
| ROPユニット数 | 88 | 64 | 64 |
| Tensorコア数 | 544 | 384 | 368 |
| RTX-OPS | 76T(FEは78T) | 63T | 60T |
| メモリ速度(Gbps) | 14 | 15.5 | 14 |
| 標準メモリ | 11GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 |
| メモリインタフェース幅 | 352bit | 256bit | 256bit |
| メモリバンド幅(GB/s) | 616 | 496 | 448 |
| 最大消費電力(W) | 250(FEは260) | 250 | 215 |
| 推奨システム電力(W) | 650 | 650 | 650 |
| 補助電源コネクタ | 8pin x2 | 8pin+6pin | 8pin+6pin |
注1) Tensorコアはディープラーニング用に導入された4x4の行列演算専用ユニット~
注2) RTX-OPSはNVIDIAが新たに導入したハイブリッドレンダリングの性能指標.Turingアーキテクチャでは従来のシェーダーレンダリングとレイトレーシングのハイブリッドレンダリングのために,レイトレ用のRTコアを備えているのでそれを含めたレンダリング性能評価のために作ったらしい(詳細な計算方法は不明).~
注3) FE : Founders Edition,NVIDIAが冷却機能などを設計しているリファレンスカード~
注4) CUDA Capabilityは7.5~
***GeForce 1000 (Pascal) [#t20c1ea5]
| | TITAN X | GTX1080 Ti | GTX1080 | GTX1070 | GTX1060(6GB) | GTX1060(3GB) |
| コア名 | GP102 | GP102 | GP104-400 | GP104-200 | GP106-400 | GP106-300 |
| CUDAコア数 | 3584 | 3584 | 2560 | 1920 | 1280 | 1152 |
| プロセッサクロック(MHz) | 1417 | 1480 | 1607 | 1506 | 1506 | 1506 |
| ブーストクロック(MHz) | 1531 | 1582 | 1733 | 1683 | 1708 | 1708 |
| ROP | 96 | 88 | 64 | 64 | 48 | 48 |
| メモリ速度(Gbps) | 10 | 11 | 10 | 8 | 8 | 8 |
| 標準メモリ | 12GB GDDR5X | 11GB GDDR5X | 8GB GDDR5X | 8GB GDDR5 | 6GB GDDR5 | 3GB GDDR5 |
| メモリインタフェース幅 | 384bit | 352bit | 256bit | 256bit | 192bit | 192bit |
| メモリバンド幅(GB/s) | 480 | 484 | 320 | 256 | 192 | 192 |
| 最大消費電力(W) | 250 | 250 | 180 | 150 | 120 | 120 |
| 最小システム所要電力(W) | 600 | 600 | 500 | 500 | 400 | 400 |
| 補助電源コネクタ | 8pin+6pin | 8pin+6pin | 8pin | 8pin | 6pin | 6pin |
| OpenGL | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 |
| DirectX | 12(FL12_1) | 12(FL12_1) | 12(FL12_1) | 12(FL12_1) | 12(FL12_1) | 12(FL12_1) |
注1) TITAN XはMaxwell世代のもの(GeForce GTX TITAN X)と異なり,製品名からGeForce GTXがなく単に「TITAN X」となる(調べるときは"TITAN X Pascal"で検索した方が良さそうです).~
注2) DirectXの項のFL12_1はFeature Level 12_1の意味~
注3) CUDA Capabilityは6.1~
***GeForce 900 (Maxwell) [#ub2df310]
| | TITAN X | 980 Ti | 980 | 970 | 960 | 950 |
| コア名 | GM200 | GM200 | GM204-400 | GM204-200 | GM206 | GM206 |
| CUDAコア数 | 3072 | 2816 | 2048 | 1664 | 1024 | 768 |
| プロセッサクロック(MHz) | 1000 | 1000 | 1126 | 1050 | 1127 | 1024 |
| ブーストクロック(MHz) | 1075 | 1075 | 1216 | 1178 | 1178 | 1188 |
| TFR(GigaTexel/sec) | 192 | 176 | 144 | 109 | 72 | 49.2 |
| ROP | 96 | 96 | 64 | 56 | 32 | 32 |
| メモリ速度(Gbps) | 7 | 7 | 7 | 7 | 7 | 6.6 |
| 標準メモリ | 12GB GDDR5 | 6GB GDDR5 | 4GB GDDR5 | 4GB GDDR5 | 2GB GDDR5 | 2GB GDDR5 |
| メモリインタフェース幅 | 384bit | 384bit | 256bit | 256bit | 128bit | 128bit |
| メモリバンド幅(GB/s) | 336 | 336.5 | 224 | 224 | 112 | 105.6 |
| 最大消費電力(W) | 250 | 250 | 165 | 145 | 120 | 90 |
| 最小システム所要電力(W) | 600 | 600 | 500 | 500 | 400 | 350 |
| 補助電源コネクタ | 8pin+6pin | 8pin+6pin | 6pin x 2 | 6pin x 2 | 6pin x 1 | 6pin x 1 |
| OpenGL | 4.5 | 4.5 | 4.4 | 4.4 | 4.4 | 4.5 |
| DirectX | 12 | 12 | 12 | 12 | 12 | 12 |
注1) CUDA Capabilityは5.2
***GeForce 700 (Kepler) [#d61bb107]
| | TITAN Z | TITAN Black | GTX780 Ti | TITAN | GTX780 | GTX770 | GT760 |
| コア名 | GK110x2 | GK110 | GK110 | GK110 | GK110 | GK104 | GK104 |
| CUDAコア数 | 5760(2880x2) | 2880 | 2880 | 2688 | 2304 | 1536 | 1152 |
| プロセッサクロック(MHz) | 705 | 889 | 875 | 837 | 863 | 1046 | 980 |
| ブーストクロック(MHz) | 876 | 980 | 928 | 876 | 900 | 1085 | 1033 |
| TFR(GigaTexel/sec) | 338 | 199.1 | 210 | 187.5 | 160.5 | 134 | 94.1 |
| ROP | 48x2 | 48 | 48 | 48 | 48 | 32 | 32 |
| メモリ速度(Gbps) | 7 | 7 | 7 | 6 | 6 | 7 | 6 |
| 標準メモリ | 12GB GDDR5 | 6GB GDDR5 | 3GB GDDR5 | 6GB GDDR5 | 3GB GDDR5 | 2GB GDDR5 | 2GB GDDR5 |
| メモリインタフェース幅 | 768bit | 384bit | 384bit | 384bit | 384bit | 256bit | 256bit |
| メモリバンド幅(GB/s) | 672 | 336 | 336 | 288.4 | 288.4 | 224.3 | 192.2 |
| 最大消費電力(W) | 375 | 250 | 250 | 250 | 250 | 230 | 170 |
| 最小システム所要電力(W) | 700 | 600 | 600 | 600 | 600 | 600 | 500 |
| 補助電源コネクタ | 8pinx2 | 8pin+6pin | 8pin+6pin | 8pin+6pin | 8pin+6pin | 8pin+6pin | 6pin x 2 |
| OpenGL | 4.4 | 4.4 | 4.4 | 4.4 | 4.3 | 4.3 | 4.3 |
| DirectX | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 | 11.2 |
***GeForce 600 (Kepler) [#ec7d53b1]
| | GTX690 | GTX680 | GTX670 |
| コア名 | GK104 | GK104 | GK104 |
| プロセス | 28nm | 28nm | 28nm |
| CUDAコア数 | 3072(1536x2) | 1536 | 1344 |
| プロセッサクロック(MHz) | 915 | 1006 | 915 |
| ブーストクロック(MHz) | 1019 | 1058 | 980 |
| TFR(billion/sec) | 234 | 128.8 | 102.5 |
| メモリ速度(Gbps) | 6 | 6 | 6 |
| 標準メモリ | 4096MB GDDR5 (2GB/GPU) | 2048MB GDDR5 | 2048MB GDDR5 |
| メモリインタフェース幅 | 512bit | 256bit | 256bit |
| メモリバンド幅(GB/s) | 384 | 192.2 | 192.2 |
| 最大消費電力(W) | 300 | 195 | 170 |
| 最小システム所要電力(W) | 650 | 550 | 500 |
| 補助電源コネクタ | 8pin x 2 | 6pin x 2 | 6pin x 2 |
| OpenGL | 4.2 | 4.2 | 4.2 |
| DirectX | 11 | 11 | 11 |
***GeForce 500 [#a6cd797b]
| | GTX590 | GTX580 | GTX570 | GTX560 Ti | GTX560 | GTX550 Ti |
| コア名 | GF110 | GF110 | GF110 | GF114 | GF114 | GF116 |
| プロセス | 40nm | 40nm | 40nm | 40nm | 40nm | 40nm |
| CUDAコア数 | 1024(512x2) | 512 | 480 | 384 | 336 | 192 |
| コアクロック(MHz) | 607 | 772 | 732 | 822 | 810-950 | 900 |
| シェーダクロック(MHz) | 1215 | 1544 | 1464 | 1645 | 1620-1900 | 1800 |
| TFR(billion/sec) | 77.7 | 49.4 | 43.9 | 52.5 | 45.4-49.8 | 28.8 |
| メモリクロック(Gbps) | 1707 | 2004 | 1900 | 4008 | 2002-2200 | 4100 |
| 標準メモリ | 3072MB GDDR5 | 1536MB GDDR5 | 1280MB GDDR5 | 1024MB GDDR5 | 1024MB GDDR5 | 1024MB GDDR5 |
| メモリインタフェース幅 | 768bit | 384bit | 320bit | 256bit | 256bit | 192bit |
| メモリバンド幅(GB/s) | 327.7 | 192.4 | 152 | 128 | 128 | 128 |
| 最大消費電力(W) | 365 | 244 | 219 | 170 | 150 | 116 |
| 最小システム所要電力(W) | 700 | 600 | 550 | 500 | 450 | 400 |
| 補助電源コネクタ | 8pinx2 | 8pinx2 | 6pin+8pin | 6pin x 2 | 6pin x 2 | 6pin |
| OpenGL | 4.1 | 4.1 | 4.1 | 4.1 | 4.1 | 4.1 |
| DirectX | 11 | 11 | 11 | 11 | 11 | 11 |
-GTX590はGPUx2
-TFR : テクスチャフィルレート
***GeForce 400 [#ubebcb57]
| | GTX480 | GTX470 | GTX465 |
| コア名 | GF100 | GF100 | GF100 |
| プロセス | 40nm | 40nm | 40nm |
| CUDAプロセッサコア数 | 480 | 448 | 352 |
| コアクロック(MHz) | 700 | 607 | 607 |
| シェーダクロック(MHz) | 1401 | 1215 | 1215 |
| TFR(billion/sec) | 42 | 34 | 26.7 |
| メモリクロック(MHz) | 1848 | 1674 | 1603 |
| 標準メモリ | 1536MB GDDR5 | 1280MB GDDR5 | 1024MB GDDR5 |
| メモリインタフェース幅 | 384bit | 320bit | 256bit |
| メモリバンド幅(GB/s) | 177.4 | 133.9 | 102.6 |
| 最大消費電力(W) | 250 | 215 | 200 |
| 最小システム所要電力(W) | 600 | 550 | 550 |
| 補助電源コネクタ | 6pin+8pin | 6pinx2 | 6pinx2 |
| OpenGL | 4 | 4 | 4 |
| DirectX | 11 | 11 | 11 |
***GeForce 200 [#d0441c09]
| | GTX295 | GTX285 | GTX280 | GTX275 | GTX260 |
| コア名 | GT200b(GT206) | GT200b(GT206) | GT200 | GT200b(GT206) | GT200 or GT200b(GT206) |
| プロセス | 55nm | 55nm | 65nm | 55nm | 55nm or 65nm |
| CUDAプロセッサコア数 | 480(240x2) | 240 | 240 | 240 | 192 |
| コアクロック(MHz) | 576 | 648 | 602 | 633 | 576 |
| シェーダクロック(MHz) | 1242 | 1476 | 1296 | 1404 | 1242 |
| TFR(billion/sec) | 92.2 | 51.8 | 48.2 | 50.6 | 36.9 |
| メモリクロック(MHz) | 999 | 1242 | 1107 | 1134 | 999 |
| 標準メモリ | 1792MB GDDR3 | 1024MB GDDR3 | 1024MB GDDR3 | 896MB GDDR3 | 896MB GDDR3 |
| メモリインタフェース幅 | 896bit | 512bit | 512bit | 448bit | 448bit |
| メモリバンド幅(GB/s) | 223.8 | 159 | 141.7 | 127 | 111.9 |
| 最大消費電力(W) | 289 | 204 | 236 | 219 | 182 |
| 最小システム所要電力(W) | 680 | 550 | 550 | 550 | 500 |
| 補助電源コネクタ | 6pin+8pin | 6pinx2 | 6pin+8pin | 6pinx2 | 6pinx2 |
| OpenGL | 2.1 | 2.1 | 2.1 | 3 | 2.1 |
| DirectX | 10 | 10 | 10 | 10 | 10 |
-GTX295はGPUx2