GDDR Generation Comparison
GDDR SGRAM Generation Comparison โ GDDR1 through GDDR7
๊ฐ์
GDDR๋ GPU์ AI ๊ฐ์๊ธฐ์์ ์ฐ๋ ๊ณ ๋์ญํญ ๊ทธ๋ํฝ DRAM์ ๋๋ค. ๊ฐ์ DRAM ์ ์ ์ฐ๋๋ผ๋ I/O signaling, prefetch, ์ฑ๋ ๋ถํ , ์ ์ยท์ ๋ขฐ์ฑ ๊ธฐ๋ฅ์ ๊ณ์ ๋ฐ๊ฟ ์ธ๋๋ง๋ค ํ๋น ์๋์ ์์คํ ํจ์จ์ ๋์ด์ฌ๋ ค ์์ต๋๋ค. ์์คํ ๋ฉ๋ชจ๋ฆฌ DDR๋ณด๋ค ๋ณด๋์ ํจํค์ง์ ๋ณ๋ ฌ ๋์ญํญ์ด ์ค์ํ๊ณ , HBM๋ณด๋ค ๊ตฌํ ๋น์ฉ๊ณผ ์ค๊ณ ์ ์ฐ์ฑ์ด ๋์ ๊ฒ์ด ์ผ๋ฐ์ ์ธ ํฌ์ง์ ์ ๋๋ค.
GDDR7์ JEDEC ํ์ค GDDR ์ค ์ฒ์์ผ๋ก PAM3 signaling์ ์ฑํํ ์ธ๋์ด๋ฉฐ, Samsung Semiconductor๋ ์ด์ ์ธ๋ ๋๋น ํ๋น I/O ์๋ ์ต๋ 25% ํฅ์๊ณผ ์ ๋ ฅ ํจ์จ ์ต๋ 30% ํฅ์์ ์๊ฐํฉ๋๋ค. GDDR5X์ GDDR6X๋ ๊ฐ์ ์ธ๋ ์์ vendor extension์ผ๋ก, ํ์ค ์ธ๋์ ํจ๊ป ๋ณด๋ฉด ๋ณํ ํ๋ฆ์ด ๋ ์ ๋ณด์ ๋๋ค.
ํต์ฌ ๊ฐ๋
๊ทธ๋ํฝ ๋ฉ๋ชจ๋ฆฌ์ ์ญํ
GDDR์ ๋์ฉ๋ ๋ฒ์ฉ ๋ฉ๋ชจ๋ฆฌ๋ณด๋ค GPU ์ฝ์ด์ ๋น ๋ฅด๊ฒ ๋ฐ์ดํฐ๋ฅผ ๊ณต๊ธํ๋ ๋ฐ ๋ง์ถฐ์ ธ ์์ต๋๋ค. ๊ทธ๋์ ์ฉ๋๋ง ํค์ฐ๊ธฐ๋ณด๋ค 32-bit๊ธ ์ฑ๋์ ์ฌ๋ฌ ๊ฐ ๋ณ๋ ฌ๋ก ๋๊ณ , ํ๋น ์ ์ก๋ฅ ์ ๋์ด๋ฉฐ, ๋ณด๋ ๋ผ์ฐํ ๊ณผ ํจํค์ง ์ ๋ ฅ์ ํจ๊ป ๊ด๋ฆฌํ๋ ๋ฐฉํฅ์ผ๋ก ๋ฐ์ ํ์ต๋๋ค.
Prefetch์ ์ฑ๋ ๋ถํ
prefetch๋ ๋ด๋ถ ๋ฐฐ์ด์์ ํ ๋ฒ์ ๋์ด์ฌ๋ฆฐ ๋ฐ์ดํฐ๋ฅผ I/O๋ก ๋ช ๋ฐฐ์๋งํผ ๋ด๋ณด๋ผ์ง ์ ํฉ๋๋ค. GDDR1์ 2n์์ GDDR7์ 32n๊น์ง ์ปค์ง๋ฉด์ ์ธ๋ถ ๋์ญํญ์ ๋์๊ณ , GDDR6๋ 2๊ฐ์ 16-bit ์ฑ๋, GDDR7์ 4๊ฐ์ 8-bit ์ฑ๋๋ก ๋๋ ๋ณ๋ ฌ์ฑ์ ๋ ์ธ๋ถํํ์ต๋๋ค.
์ ํธ ๋ฐฉ์
์ด๊ธฐ GDDR์ NRZ์ POD ์ค์ฌ์ด์๊ณ , GDDR5X๋ QDR mode๋ฅผ, GDDR6X๋ PAM4๋ฅผ vendor extension์ผ๋ก ์ฌ์ฉํ์ต๋๋ค. GDDR7์ JEDEC ํ์ค์ผ๋ก PAM3๋ฅผ ๋์ ํด ์ฌ๋ณผ ํจ์จ์ ๋์ด๋ฉด์๋ NRZ๋ณด๋ค ๋ ๋์ ์ ์ก๋ฅ ์ ๋ ธ๋ฆฝ๋๋ค.
์ ๋ ฅ๊ณผ ์ ๋ขฐ์ฑ
์ธ๋๊ฐ ๋ฐ๋์๋ก ์ ์์ 2.5 V์์ 1.2 V๊น์ง ๋ด๋ ค๊ฐ๊ณ , ODT, ZQ calibration, DBI, ODECC, CA parity ๊ฐ์ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์ต๋๋ค. ๊ณ ์ GDDR์ ์ ํธ ๋ฌด๊ฒฐ์ฑ๊ณผ ๋ฐ์ด ๊ด๋ฆฌ๊ฐ ์ฑ๋ฅ๋งํผ ์ค์ํ๋ฏ๋ก, ์ ์ ์์ ์ฑ๊ณผ ๋ณด๋ ์ค๊ณ๊ฐ ์ค์ ์ฒด๊ฐ ์ฑ๋ฅ์ ์ข์ฐํฉ๋๋ค.
๋น๊ต/๋ถ์
์๋ ํ๋ JEDEC JESD212(GDDR5), JESD232(GDDR5X), JESD250D(GDDR6), JESD239(GDDR7)๊ณผ ์ ์กฐ์ฌ ๊ณต๊ฐ ์๋ฃ๋ฅผ ํจ๊ป ๋์กฐํด ์ ๋ฆฌํ ๊ฒ์
๋๋ค. NEW๋ ํด๋น ์ธ๋์์ ์ฒ์ ๋์
๋ ํญ๋ชฉ์ ๋ปํ๊ณ , -๋ ํด๋น ์์์
๋๋ค. POD๋ pull-up termination์ ์ฐ๋ Pseudo Open Drain I/O๋ฅผ ๋ปํฉ๋๋ค.
ํต์ฌ ํ๋ฆ์ ์ธ ๊ฐ์ง์ ๋๋ค. ์ฒซ์งธ, GDDR5 ์ดํ์๋ ๋ด๋ถ array ์์ฒด๋ณด๋ค I/O signaling๊ณผ prefetch buffer ํ์ฅ์ ํตํด ์ธ๋ถ ๋์ญํญ์ ๋์ด์ฌ๋ฆฌ๋ ๋ฐฉํฅ์ด ๊ฐํด์ก์ต๋๋ค. ๋์งธ, GDDR6๋ถํฐ๋ 32-bit ์นฉ์ ๋ด๋ถ์ ์ผ๋ก ๋ ์๊ฒ ๋๋ sub-channel ๊ตฌ์กฐ๊ฐ ๋ณธ๊ฒฉํ๋์ด GPU ๋ฉ๋ชจ๋ฆฌ ์ปจํธ๋กค๋ฌ๊ฐ ๋ณ๋ ฌ ์์ฒญ์ ๋ ์ธ๋ฐํ๊ฒ ๋ถ์ฐํ ์ ์๊ฒ ๋์ต๋๋ค. ์ ์งธ, GDDR5X์ GDDR6X๋ ํ์ค ์ธ๋์ ํ์ฅํ์ด๊ณ , GDDR7์ JEDEC ํ์ค DRAM ๊ธฐ์ค์ผ๋ก ์ฒ์ PAM ๊ณ์ด signaling์ ์ฑํํ ์ธ๋๋ผ๋ ์ ์ด ๊ตฌ๋ถ์ ์ ๋๋ค.
์นฉ๋น ์ต๋ ๋์ญํญ์ (32 bits / 8) x pin๋น data rate๋ก ๊ณ์ฐํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด GDDR7์ด 48 Gbps/pin๊น์ง ๋์ํ๋ฉด 32-bit ์นฉ ํ๋์์ ์ด๋ก ์ 192 GB/s๊ฐ ๋ฉ๋๋ค. ์ค์ GPU๋ ์ด๋ฐ ์นฉ์ ์ฌ๋ฌ ๊ฐ ๋ณ๋ ฌ ๋ฐฐ์นํด 256-bit, 384-bit, 512-bit ๊ฐ์ ๋์ ๋ฉ๋ชจ๋ฆฌ ๋ฒ์ค๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
| Parameter | GDDR1 ~2000 | GDDR2 ~2003 | GDDR3 ~2004 | GDDR4 ~2007 | GDDR5 / GDDR5X (2016) | GDDR6 / GDDR6X (2020) | GDDR7 Mar 2024 |
|---|---|---|---|---|---|---|---|
| JEDEC Standard | (DDR-based, not sep. std.) | (DDR2-based, not sep. std.) | JEDEC GDDR3 (~2004) | JEDEC GDDR4 (~2006) | JESD212 (GDDR5) JESD232 (GDDR5X) | JESD250 (GDDR6) | JESD239 (Mar 2024) |
| ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL |
| VDD / VDDQ | 2.5 V | 1.8 V | 1.5 V | 1.5 V | 1.5 V (GDDR5) 1.35 V (GDDR5X) | 1.35 V (GDDR6) 1.35 V (GDDR6X) | NEW 1.2 V (1.1 V option TBD) |
| I/O signaling | NRZ | NRZ | PODโก (NRZ) | POD (NRZ) | POD / NRZ (GDDR5) NRZ / QDR (GDDR5X) | NRZ / QDR (GDDR6) PAM4 (GDDR6X) | NEW PAM3 (3-level, 1.5b/UI) |
| DDR base design | DDR1 | DDR2 | DDR2 | DDR3 | DDR3 | New (GDDR6) | NEW New (GDDR7) |
| INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE | INTERFACE & PREFETCH ARCHITECTURE |
| Prefetch | 2n | 4n | 4n | 8n | 8n (GDDR5) 8n / 16n (GDDR5X QDR) | 16n (QDR / DDR mode) | NEW 32n (4ch ร 8-bit, PAM3) |
| Bus width / chip | 32-bit | 32-bit | 32-bit | 32-bit | 32-bit | 32-bit (2 ร 16-bit ch) | NEW 32-bit (4 ร 8-bit ch) |
| Channels per chip | 1 | 1 | 1 | 1 | 1 | NEW 2 | NEW 4 |
| Separate WCK clock | โ | โ | โ | โ | NEW โ (GDDR5) (WCK = 2ร CK) | โ | โ |
| SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH |
| Data rate / pin | 0.5 โ 0.7 Gbps | 0.7 โ 1.0 Gbps | 0.7 โ 2.0 Gbps | 2.0 โ 3.6 Gbps | 4.0 โ 8.0 Gbps 5X: 10 โ 14 Gbps | 12 โ 24 Gbps 6X: 19 โ 23 Gbps (PAM4) | NEW 28 โ 48 Gbps (initial 32 Gbps) |
| Peak BW / chip (32-bit bus) | ~2.8 GB/s | ~4.0 GB/s | ~8.0 GB/s | ~14.4 GB/s | ~32 GB/s (GDDR5) 5X: ~56 GB/s | ~64 GB/s (GDDR6) 6X: ~84 GB/s | NEW ~128 GB/s (up to 192 GB/s @ 48G) |
| ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION |
| Banks per chip | 4 | 4 | 4 | 8 | 8 (GDDR5) 16 (GDDR5X) | 16 (8 per channel) | 16 (4 per channel) |
| Die density | 64Mb โ 256Mb | 128Mb โ 512Mb | 256Mb โ 1Gb | 256Mb โ 1Gb | 512Mb โ 8Gb | 8Gb โ 32Gb | NEW 16Gb โ 32Gb |
| KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION | KEY FEATURES INTRODUCED PER GENERATION |
| DBI (Data Bus Inversion) | โ | โ | โ | NEW โ | โ | โ | โ |
| On-die termination (ODT) | โ | โ | โ | โ | NEW โ | โ | โ |
| ZQ calibration | โ | โ | โ | โ | NEW โ | โ | โ |
| Multi-preamble | โ | โ | โ | NEW โ | โ | โ | โ |
| QDR (Quad Data Rate) mode | โ | โ | โ | โ | NEW โ (GDDR5X only) | โ | โ |
| PAM signaling | โ | โ | โ | โ | โ | NEW PAM4 (GDDR6X only) | NEW PAM3 (all GDDR7) |
| On-die ECC (ODECC) | โ | โ | โ | โ | โ | โ | NEW โ (mandatory) + ECS + data poison |
| CA parity (CAPARBLK) | โ | โ | โ | โ | โ | โ | NEW โ |
| Notable products | Radeon 8500 GeForce3 | GeForce FX 5800 | PS3, Xbox 360 GeForce 7/8xx | HD 2900 XT (niche) | GTX 1080, Vega 64 RX 480, GTX 1070 | RTX 3060/4070, RX 6700/7900 (GDDR6) RTX 3090/4090 (6X) | RTX 5080/5090 RX 9070 XT |
๋์ ์๋ฆฌ
GPU๋ ์ปจํธ๋กค๋ฌ๋ ACT๋ก row๋ฅผ ์ด๊ณ READ/WRITE๋ฅผ ๋ฐํํ ๋ค, prefetch buffer์ ๋ชจ์ธ ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ I/O lane์ผ๋ก ๋ด๋ณด๋ ๋๋ค. GDDR์ ๋ด๋ถ array๋ฅผ ๋ฌด๋ฆฌํ๊ฒ ๊ฐ์ํ๊ธฐ๋ณด๋ค ์ธ๋ถ ์ธํฐํ์ด์ค๋ฅผ ํค์ฐ๋ ๋ฐฉ์์ผ๋ก ๋์ญํญ์ ์ฌ๋ฆฌ๋ฏ๋ก, ์ธ๋๊ฐ ์ฌ๋ผ๊ฐ์๋ก prefetch์ ์ฑ๋ ๋ถํ ์ด ํจ๊ป ์ปค์ง๋๋ค.
GDDR7์ PAM3 signaling๊ณผ ๋ถํ ์ฑ๋์ ํตํด ๊ฐ์ ํจํค์ง ์์์ ๋ ๋ง์ ๋นํธ๋ฅผ ์ค์ด ๋๋ฅด๋ฉฐ, WCK ๊ฐ์ ๋ณ๋ ํด๋ก๊ณผ ๊ฐ์ข calibration์ผ๋ก ํ์ด๋ฐ ์ค์ฐจ๋ฅผ ์ค์ ๋๋ค. ๊ฒฐ๊ตญ ์ค์ ์ฑ๋ฅ์ ๋ฉ๋ชจ๋ฆฌ ์นฉ ๋จ๋ ์์น๋ณด๋ค GPU ๋ณด๋์ ๋ผ์ฐํ , ์ ์ ํ์ง, ๋ฐ์ด ๊ด๋ฆฌ์ ํฌ๊ฒ ์ข์ฐ๋ฉ๋๋ค.
GDDR2์ GDDR4๋ ๊ฐ๊ฐ ๊ณผ๋๊ธฐ ์ฑ๊ฒฉ์ด ๊ฐํ ์ธ๋๋ก ๋ณผ ์ ์์ต๋๋ค. GDDR2๋ ์ ๋ ฅ๊ณผ ๋ฐ์ด ๋ฌธ์ ๋ก ํ์ฐ ํญ์ด ์ ํ์ ์ด์๊ณ , GDDR4๋ prefetch ํ๋์ ์๋ ํฅ์์ ์์์ง๋ง ๊ณง๋ฐ๋ก GDDR5๊ฐ ๋ ๋์ ์คํจ ๋์ญํญ๊ณผ ํ๋ถํ ์ ๋ขฐ์ฑ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ฉด์ ์ฃผ๋ฅ ์๋ฆฌ๋ฅผ ๋๊ฒจ์ฃผ์์ต๋๋ค. ๊ทธ๋์ ์ค์ ์ ํ ์ํ๊ณ ๊ด์ ์์๋ GDDR1, GDDR3, GDDR5, GDDR6, GDDR7์ด ์ธ๋ ์ ํ์ ์ผ๋ก ๋ ์์ฃผ ์ธ๊ธ๋ฉ๋๋ค.
์ฅ๋จ์
- ์ฅ์ : ํ๋น ์ ์ก๋ฅ ์ด ๋์ GPU/AI ๊ฐ์๊ธฐ์์ ํฐ ๋์ญํญ์ ๋ง๋ค๊ธฐ ์ฝ์ต๋๋ค.
- ์ฅ์ : HBM๋ณด๋ค ํจํค์ง์ ๋ณด๋ ๊ตฌ์ฑ์ด ๋จ์ํ ํธ์ด๋ผ ์ ์ฉ ๋ฒ์๊ฐ ๋์ต๋๋ค.
- ์ฅ์ : GDDR7์ PAM3์ ์ ์ ์ ์ค๊ณ๋ก ๊ฐ์ ๊ธ์์ ์ ๋ ฅ ํจ์จ๊ณผ ์ด ํน์ฑ์ ๊ฐ์ ํ์ต๋๋ค.
- ๋จ์ : ์ ํธ ๋ฌด๊ฒฐ์ฑ, ์ํผ๋์ค, ํ์ด๋ฐ ํ๋ ๋ถ๋ด์ด DDR๋ณด๋ค ํจ์ฌ ํฝ๋๋ค.
- ๋จ์ : HBM๋ณด๋ค ๋นํธ๋น ๋์ญํญ ๋ฐ๋๋ ๋ฎ์ ์ต๊ณ ๊ธ ๊ฐ์๊ธฐ์์๋ ์ฌ์ ํ ๋ถ๋ฆฌํ ์ ์์ต๋๋ค.
- ๋จ์ : ๊ณ ์ ์ธ๋๋ก ๊ฐ์๋ก ๋ผ์ฐํ ๊ณผ ์ ์ ์ค๊ณ ์คํจ๊ฐ ๊ณง ์ฑ๋ฅ ์ ํ๋ก ์ด์ด์ง๋๋ค.
๊ด๋ จ ๊ธฐ์
- DDR Generation Comparison
- HBM Generation Comparison
- LPDDR Generation Comparison
- Memory Design Philosophy
- Samsung Semiconductor GDDR7: https://semiconductor.samsung.com/dram/gddr/gddr7/
- Samsung Semiconductor GDDR: https://semiconductor.samsung.com/dram/gddr/
- JEDEC JESD212 / JESD232 / JESD250D / JESD239
ํต์ฌ ์ ๋ฆฌ
GDDR ์ธ๋ ๋น๊ต์ ํต์ฌ์ ๋ด๋ถ ์ ์ ๋ฐ๊พธ๋ ๊ฒ๋ณด๋ค ์ธ๋ถ ์ธํฐํ์ด์ค๋ฅผ ์ผ๋ง๋ ํจ์จ์ ์ผ๋ก ํ์ฅํ๋๋์ ์์ต๋๋ค. GDDR5๋ POD์ DBI๋ก, GDDR6๋ ์ฑ๋ ๋ถํ ๊ณผ ๋ ๋์ ์ ์ก๋ฅ ๋ก, GDDR7์ PAM3์ ๋ ๋ฎ์ ์ ์์ผ๋ก ์ฑ๋ฅ๊ณผ ํจ์จ์ ๊ท ํ์ ๋ง์ท์ต๋๋ค. GDDR5X์ GDDR6X๋ ํ์ค ์ธ๋์ ํ์ฅํ์ผ๋ก ์ดํดํ๋ฉด ๋น๊ต๊ฐ ์ฌ์์ง๋๋ค. ์ด ๋ฌธ์๋ GDDR1๋ถํฐ GDDR7๊น์ง์ ๊ตฌ์กฐ์ ์ฐจ์ด๋ฅผ ํ ํ์ ํจ๊ป ๋น ๋ฅด๊ฒ ๋์กฐํ ์ ์๋๋ก ์ ๋ฆฌํ ๊ธฐ์ค์ ์ ๋๋ค.