HBM Generation Comparison
HBM DRAM ์ธ๋ ๋น๊ต HBM1 ยท HBM2 ยท HBM3 ยท HBM3E ยท HBM4
๊ฐ์
HBM(High Bandwidth Memory)์ TSV ๊ธฐ๋ฐ 3D ์ ์ธต๊ณผ ์ค๋ฆฌ์ฝ ์ธํฐํฌ์ ๋ฅผ ์ด์ฉํด GPU์ AI ๊ฐ์๊ธฐ ๊ฐ๊น์ด์์ TB/s๊ธ ๋์ญํญ์ ์ ๊ณตํ๋ DRAM ๊ณ์ด์ ๋๋ค. HBM1๊ณผ HBM2๋ 1024-bit ์ธํฐํ์ด์ค๋ฅผ ์ค์ฌ์ผ๋ก ์ถ๋ฐํ๊ณ , HBM3๋ถํฐ๋ pseudo channel๊ณผ ์ฑ๋ ๋ถํ ์ ํตํด ๋ณ๋ ฌ์ฑ์ ๋ ์ธ๋ฐํ๊ฒ ๋๋ด์ต๋๋ค.
HBM3E๋ HBM3๋ฅผ ๋ ๋์ ํ ์๋์ ๋ ๋ฎ์ ์ ์์ผ๋ก ํ์ฅํ ์ธ๋์ด๊ณ , HBM4๋ 2048-bit ์ธํฐํ์ด์ค์ ๋ ํฐ I/O ์ง์ ์ ํตํด AI/HPC ์ํฌ๋ก๋์ ๋ฉ๋ชจ๋ฆฌ ๋ณ๋ชฉ์ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์งํํ์ต๋๋ค. ๊ณต๊ฐ ์ ํ ๊ธฐ์ค์ผ๋ก๋ Samsung HBM4๊ฐ 13 Gbps, 3,300 GB/s, 36 GB 12H๋ฅผ, Micron HBM4๊ฐ 11 Gbps ์ด์, 2.8 TB/s ์ด์, 2048-pin ๋ฒ์ค๋ฅผ ์ ์ํฉ๋๋ค.
ํต์ฌ ๊ฐ๋
Wide interface
HBM์ ํต์ฌ์ ๋์ ๋ฒ์ค์ ๋๋ค. ์ผ๋ฐ DRAM์ด ์ฑ๋ ์๋ฅผ ๋๋ ค ๋์ญํญ์ ํ๋ณดํ๋ ๋ฐ๋ฉด, HBM์ ํจํค์ง ๋ด๋ถ์์ ๋งค์ฐ ๋์ ์ธํฐํ์ด์ค๋ฅผ ์งง์ ๊ฒฝ๋ก๋ก ์ฐ๊ฒฐํด ํ๋น ์ ์ก๋์ ํฌ๊ฒ ๋์ด์ฌ๋ฆฝ๋๋ค.
TSV์ ์ธํฐํฌ์
HBM์ ๋ค์ด ์ฌ์ด๋ฅผ TSV๋ก ์์ง ์ฐ๊ฒฐํ๊ณ , GPU๋ ASIC๊ณผ๋ ์ค๋ฆฌ์ฝ ์ธํฐํฌ์ ๋ก ์ด์ด์ง๋๋ค. ์ด ๊ตฌ์กฐ ๋๋ถ์ ์ ํธ ๊ฒฝ๋ก๊ฐ ์งง์์ง๊ณ ๋์ญํญ ๋ฐ๋๊ฐ ๋์์ง์ง๋ง, ํจํค์ง ๋๋๊ฐ ์ฌ๋ผ๊ฐ๋๋ค.
Pseudo channel๊ณผ ์ฑ๋ ์ธ๋ถํ
HBM2์ pseudo channel์ ๋ด๋ถ ๋ณ๋ ฌ์ฑ์ ๋ ์ ํ์ฉํ๊ธฐ ์ํ ๋ถํ ๋ฐฉ์์ ๋๋ค. HBM3 ์ดํ์๋ ์ฑ๋ ํญ์ ๋ ์๊ฒ ๋๋ ๋ณ๋ ฌ ์ ๊ทผ์ฑ๊ณผ ํจ์จ์ ๋์๊ณ , HBM4๋ 32์ฑ๋ ๊ตฌ์กฐ๋ก ์ด ํ๋ฆ์ ๋ ํ์ฅํฉ๋๋ค.
์ ๋ขฐ์ฑ ๊ธฐ๋ฅ
์ธ๋๊ฐ ์ฌ๋ผ๊ฐ์๋ก on-die ECC, ECS, DRFM ๊ฐ์ ๊ธฐ๋ฅ์ด ๋ถ์ด AI/HPC ํ๊ฒฝ์์์ ์ฅ์๊ฐ ๋์๊ณผ ์ค๋ฅ ๋ด์ฑ์ ๋ณด๊ฐํฉ๋๋ค. HBM์ ๋จ์ํ ์๋ ๊ฒฝ์์ด ์๋๋ผ ํจํค์ง, ์ ๋ ฅ ๋ฐฐ๋ถ, ๋ณต์๋ ฅ์ ํจ๊ป ๋ณด๋ ๋ฉ๋ชจ๋ฆฌ์ ๋๋ค.
๋น๊ต/๋ถ์
์ถ์ฒ: JEDEC JESD235/235D (HBM1, HBM2) ยท JESD238 (HBM3) ยท JESD238A (HBM3E) ยท Samsung HBM4 product page ยท Micron HBM4 product page ยท HBM4 public technical reports
NEW = ํด๋น ์ธ๋์์ ์ฒ์ ๋์ . N/A = ํด๋น ์์. โก ๊ณต๊ฐ ์ ํ ๊ธฐ์ค ์์น๋ก, JEDEC baseline spec ์์ฒด ์์น๋ ์๋.
๋์ญํญ ๊ณ์ฐ ์์: HBM1=8ร16Bร1G, HBM2=8ร16Bร2.4G, HBM3=16ร8Bร6.4G, HBM3E=16ร8Bร9.6G, HBM4=32ร8Bร8G baseline์ ๋๋ค. ๊ณต๊ฐ ์ ํ์ Samsung 3,300 GB/s, Micron >2.8 TB/s ์์ค๊น์ง ์ ์๋ฉ๋๋ค.
| Parameter | HBM1 Legacy Mode | HBM2 Pseudo Channel Mode | HBM3 Pseudo Channel Mode | HBM3E HBM3 Extended | HBM4 Pseudo Channel Mode |
|---|---|---|---|---|---|
| JEDEC Standard | JESD235 (2013) | JESD235AโD | JESD238 (Jan 2022) | JESD238A (May 2023) | JESD270-4 (Apr 2025) |
| ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL | ELECTRICAL |
| VDDC (core) | 1.2 V | 1.2 V | 1.1 V | 1.1 V (same as HBM3) | NEW 1.0 V / 1.05 V (vendor-specific) |
| VDDQ (I/O) | 1.2 V | 1.2 V | 1.1 V | 1.1 V (same as HBM3) | NEW 0.7 / 0.75 / 0.8 / 0.9 V (vendor-specific) |
| Tx driver voltage | โ | โ | 0.4 V | 0.4 V | 0.4 V |
| INTERFACE & TOPOLOGY | INTERFACE & TOPOLOGY | INTERFACE & TOPOLOGY | INTERFACE & TOPOLOGY | INTERFACE & TOPOLOGY | INTERFACE & TOPOLOGY |
| Total interface width | 8ch ร 128b = 1024-bit | 8ch ร 128b = 1024-bit | 16ch ร 64b = 1024-bit | 16ch ร 64b = 1024-bit (same as HBM3) | NEW 32ch ร 64b = 2048-bit (doubled vs. HBM3/3E) |
| Channels / stack | Up to 8 | Up to 8 | Up to 16 | Up to 16 (same as HBM3) | NEW Up to 32 |
| DQ width / channel | 128-bit | 128-bit | 64-bit | 64-bit | 64-bit |
| Pseudo channels / ch. | โ | 2 ร 64-bit | 2 ร 32-bit | 2 ร 32-bit | 2 ร 32-bit |
| Total pseudo ch. / stack | โ | 16 | 32 | 32 | NEW 64 |
| Prefetch / access | 256-bit (BL2) | 256-bit / PC (BL4) | 256-bit / PC (BL8) | 256-bit / PC (BL8) | 256-bit / PC (BL8) |
| Separate cmd/data buses | โ | โ | โ | โ | NEW โ |
| SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH | SPEED & BANDWIDTH |
| Data rate / pin | 1.0 Gbps (target) | 1.0 โ 3.6 Gbps/pin | 4.8 โ 6.4 Gbps/pin | NEW 9.2 โ 9.6 Gbps/pin (JESD238A speed bins) | NEW 8.0 Gbps/pinโก baseline; public products 11.0 โ 13.0 Gbpsโก |
| Peak bandwidth / stack | ~128 GB/s (8chร16Bร1G) | ~307 GB/s (8chร16Bร2.4G) | ~819 GB/s (16chร8Bร6.4G) | NEW ~1,229 GB/s (~1.2 TB/s) (16chร8Bร9.6G) | NEW ~2,048 GB/s (2 TB/s) baseline; public products >2.8 TB/sโก |
| Bandwidth gain vs. prev. gen | baseline | ~2.4ร | ~2.7ร | ~1.5ร | ~1.7ร |
| ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION | ARRAY ORGANIZATION |
| Banks / channel | 8 | 8, 16, 32, or 48 | 16, 32, 48, or 64 | 16, 32, 48, or 64 (same as HBM3) | TBD (โฅ HBM3) |
| Bank groups | โ | โ | โ | โ | โ |
| Page size / pseudo ch. | 2 KB / ch. | 2 KB / ch. | 1 KB / PC | 1 KB / PC | 1 KB / PC |
| Die density | 1, 2 Gb / die | 4, 8, 12, 16 Gb / die | 8, 16, 24, 32 Gb / die | 16, 24 Gb / die (products: 24GB 8-Hi, 36GB 12-Hi) | NEW 24, 32 Gb / die |
| Stack heights (Hi) | 4-Hi | 8-Hi (12-Hi opt.) | 4 / 8 / 12 / 16-Hi | 8-Hi, 12-Hi, 16-Hi | 4 / 8 / 12 / 16-Hi |
| Max stack capacity | ~4 GB | ~24 GB (8-Hi, 16Gb) | ~64 GB (16-Hi, 32Gb) | ~36 GBโก (12-Hi, SK Hynix/Micron) | NEW ~64 GB (16-Hi, 32Gb) |
| HBM3 controller compat. | โ | โ | โ | โ (HBM3E โ HBM3) | โ (backward compat. w/ HBM3) |
| RELIABILITY & RAS | RELIABILITY & RAS | RELIABILITY & RAS | RELIABILITY & RAS | RELIABILITY & RAS | RELIABILITY & RAS |
| ECC mode | Optional (external pins) | Optional (external pins) | On-die ECC (mandatory) Symbol-based, 256b+16b | On-die ECC (mandatory) (same as HBM3) | On-die ECC (mandatory) + enhanced RAS |
| Error Check & Scrub (ECS) | โ | โ | โ | โ | โ |
| Directed Refresh Mgmt. (DRFM) | โ | โ | โ | โ | NEW โ (row-hammer mitigation) |
| DBIac | โ | โ | โ | โ | โ |
| Interconnect redundancy remapping | โ | โ | โ | โ | โ |
| Self-refresh modes | โ | โ | โ | โ | โ |
๋์ ์๋ฆฌ
HBM ์ปจํธ๋กค๋ฌ๋ row activate์ read/write ๋ช ๋ น์ ๋ด๋ฆฐ ๋ค, pseudo channel ๋จ์๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐํด ๋ ์งง์ ๋ด๋ถ ๊ฒฝ๋ก๋ก ์ฃผ๊ณ ๋ฐ์ต๋๋ค. ์ด๋ฐ ๊ตฌ์กฐ๋ ๊ฐ์ ํ ์์์ ๋ ๋์ ์ฒ๋ฆฌ๋์ ์ป๋ ๋ฐ ์ ๋ฆฌํ์ง๋ง, command scheduling๊ณผ refresh ํ์ด๋ฐ์ ๋ ์ ๊ตํ๊ฒ ๋ง์ถฐ์ผ ํฉ๋๋ค.
์ ์ธต๋ DRAM ๋ค์ด์ logic die ์ฌ์ด์ ์ฐ๊ฒฐ์ TSV์ micro-bump๊ฐ ๋ด๋นํ๊ณ , GPU์ HBM ์คํ ์ฌ์ด์ ์ฐ๊ฒฐ์ ์ธํฐํฌ์ ๊ฐ ๋ด๋นํฉ๋๋ค. ๊ทธ๋์ ์ฑ๋ฅ์ ๋ฉ๋ชจ๋ฆฌ ๋ค์ด ์์ฒด๋ณด๋ค๋ ํจํค์ง ์ค๊ณ, ์ ์ ๋ถ๋ฐฐ, ์ด ํ์ฐ, ์ธํฐํฌ์ ๋ฐฐ์ ํ์ง์ ํฌ๊ฒ ์ข์ฐ๋ฉ๋๋ค.
HBM3E์ HBM4์์๋ on-die ECC, ECS, DRFM ๊ฐ์ ๊ธฐ๋ฅ์ด ์ค๋ฅ ํ๋ณต๊ณผ ์ฅ๊ธฐ ์์ ์ฑ์ ๋ณด๊ฐํฉ๋๋ค. AI ํ์ต๊ณผ ์ถ๋ก ์์๋ ๋์ญํญ์ด ๊ณง ์ฒ๋ฆฌ๋์ด๋ฏ๋ก, HBM์ "๋น ๋ฅธ ๋ฉ๋ชจ๋ฆฌ"๋ผ๊ธฐ๋ณด๋ค "ํจํค์ง ๋จ์ ์์คํ ๋ฉ๋ชจ๋ฆฌ"์ ๊ฐ๊น๊ฒ ๋ค๋ค์ง๋๋ค.
์ฅ๋จ์
- ์ฅ์ : ๋งค์ฐ ๋์ ๋ฒ์ค๋ก TB/s๊ธ ๋์ญํญ์ ๋ง๋ค ์ ์์ต๋๋ค.
- ์ฅ์ : ์งง์ ์ธํฐ์ปค๋ฅํธ ๋๋ถ์ ํ๋น ์ ๋ ฅ ํจ์จ์ด ๋์ต๋๋ค.
- ์ฅ์ : AI/HPC์ฉ GPU์ ASIC์ ํ์ํ ๋์ฉ๋ ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ์ ๋ง์ต๋๋ค.
- ๋จ์ : ์ธํฐํฌ์ , TSV, ์ ์ธต ๊ณต์ ๋๋ฌธ์ ์ ์กฐ ๋น์ฉ๊ณผ ๋๋๊ฐ ๋์ต๋๋ค.
- ๋จ์ : ์ด ๋ฐ๋๊ฐ ๋์ ํจํค์ง ์์ค์ ์ด ์ค๊ณ๊ฐ ์ค์ํฉ๋๋ค.
- ๋จ์ : DIMM์ฒ๋ผ ์ฝ๊ฒ ๊ต์ฒดํ๊ฑฐ๋ ํ์ฅํ๊ธฐ ์ด๋ ต์ต๋๋ค.
๊ด๋ จ ๊ธฐ์
- Memory Design Philosophy
- DDR Generation Comparison
- GDDR Generation Comparison
- DRAM Refresh Comparison
- GPU Memory Architecture Basics
- Samsung HBM: https://semiconductor.samsung.com/dram/hbm/
- Samsung HBM4: https://semiconductor.samsung.com/dram/hbm/hbm4/
- Micron HBM: https://www.micron.com/products/memory/hbm
- Micron HBM4: https://www.micron.com/products/memory/hbm/hbm4
- JEDEC JESD235, JESD238, JESD238A, JESD270-4
ํต์ฌ ์ ๋ฆฌ
HBM ์ธ๋ ๋น๊ต์ ํต์ฌ์ ๋ฒ์ค ํญ, ํ ์๋, ์ ์ธต ๋์ด, ์ ๋ขฐ์ฑ ๊ธฐ๋ฅ์ด ํจ๊ป ์งํํ๋ค๋ ์ ์ ๋๋ค. HBM1๊ณผ HBM2๋ 1024-bit ๊ตฌ์กฐ๋ฅผ, HBM3์ HBM3E๋ ๋ ์ธ๋ถํ๋ ์ฑ๋๊ณผ ๋์ ํ ์๋๋ฅผ, HBM4๋ 2048-bit ์ธํฐํ์ด์ค์ ๊ณต๊ฐ ์ ํ ๊ธฐ์ค 3TB/s ์ํ์ ๋์ญํญ์ ๋ณด์ฌ ์ค๋๋ค. ์ค์ ์ฑ๋ฅ์ ๋ฉ๋ชจ๋ฆฌ ๋ค์ด๋ง์ด ์๋๋ผ ์ธํฐํฌ์ , logic die, ์ ๋ ฅ ๋ถ๋ฐฐ, ๋ฐ์ด ๊ด๋ฆฌ๊น์ง ํฌํจํ ํจํค์ง ์ค๊ณ๊ฐ ๊ฒฐ์ ํฉ๋๋ค. ์ด ๋ฌธ์๋ ํ์ค ์ธ๋์ ๊ณต๊ฐ ์ ํ ์ ๋ณด๋ฅผ ํจ๊ป ๋๊ณ HBM์ ์งํ ๋ฐฉํฅ์ ๋น ๋ฅด๊ฒ ๋์กฐํ ์ ์๊ฒ ์ ๋ฆฌํฉ๋๋ค.