Ryotta's Basic

Arch
🏗️ Arch 검증완료

title: Intel/AMD 마이크로아키텍처 비교
date: 2025-06-26
category: arch
tags: [Intel, AMD, Zen, Alder Lake, Raptor Lake, microarchitecture, hybrid, chiplet, desktop, server]


Intel/AMD 마이크로아키텍처 비교

개요

현대 x86 프로세서 시장은 Intel과 AMD 양사가 지배하고 있으며, 각각 독자적인 마이크로아키텍처 진화 경로를 걸어왔다. Intel은 Alder Lake(12세대)부터 하이브리드 아키텍처(P-코어 + E-코어)를 도입하여 데스크톱과 노트북에서 높은 성능과 전력 효율을 동시에 달성했고, AMD는 Zen 마이크로아키텍처의 세대별 발전을 통해 코어 수와 캐시 용량에서 경쟁 우위를 확보했다.

양사의 아키텍처는 설계 철학, 공정 기술, 칩렛 전략, ISA 확장 지원, 보안 기술 등 다양한 측면에서 뚜렷한 차이를 보인다. Intel은 모놀리식 디자인에서 출발해 Meteor Lake부터 칩렛 방식을 채택했고, AMD는 Zen 2부터 칩렛 아키텍처를 운영해왔다. 이러한 차이는 서버용 프로세서에서 특히 두드러지며, EPYC과 Xeon의 경쟁은 메모리 대역폭, 코어 밀도, 전력 효율 등 주요 지표에서 치열한 격차를 만들어낸다.

핵심 개념

Intel/AMD 마이크로아키텍처 개요 비교

Intel 마이크로아키텍처 세대별 특징

Intel의 주요 마이크로아키텍처는 다음과 같이 발전해왔다:

아키텍처 공정 최대 코어 구성 핵심 혁신
Alder Lake (12세대) Intel 7 8P+8E 최초 하이브리드 아키텍처
Raptor Lake (13세대) Intel 7 8P+16E E-코어 2배 증가
Meteor Lake (14세대) Intel 4 + TSMC 6P+8E+2LP 최초 칩렛 디자인, NPU
Arrow Lake TSMC N3B 8P+16E SMT 제거, Lion Cove/Skymont

P-코어(Performance Core): 단일 스레드 성능이 중요한 워크로드를 위한 고성능 코어로, 깊은 파이프라인과 높은 IPC를 특징으로 한다. AVX-512, VNNI 등 고급 ISA 확장을 지원하며, SMT(하이퍼스레딩)를 통해 스레드당 2개의 논리적 코어를 제공했다(단, Arrow Lake부터 SMT 제거).

E-코어(Efficiency Core): 멀티스레드 성능과 전력 효율이 중요한 워크로드를 위한 저전력 코어로, 더 짧은 파이프라인과 낮은 클럭을 갖는다. 백그라운드 작업, 가벼운 멀티태스킹에 적합하며, 단일 E-코어의 성능은 P-코어의 약 50~60% 수준이다.

Thread Director: 하드웨어 기반 스케줄러로, 워크로드 특성에 따라 P-코어와 E-코어 사이에서 실시간으로 스레드를 배정한다. OS 수준의 스케줄러와 협력하여 최적의 코어 배치를 수행한다.

AMD Zen 마이크로아키텍처 세대별 특징

AMD의 Zen 아키텍처는 다음과 같이 발전해왔다:

아키텍처 공정 최대 코어 수 (서버) 핵심 혁신
Zen 4 TSMC N5 96 (EPYC) 최초 AVX-512, DDR5 지원
Zen 4c TSMC N5 128 (Bergamo) 밀도 최적화 코어
Zen 5 TSMC N4X 128 (Turin) 2-ahead 분기 예측, 네이티브 512비트 AVX
Zen 5c TSMC N3E 192 (Turin Dense) 최고 성능/전력 비율

Zen 코어 설계: AMD는 데스크톱과 서버 모두에서 동일한 코어 아키텍처를 기반으로 하며, 4c 변형을 통해 밀도를 높이는 전략을 채택했다. Intel의 P/E 하이브리드와는 접근 방식이 다르다.

Chiplet 아키텍처: AMD는 Zen 2부터 CCD(Chiplet Compute Die)와 IOD(I/O Die)를 분리하는 칩렛 방식을 사용해왔다. 이를 통해 제조 수율을 높이고, 서로 다른 공정의 칩렛을 조합할 수 있는 유연성을 확보했다.

3D V-Cache: Zen 3부터 도입된 적층 캐시 기술로, CCD 위에 추가 L3 캐시를 적층하여 게임과 같은 캐시 민감 워크로드에서 큰 성능 향상을 제공한다.

Intel/AMD 캐시 계층 비교

캐시 계층 비교

특성 Intel (Alder Lake~) AMD (Zen 4~)
L1I 캐시 (P-코어) 32KB, 8-way 32KB, 8-way
L1D 캐시 (P-코어) 48KB, 12-way 32KB, 8-way
L2 캐시 (P-코어) 2~3MB (공유) 1MB (코어당)
L3 캐시 36~54MB (공유) 32~128MB (공유)
캐시 라인 크기 64B 64B

Intel은 P-코어의 L1D 캐시 용량(48KB)에서 우위를 보이며, Arrow Lake에서는 L2 캐시를 최대 3MB로 확대했다. AMD는 코어당 L2 캐시가 1MB로 작지만, 3D V-Cache를 통해 L3 캐시를 대폭 확장할 수 있는 구조적 장점이 있다.

비교/분석

데스크톱 프로세서 비교

항목 Intel Arrow Lake AMD Zen 5
공정 TSMC N3B TSMC N4X
최대 P-코어 8개 8개 (CCD당)
최대 E-코어 16개 없음 (단일 코어 타입)
SMT 지원 아니오 (제거됨) 예 (2-way)
L2 캐시 P-코어 3MB 1MB
L3 캐시 36~54MB 32~128MB (3D V-Cache)
메모리 DDR5-5600 DDR5-5600
PCIe 5.0 5.0
TDP 125~250W 170W

서버 프로세서 비교

항목 Intel Xeon (Emerald Rapids) AMD EPYC (Genoa/Turin)
최대 코어 수 64 96 (Genoa) / 128 (Turin)
공정 Intel 7 TSMC N5 (Zen 4) / N4X (Zen 5)
L3 캐시 112.5MB 384MB (Genoa) / 512MB (Turin)
메모리 채널 8ch DDR5 12ch DDR5
메모리 대역폭 ~400GB/s ~600GB/s (Genoa) / ~800GB/s (Turin)
CXL 지원 1.1 1.1/2.0
PCIe 레인 80 (PCIe 5.0) 128 (PCIe 5.0)

ISA 확장 비교

ISA 확장 Intel AMD
AVX-512 하이브리드에서 비활성화 네이티브 512비트 (Zen 5)
AVX-VNNI 예 (Zen 5)
AVX10 예 (로드맵 통합 축) 공개 지원 계획 없음
BF16 예 (Zen 4+)
SHA
기밀 컴퓨팅 TDX 중심 SEV-SNP 중심

프로세스 기술 비교

항목 Intel AMD (TSMC 의존)
데스크톱 공정 Intel 7 (10nm ESF) TSMC N5/N4X
서버 공정 Intel 7 TSMC N5/N3E
트랜지스터 밀도 약 100MT/mm² 약 170MT/mm² (N5)
칩렛 전략 Meteor Lake부터 도입 Zen 2부터 운영
제조 자립 자체 공정 TSMC 아웃소싱

동작 원리

하이브리드 아키텍처 동작 (Intel)

Intel의 하이브리드 아키텍처는 다음 흐름으로 동작한다:

  1. 워크로드 분석: Thread Director가 실행 중인 스레드의 특성을 실시간으로 분석한다
  2. 코어 배정 결정: 분석 결과를 기반으로 해당 스레드를 P-코어 또는 E-코어에 배정한다
  3. OS 스케줄링 협력: Windows/Linux 스케줄러와 정보를 교환하여 최적의 코어 배치를 수행한다
  4. 동적 조정: 워크로드 변화에 따라 스레드를 다른 코어 타입으로 이동시킨다

P-코어 → E-코어 이동: 백그라운드 작업, 미디어 디코딩 등 가벼운 워크로드
E-코어 → P-코어 이동: 게임, 과학 계산 등 단일 스레드 성능이 중요한 워크로드

칩렛 아키텍처 동작 (AMD)

AMD의 칩렛 아키텍처는 다음 구조로 동작한다:

  1. CCD (Chiplet Compute Die): 각 CCD는 최대 8개의 Zen 코어와 L2/L3 캐시를 포함한다
  2. IOD (I/O Die): 메모리 컨트롤러, PCIe 컨트롤러, Infinity Fabric 인터페이스를 포함한다
  3. Infinity Fabric: CCD와 IOD를 연결하는 고속 인터커넥트로, 메모리 접근 경로를 제공한다
  4. 3D V-Cache: CCD 위에 추가 L3 캐시 칩렛을 적층하여 캐시 용량을 대폭 확장한다

메모리 접근 경로: CCD → Infinity Fabric → IOD → DDR5 메모리
칩렛 간 통신: CCD 간 Infinity Fabric을 통한 직접 통신

장단점

Intel 아키텍처 장점

  1. 하이브리드 유연성: P/E 코어 조합으로 다양한 워크로드에 대응 가능
  2. 강력한 단일 스레드: P-코어의 높은 IPC와 클럭으로 단일 스레드 성능 우위
  3. 소프트웨어 생태계: 오랜 역사로 인한 폭넓은 소프트웨어 호환성과 최적화
  4. 보안 기술: CET, SGX 등 체계적인 보안 기술 스택

Intel 아키텍처 단점

  1. 공정 지연: 최근 공정 미세화에서 TSMC 대비 열세
  2. SMT 제거: Arrow Lake에서 SMT를 제거하여 멀티스레드 성능에 영향
  3. AVX-512 비활성화: 하이브리드 아키텍처에서 AVX-512 사용 불가
  4. 전력 소비: 높은 성능을 위해 상대적으로 높은 전력 소비

AMD 아키텍처 장점

  1. 카테고리 리더십: 코어 수, 캐시 용량, 메모리 대역폭에서 서버 시장 우위
  2. 유연한 칩렛: 다양한 CCD/IOD 조합으로 세분화된 제품 라인 운영
  3. AVX-512 지원: 네이티브 512비트 AVX로 HPC/AI 워크로드에서 성능 우위
  4. 3D V-Cache: 캐시 민감 워크로드에서 폭발적 성능 향상
  5. 전력 효율: TSMC 공정 활용으로 높은 성능 대비 전력 효율

AMD 아키텍처 단점

  1. TSMC 의존: 제조를 TSMC에 의존하여 공정 리스크 존재
  2. 초기 드라이버 문제: 신규 출시 시 메모리/호환성 이슈 가능성
  3. 단일 스레드 격차: 일부 워크로드에서 Intel P-코어 대비 IPC 열세
  4. 소프트웨어 최적화 부족: 일부 애플리케이션에서 Intel 대비 최적화 부족

관련 기술

관련 하드웨어 기술

기술 설명 관련 아키텍처
DDR5 차세대 메모리 표준, 더 높은 대역폭과 낮은 전력 Intel/AMD 모두 지원
PCIe 5.0 고속 인터페이스, 32GT/s 전송 속도 Intel/AMD 모두 지원
CXL Compute Express Link, 메모리 풀링/확장 Intel/AMD 모두 지원
3D V-Cache AMD 적층 캐시 기술 AMD 전용
Thread Director Intel 하이브리드 코어 스케줄링 Intel 전용
Infinity Fabric AMD 칩렛 간 인터커넥트 AMD 전용

관련 소프트웨어/도구 기술

기술 설명 관련 아키텍처
Intel VTune 프로파일링 도구 Intel 전용
AMD uProf 프로파일링 도구 AMD 전용
Intel oneAPI 통합 개발 도구 Intel 전용
AMD ROCm GPU 컴퓨팅 플랫폼 AMD 전용
Linux perf 커널 성능 분석 도구 Intel/AMD 모두 지원

참고 문헌

  1. Intel Corporation. Intel 64 and IA-32 Architectures Software Developer's Manual. Volumes 1-4.
  2. AMD. AMD64 Architecture Programmer's Manual. Volumes 1-5.
  3. Hennessy, J.L. & Patterson, D.A. Computer Architecture: A Quantitative Approach, 6th Edition. Morgan Kaufmann, 2017.
  4. Intel Corporation. Intel Architecture Day 2023. Lion Cove, Skymont microarchitecture details.
  5. AMD. AMD Tech Day 2023. Zen 5 microarchitecture deep dive.
  6. Chip Hell, AnandTech, Tom's Hardware. Various microarchitecture analysis articles.
  7. Agner Fog. microarchitecture of Intel, AMD, and VIA CPUs. Technical report, 2024.

핵심 정리

  1. Intel은 Alder Lake부터 P-코어와 E-코어를 결합한 하이브리드 아키텍처를 채택하여, 워크로드 특성에 따라 동적으로 코어를 배정하는 유연한 구조를 구현했다. AMD는 Zen 아키텍처 기반의 단일 코어 타입으로 높은 코어 밀도를 달성했으며, 4c 변형을 통해 밀도를 추가로 확보하는 전략을 사용한다.

  2. 칩렛 아키텍처 측면에서 AMD는 Zen 2부터 CCD와 IOD를 분리하는 방식을 운영해왔으나, Intel은 Meteor Lake에서야 칩렛 디자인을 도입했다. AMD의 칩렛 방식은 제조 수율 향상과 유연한 제품 구성이라는 장점을 제공하며, 3D V-Cache 적층을 통한 캐시 확장도 가능하다.

  3. ISA 확장 지원에서 AMD Zen 5는 네이티브 512비트 AVX-512와 AVX-VNNI를 제공하여 HPC/AI 워크로드에서 강점을 보이고, Intel은 하이브리드 아키텍처 특성상 AVX-512를 비활성화하는 대신 AVX10 로드맵과 TDX 같은 플랫폼 기능으로 경쟁력을 유지하고 있다.

  4. 서버 시장에서 AMD EPYC은 코어 수, L3 캐시 용량, 메모리 채널 수에서 Intel Xeon 대비 뚜렷한 우위를 보이며, CXL 2.0 등 최신 인터커넥트 기술도 빠르게 도입하고 있다. Intel은 보안 기술과 소프트웨어 생태계에서 여전히 강점을 보이나, 공정 기술에서의 열세가 지속적인 경쟁력 확보에 중요한 과제로 남아있다.