CPU – SK hynix Newsroom

[인공지능과 반도체 4편] 챗GPT 등 인공지능의 시대 : 메모리 공유를 통한 성능향상, CXL로 이루다 (4/7)

정인성 작가 — Tue, 23 May 2023 15:00:00 +0000

인공지능(AI, Artificial Intelligence)은 현재 전 세계를 가장 뜨겁게 달구는 키워드다. SK하이닉스 뉴스룸에서는 [인공지능 반도체] 코너를 마련, 인공지능 전문가 정인성 작가와 함께 총 일곱 편의 기고문을 연재하고 있다.

이번 연재물에서는 컴퓨터와 반도체의 관점에서 인공지능을 살펴볼 것이다. 인공지능으로 바뀌면서 ‘0’과 ‘1’이 구체적으로 어떻게 변화되어 응용되는지를 알아보고, 이때 반도체는 어떤 역할을 해야 하는지 확인해 볼 것이다. (필자 주)

서버 컴퓨터의 메모리 용량은 CPU 성능만큼이나 중요하다. 메모리 용량이 클 경우, 서버에 더 많은 프로그램을 탑해 다양한 작업 수행이 가능해지기 때문이다. 주 기억장치인 메모리의 용량이 작은 서버는 보조기억장치 용량이 아무리 커도 많은 프로그램을 동시에 실행시킬 경우 부족한 메모리 용량을 해결하기 위해 보조기억장치(SSD 또는 HDD)를 활용한 가상 메모리*라는 기술을 사용하게 되는 데, 이로 인해 속도는 느려진다. 운이 없는 경우, 진행하고 있던 작업이 에러로 중단되기도 한다.

* 가상 메모리 : SSD(Solid State Disk)나 HDD(Hard Disk)의 일부 영역을 마치 시스템 메모리인 것처럼 사용하는 기법. 메모리 안에서 자주 사용하지 않는 내용을 보조기억장치(SSD 또는 디스크)에 옮겼다가, 데이터가 필요할 때 다시 메모리에 불러오는 식으로 동작해 속도가 느려지는 문제를 가지고 있다.

그리고 인공지능 시대가 열리면서, 더 많은 데이터를 더 빨리 처리해야 하는 상황이 됐다. 당연히, 메모리 용량은 더욱 중요해졌다. 이 때문에 인공지능 학습 서버(컴퓨터)는 CPU(Central Processing Unit, 중앙 처리 장치)가 사용하는 일반 메모리뿐만 아니라, GPU(Graphic Processing Unit, 그래픽 처리 장치) 자체에도 고성능, 고용량 메모리인 HBM(High Bandwidth Memory)을 탑재하고 있다. 재미있는 것은 GPU에서 메모리를 장착했음에도 CPU 메모리 용량이 줄어들지 않았다는 것이다.

▲ 표 1 : 8개 GPU와 1.1TB 메모리를 가진 인공지능용 컴퓨터 ‘p4d’와 ‘p4de’의 스펙표 (출처 : AWS)

<표 1>은 아마존 웹서비스(AWS)의 인공지능 학습용 컴퓨터 ‘Amazon EC2 p4d(이하 p4d)’의 사양이다. p4d는 클라우드 환경에서 머신러닝 등 인공지능 구현을 위한 고성능 컴퓨터(HPC)의 일종으로 세계에서 가장 뛰어난 성능의 슈퍼컴퓨터 중 하나이다. 해당 컴퓨터에는 CPU를 비롯해 NVIDIA의 인공지능용 데이터 서버 GPU인 A100이 8개가 장착돼 있다. p4d는 GPU 8개를 통해 320~640GB라는 거대한 용량의 GPU 메모리를 가지고 있음에도, CPU가 별도로 1TB가 넘는 메모리를 사용하고 있음을 알 수 있다. 이는 큰 용량의 메모리가 인공지능 시대에 얼마나 큰 가치가 있는가를 시사한다.

성능 향상을 위한 새로운 표준, ‘CXL’

이처럼 메모리가 더욱 중요해지면서, 최근 주목받고 있는 것이 CXL(Computer eXpress Link)이다. CXL은 제품 그 자체라기보단, 컴퓨터 시스템 내부에서 CPU나 메모리, 저장 장치 간의 데이터를 더 빠르게 전송하기 위한 인터페이스 기술이다. 조금 더 자세히 살펴보자면, CXL은 기업들이 모여서 만든 컴퓨터 확장 부품의 표준이다. 표준의 중요성은 우리 모두 매우 잘 알고 있다. 만약 한국전력이 220V로 모든 전원을 통일하지 않았다면, 한국에서 가전 사업을 영위하는 것은 매우 힘들었을 것이다. 가전제품 회사 입장에서 같은 가전제품이 다양한 전압을 지원하게 조치해야만 하기 때문이다. 이는 소비자의 부담으로 전가된다.

컴퓨터도 마찬가지다. 우리가 NVIDIA의 GPU를 장착하든, AMD의 GPU를 장착하든 컴퓨터 내의 동일한 PCIe* 슬롯에 끼우면 운영체제가 스스로 새로운 GPU를 찾아내며, 사용자는 아무 문제 없이 새로운 GPU를 사용할 수 있다. 이런 일이 가능한 이유는 컴퓨터를 구성하는 메인보드, CPU, GPU, OS(운영체제) 등을 제조하는 기업 등이 협의해 PCIe라는 규격에 따라 각 기기를 통신시키자고 정했기 때문이다.

* PCIe(PCI Express) : 기존 PCI(Peripheral Component Interconnect)의 속도를 2배 이상 향상한 인터페이스 기술. PCI는 컴퓨터에 주변장치 GPU, 무선랜 등을 장착할 수 있는 고속 확장 슬롯의 인터페이스 기술

▲ 그림 1 : 메인보드의 PCIe 슬롯. 주로 그래픽 카드나 SSD가 장착된다.

CXL도 이와 같은 표준이다. 서버의 역할이 늘어남에 따라, 한 작업을 수행하기 위해 더 다양한 기기들이 관여해야 하는 상황이 만들어지면서 새로운 표준이 필요해진 것이다. 기존의 서버들은 대부분 CPU와 자체 메모리 정도로 간단하게 구성돼 있었다. 대부분의 작업은 CPU가 메모리를 직접 사용하며 수행했다. 하지만 서버가 하는 일이 인터넷 서비스뿐만 아니라 인공지능과 클라우드 등 각종 인프라 관리까지 매우 다양해지면서, 서버 내부의 CPU 외 GPU, FPGA* 등 다양한 확장 카드가 적용됐다.

* FPGA(Field-Programmable Gate Array) : 프로그래밍을 할 수 있는 중간 형태의 집적회로(IC)로 비메모리 반도체의 한 종류다. 회로 변경이 불가능한 일반적인 반도체와 달리 용도에 맞게 회로를 수정할 수 있다. 칩 설계 단계에서 칩을 시뮬레이션하는 용도와 CPU, GPU 등이 대응하기 힘든 독특한 작업을 빠르게 처리하는 용도로 사용된다.

서버의 성능을 최대한 끌어내기 위해서는 각종 확장 카드가 서로 하는 일을 방해하지 않으면서도 처리하고 있던 데이터를 빠르게 공유할 수 있어야 한다. 이를 위해 나온 표준이 CXL이다. 즉, CXL 표준을 준수하는 제품들을 서버 컴퓨터 내부에 함께 적용하면, 각 칩이 서로 잘하는 업무를 분담하기 쉬워진다. 이를 통해 전반적인 작업의 효율을 증대시킬 수 있다.<

▲ 그림 2 : SK하이닉스의 CXL 2.0 메모리와 같은 공유 메모리는 메모리 용량을 확장하면서, 다양한 연산 장치들이 빠르게 프로그램을 처리할 수 있다.

CXL 표준이 등장한 중요한 이유 중 하나는 바로 메모리의 확장 및 공유다. 최근 인공지능 기술 등이 발전하면서, CPU가 잘 해내지 못하는 작업이 늘어났다.* 이 문제를 해결하기 위해서는 서버 컴퓨터 내의 총 메모리 용량을 늘려 수용 가능한 데이터의 양을 늘려야 할 뿐만 아니라, 메모리 내부에 흩어져 있는 다양한 데이터를 가장 적합한 반도체가 접근해 처리할 수 있어야 한다.

* 메모리 접근과 산술 연산, 많은 분기를 통해 데이터를 처리하는 CPU 프로세스는 동시에 많은 연산을 해야 하는 인공신경망 학습에는 효율적이지 못하다. [관련기사]

이종 컴퓨팅: 공유 메모리의 이점

CXL 표준이 등장하기 전에는 연산 칩들이 메모리를 안전하게 공유할 방법이 없어, 칩 간 통신이 비효율적이었다. 현실의 예를 들어보자. 일반적으로 우리가 구매하는 컴퓨터나 노트북에는 그래픽 표시를 위한 GPU가 탑재돼 있다. 다만 이 GPU들은 대부분 CPU 칩 안에 함께 내장된 형태를 보인다. 이러한 GPU를 내장 GPU(iGPU)라고 부른다.

이런 GPU들은 NVIDIA 등의 외장 GPU(dGPU)와 달리 자체 메모리가 없어 컴퓨터 CPU에 연결된 D램을 사용해야 동작할 수 있다. CPU에 연결된 8GB 메모리 중 1GB 정도를 내장 GPU에 나눠주는 식이다.

▲ 그림 3 : CPU와 내장 GPU의 현재 협업 방식

얼핏 보면 동일한 물리적 메모리를 나눠 쓰고 있으니, CPU와 내장 GPU 간 협업이 쉬울 것 같다. 하지만 이들이 협업하기 위해선 복잡한 과정이 필요하다. 어떤 프로그래머가 GPU를 이용해 프로그램의 성능을 높이고 싶다고 해 보자. GPU는 병렬 연산에 강하므로, 병렬 연산해야 할 데이터는 GPU가 처리하게 만들고 싶을 것이다. 얼핏 봐서는 GPU가 직접 CPU가 처리하던 메모리에 접근하여 작업을 수행할 수 있을 것으로 보인다.

하지만 실제로는 그렇게 작동하지 않는다. CPU와 내장 GPU는 통일된 메모리를 사용하는 게 아니라, 메모리에 칸막이를 친 형태로 작동되기 때문이다. <그림 3>을 보면 알 수 있듯, 실제로 이런 작업을 하기 위해선 CPU와 GPU는 일단 서로의 메모리 공간에 공유해야 할 데이터를 복사한 뒤 작업해야만 한다. <그림 3>에서 <1>과 <3>과정이 낭비로 보이지 않는가? 메모리 공유만 잘 이루어진다면, GPU가 바로 과정<2>만 수행해 데이터를 처리할 수도 있었을 것이다.

위와 같은 이유로, CPU와 내장 GPU는 이론상 낼 수 있는 시너지를 제대로 낼 수 없었다. 복사로 인한 시간 및 에너지 소모가 클 뿐만 아니라, 반응 속도도 느려지기 때문이다. 현재 이런 메모리 공유 문제는 CPU와 내장 GPU뿐만 아니라, 다양한 하드웨어 사이에서 발생하고 있다. 물리적으로도 한 덩어리인 메모리에 칸막이가 존재한다면, 물리적으로 멀리 떨어진 칩끼리의 데이터 공유는 더욱 어려울 것이다. 이로 인해 다양한 반도체를 엮어서 작업을 하고자 해도, 시간 손해가 커서 큰 효율 개선이 일어나지 않는 것이다.

하지만, CXL과 같은 거대한 공유 메모리가 생기게 되면서 상황이 달라졌다. 번거로운 기기 간 메모리 공유가 CXL로 인해 간단해진 것이다. 이렇게 되면, ‘인공지능’이라는 하나의 작업을 위해 메모리를 쪼개서 CPU, GPU 등에 나눠줄 수 있게 된다. 기존에는 전체적으로 가장 뛰어났던 GPU가 대부분의 인공지능 일을 전담했다면, 이젠 특정 구역은 GPU가, 다른 부분은 FPGA가, 나머지는 CPU가 처리하는 식으로 바뀔 수 있게 된다.

이는 분업화라 할 수 있다. 기존에는 10명의 주방 직원이 동일한 코스요리를 똑같이 준비했다고 하면, 이제는 코스요리를 애피타이저, 메인(고기/생선), 후식 등으로 나눈 뒤 각 요리를 저마다 가장 잘할 수 있는 요리사에게 맡길 수 있도록 변한 것이다. 이러한 컴퓨터 동작 방식을 이종 컴퓨팅(Heterogeneous Computing)이라고 한다. 다양한 반도체들이 자신이 잘하는 연산 부분을 담당해 전체 성능을 개선하는 것이다.

▲ 그림 4 : 데이터를 인공신경망으로 학습하는 과정에서 각 부분에 최적화된 연산 장치를 사용해 전체 성능을 높일 수 있다. (해당 그림은 연산 장치의 분산을 설명하기 위한 예시로, 기술 개발에 의해 각 연산장치가 잘하는 부분이 달라질 수 있다.)

CXL의 또 한 가지 강점은 메모리 대역폭과 큰 용량이다. 우리가 HBM 편[관련기사]에서 살펴보았듯, 인공지능 환경에서는 메모리의 용량과 대역폭이 모두 중요하다. 다뤄야 하는 데이터가 크기 때문이다. 이 상황에서 CXL은 CPU 등 인공지능 분야에서는 다소 뒤처진 반도체에 큰 이점을 제공할 수 있다.

CPU가 기존에 사용하던 D램에 더해 CXL 메모리를 탑재할 경우, 메모리 용량과 대역폭이 모두 상당히 증가하게 된다. 현재 NVIDIA의 A100 GPU는 2TB/s의 높은 대역폭을 가지고 있는 대신 기기당 40~80GB 정도의 메모리밖에 탑재하지 못한다. 반면 현재의 CPU는 1TB가 넘는 큰 메모리를 장착할 수 있지만, 메모리 대역폭은 250~500GB/s 정도밖에 되지 않는다.

CPU에 CXL 메모리가 채용될 경우, CPU와 GPU의 대역폭 차이는 좁혀지고 CPU는 거대한 메모리 용량을 유지할 수 있게 된다. 만약 수많은 고성능의 CPU에 CXL 메모리를 채용하기 시작한다면, 인공지능 분야에서 GPU에 밀렸던 경쟁력을 어느 정도 찾을 수 있을 것이다.

GPU는 인공지능 추론 속도가 빠르지만 메모리 용량이 작고, CPU는 메모리가 크지만, 대역폭이 상대적으로 낮다. GPU에는 자주 호출되는 인공신경망을 소량 올려서 추론에 사용하고, CPU에는 자주 사용하지 않는 인공신경망을 다량 탑재해 사용하는 등의 방식을 사용한다면, 인공지능 비용을 아끼면서 더욱 높은 효율을 기대할 수 있을 것이다. 예를 들면, 다국어 번역 인공지능 서비스를 운영할 때, 영어 번역기는 수요가 크기 때문에, GPU에 탑재하고, 기타 사용 비율이 낮은 언어들은 CPU에 대량으로 탑재하는 등의 방식을 쓸 수 있다.

CXL로 만드는 새로운 컴퓨터

▲ 그림 5 : 기존 컴퓨터(좌)와 이종 컴퓨팅이 적용된 컴퓨터(우)의 구조

<그림 5> 중 우측 그림은 미래에 생겨날 수 있는 이종 컴퓨터가 적용된 컴퓨터의 예시 모습이다. 매우 이상적이고 멋진 모습으로 보일 수 있다. 하지만 이것은 더 나은 서비스를 누리게 될 일반인들의 입장이고, 반도체 회사나 소프트웨어 회사에 새로운 컴퓨터는 거대한 도전으로 다가온다. 컴퓨터는 프로그램 없이 동작할 수 없다. 그리고 기존의 프로그램은 왼쪽 그림의 기존 컴퓨터 모습에 최적화돼 있다. 컴퓨터의 구조를 바꾼다는 것은 기존에 쌓아 놓은 수많은 노하우, 안정성 등을 포기하고 불모지로 나아간다는 의미다.

노하우와 안정성을 포기한다는 것은 반도체 회사와 소프트웨어 회사 모두에게 큰 불확실성을 가져온다. 반도체 회사들은 자신들이 만든 새로운 CXL 기기가 소프트웨어 회사들이 만든 새로운 프로그램과 조화롭고 안정적으로 동작할지 확신할 수 없다. 소프트웨어 회사는 CXL 기기가 약속한 성능과 안정성을 만족하며 출시될지, 이후에도 끊기지 않고 성능 개선된 버전을 출시해 줄지 확신할 수 없다. 때로는 새로운 CXL 기기의 기능이 기존 파트너 회사의 영역을 침범하게 되기도 한다. 이로 인해 많은 회사가 새로운 시도를 어려워하게 되고, 기존 컴퓨터에 안주하게 된다.

▲ 그림 6 : SK하이닉스가 소프트웨어를 활용, SKT와 공동 개발한 H/W-S/W 통합 플랫폼인 CMS가 2022년 10월 OCP 글로벌 서밋에 전시된 모습 [관련기사]

SK하이닉스와 같은 메모리 회사 역시 새로운 컴퓨터를 만드는 핵심 일원이다. CXL 기반의 새로운 컴퓨터를 만들어 나가는 과정에서 소프트웨어 회사, 플랫폼 회사, 타 반도체 회사 등은 경쟁자이면서도 협력자, 그리고 고객이기도 한 구조의 관계를 맺게 된다. 이들과의 신뢰를 유지하면서도 새로운 관계로 협업하며 새로운 컴퓨팅 시스템을 만들어 가는 미래를 향해 함께 성장한다면 기업이 아닌 인류 모두에게 큰 이익이 될 것이다.

※ 본 칼럼은 반도체에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.

[인공지능과 반도체 1편] 챗GPT 등 인공지능의 시대 : 프로그래밍과 인공지능, 그리고 GPU의 등장 (1/7)

정인성 작가 — Thu, 23 Feb 2023 15:00:00 +0000

인공지능(AI, Artificial Intelligence)은 최근 전 세계를 가장 뜨겁게 달구는 키워드다. 그래서 SK하이닉스 뉴스룸에서는 [인공지능 반도체] 코너를 마련, 인공지능 전문가 정인성 작가와 함께 총 일곱 편의 기고문을 연재할 예정이다.

이번 연재는 컴퓨터와 반도체의 관점에서 인공지능을 살펴볼 것이다. 기존의 프로그램이 인공지능으로 바뀌면서 0과 1의 세계가 구체적으로 어떻게 변화하는 것인지 알아보고, 이를 실행하는 데 필수적인 반도체는 어떤 중요한 역할을 해야 하는지 확인해볼 것이다. 이를 통해 반도체는 인공지능을 포함한 새로운 ICT 기술의 등장에도 두려워하기보다는 세상을 변화시킬 혁명의 주인공이 될 것이다. (필자 주)

전통적 프로그램이 동작하는 방식

우리는 이미 20년 전에도 컴퓨터 없는 세상을 상상할 수 없었다. 21세기 초, 인터넷 뱅킹이 생겨나기 시작했고, 각종 인터넷 쇼핑몰이 생겨났다. 수많은 회사가 엑셀과 같은 스프레드시트 프로그램을 사용해 회계 작업의 효율성을 높였고, 워드프로세서 프로그램들을 통해 수기 작업을 대체했다. 이후에는 개별 컴퓨터에 보관되던 작업물이 중앙 서버에 집중되기 시작했고, 각 직원은 자신의 물리적 위치에 구애받지 않고 일할 수 있게 됐다. 그렇다면 의문이 하나 생길 것이다. 대체 프로그램이란 무엇인가?

간단한 예를 들어 보자. 한 직원이 문서 내의 모든 행에 있는 숫자를 합하는 프로그램을 만들고 싶어 한다고 가정해보겠다. 그리고 현재 문서가 다섯 줄이라면 어떻게 해야 할까? 제일 첫 단계는 일단 ‘사람이라면 어떻게 하는지’ 고민하는 것이다. 아마도 마음속에 제일 먼저 떠오르는 것은 무언가를 ‘다섯 번 반복’하면 된다는 사실일 것이다.

▲ 그림 1 : 무언가를 다섯 번 반복하기 위한 코드의 흐름

하지만 이렇게 다섯 번 반복해서는 의미가 없다. 수를 모두 합해야 하기 때문이다. 반복할 때마다 사라지지 않고 누적되는 어떤 값을 만들어야 한다. 따라서 프로그램을 다음과 같이 개조할 수 있다.

▲ 그림 2 : 다섯 줄의 숫자를 합하는 프로그램의 흐름

해냈다! 드디어 프로그램의 구조를 만들었다. 이제 이 순서도에 맞춰서 프로그래밍 언어로 코드를 만들면 된다. 파이썬(Python)*이라는 프로그래밍 언어로 만든다면 아래와 같은 모습이 될 것이다. 프로그래밍 언어를 모르는 사람이라도, 아래 코드를 읽는 것에는 큰 어려움이 없을 것이다.

* 파이썬(Python) : 귀도 반 로썸(Guido van Rossum)이 개발한 프로그래밍 언어. 초보자도 사용하기 편하다는 특징이 있다.

▲ 그림 3 : 완성된 다섯 줄의 숫자를 합하는 파이썬 프로그램 코드

만약 지금 만든 프로그램을 다섯 줄의 한계 없이, 어떤 데이터가 입력되더라도 파일의 끝까지 더하는 프로그램으로 개선하고 싶다면 어떻게 해야 할까? 아마도 ‘다섯 번 반복’을 무언가 다른 것으로 바꿔야 한다는 짐작이 가능할 것이다. 다행히도 이미 ‘누군가’가 파일을 읽을 때 EOF(End of File)을 알려주는 기능을 추가했다. 이 기능을 활용하면 된다. 위 그림에서 빨간 네모 친 부분을 바꾸면 된다는 의미다.

이렇게 우리는 전통적 프로그램을 완성하고, 개선까지 해냈다. 우리는 이 과정에서 여러 가지 사실을 알 수 있다. 가장 중요한 것은 순서도를 만드는 것이다. 시키고 싶은 작업이 있다면, 프로그래밍 언어는 달라도 순서도의 모습 자체는 동일하다는 것을 명심해야 한다. 다시 말하면, 순서도를 떠올리지 못하면 프로그램을 만들 수 없다는 의미다.

또, 한 가지 사실은 프로그램을 만드는 과정에서 ‘누군가’ 다른 사람이 만든 코드에 크게 의존하게 된다는 것이다. 사실 위에서 구체적으로 언급하지는 않았지만, EOF 확인 이외에도 ‘파일을 읽는 것’, ‘모니터에 출력하는 것’ 등 역시 다른 누군가가 만든 함수다. 이런 기능들은 운영체제(OS, Operating System)가 제공하기도 하며, 누군가 다른 사람이 특정 프로그래밍 언어로 만들어 두기도 한다. 프로그래머들은 프로그래밍을 시작하기 전 이런 다양한 요소들을 고려한다. 예를 들어, 만약 내가 만들고 싶은 프로그램을 개발하기 위해선 데이터를 매우 특별한 방식으로 바꿔야 하는데, 그 기능이 자바(Java)*에 이미 존재한다면 자바로 코드를 만드는 것이 효율적이다.

우리가 매일 사용하는 워드프로세서, 스프레드시트, 웹 브라우저 등 대부분의 프로그램이 위와 같은 작업을 통해 만들어진 것이다. 그렇다면 인공지능 시대에는 무엇이 바뀌는 것일까?

* 자바(Java) : 오라클(Oracle)사가 개발한 프로그래밍 언어의 일종

신경망과 인공지능

위에서 우리가 살펴본 프로그래밍 방법은 완벽한 것 같지만 사실은 그렇지 않다. 여기에는 두 가지 문제가 있다. 하나는 프로그램이 스스로 배우지 못한다는 것이다. 우리는 프로그램을 고치기 위해 순서도를 고쳐야 했다. ‘다섯 번 루프’를 ‘EOF로 대체하지 않는 이상, 프로그램은 영원히 파일의 첫 다섯 줄만을 가져와 처리했을 것이다.

더 큰 문제는 따로 있다. 바로 인간이 순서도를 만들지 못하는 프로그램은 만들 수 없다는 것이다. 프로그래밍의 첫 단계를 해내지 못하니 다음 단계로 가지 못하는 것이다.

사진이 입력되면 동물의 종류(개와 고양이)를 구분하는 프로그램을 만들어야 한다고 해 보자. 여러분은 개와 고양이를 어떻게 구분하는가? 아마 바로 떠오르는 것은 주둥이의 모습일 것이다. 그래서 아래와 같은 순서도를 만들었다고 해 보자.

▲ 그림 4 : 개와 고양이를 구분하는 간단한 프로그램의 흐름

그런데 문제가 생긴다. 누군가 동물 주둥이가 가려진 사진을 두 개 가지고 온 것이다. 이제 프로그램이 작동하지 않는다. 프로그래머는 놀라 허겁지겁 새로운 알고리즘을 만들기로 한다. 눈동자의 모양을 확인하는 코드를 추가하면 개와 고양이의 구분이 가능할 것이다. 하지만 새로운 개, 고양이 사진을 가지고 올 때마다 이런 일이 계속 생겨날 것이다. 위와 같은 순서도 기반의 프로그램으로는 도저히 개와 고양이를 구분하는 안정적인 프로그램을 만들 수 없을 것이다. 현실에서는 개와 고양이를 구분하는 눈, 코 등의 요소들을 찾아내는 것도 힘든데, ‘주둥이, 눈동자 모양’만 골라내는 코드를 만드는 것 역시 매우 힘들다. 특정 사진에서는 쉽게 찾아낼 수도 있지만, 수백만 개의 다양한 사진에서 특정 요소를 골라내기는 매우 어려운 일이다.

▲ 그림 5 : 개와 고양이 구분하는 프로그램을 구성하기란 매우 어렵다.

하지만 인간은 사진을 보면 ‘척 보면 딱’ 개와 고양이를 구분해낸다. 스스로 어떻게 구분했는지는 잘 모르지만, 할 수 있다. 그렇다면, 인간과 비슷한 구조의 프로그램을 만든다면 어떻게 동작하는지는 몰라도, 개와 고양이를 잘 구분할 수 있게 될 것이라는 가정이 가능하다. 따라서 아래의 구조와 같은 프로그램을 만들어 보게 된다. 이제 프로그램에는 순서도가 없고, 수 없이 연결된 인공적인 신경세포가 가득하다. 이를 ‘인공신경망’이라 부른다.

인공신경망의 입력 부분에 사진을 투입하면, 출력 부분에서는 개인지 고양이인지가 출력되는 것이다. 이제 프로그래머가 해야 하는 일은 저 수많은(수백만~수백억 개) 신경세포들 사이의 연결 강도를 지정해 주는 것이다. 하지만 순서도가 없으니 각 세포가 뭘 하는 것인지 하는지 알 수가 없다. 개와 고양이를 구분하기위해 첫 번째, 두 번째… 백만 번째 인공 뇌세포는 무엇을 해야 하는 건지 어떻게 알 수 있겠는가? 이 문제로 인해 인공신경망이라는 개념은 1960년대에 처음 등장했음에도 50년 가까운 세월 동안 빛을 보지 못했다. 우리가 학습이라고 부르는 것은 일종의 프로그래밍 방법이다.

▲ 그림 6 : 인공신경망이 동작하는 방식

* 입력층 : 입력을 받아들이는 층
* 은닉층 : 입력층으로부터 입력값을 받아 가중치를 계산하는 부분으로 가중치의 수정으로 인한 학습이 진행되는 층
* 출력층 : 결과를 출력하는 층

오랜 연구 끝에, 과학자들은 역전파(Backpropagation)*, 초깃값 세팅 등 다양한 방법을 개발했다. 위 방법들과 함께 대량의 학습 데이터를 투입할 경우, 우리들이 개별 세포들의 역할을 모르더라도 잘 동작하는 프로그램, 즉 인공지능을 만들 수 있게 된 것이다. 이렇게 해서 새로운 세상이 열리게 됐다. 새로운 이론들을 통해 신경망을 학습시키자, 신경망 내 다양한 은닉층은 각자의 역할을 가질 수 있게 됐다.

* 역전파(Backpropagation) : 맨 마지막 층의 값부터 비교하는 방법으로 학습하면서 차례차례 역으로 원하는 곳까지의 결과값을 얻어내는 과정

이 대목에서 우리는 반도체 엔지니어들이 인공지능 기술을 어떻게 접근해야 하는지 알 수 있다. 예를 들면, 우리가 인공지능의 ‘학습’이라고 부르는 것은 결국 수백만 개가 넘는 인공 뉴런 사이의 연결 세기를 ‘제대로’ 지정해 주는 일이었을 뿐이다. 반도체 엔지니어가 인공지능에 접근하는 방법에 대해 다음 예를 통해 설명해보겠다.

▲ 그림 7 : 인간의 얼굴을 찾아내는 가상의 인공신경망 예

<그림7>의 예는 사람의 얼굴만을 골라내 출력하는 가상의 인공신경망이다. 우리가 이 신경망을 구성한 뒤 학습시키게 되면, 각 층은 대략 위와 같은 역할을 가지게 된다. 일단 입력층에 가까운 은닉층이 원, 가로선, 세로선, 대각선 등 특정 도형들에 활성화가 되게 학습된다. 그다음 은닉층은 인간의 얼굴을 찾기 위해, 눈 코 입 등을 찾으려 한다. 이때 사진 원본 대신 그 전 단계 은닉층이 제공해준 정보를 사용하는 것이다.

눈을 탐지하는 은닉층은 눈이라는 신체 부위의 특징상, 원에는 크게 반응해야 하지만, 세로선에는 거의 반응하지 않아야 할 것이다. 만약 입을 찾아야 한다면, 가로선이 가장 중요하고 세로선은 별로 중요하지 않을 것이다. 과학자들이 발견한 학습 방법론의 의의는 사람이 일일이 눈, 코, 입 등을 얼굴 구분에 중요한 요소를 지정해주지 않아도 데이터만 투입해 주면 자동으로 내부의 신경망이 층을 나눠 위와 같은 역할을 가지게 만들 수 있다는 것이었다.

당연하지만 인공신경망을 키우고 은닉층이 깊어질수록 더욱 세밀한 분석을 할 수 있게 된다. 더 많은 은닉층이 있다면, 대각선에 반응하는 선이 학습 과정에서 생겨날 수 있고, 눈과 코 출력 결과를 또 모아서 눈과 코 사이의 거리를 확인하는 세 번째 은닉층이 생길 수도 있다. 이 과정에서 점점 인간 얼굴을 구성하는 더 많은 요소를 고려할 수 있게 되며, 정확도가 높아지게 되는 것이다.

‘현재 인공지능의 학습이란 것은 수많은 소수점을 변경하고 저장하는 것을 반복하는 것이다.’

이것이 여러분이 반도체를 알기 위해서 프로그램을 이해해야 하는 이유다. 위와 같은 이해를 해야만 이후 중요한 변화가 생겼을 때 대응할 수 있다. 만약 인공지능 기술의 트렌드가 바뀌어, 신경망의 크기가 매우 작아지면? 역전파를 대체할 학습 방법론이 생겨나면? 이런 세세한 트렌드 변화는 프로그램들이 원하는 반도체의 특성을 바꾼다. 만약 ‘인공지능은 큰 메모리가 필요하다’라고 암기식으로 접근한다면, 이때 잘못된 결론을 내리게 될 것이다.

프로그램을 위해 진화해 온 CPU

반도체 입장에서의 프로그램을 조금 더 자세하게 살펴보자. 앞서 우리는 순서도 기반으로 만들어진 프로그램을 살펴봤다. 이런 프로그램들은 그 자체로는 의미가 없으며, CPU(Central Processing Unit, 중앙처리장치)가 있어야만 의미를 가진다. 프로그래머는 앞서 만든 순서도를 컴퓨터가 이해하는 기계어로 변환한 뒤, 메모리에 저장한 다음 CPU에 프로그램을 실행해 달라고 요청하는 것이다.

위 예에서 알 수 있지만, 프로그램을 수행하기 위해서는 크게 세 가지의 연산 종류가 필요함을 알 수 있다. 하나는 덧셈, 뺄셈 등의 사칙연산, 메모리 입출력, 비교와 분기다. 분기라는 것은 조건에 맞춰 선택지를 택하는 것을 의미한다. 인간 입장에서 ‘1부터 5까지 더한다’라는 작업은 컴퓨터 입장에선 아래와 같이 보이게 된다. 일반적으로 CPU 내부에 레지스터라는 고속 저장소가 있으므로, 변수 2개(N, S) 정도는 메모리 접근 없이 처리할 수 있지만 설명을 간단히 하기 위해 이런 부분은 과감히 생략하겠다.

▲ 그림 8 : 연산 칩 입장에서 1에서 5까지 더하는 프로그램의 흐름과 CPU와 메모리의 역할

위 작업을 분석해 보면 메모리 접근과 산술 연산이 매우 빈번하지만, 분기 역시 자주 발생함을 알 수 있다. 이와 마찬가지로 현대 컴퓨터 프로그램의 상당 부분은 분기 처리로 이뤄져 있다. “ESC 버튼을 입력하면 → 현재 프로그램을 종료하라”와 같은 간단한 명령조차 분기다. “출금 버튼을 누르고 대상 계좌가 입력되면, 돈을 송금하라”와 같은 명령도 분기가 필요하다.

그렇다면 CPU가 계속 활용되기 위해서는 어떻게 해야 할까? 위 순서도에 따르면 세 가지 성능이 개선되면 된다. 산술 연산 속도, 분기 처리 속도, 메모리 접근 속도가 높아지면 된다. 위 예에서는 연산을 한 바퀴 돌 때 메모리 접근 6회, 산술 연산 2회, 비교 및 분기 1회가 포함돼 있다. 여기서 만약 메모리 접근과 산술 연산이 회당 1의 시간이 필요하고, 비교 및 분기에 10의 시간이 필요하다고 가정하면, 현재 작업 한 바퀴 수행에 걸리는 시간은 18(6*1+2*1+1*10)이다. 그런데 CPU가 비교 및 분기에 시간이 5로 개선된다면, 이 시간은 13으로 줄어 30% 가까이 빨라질 것이다.

CPU는 다양한 연산 종류와 분기 등이 섞여 있는 프로그램을 처리해야 했기 때문에 이 3가지 능력을 골고루 발전시키는 방향으로 발전했다. CPU 회사들은 미세화의 힘으로 얻어낸 새로운 트랜지스터들을 이런 능력을 향상하기 위해 아낌없이 투자했다. 기존 프로그램이 CPU만 바꾸면 빨라지게 되니, 새로운 수요는 계속 창출될 수 있었다. 지난 수십 년간 인텔의 CPU가 세계를 지배한 이유가 이것이다.

GPU의 등장과 인공지능

하지만 인공지능 기술이 크게 발전하면서 완전히 다른 형태의 프로그래밍이 생겨났다. 인공지능, 정확하게는 인공신경망 기반의 프로그램은 아래와 같은 구조로 움직인다. 과연 프로그램과 반도체의 입장에서 인공지능은 어떤 모습으로 보일까?

▲ 그림 9 : 연산 칩 입장에서 인공신경망의 구성

이 안에는 분기라는 것이 없다. 대신 산술 연산과 메모리 접근이 압도적으로 많다. 위에서 살펴본 CPU 기반 프로그램의 경우, 고작 몇 번의 연산과 분기만 처리하면 결괏값이 출력됐다. 하지만 인공신경망은 수백~수억 번의 연산을 거쳐야 결괏값을 출력할 수 있다. 실제로 인공신경망은 CPU 기반의 일반적 프로그램보다 코드의 크기가 매우 크다. 이런 인공신경망을 빠르고 효율적으로 동작시키기 위해서는 당연히 수천 개의 숫자 연산을 동시에 수행할 수 있으면서, 큰 메모리에 빠르게 접근할 수 있는 능력이 중요시된다. 따라서 위와 같은 프로그램은 CPU에서는 효율이 매우 낮다.

이는 인공지능 과학자들에게 큰 문제였다. 1970년대 인공지능 시도가 좌절된 원인 중 하나이기도 했다. 만약 위 문제가 해결되지 않으면, 이론적 돌파가 생겨도 무용지물이 될 것이다. 이 문제는 반도체 기술의 발전이 해결했다. GPU(Graphics Processing Unit, 그래픽처리장치)가 등장한 것이다.

GPU는 본래 컴퓨터의 그래픽 처리를 전담하기 위해 설계된 반도체 칩이다. GPU는 우리가 보는 화면에 그림을 빠르게 그려주는 일을 한다. 그래픽 작업의 경우, 분기가 필요치 않고 픽셀과 픽셀의 선후관계 없이 위치마다 각각의 색상 값을 계산해서 그려주면 된다. 이처럼 분기 없이 동시에 여러 작업이 가능한 GPU는 그래픽을 구현하는 작업에서 CPU보다 압도적인 효율을 보이며, 빠르게 발전했다. 이 과정에서 우리가 아는 NVIDIA가 떠오르게 된다.

NVIDIA는 그래픽 시장을 장악한 뒤에도 지속해서 GPU의 새로운 용도를 찾아다녔다. 이런 과정의 일환으로 2007년, CUDA 등 GPU 기반 프로그램 개발을 도와주는 도구를 만들어왔다. 그리고 인공지능 기술의 이론적 돌파가 진척되자, 과학자들은 더 빠르게 인공지능 개발을 도와줄 수 있는 칩을 찾아 나섰다. 그들은 GPU를 적극적으로 채용했고, GPU를 사용할 경우 5배 이상의 성능 향상을 이룰 수 있음을 확인했다. 인공지능을 구현하기에 CPU는 분기 예측 등 필요치 않은 곳에 트랜지스터를 낭비하는 비효율적인 칩이었다. 이렇게 이론적 돌파와 새로운 반도체가 만나 세상을 바꿀 인공지능(AI) 혁명*이 시작된다.

그리고 이 국면에서 빼놓을 수 없는 반도체가 또 있다. 바로 메모리다. 인공신경망의 크기는 기존 CPU 기반 프로그램보다 매우 거대하다. 인공신경망은 어딘가 저장돼 있어야 하므로, 인공지능에 사용되는 GPU는 큰 메모리가 필요하다. 이 때문에 인공지능 시대에 메모리 반도체 기업들 역시 주목받는 것이다.

* 출처 : Large-scale Deep Unsupervised Learning using Graphics Processors, Stanford Univ, 2009

프로그래밍 방법론에서 반도체까지

이번 편에서는 새로운 프로그래밍 방법론이 반도체 입장에서 어떻게 보이는지를 개략적으로 알아봤다. 프로그램은 인간이 생산적인 일을 하기 위한 수단이다. 프로그램은 순서도를 이용한 전통적인 방법으로도 만들 수 있고, 인공신경망 학습 방식으로 만들 수 있다. 그리고 사용자들은 순서도를 이용해 만든 프로그램과 인공신경망 중, 자신이 원하는 프로그램을 잘 돌리는 반도체를 택하는 것뿐이다. 만약 사용자가 엑셀과 같은 기존의 프로그램을 돌리고 싶다면 고성능 CPU를 이용할 것이고, 인공지능 기반의 언어 생성 등을 하고 싶다면 GPU를 이용하면 될 것이다.

이 글을 통해 후배, 동료 여러분에게 하고 싶은 말은 기술과 기술의 관계를 이해하며 나아갔으면 한다는 것이다. 캐나다의 연구원들은 기존 순서도 형태의 프로그램으로 해낼 수 없던 수많은 일을 인공신경망으로 해냈다. 그리고 인공신경망 구동은 기존 프로그램과 비교해 더 많은 사칙연산 횟수와 메모리가 필요했던 것일 뿐이다. 이러한 개선은 결국 위에서 살펴본 분기 속도를 2배로 올렸더니 전체 프로그램이 수십 퍼센트(%) 빨라졌던 것과 다르지 않다. 이런 사실을 잊지 않는다면, 이후에 새로운 프로그래밍 기술이 생겨났을 때 그 프로그램이 어떤 연산을 요구할지, 어떤 형태의 메모리를 요구할지도 알 수 있을 것이다.

다음 편부터는 인공지능 기술과 그 주변을 이루는 생태계를 살펴볼 것이다. 그리고 그 생태계들이 가지고 있는 한계와 어려움을 찾아보고, 반도체가 이를 어떻게 도와줄 수 있을지 살펴볼 것이다.

※ 본 칼럼은 반도체에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.

[반도체 전공정 1편] 컴퓨터, 트랜지스터의 탄생과 반도체 (1/6)

정인성 작가 — Wed, 17 Aug 2022 15:00:00 +0000

최근 우리는 수많은 반도체 관련 뉴스를 접하고 있다. 반도체 관련 소식을 접하면서 우리는 자연스레 반도체가 단순한 수출 역군을 넘어서 국가 안보에까지 영향을 미치는 중요한 제품이 됐다는 점을 인지하기 시작했다. 반도체의 중요도가 높아짐에 따라 정부를 비롯해 여러 기업들은 반도체 산업의 경쟁력을 높이기 위한 방안을 강구하고 있다.

반도체 산업의 경쟁력을 높이는 첫 발걸음은 당연히 반도체에 대한 지식을 공유하는 것이다. 이에 본인 역시 반도체 산업에 몸담았던 일원으로서 반도체에 대해 관심이 있거나 반도체 산업에 종사하고자 하는 취업준비생들을 위한 지식을 공유하고자 한다.

인터넷이나 교재에서 찾아볼 수 있는 기술에 치중된 지식이 아니라 각 기술이 가지는 연관성을 통한 관계의 중심으로 반도체를 설명하고자 한다. ‘컴퓨터와 트랜지스터’의 주제를 시작으로 공정과 산화, 포토, 식각, 증착, 금속배선 등 총 6편의 시리즈로 반도체 기술에 대한 설명을 이어갈 예정이다.

이를 읽는 독자 여러분은 개별 용어에 너무 얽매이지 말고 ‘관계’에 주목하길 바란다. 글을 읽다 보면 갑작스럽게 전문 용어들이 등장할 수 있지만, 이해가 되지 않는다면 그냥 넘어가도 좋다. (필자 주)

인간의 욕심 : 컴퓨터의 탄생

인간은 게으르다. 주말이 되면 일어나고 싶지 않아, 이불 속에서 스마트폰을 하는 것이 일상이다. 회사에 가서 회계 업무를 볼 때, 수만 개의 숫자를 일일이 더하고 뺀 뒤 암산하고 싶지도 않다. 내가 할 일이 줄어들면 삶은 매우 윤택해질 것이다. 나는 가만히 앉아서 명령만 내리고 매일 누군가가 그 일을 대신해 준다면 얼마나 편리할까?

문제는 업무의 정확도다. 방의 전등을 끄는 정도의 지시는 웬만한 사람이라면 다 해낼 수 있다. 하지만 해야 하는 일이 매우 복잡한 숫자 수천 개를 오차 없이 계산하는 것, 원주율을 수만 자리까지 계산하는 것이라면 어떨까? 이런 작업들은 사람이 할 줄 알더라도 실제로 해보면 실수가 빈번히 일어나는 일들이다. 이런 작업을 정확히 하기 위해서는 기계의 힘이 필요했다. 이것이 컴퓨터의 시작이다.

이런 기계를 발명하기 위해 과거의 사람들은 많은 노력을 아끼지 않았다. 이 과정에서 나온 대표적인 실험 작품이 1871년에 조립된 찰스 배비지(Charles Babbage)의 해석 기관(Analytical Machine)이다. 사용자는 이 기계에 펀치 카드라는 얇은 판을 넣어서 원하는 숫자 계산을 할 수 있었다. 카드를 기계에 넣은면 해석 기관이 내부에서 명령어에 맞춰 각종 산술연산을 반복한 뒤, 결과 값이 기기의 다른 곳에서 출력돼 나오는 구조다. 게임 팩을 끼워서 원하는 게임을 돌리는 패미컴과 같은 게임기와 비슷한 개념이다.

비록 해석 기관은 완성되지 못했지만 우리는 여기서 흥미로운 사실을 알 수 있다. 일단 해석 기관은 컴퓨터가 가져야 할 모든 요소를 가지고 있다는 것이다. 펀치 카드와 결과 값이 출력되는 부분은 메모리에 해당하며, 해석 기관은 매우 원시적인 요소의 CPU^*라 할 수 있다.

* CPU : Central Processing Unit의 약자 컴퓨터의 중앙 처리 장치로 컴퓨터의 두뇌 역할을 하는 장치.

이런 해석 기관의 동력원은 증기다. 쉽게 말하면 해석 기관은 증기로 작동하고 각종 금속조각과 나무 재질의 메모리와 CPU로 만들고자 했던 컴퓨터다. 우리는 이 사실들을 통해 옛날 사람들도 컴퓨터가 어떤 구조로 작동해야 하는지 알고 있었다는 걸 짐작할 수 있다. 또 컴퓨터와 ‘전자회로’는 전혀 다른 개념이란 것도 알 수 있다. 이제 우리는 ‘어떤 이유로 전자회로가 현대 컴퓨터의 핵심이 됐는지’를 고민해 볼 필요가 있다. 과거의 컴퓨터는 세상을 바꾸지 못했지만, 전자회로 기반의 컴퓨터는 세상을 바꾸지 않았던가.

전기로 제어되는 컴퓨터

전자회로는 증기, 인력, 수력을 기반으로 하는 다른 기기들을 앞선다는 장점이 있다. 신호의 제어가 빠르고 효율이 좋기 때문이다. 대표적으로 증기를 살펴보면 물리적으로 특정 위치에 도달해야 하기 때문에 반응 속도가 느리다는 단점이 있다. 또, 높은 압력으로 전달되기 때문에 관의 두께가 두꺼워야 하는 등 효율적인 측면에서는 상당히 좋지 않다. 줄을 당기면 자동으로 문이 열리고 닫히는 기기가 있다고 가정하자. 만약 여기서 사용되는 에너지원이 증기라면 문을 닫기 위해선 보일러 밸브를 연 뒤, 고압 증기가 문을 밀어낼 때까지 기다려야 할 것이다. 하지만 전기를 사용하면 버튼과 모터 하나만 있으면 모든 것이 해결된다. 전체 기기의 크기도 작아지고, 에너지 효율이 높아질 뿐만 아니라 반응속도까지 빠르다.

▲증기 기반 자동문(좌)과 전기 기반의 자동문(우)

전기가 발명되자 컴퓨터 역시 전기로 제어하려는 시도가 대세가 됐다. 전기 기반의 컴퓨터를 만들기 위한 수많은 시도가 있었으며, 그렇게 해서 탄생한 기기가 바로 에니악(ENIAC)이다. 에니악은 톱니바퀴와 증기를 사용했던 해석 기관과는 달리, 진공관이라고 부르는 일종의 전구와 각종 전자회로를 조합해 작동하는 컴퓨터였다. 전구에 가까운 부품이 달려 있는 것에서 알 수 있듯, 에니악의 에너지원은 전기였다.

▲에니악의 모습 (출처 : 원문 보기)

에니악은 방 하나를 차지할 만큼 거대한 컴퓨터였으며 전기를 무려 170kW나 사용했다. 이는 전자레인지 170대분의 어마어마한 전력을 사용하는 것과 같은 수준이다. 하지만 그 규모와 에너지 소모에 걸맞게 당시에 필요로 하던 수많은 일을 해낼 수 있었다. 삐걱대며 천천히 움직일 톱니바퀴 대신 17만 개가 넘는 진공관을 사용했으므로 연산 속도도 훨씬 빨랐다. 에니악은 개발된 이후 수소폭탄 개발, 시뮬레이션 방법론 등의 큰 족적을 남겼다.

하지만 우리는 에니악의 성능이 1990년대의 휴대용 계산기보다도 못하다는 것을 알고 있다. 저성능 전자계산기를 구동하기 위해 전자레인지 170대의 전력을 사용해야 한다니, 지금의 시점에서 보면 효율이 굉장히 나쁘다. 게다가 크기까지 거대했기 때문에 이런 물건을 대규모로 보급하는 것은 불가능하다. 에니악의 크기를 절반쯤, 심지어 1/10 정도로 줄여도 마찬가지다. 분명 증기를 사용하는 것보다는 훨씬 효율이 좋겠지만, 여전히 우리 모두가 사용하기에는 너무나 크기가 크고 비효율적이다. 에니악 정도로는 우리가 아는 세상을 열 수 없었다. 세상은 또 다른 혁신을 필요로 했다. 그것이 바로 트랜지스터다.

트랜지스터의 등장

에니악은 진공관이라고 부르는 일종의 전구를 이용해 만들어졌다고 했다. 먼저 알아봐야 할 것은 이런 소자들이 ‘왜 필요한가’이다. 당시 사람들은 신호를 제어할 수 있으면 일종의 연산 장치를 만들 수 있음을 알고 있었다. 그 예가 우리가 위에서 봤던 증기 자동문이다. 줄이라는 도구를 이용해 증기라는 신호를 제어하고 ‘줄을 당기면 문을 열어라’라는 프로그램을 수행한 것이다. 개선판인 전기 자동문 역시 본질은 같다. 버튼을 이용해 모터로 향하는 전기를 제어하는 것일 뿐이다.

컴퓨터는 본질적으로 증기 자동문의 입출력을 잔뜩 늘리고, 내부에 파이프를 수천 개 연결해 다양한 논리 구조를 추가한 것일 뿐이다. 증기 자동문은 단순히 문을 열고 닫는 수준의 간단한 일 밖에 하지 못한다. 하지만, 원한다면 줄 하나로 문 두 개를 동시에 연다거나, 사람이 문 아래에 있으면 닫히지 않는 안전문을 만드는 다양한 일을 할 수 있지 않은가. 이 규모를 계속 키워가다 보면 컴퓨터를 만들 수 있다. 잡아당기는 줄, 증기 배관 등은 진공관에 해당하는 기초 소자인 것이다.

▲하나의 조작으로 문 여러 개를 여는 증기 자동문과 두 사람이 동의해야 열리는 자동문

증기 컴퓨터의 기능을 추가하고, 전체 성능을 높이려면 어떻게 해야 할까? 증기관을 늘려 많은 기능을 넣거나, 더욱 높은 압력, 온도의 보일러를 설치해 증기가 차오르는 속도를 높이면 될 것이다. 문제는 이것 모두 쉽지 않다는 것이다.

증기기관은 그 자체로 크기가 매우 크기 때문에 보일러에서 다른 곳으로 관 하나를 추가하는 것만으로도 이미 거대한 크기가 더욱 커진다. 보일러의 성능을 높이려고 하면 필요한 에너지가 매우 커지고, 위험도도 높아진다. 진공관은 당시 사람들이 알고 있던 소자 중 가장 나은 소자였을 뿐이다. 전기로 동작하므로 고압 보일러처럼 폭발할 위험도 없고, 동작 속도도 초당 수십 회 정도는 됐다. 물론 그래도 사용하는 전력이 커 개별 진공관이 고장나는 등의 사고가 빈번했다. 더 나은 컴퓨터를 만들기 위해선 더 나은 소자를 찾을 필요가 있었다.

그리고 1947년, 트랜지스터가 발명됐다. 트랜지스터는 큰 전류의 흐름을 매우 작은 전류로 조절할 수 있는 혁신적인 기기였다. 과학자들은 아래와 같이 반도체 소재 두 종류를 사용하면 신호를 매우 쉽게 끊고 연결할 수 있음을 알게 됐다. 구조가 어려워 보이지만, 작동 원리는 본질적으로 밧줄을 당겨 증기 이동을 제어하는 것과 똑같다. 최초의 트랜지스터가 발명된 그 해, 지금까지 널리 사용되는 BJT^*라는 트랜지스터가 발명됐다. 이 과정에서 반도체라는 물질 역시 대중에게 알려지기 시작했다.

* BJT : Bipolar Junction Transistor, 양극성 집합 트랜지스터, 반도체 내부에서 P형 반도체와 N형 반도체의 두 영역 사이의 경계부분을 일컫는 PN 접합을 이용해 만든 트랜지스터를 의미한다.

▲트랜지스터의 구조. N형 P형 반도체 두 가지가 사용된다.(우측 이미지 출처 : 반도체 제조기술의 이해 143p 표 4-6)

모두를 위한 반도체 : MOSFET 혁명과 제조기술

1959년, 벨 연구소에 재직 중이던 모하메드 아탈라 박사와 강대원 박사, 두 사람은 모스펫(MOSFET)이라는 새로운 형태의 트랜지스터를 개발하게 된다. 두 사람은 실리콘 원판 위에 두 종류의 반도체 층을 형성한 뒤, 그 위에 금속을 얹음으로써 평평한 모양의 트랜지스터를 만들어 냈다.

이 트랜지스터는 작동 원리는 약간 달랐으나, 사용 방법은 위에 소개된 트랜지스터들과 크게 다르지 않았다. 이 트랜지스터가 진정 가치 있는 이유는 생산성이었다.

▲강대원 박사의 모스펫(MOSFET) 모형 구조(출처 : ㈜도서출판한올출판사)

모스펫은 납작한 모습 덕분에 여러 개를 실리콘 웨이퍼 위에서 붕어빵 찍어내듯 한 번에 만들 수 있었다. 어떻게든 붕어빵 틀을 더 작게 만들기만 하면 동일한 넓이의 웨이퍼에 수십 배의 모스펫을 만들어 낼 수도 있었다. 더욱 좋은 점은 이미 연결된 모스펫의 집합을 한 번에 제조할 수 있었다는 것이다. BJT를 이용해 CPU를 만들어야 한다고 하자. BJT를 만드는 과정이 아무리 효율적이더라도 CPU는 BJT를 연결해 만드는 것이므로 수억 개의 BJT들을 서로 납땜하고 기판에 붙이는 과정이 필요하다. 하지만 모스펫의 경우 이미 수억 개의 트랜지스터가 납땜 된 상태로 만들어 진다. 이 발명 덕분에 ‘실리콘 웨이퍼 위에 형성된 모스펫 집합’은 물리학으로부터 반도체라는 이름을 빼앗기까지 했다.

이제부터 우리가 살펴볼 내용이 바로 이것이다. 우리는 반도체 공장이 수조 원이 넘는 비싼 가격이라고 하지만, 놀랍게도 공장의 본질은 모스펫을 싸게 만드는 공장인 것이다. 우리는 이제부터 반도체에 관심 있는 사람이라면 들어보았을 노광, 식각, 증착 등이 과연 어떤 식으로 ‘값싼’ 모스펫에 공헌하는지 알아볼 것이다.

이번 장을 통해 독자 여러분이 기술 개발에서 목적과 수단을 분명히 구분할 수 있기를 바란다. 과학자들의 목적은 컴퓨터를 만드는 것이었다. 이를 위해 신호 전달의 수단으로 전기가 선택됐다. 모스펫은 전기 기반의 기초 소자 중 으뜸인 ‘수단’인데, 그 이유는 앞으로 배울 제조 공정으로 대량 제조가 가능하기 때문이다. 이후 반도체 제조 관련 글을 보면서, 해당 기술들이 어떤 식으로 값싼 반도체에 기여했으며 나아가 우리 모두에게 컴퓨터와 스마트폰을 가질 수 있게 했는지 느껴 봤으면 좋겠다.

※ 본 칼럼은 반도체/ICT에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.

CPU가 아니라 모바일 AP라 불리는 이유?

세아향 — Mon, 10 Jul 2017 20:00:00 +0000

스마트폰은 이제 몸의 일부분이라고 해도 과언이 아닐 정도로 우리 생활에 밀접한 전자제품입니다. 언제 어디서나 손쉽게 원하는 정보를 얻을 수 있고, 편리한 기능을 활용해 일상의 영역을 확장해주기 때문이죠. 스마트폰이 이런 다양한 일을 한꺼번에 처리 할 수 있는 건 바로 모바일 중앙처리장치 AP(Application Processor)가 들어가 있기 때문인데요. 이 용어가 생소한 분들 많으실 겁니다. 모바일 기기의 두뇌 역할을 담당하는 모바일 AP(Application Processor)의 정확한 개념에 대해 알아보도록 하겠습니다.

모바일 AP는 CPU와 어떻게 다를까

모바일 중앙처리장치 AP(Application Processor)(이하 ‘모바일 AP’)는 모바일 분야의 핵심인 반도체 칩을 말합니다. 흔히 모바일 AP는 스마트폰의 두뇌라 불리는데요. 컴퓨터에 익숙한 세대 중 일부는 모바일 AP를 중앙처리장치 CPU(Central Processing Unit)(이하 ‘CPU’)와 동일하게 생각하는 경우가 많습니다. 하지만 모바일 AP가 CPU라 불리지 않죠. 모바일 AP는 컴퓨터 CPU와 달리, 주 연산을 위한 CPU를 포함한 다양한 기능이 하나의 칩으로 통합된 형태이기 때문입니다. 모바일 AP에는 CPU, 메모리, 그래픽카드, 저장장치 등 한 개의 칩에 완전 구동이 가능한 제품과 시스템이 들어 있죠. 시스템온칩 SoC(System on Chip)(이하 ‘SoC’)’이라 불리는 이유입니다.

▲ 모바일 프로세서 엔디비아 테그라 K1 (출처: 엔디비아 홈페이지)

다양한 제조사에서 설계한 AP는 각각의 브랜드로 우리에게 잘 알려져 있는데요. 대표적으로 퀄컴(Qualcomm)의 MSM 시리즈 '퀄컴 스냅드래곤(Qualcomm Snapdragon)', 엔비디아(NVIDIA)의 '테그라(Tegra)' 시리즈, 애플의 'A' 시리즈 등이 있습니다.

▲ 모바일 플랫폼 퀄컴 스탭드레곤 (출처: 퀄컴 공식 홈페이지)

이 중에서 최근 출시된 모바일 AP 중 '퀄컴 스냅드래곤 835'를 살펴보면, 휴대성이 높은 모바일 디바이스에 탑재된 만큼 크기가 무려 72.3㎟입니다. 엄지손톱보다 작죠. 하지만 보기와 다르게 10nm 공정으로 완성된 작은 크기의 모바일 AP 칩셋에는 다양한 기능이 담겨 있습니다.

모바일 AP는 이렇게 구성되어 있다

▲ 중앙처리장치 CPU(Central Processing Unit) (출처: 퀄컴 공식 홈페이지)

모바일 AP는 제조사마다 설계 부분이 조금씩 다릅니다. 하지만 기기 구동에 꼭 필요한 제품과 시스템이 등이 포함된 건 동일하죠. 모바일 AP를 구성하는 것과 그 기능을 살펴보면 다음과 같습니다.

하나. 데이터 처리를 실행하는 중앙처리장치 CPU

AP의 중앙처리장치 CPU는 컴퓨터의 CPU와 동일한 역할로 명령을 해독하고 산술논리연산이나 데이터 처리를 실행합니다. 차이점이 있다면 설계하는 명령어 세트와 명령어 집합인 ISA(Instruction Set Architecture)입니다. 컴퓨터의 CPU는 x86, 모바일 AP의 CPU는 ARM 계열인데요. 탑재되는 기기가 아니라 각각의 방식 자체에 차이가 있어 달리 불립니다. 각각의 계열에 따른 방식을 살펴보면, x86은 CISC(Complex Instruction Set Computer), ARM은 RISC(Reduced Instruction Set Computer)로 나뉩니다.

CISC는 복잡한 명령어를 통해 연산을 하는 방식으로, 반도체를 구성하는 트랜지스터의 직접도가 과다하게 높아 소비전력과 발열 또한 높습니다. 이와 다르게 RISC는 명령어를 최소로 줄여 단순하게 만든 방식으로, 트랜지스터의 직접도가 낮아 소비전력과 발열 또한 낮습니다.

둘. 그래픽 작업을 책임지는 GPU

그래픽 작업을 처리하는 장치로 CPU와 함께 가장 복잡한 반도체 중 하나로 꼽힙니다. CPU 설계보다는 간단하지만 벡터 부동소수점 연산 등 3D 그래픽에 필요한 기능은 오히려 CPU를 능가하죠. 스마트폰에서 처리하는 2D, 3D 그래픽 작업을 모두 이 칩셋에서 처리하므로, 모바일 AP 성능에 중요한 부분이라 할 수 있습니다.

셋. 인터넷을 연결해주는 모뎀

3G나 LTE, 그리고 Wi-Fi(802.11a/b/g/n/ac) 인터넷 연결을 가능하게 해주는 모뎀 Modem 칩도 AP에 포함되어 있습니다. 지금까지 공개됐던 다수의 AP 중 퀄컴 스냅드래곤이 모뎀칩을 AP에 통합했고, 이로 인해 세계에서 가장 높은 점유율의 AP 제조사가 되었습니다. 최근 출시되는 다양한 AP는 기본적으로 모뎀을 내장하고 있습니다.

넷. 화려한 영상을 볼 수 있는 VPU

공중파를 통해 4K UHD 콘텐츠를 즐길 수 있는 세상이죠. 초고화질 콘텐츠를 재생하기 위해서는 영상처리장치 VPU(Video Processing Unit)(이하 ‘VPU’)라 불리는 동영상 재생에 특화된 프로세서의 성능이 중요합니다. VPU의 성능이 뒷받침될 때 스마트폰에서 4K UHD 영상을 끊김 없이 재생할 수 있는데요. 최근 다수의 AP 업체들은 VPU를 GPU에 통합하는 방식을 택하고 있습니다.

다섯. 디지털 신호 처리 프로세서 DSP

디지털 신호를 빠르게 처리할 수 있는 직접회로를 말합니다. 주로 오디오, 영상 신호 처리를 위해 사용하는데요. 그래픽(영상)처리나 음악(오디오) 재생과 같이 단순한 반복 계산에 특화되어 있죠. 모바일 AP의 디지털 신호 처리 프로세서 DSP(Digital Signal Processor)는 보통 영상 신호 처리에 높은 비중을 두고 있어요. 최근 스마트폰에는 모바일 AP 칩 외에 별도의 디지털 아날로그 변환기 DAC(Digital-to-Analog Converter)칩을 추가해 오디오 성능을 업그레이드 하고 있습니다.

여섯. 스마트폰 사진을 찰칵! ISP

스마트폰으로 사진을 찍는 경우가 많아지면서 AP에 이미지 처리 프로세서 ISP(Image Signal Processor)(이하 ‘ISP’)가 기본 내장되는 건 그리 특별한 일은 아닙니다. 보통 ISP는 디지털 카메라에 들어가는 이미지 처리장치를 말하는데요. CIS(CMOS Image Sensor) 영상 센서에서 들어오는 RAW 데이터 가공 업무 등 전반적인 이미지 프로세싱 과정을 수행합니다.

이 외에도 모바일 AP에는 위치 정보를 위한 위성항법시스템 GPS(Global Positioning System) · GLONASS나 음성 신호 처리를 위한 오디오 신호 처리장치 ASP(Audio Signal Processor) 등이 있습니다.

스마트폰을 구입할 때, 스펙을 확인하자

다양한 기능을 수행하는 프로세서들이 ‘한집살림’을 하고 있는 모바일 AP. 모바일 AP는 정보와 명령을 확인하고 데이터를 기록해 저장하며, 화려한 3D 그래픽까지 구현해냅니다. 스마트폰과 태블릿 PC 등의 다양한 하드웨어 스펙 중 모바일 AP를 가장 먼저 살펴보는 이유도 모바일 AP는 전체적인 성능 측정 기준이 되기 때문입니다.

모바일 기기가 지속적으로 발전하기 위해서는 모바일 AP 성능 향상과 함께 CPU와 마찬가지로 모바일 AP에 꼭 필요한 메모리 RAM과 낸드플래시의 성능 개선에도 힘을 실어야 합니다. 빠른 데이터 전송 속도와 부족함 없는 용량 확보를 위해 메모리 반도체의 성능도 중요하니 LPDDR4X와 UFS 같은 제품의 스펙도 구입할 때 확인해보세요. 마찬가지로 찰나의 순간을 고화소 사진으로 담기 위해서는 CIS 성능도 중요하겠죠?

작은 크기의 모바일 AP안에 CPU를 비롯한 다양한 기능들이 모두 들어있다는 사실이 놀라울 따름인데요. 스마트폰의 두뇌라 할만 합니다. 더불어 모바일 AP와 함께 없어서는 안될 메모리 반도체 또한 스마트폰을 구성하는 중요한 요소라는 것도 알 수 있습니다. 이제부터 남들보다 더 나은 스마트폰을 선택하고 싶다면, 디자인만 볼 게 아니라 먼저 중요 기능을 담당하는 반도체의 성능도 꼭 살펴봐야겠습니다.

CPU 추천 – 컴퓨터의 뇌, CPU 이제는 알고 구입하자!

영하이라이터 — Sun, 22 Nov 2015 20:00:00 +0000

컴퓨터는 현대인의 필수품 중 하나입니다. 하지만 워낙 복잡한 기계이기 때문에 들어가는 부품도 매우 다양한데요. 이 수 많은 부품 중에서 가장 핵심은 컴퓨터의 뇌에 해당되는 부품, 바로 CPU랍니다. 단연 가장 비싼 부품이며 컴퓨터의 모든 계산을 담당하는 부품이죠. 따라서 구입할때 신중하게 선택해야 하는데요. 하지만 대부분의 사람이 용도에 맞게 CPU를 고르는 방법을 잘 모르고 있습니다. 게다가 종류도 워낙 많고 정확히 어떤 기준인지도 잘 몰라 쉽게 고르지 못하는 경우도 많죠. 그래서 준비했습니다. 이제부터 이해하고 알기 쉽게 본인의 용도에 맞는 CPU를 고르는 방법을 알아보도록 할게요~!

CPU는 Central Processing Unit의 약자입니다. 중앙처리장치로 해석할 수 있는데 컴퓨터의 모든 계산을 담당하는만큼 가장 핵심적인 부품입니다. 컴퓨터의 성능은 곧 CPU의 성능과 직결될 정도이죠.

CPU를 생산하는 업체에는 AMD와 Intel이 있는데 이 중에 시장 점유율이 독보적으로 높은 Intel이 최근에 6세대 CPU인 Skylake 시리즈를 출시했습니다. 세대를 거듭할 때마다 CPU의 성능 또한 좋아지는데 안에 들어가는 트랜지스터의 개수가 많을수록 성능이 업그레이드된다고 보시면 됩니다. 최초의 CPU는 1971년에 Intel이 개발한 4004으로, 2250개의 트랜지스터가 들어가며 최근 출시된 CPU에는 50억 개 이상의 트랜지스터가 들어갑니다. 그만큼 공정 방식이 40년 사이에 획기적으로 발달한 것인데요. 이 CPU와 관련된 전자공학 법칙이 있는데 바로 18개월마다 CPU의 성능이 2배씩 중가한다는 ‘무어의 법칙’입니다. 법칙이라기보다는 실질적으로 Intel의 공동 설립자인 고든 무어의 각오라고 할 수 있죠. Intel은 매년 이 목표를 맞추기 위해 수 많은 연구와 개발을 했으며 공정을 더 미세하게 하는 방법과 아키텍쳐를 바꾸는 방법 2가지를 이용해 오늘의 6세대 Skylake까지 왔습니다.

하나. 어떤 종류가 있을까? 등급과 세대에 따른 CPU의 종류

CPU는 크게 등급과 코어 개수에 따라 분류할 수 있습니다. 다음 표를 통해 간단하게 알아보록 할께요!

▲ 등급에 따른 CPU의 분류

▲ 세대에 따른 CPU의 분류

세대에 따른 분류는 Intel이 새로운 제품을 출시할 때를 기준으로 나눈 것입니다. 세대가 바뀔 때마다 공정 방식과 아키텍쳐 방식이 달리지는데, 전 세대의 아키텍쳐를 변경한 것이 TOCK 계열, 전 세대에 비해 공정을 미세하게 한 것이 TICK 계열입니다. 공정 방식을 미세하게 하거나 아키텍쳐를 바꿀 때 한정된 공간 안에 들어가는 트랜지스터의 개수가 증가하기 때문에 세대가 올라갈수록 CPU의 성능은 더욱 더 좋아집니다.

등급에 따른 분류는 CPU 안에 있는 프로세서의 종류입니다. CPU 안에서 봤을 때 코어는 공장, 스레드는 일꾼으로 볼 수 있습니다. 공장인 프로세서의 역할이 훨씬 중요하지만 공장과 일꾼이 많아지면 작업 속도가 빨라지듯이 코어와 스레드의 개수가 늘어나면 CPU의 성능 또한 좋아지는데요. 코어와 스레드의 개수에 따라 시중에 일반적은 출시되는 CPU에는 크게 i3, i5, i7 3가지 종류로 나뉘게 됩니다.

둘. 모델명 읽는 방법!

바탕화면의 “컴퓨터” 아이콘을 오른쪽 클릭하여 속성을 누르면 다음과 같은 창을 볼 수 있습니다.

A ‘i5’ CPU의 등급을 말하며, i5이므로 쿼드코어 4스레드입니다.
B ‘2’ 세대를 말하며, 2이므로 샌디브릿지 세대임을 뜻합니다.
C ‘410’ 같은 세대, 같은 코어 모델들 중에서 성능을 나타내는 수치이며 높은 숫자일수록 고성능입니다. 노트북일 경우, 마지막자리 숫자가 0일경우 일반, 7일 경우 저전력제품입니다.
D ‘M’ 전력 소모 타입을 나타내며 성능은 QM으로 갈수록 좋고, 전력소모 및 배터리와 발열 기능은 Y가 가장 좋습니다. (Y=울트라북 초저전력 U=울트라북 저전력 M=모바일 QM = 쿼드코어 모바일(일반형) HQ = 쿼드코어 모바일(메인보드 내장형)
E 2.30GHz CPU의 클럭을 말합니다.

컴퓨터를 사는 대표적인 3가지 유형을 통해 자기한테 맞는 CPU가 무엇인지 한 번 알아보도록 할께요!

하나. 가볍게 들고 다니며 주로 문서작업을 한다면?

들고 다니기 편리하고, 주된 작업이 문서 작업과 인터넷 서핑인 사람들은 데스크탑보다는 가벼운 노트북을 선호합니다. 주로 여성 직장인이나 여자 대학생들이 많이 찾는 종류인데요. 가벼운 노트북인만큼 얇을 확률이 높습니다. 하지만 같은 종류여도 CPU가 i3부터 i7까지 있다는 사실!

i7이 들어 있는 모델은 i3가 들어있는 모델보타 현저히 비싸지만, 문서 작업, 인터넷 서핑과 같은 작업을 할 때에는 큰 차이를 느끼지 못합니다. 따라서 복잡한 작업이 필요하지 않고 가벼운 것에 초점을 맞춘 사람에게는 5, 6세대 i3 정도면 충분하고, 돈을 조금 더 투자해도 상관 없는 사람에게는 i5를 추천할 수 있을 것 같습니다.

★ 영하이라이터가 추천하는 CPU모델 – 문서작업형

▲ (좌측부터) LG PC 그램, 삼성 노트북 9 출처 : LG전자 (http://www.lge.co.kr/), 삼성전자(http://www.samsung.com)

둘. 모든 것을 무난히 소화하는 만능 컴퓨터를 원한다면?

대부분의 남자 대학생들은 문서 작업, 인터넷 서핑도 하지만 게임을 하는 경우가 많습니다. 게임의 최소 요구 사양을 맞추면 상관없지만, 게임 중 렉이 걸리면 매우 걸리적거리는 느낌이 드는데요. 그래서 최소사양보다는 조금 더 좋은 컴퓨터를 찾고자 하는데 이러한 분들에게는 최신 세대 i5를 추천하고 싶습니다.

고화질 게임이라고 해서 i7이 항상 소화할 수 있는 것은 아닙니다. 오히려 고해상도 그래픽을 단순히 CPU의 힘만으로 소화하려고 하면 무리가 가서 성능이 저하될 수도 있죠. 적당한 i5 CPU에 그래픽 카드의 조화를 잘 고려하시는 것이 훨씬 효율적이랍니다. 가끔 고해상도 게임을 하면서 문서 작업, 인터넷 서핑 등 모든 것을 무난히 소화할 수 있는 만능형 컴퓨터를 찾는 사람에게는 i5가 적당할 것입니다. 본인의 작업 내용을 파악해서 그래픽 카드를 적절히 선택하시면 최신 세대 i3을 사용해도 큰 무리는 없을 듯합니다.

★ 영하이라이터가 추천하는 CPU모델 – 만능형

▲ (좌측부터) Dell Inspiron 15-5599, LG 울트라북 출처 : Dell ( http://www.dell.com/kr), LG전자( http://www.lge.co.kr)

셋. 그래픽 디자인 혹은 초고사양 게임을 충족하려면?

고성능의 CPU가 요구되는 작업은 주로 그래픽 처리가 많이 들어가는 작업입니다. 그래픽 디자인 작업을 많이 하거나, 게임을 좋아해서 초고화질 게임을 즐기시는 분들이라면 i7을 사용하시는 것을 추천하는데요. 수 많은 그래픽 처리와 계산이 요구되는 작업을 오래하는 경우에는 이러한 작업을 오래 해도 소화할 수 있기 때문에 최신 세대 i7이 좋습니다. 조금 강도가 낮은 작업을 한다면 i5을 사용해도 무방하죠. 단, 여기서도 주의할 것이 단순히 i7 CPU만으로 해결하면 안되고 그래픽 카드와 적절히 조화를 잘 맞추어야 한답니다.

★ 영하이라이터가 추천하는 CPU모델 – 고사양형

출처 : Dell (http://www.dell.com/kr)

★ TIP! 브랜드 PC 구입 시 주의점

조립 컴퓨터 사이트를 제외한 대부분의 브랜드 PC 사이트에서는 코어의 개수를 선택하는 항목은 있지만, 세대를 선택하는 항목은 많지 않습니다. 이는 CPU의 한 세대가 지나면, 그 전전 세대의 종류는 생산을 더 이상 많이 하지 않기 때문인데요. Intel이 최근에 출시한 Skylake는 6세대이므로, 현재 브랜드 PC 매장에서는 주로 5세대 CPU를 판매하고 있으며 4세대 CPU는 많지 않고 조립 컴퓨터 매장에 가야 어느 정도 찾을 수 있습니다. 따라서 브랜드 PC를 살 때 코어의 개수를 고려하는 것이 훨씬 중요하며, 세대는 크게 신경 쓰지 않아도 된답니다!

지금까지 컴퓨터의 뇌인 CPU에 대해 알아보았는데요. 인터넷에서 더 자세한 정보를 찾아보면 종류도 훨씬 많고 다양하다는 것을 알 수 있을 것입니다. 하지만 전문적으로 PC를 맞추지 않은 일반인들은 위의 기준만 잘 이해하고 고려하면 충분히 본인에게 맞는 컴퓨터를 고를 수 있습니다. 마지막으로, CPU의 성능도 중요하지만 그래픽 카드 같은 다른 부품과의 조화를 고려하는 것도 좋은 중요해요! 컴퓨터 판매 업체에서는 언제나 친절히 설명을 해주기 때문에 상담을 받으시면 자세한 정보를 얻을 수 있습니다. 자신에게 맞는 CPU 선택으로 후회 없이 컴퓨터를 구입하시길 바랄게요~!