챗GPT – SK hynix Newsroom 'SK하이닉스 뉴스룸'은 SK하이닉스의 다양한 소식과 반도체 시장의 변화하는 트렌드를 전달합니다 Fri, 14 Feb 2025 08:01:42 +0000 ko-KR hourly 1 https://wordpress.org/?v=6.7.1 https://skhynix-prd-data.s3.ap-northeast-2.amazonaws.com/wp-content/uploads/2024/12/ico_favi-150x150.png 챗GPT – SK hynix Newsroom 32 32 [미래를 바꾸는 빅테크 1편] 인간의 뇌를 닮은 ‘초거대 AI’가 바꾸는 세상 (1/5) /big-tech-1-ai/ /big-tech-1-ai/#respond Thu, 27 Apr 2023 15:00:00 +0000 http://localhost:8080/big-tech-1-ai/ 세계가 코로나 팬데믹을 겪으며 인류가 처한 여러 문제를 해결하는 과정에서 혁신적인 기술이 등장하고, 동시에 기술 간의 융합이 빠르게 이루어지며 창의적인 가치들이 창출되고 있다.
이에 초거대 AI에서부터 로봇, 스마트모빌리티, 웹3.0, 메타버스라는 인류의 행복과 평화를 책임질 최신 테크 트렌드를 5편의 시리즈로 소개할 예정이다. 특히 이 칼럼을 통해 얻는 ‘지식’도 중요하지만, 각 기술이 어떻게 연계되고, 어떤 방향으로 발전되고 있는지 ‘흐름’을 읽는 것도 큰 도움이 될 것이다. (필자 주)

2022년 11월 말에 세상에 등장한 챗GPT는 아이폰, 알파고의 등장에 버금가는 충격적인 사건이었다. 챗GPT의 등장으로 ‘초거대 AI’에 대한 관심이 폭증했고, 이로 인해 인류의 삶이 크게 변할 것이라는 전망이 펼쳐졌다. 초거대 AI는 대체 무엇이고, 현재 어느 수준까지 도달했을까? 이에 관해 살펴보고 앞으로의 찾아올 변화에 대해 알아본다.

초거대 AI는 인간의 뇌 구조를 닮은 딥러닝 기반 AI

초거대 AI(Super-Giant AI, Hyperscale AI)는 딥러닝 기법을 쓰는 인공신경망 가운데서도 파라미터(Parameter, 매개변수)가 무수히 많아 스스로 학습·사고·판단할 수 있는 인간의 뇌 구조를 모방한 AI를 의미한다.

초거대 AI란 위 개념을 바탕으로 국내 한 AI 연구원이 만든 용어로, 아직 파라미터의 개수나 사고의 깊이 등 명확한 기준이 규정되지는 않은 상태다. 다만 통상적으로 대용량 연산이 가능한 컴퓨팅 인프라, 딥러닝을 기반으로 대규모 데이터를 스스로 학습하고 사고하며 판단할 수 있는 AI를 가리켜 ‘초거대 AI’라고 부르고 있다.

▲ 인공지능에 쓰이는 머신러닝과 딥러닝의 차이

일반적으로 인공지능은 머신러닝(Machine Learning, 기계학습)과 딥러닝(Deep Learning)으로 구분된다. 머신러닝은 누적된 경험을 통해 컴퓨터가 스스로 학습할 수 있게 하는 알고리즘이다. 처리해야 할 정보를 더 많이 학습하기 위해서는 보통 많은 양의 데이터가 필요하다.

딥러닝은 머신러닝의 개념 중 하나인 인공신경망(Artificial Neural Network, ANN)에서 발전한 형태다. 인공신경망은 뇌의 뉴런과 유사한 정보 입출력 계층을 활용한 것으로, 블랙박스 형태로 데이터를 입력하면 자동으로 복잡한 수학식 모델링이 이뤄지는 기법이다. 네이버의 번역 서비스 ‘파파고’나 구글의 번역 프로그램이 대표적인 예다. 딥러닝은 이러한 인공신경망을 사용한 알고리즘을 통해 데이터를 학습한다. 이 딥러닝 영역에 속하는 것이 초거대 AI다.

딥러닝은 추상적인 정보를 인식하는 능력이 뛰어나다. 머신러닝은 컴퓨터에 입력할 소재를 인간이 먼저 처리해 줘야 했다. 사진 정보 학습을 예로 들면 사람이 먼저 트레이닝 데이터를 분류해 입력하면, 컴퓨터가 데이터에 포함된 특징을 축적·분석해 답을 도출해 내도록 하는 방식이었다. 하지만 딥러닝은 이런 번거로운 작업이 생략된다. 딥러닝 알고리즘이 스스로 분석하고 답을 내기 때문이다.

딥러닝의 이러한 추론 능력 때문에 초거대 AI가 기존 데이터들을 학습해 글을 쓰고 그림을 그리고 음악을 만드는 일이 가능한 것이다. 인간이 어떤 창작 혹은 예술 작업을 할 때, 먼저 이전에 나온 수많은 작품들을 보고 듣고 참고해서 결과물을 만들어 내는 것과 유사한 원리다.

초거대 AI는 대용량 데이터를 학습해 기존 AI보다 더 인간의 뇌에 가깝게 학습 및 판단 능력이 향상된 형태다. 알파고는 바둑 분야에 특화돼 있지만 초거대 AI는 여러 상황에 대해 스스로 학습해 역할을 수행한다. 이를 위해 기존 AI보다 수백 배 이상의 데이터 학습량이 필요하다.

초거대 AI는 어떻게 초대량의 데이터를 학습해 인간의 뇌처럼 스스로 생각할 수 있는 걸까? 답은 인간 뇌의 뉴런 간 정보전달 통로인 시냅스와 유사한 역할을 하는 ‘파라미터’에 달렸다.

초거대 AI의 능력을 결정짓는 파라미터

▲초거대 AI에 쓰이는 인공신경망의 원리

인간의 뇌는 1,000억 개 이상의 뉴런(신경 세포)으로 구성되어 있다. 뉴런은 외부로부터의 자극(여러 입력값들)을 받으면 이를 가중해 합산하고 그 값이 임계값을 넘으면 다음 뉴런에 신호를 전달한다. 각 뉴런들은 100조 개 이상의 시냅스로 연결되어 서로 전기, 화학적 신호를 주고받으면서 정보를 처리한다. 인공 신경은 사람의 뉴런을 모방해 여러 가지 입력값에 가중치를 두고 이를 합친 뒤 그 값이 임계값을 넘어서면 출력한다. 이 인공 신경을 네트워크로 연결한 것이 인공 신경망이다.

초거대 AI는 시냅스와 비슷한 역할을 하는 인공 신경망의 파라미터에 의해 작동한다. 인간의 시냅스는 기억을 담당하고 있는데, 뉴런과의 상호작용으로 기억, 학습, 인지 기능이 나타나게 된다. 평균적으로 인간의 뇌는 100조 개의 시냅스를 가지고 있다. 딥러닝으로 AI를 학습시킨다는 것은 가중치, 즉 파라미터를 찾는 것이다.

예를 들어 고양이를 판별할 때 고양이가 갖고 있는 여러 요인에 어떻게 가중치를 부여해야 가장 정확하게 판단할 수 있을지를 계산해 내는 것이다. 고양이를 정확하게 분류하는 딥러닝 모델을 만들려면 품질이 높은 고양이 이미지와 고양이를 분류하는 요인들이 다양해야 한다. 쉽게 말해 눈과 코의 모양만으로 분류하는 것보다 눈, 코, 입, 귀, 꼬리 등 많은 변수를 고려하는 것이 더 정확하다.

초거대 AI는 파라미터가 많을수록 더 정교한 학습을 할 수 있다. 결국 AI의 기술 발전은 파라미터 수를 얼마나 높일 수 있느냐에 달렸다 해도 과언이 아닐 것이다. 그렇다면 현재 초거대 AI는 어디까지 발전했고 무엇을 할 수 있을까? 이제부터 알아보자.

인류의 난제를 해결하는 초거대 AI

초거대 AI는 인류가 오랫동안 풀지 못한 난제 해결에도 기여할 수 있을 것으로 기대를 모으고 있다. 구글 딥마인드가 개발한 초거대 AI ‘알파폴드2(AlphaFold2)’는 단백질 접힘* 구조를 분석해 많은 이목을 끌었다.

* 단백질 접힘(Protein Folding) : 단백질은 체내에서 고유의 기능을 수행하기 위해 1차원 서열에서 3차원 구조를 형성한다. 단백질을 구성하는 아미노산이 구부러지면서 3차원 입체 구조가 형성되며, 이때 단백질의 특징과 기능이 결정된다. 단백질 접힘 구조를 알 수 있다면 단백질의 역할을 이해하고, 잘못 접힌 단백질로 인해 발생하는 질병의 진단 및 치료에 활용할 수 있다.

지금까지는 과학자들이 X선, 핵자기공명(Nuclear Magnetic Resonance, NMR), 저온전자현미경(Cryo-EM)을 이용하여 단백질 구조들을 밝혀내 단백질 데이터 은행(Protein Data Bank, PDB)을 구축했다. 다만 수개월~수년의 시간이 걸리고 많은 비용이 들어 수억 개의 단백질 중 겨우 18만 개가 넘는 단백질 구조만을 저장할 수 있었다.

▲ 이전 버전의 성과를 크게 뛰어넘은 알파폴드2의 단백질 구조 예측 점수

그런데 단백질 구조 예측 대회(CASP)*에서 알파폴드2는 기존에 30~40점대 수준이었던 단백질 접힘 예측 점수를 90점 수준까지 끌어올렸다. 구조 예측에 걸리는 시간도 수 분에서 수 시간으로 단축했다. 알파폴드2는 단백질 서열이나 구조 중에서도 더 중요한 역할을 하는 곳에 ‘집중’해서 정보를 가져와 정보 처리에 드는 시간을 대폭 단축했다. 알파폴드2의 놀랄만한 성능 덕분에 예측할 수 있는 단백질 수는 획기적으로 증가해 2022년 7월 기준으로 지구상에 알려진 거의 모든 단백질(약 2억 개)의 구조를 예측할 수 있게 되었다.

* 단백질 구조 예측 대회(CASP, Critical Assessment of protein Structure Prediction) : 단백질 구조 예측 알고리즘의 성능을 평가하기 위한 경쟁으로, 미국 국립보건원(NIH)이 후원하는 국제 대회다. 1994년 시작돼 2년마다 개최된다.

이처럼 알파폴드2라는 초거대 AI 덕에 인류는 생명 현상의 메커니즘을 밝혀낼 실마리를 얻었다. 알파폴드2의 성과로 신약 개발 분야에서도 기존에 고치지 못한 질병 치료에 진보가 있을 것으로 기대하고 있다. 미래에 더욱 발전할 초거대 AI로 인류는 질병을 극복하고 더 건강한 생활을 영위할 수 있을 것으로 예측된다.

사람에 가까운 AI 챗봇, 챗GPT의 등장

2022년 11월 말, 챗GPT의 등장은 전 세계에 충격을 안겼다. 챗GPT는 오픈AI가 개발한 GPT-3.5 버전에 해당하는 대화형 AI 서비스로, 이용자와 실시간으로 대화가 가능하다. 이전 버전인 GPT-3의 방대한 데이터 처리 능력을 바탕으로, 기존의 AI 챗봇과 달리 훨씬 자연스러운 대화가 가능해져 많은 이를 놀라게 했다.

챗GPT는 온라인에서 가져온 방대한 양의 텍스트 샘플을 학습하고, 대화형 인터페이스를 통해 정보를 제공한다. 대화를 나누던 도중 맥락에 맞지 않거나, 어색한 회피성 답변을 보이던 기존 챗봇과는 달리, 챗GPT는 실제 인간과 구분할 수 없을 만큼 자연스러운 대화가 가능하다. 간단한 질문뿐만 아니라 어려운 내용을 요약해달라고 요청할 수도 있다. 더 놀라운 점은 스스로 내놓은 답변에 대한 실수를 인정할 뿐만 아니라, 잘못된 전제에 이의를 제기하고 부적절한 요청에 대해서는 답변을 거절한다는 점이다. 예를 들어 차를 훔치는 방법에 대해 물을 경우 “차를 훔치는 것은 심각한 범죄”라고 말하며 답변하지 않는다. 또한 대부분의 AI 챗봇이 이전 대화를 기억하지 않는 반면, 챗GPT는 사용자와 이전에 나눴던 대화를 기억하고 대화에 반영한다.

전문가들이 챗GPT에 흥분하는 이유는 짧은 논문이나 에세이, 노래, 시 등을 작성할 수 있고, 심지어는 코딩 도구로도 활용할 수 있기 때문이다. 또한 한국어로 질문이 가능하고 답변도 한국어로 받을 수 있다. 기존의 AI 챗봇과 대화할 때는 AI가 좀 더 이해하기 쉬운 단어나 문장 등을 고민하며 작성했는데 챗GPT에서는 그런 걱정 없이 정말로 사람과 대화하듯 질문할 수 있게 된 것이다.

직접 사용해 본 결과 초거대 AI에 대한 질문에 개념을 잘 설명해 주었고, 스트레스 해소법을 알려주거나 비 오는 날 들을 만한 음악 추천도 해주었다. 답변을 보면 알겠지만 내용 자체가 엄청 대단하거나 놀랄만한 것은 아니다. 하지만 돌아오는 답변의 자연스러움이 기존의 AI 챗봇과 전혀 달랐다. 게다가 준비된 답변이 아닌 질문을 이해해서 답변을 ‘만들어 내는’, 즉 ‘생성(Generative)’해 낸다는 점이 앞으로의 발전에 기대감을 주는 부분이다.

▲ 챗GPT에게 질문해서 얻은 결과

챗GPT 출시 4개월 만에 깜짝 등장한 GPT-4

세상을 놀라게 한 챗GPT가 출시된 지 4개월 정도 지난 2023년 3월 14일, ‘GPT-4’가 출시됐다. 2023년 상반기 이후에나 출시될 것이라는 예상을 깨고 엄청나게 빠른 속도로 등장한 것이다. GPT-4는 유료 버전인 ‘챗GPT PLUS’에서만 사용 가능하지만, 마이크로소프트의 검색엔진 ‘뉴 빙(New Bing)’에도 탑재되어 꼭 유료 버전을 구입하지 않아도 GPT-4를 체험해 볼 수 있다.

GPT-4는 한 번에 기억할 수 있는 단어 수가 크게 늘었다. 이전 버전인 챗GPT는 최대 약 8,000개의 단어를 입력할 수 있었고, 이는 책 4~5페이지에 해당하는 분량이다. 반면 GPT-4는 약 6만 4,000개의 단어를 입력할 수 있는데, 약 50페이지에 달하는 분량으로 웬만한 단편 소설 한 편과 맞먹는다. 수십 페이지에 달하는 문서도 한 번에 입력해 요약해 달라고 하면 순식간에 요약 정리 해준다.

언어 구사 능력도 향상되었다. 한국어를 포함한 26개 언어에서 70% 이상의 정확도로 이해력이 크게 향상됐다. GPT-4의 처리 가능 영어 단어는 2만 5,000개로 챗GPT의 약 8배로 늘어났다. GPT-4는 말투나 스타일도 변경할 수 있는데, 사용자가 GPT-4에게 해적 스타일로 말해달라고 요청하면 해적의 말투로 답변을 내놓는 식이다.

독창성과 창의성도 강화되었는데, 동화 신데렐라의 줄거리를 A~Z 순으로 각 알파벳을 사용하되 중복되는 단어 없이 요약해달라는 요청에도 완벽하게 요구 사항을 수행해 냈다. 이런 글짓기는 인간도 해내기가 쉽지 않은데 GPT-4는 단시간에 해낸 것이다. 참고로 같은 질문을 구글의 AI 서비스 ‘바드(BARD)’에게 하면 글짓기는 고사하고 질문을 무시한 답변만 나온다.

▲ GPT-4에게 신데렐라의 줄거리 요약을 요청한 결과 / 오픈AI의 자료를 재가공

이미지를 해석할 수 있는 멀티모달 GPT-4

GPT-4의 지능 역시 높아졌다. 특히 전문적인 시험에서 ‘인간 수준의 능력’을 보여줬는데, 미국 모의 변호사 시험에서는 90번째, 대학 입학 자격시험인 SAT 읽기와 수학 시험에서는 각각 93번째와 89번째의 백분위수를 기록했다. 이는 상위 10%에 해당하는 수준으로, 기존 챗GPT는 하위 10% 정도의 점수대를 나타냈다. 하지만 GPT-4에서도 수학 문제 해결 능력은 크게 개선되지 않았다.

GPT-4는 기존 챗GPT에 비해 사실을 기반으로 대답하는 응답 비율이 40% 정도 높아졌다. 인터넷 밈(Meme: 유행하는 콘텐츠)으로도 유명했던 ‘세종대왕 맥북 던짐 사건’*에 대해 GPT-4에게 질문하면 “이 질문은 농담으로 보입니다”라고 답해 어느 정도 허구와 사실을 구별해 답을 내놓을 수 있게 됐다. 하지만 여전히 사회적 편견이나 허구, 적대적 표현과 관련한 문제를 나타낼 수 있기 때문에 GPT-4에서도 ‘할루시네이션(Hallucination: 환각, 거짓 답변 현상)’은 경계할 필요가 있다. 한편, GPT-4의 정보 역시 아직은 기존 챗GPT와 동일하게 2021년 9월까지의 정보를 제공한다.

* 세종대왕 맥북 던짐 사건: 한 네티즌이 챗GPT에게 ‘세종대왕 맥북프로 던짐 사건’에 대해 알려달라 물었고, 이에 챗GPT가 마치 실제 있었던 역사처럼 ‘세종대왕이 한글을 창제하던 중 맥북을 던졌다’고 응답해 인터넷에서 화제가 되었다.

GPT-4에서 가장 눈에 띄는 변화는 텍스트와 이미지를 이해할 수 있는 멀티모달 모델(Multi-Modal: 텍스트, 사진, 음성, 동영상 등 여러 복합 정보를 이해할 수 있는 AI 모델)을 채택했다는 점이다.

텍스트만 인식할 수 있었던 기존 챗GPT와 비교해 사진이나 그림을 인식하는 것은 물론 이미지 속 ‘맥락(Context)’을 이해할 수도 있다. 예를 들어 밀가루와 달걀 사진을 GPT-4에 입력한 뒤 “이 재료로 무슨 음식을 만들 수 있어?”라고 물으면, GPT-4는 “팬케익이나 와플 등 여러 가지 음식을 만드는 것이 가능하다”고 답한다. 또 많은 풍선이 달려있는 그림을 보여주며 “줄을 자르면 어떻게 될까?”라고 물어보면 “하늘로 날아갈 것”이라고 답해 그림 속 상황을 정확히 이해할 뿐만 아니라, 공기보다 가벼운 물체는 떠오른다는 개념까지 포함해 답변했다는 점을 알 수 있다. ‘다람쥐가 카메라를 들고 호두를 찍는 사진’을 GPT-4에게 보여주며 ‘이 그림의 어디가 웃기지?’라고 물으면 GPT-4는 “다람쥐는 호두를 먹지 사진을 찍지 않는데 마치 다람쥐가 사진사처럼 사람 흉내를 내는 부분이 재밌다”라고 유머 섞인 답변도 내놓는다.

‘알잘딱깔센’ 초거대 AI 비서의 등장이 멀지 않았다

앞서 보았듯이 초거대 AI에서 가장 주목할 특징은 바로 ‘생성’, 스스로 컨텐츠를 만들어 낸다는 점이다. 이용자가 AI에게 어떤 것을 만들어 달라고 요구하면, 그 요구에 맞춰서 결과를 만들어 내는 AI를 ‘생성형 AI(Generative AI)’라고 한다.

이는 AI에게 특정 개념을 학습시키는 것이 아니라 데이터 원본을 제공하고 나머지 부분을 예측하도록 유도해 그 과정에서 AI가 추상적인 표현을 배울 수 있도록 하는 모델이다. 주어진 학습 데이터와 유사한 분포를 따르는 데이터를 생성하는 모델이기 때문에, 원본과 유사하지만 완전히 똑같지는 않은, 실존하지는 않지만 있을 법한 새로운 이미지, 비디오, 오디오, 텍스트 또는 코드 등의 창작물을 연속적으로 만들 수 있다.

눈에 띄는 발전을 이룬 것은 이미지 생성 AI다. 실제로 현재 ‘미드저니’, ‘달리 2(DALL-E 2)’, ‘크레용(Craiyon)’ 등 그림을 그려주는 초거대 AI 프로그램으로 누구나 텍스트를 입력하기만 하면 손쉽게 그림을 그릴 수 있는 시대가 되었다.

▲ ‘모네 스타일로 파리에서 비가 오는 날 커피를 마시며 책 읽는 노인’을 그려달라고 미드저니에게 요청해 얻은 그림

‘Generative’, ‘생성’이 갖는 의미는 일일이 AI에게 지시하거나 학습시키지 않아도 알아서 이용자가 요구하는 바를 만드는, ‘이것저것 다 할 수 있는 AI’의 등장할 수 있다는 것이다. 다시 말해 영화 아이언맨에 등장하는 AI 비서 ‘자비스’와 같이 ‘알잘딱깔센(알아서 잘 딱 깔끔하고 센스있게)’ AI가 우리 일상 곳곳에 도입되어 생활을 더욱 편리하게 해줄 수 있다는 얘기다.

2016년 알파고가 등장해 ‘AI가 사람과의 대결에서 이길 수 있다’라는 충격을 줬다면, 챗GPT는 ‘AI가 사람처럼 쓰고 말하고 행동할 수 있다’는 더 큰 충격을 안겨주었다. ‘GPT-4’ 등장과 함께 빅테크들을 비롯한 글로벌 기업들은 초거대 AI에 주목하기 시작했고, 본격적인 경쟁이 시작되었다.

이제 초거대 AI의 남은 과제는 사람들의 신뢰를 얻는 일이다. 가까운 미래의 초거대 AI가 이 문제까지 극복할 수 있다면 인류는 지금껏 경험하지 못한 새로운 AI 세상을 맞이하게 될 것이다.

※ 본 칼럼은 반도체에 관한 인사이트를 제공하는 외부 전문가 칼럼으로, SK하이닉스의 공식 입장과는 다를 수 있습니다.

]]>
/big-tech-1-ai/feed/ 0
“챗GPT로 이것까지 해봤습니다” SK하이닉스와 분야 전문가가 함께한 챗GPT 체험기 /use-evaluate-chatgpt/ /use-evaluate-chatgpt/#respond Wed, 08 Mar 2023 15:00:00 +0000 http://localhost:8080/use-evaluate-chatgpt/ “스마트폰의 등장과 비견할 만한 혁신입니다.”

세상에 스마트폰이 등장했을 때처럼 놀라운 혁신이 등장했다. 챗GPT(Chat Generated Pre-trained Transformer)의 이야기다. 최근 언론을 비롯해 다양한 플랫폼에서 연일 언급되고 있는 챗GPT는 인류의 미래를 변화시킬 핵심 기술이라는 평가를 받고 있다.

뉴스룸은 다양한 분야에 창작 활동을 챗GPT에 입력하고, 그 결과물에 대한 평가를 전문가들에게 들어보는 시간을 가졌다. 지금부터 챗GPT가 만든 시(문학), 시놉시스(영상), 코딩(파이썬)의 사례와 전문가들의 의견을 들어보자.

일상 너머의 언어, 시(詩)

먼저 챗GPT는 과연 어떻게 시를 쓸까? 사람들이 써놓은 시를 학습해 비슷한 형태의 흉내를 내는 수준이었을까? 챗GPT를 활용해 시를 쓰고, 그 수준이 어느 정도인지 확인해 보기 위해 김종훈 고려대학교 국어국문학과 교수에게 평가를 요청했다.

고려대학교, 고려대, 김종훈, 김종훈교수
챗GPT,ChatGPT,인공지능,AI
첏GPT, ChatGPT, 인공지능, AI

Q. 챗GPT가 쓴 시에 대한 전반적인 평가 부탁드립니다.

A. 시를 평가할 때는 다양한 기준이 있지만, 쉽게 이해할 수 있도록 간단한 기준을 정해서 평가를 해봤는데요. 첫 번째로는 이 표현을 독자들도 쉽게 쓸 수 있는 표현이냐, 아니냐를 고려해봤고, 두 번째로는 해당 표현의 필연성이 있는가를 기준으로 평가했습니다.

결론부터 말씀드리면, 기대 이상이었다고 할 수 있을 것 같아요. 저 역시도 시를 보고 ‘괜찮은 표현이다’ ‘일상적이지 않은 표현이다’ 생각이 들었던 부분이 많이 있었거든요. 물론, 우리가 일상에서 사용하는 익숙한 표현, 혹은 특정 낱말을 설명하기 위한 산문적인 요소들이 있어서 아쉬움이 있었지만 그래도 이 정도의 시를 만들었다는 것은 아주 놀라운 일이라고 생각합니다.

Q. 챗GPT에 만들어 달라고 한 시, ‘목련의 이름’을 조금 더 자세히 평가해 주시겠어요?

A. 전체적으로 읽어보고 한 구절, 한 구절 읽어봤는데요. 시의 전체 형태를 봤을 땐, 제법 그 형태를 잘 만드는 것 같았습니다. 특히 입력값인 ‘목련의 이름’과 ‘생일’이라는 주제를 표현하기 위해 상당히 노력했다는 느낌도 들었고요.

한 구절씩 살펴보면 특정 표현은 정말 좋다고 느꼈는데요. 첫 문단에서 ‘힘의 상징, 빛의 광선’ ‘5월 어느 날 태어난 갱신의 시간’과 같은 표현으로 목련(매그놀리아)을 설명하는 것은 상당히 놀라운 부분이었습니다.

특히 두 번째 문단에서 ‘은혜로 충만한 삶의 빛나는 본보기’라는 구절은 이걸 읽고 어떤 삶이 은혜로 충만할 것이며, 어떤 본보기가 될 것인지, 그리고 이 표현에 담긴 의미가 무엇인지를 고민하게 만들기도 했습니다. 이는 독자들에게 아주 중요한 요소인데요. 해당 구절 다음에 오는 표현들은 어떤 표현인지, 무엇을 이야기하고자 하는 지를 상상하고 그려볼 수 있기 때문입니다. 비슷한 맥락으로 마지막 문단과 행의 ‘영원히 선포되는 은혜의 상징’도 상당히 인상적인 표현이라고 생각이 드네요.

물론 지나치게 주제를 설명하려고 한다거나 우리가 일상에서 사용하는 표현들이어서 조금 아쉬운 부분이 있기는 했습니다만, 전반적으로 이해가 안 되는 난해한 표현이나 의미 전달이 되지 않는 형태의 시가 나오지 않은 것만으로도 상당히 유의미한 결과물이지 않나 생각합니다.

Q. 마지막으로, 챗GPT와 같은 인공지능이 시와 같은 문학계에 끼칠 영향에 대해 어떻게 전망하시나요?

A. 저는 개인적으로는 인공지능이 우리의 시를 좀 더 높은 수준으로 끌어올릴 수 있다고 생각하고 있습니다. 인공지능이 발전하면서 문학계에서도 인공지능을 활용하고자 하는 움직임이 더욱 많아지고 있는데요. 실제로도 인공지능이 쓴 시를 모아놓은 시집이 발간되기도 했으며, 인공지능과 시인들이 함께 만든 시를 엮은 시집도 등장한 상황입니다.

인공지능의 발전 속도가 워낙 빨라서 조금 놀랍기는 하지만, 인공지능은 우리가 사용하는 일상 너머의 언어를 표현하는 데 뛰어난 능력이 있는 것 같다는 것입니다. 사람들은 보통 우리가 평소 사용하는 언어의 영역, 그 외연을 뛰어넘기 어려워하거든요. 이는 일상 지각 밖에서 표현을 찾아내는 일이니까요. 하지만 인공지능은 각각의 낱말이 갖는 의미와 낱말의 사용 사례 등을 통해 우리가 생각하지 못한 다양한 표현을 만들어내는 능력이 뛰어나다고 느꼈습니다.

이제 시인들도 이런 인공지능의 능력을 활용해보면 좋지 않을까 생각합니다. 인공지능을 통해 새로운 창의력의 모티브를 얻고 시인들은 이러한 모티브를 잘 다듬어서 본인의 창의력을 더욱 발산하는 것이죠. 또한, 인공지능으로 인해 시인들이 위협을 받게 될 것이라는 지적에 대해 저는 오히려 이러한 위협이 시인들에게 좋은 자극이 될 것으로 생각합니다. 시인들은 이제 시를 쓰면서 더욱 많이 고민하겠죠. ‘인공지능도 쓸 수 있는 수준의 시를 쓸 순 없다’라며 기존에 쓰던 시보다 더욱 훌륭한 시를 쓰지 않을까요?

그리고 이렇게 만들어진 훌륭한 시들이 다시 또, 인공지능의 학습 데이터로 들어가게 되고, 인공지능의 수준이 높아지면, 시인들은 또, 이것을 모티브로 더 훌륭한 시를 만들어 낼 수 있다고 생각합니다.

간단하지만 간단치 않은 이야기, 시놉시스(Synopsis)

두 번째는 전체적인 줄거리를 표현하는 영화 시놉시스를 챗GPT는 과연 어떻게 썼을까? 우리는 최근 메모리 반도체 시장을 주제로 챗GPT에 제작해달라 요청했고, 그 결과물을 영화 제작 전문 업체 ‘스튜디오 N’의 손기선 프로듀서에게 요청했다.

스튜디오N, 손기선, 프로듀서
챗GPT,ChatGPT,인공지능,AI
첏GPT, ChatGPT, 인공지능, AI
챗GPT,ChatGPT,인공지능,AI

▲ 챗GPT가 만든 시놉시스로 만들어 본 이미지 콘티

Q. 챗GPT가 만든 시놉시스, 어떻게 보셨나요?

A. 먼저 저는 이러한 인공지능이 쓴 시놉시스가 평가할 수 있을 정도로 작성됐다는 것 자체가 놀라운데요. 보통 어떠한 이야기의 시작을 살펴보면 인물이 특정 상황에서 어떤 선택을 해야 하는지 고민하는 데서 시작되는 경우가 많거든요. 작가는 인물이 겪을 만한 갈등을 고민하고 이를 이야기로 구성하는 것이죠. 이것은 지금까지는 오직 인간만 가능한 영역이었습니다.

물론 현재 이 결과물로 어떠한 콘텐츠를 만들기에는 아직 부족해 보입니다. 기승전결을 갖추긴 했지만, 캐릭터의 성격이나 사건의 이야기가 쉽게 납득할 수 있는 수준이 아니거든요.

하지만, 챗GPT가 쓴 시놉시스를 보니 머지않아 더욱 발전할 인공지능이 이러한 인간의 영역을 침범할 수도 있겠다는 생각이 들었어요. 좀 더 자세히 설명해 드리자면, 납득하기 어려운 수준이긴 했지만, 챗GPT가 쓴 시놉시스에도 인물의 갈등과 고민, 선택이 존재했으며 이로 인해 사건이 변화하는 등 이야기 자체는 구성이 됐다는 점이 상당히 놀라웠습니다.

Q. 그렇다면, 시놉시스 영역을 챗GPT가 완전히 대체할 수 있을까요?

A. 현재 상황에서는 어려울 수 있습니다. 다만, 지금까지의 발전 속도를 생각해보면 머지않아 정말 사람이 쓴 시놉시스보다 뛰어난 시놉시스가 만들어질 가능성도 있다고 생각합니다.

그리고 인공지능이 쓴 시놉시스의 수준이 빠르게 향상된다면 콘텐츠 업계에서도 굳이 이것을 쓰지 않을 이유는 없다고 생각해요. 결국 더 이상 사람이 시놉시스를 쓰지 않는 날도 올 수 있겠죠. 다만, 살펴봐야 할 것은 챗GPT의 동작 구조입니다. 아무리 챗GPT가 수준 높은 글을 쓰게 되더라도 아무런 주제도, 아무런 키워드도 입력되지 않은 상황에서 시놉시스를 창작하지 않아요. 결국 어떤 키워드를 입력하느냐가 중요해질 것입니다. 결국, 원하는 방향성을 갖춘 시놉시스를 만들도록 하는 일종의 ‘연출’이 사람의 영역이 될 것으로 생각합니다.

언젠가는 챗GPT가 콘텐츠 업계에 혁신을 가져오겠지만, 이런 혁신의 상황에서도 사람들은 어떤 연출을 할 수 있는가, 챗GPT를 얼마나 잘 활용할 수 있는가로 평가받고, 그에 따른 역할을 하게 되지 않을까요?

프로그램이 프로그램을… 코딩하는 ‘챗GPT’

마지막으로 코딩(Coding) 능력을 확인해봤다. 챗GPT의 코드 생성 능력은 빠르고 정확하다는 평가가 있었던 만큼, 실제로 어느 수준인지 확인하기 위해 SK하이닉스 장비/품질분석시스템 김지원 TL에게 챗GPT를 활용한 코딩의 결과물에 대한 평가를 요청했다.

SK하이닉스, 인공지능, AI, 챗GPT, ChatGPT
챗GPT,ChatGPT,인공지능,AI
챗GPT,ChatGPT,인공지능,AI
챗GPT,ChatGPT,인공지능,AI
챗GPT,ChatGPT,인공지능,AI

Q. 챗GPT에 간단한 코딩부터 다소 복잡한 코딩까지 입력하셨는데요. 전반적인 평가를 부탁드립니다.

A. 상당히 놀라운 결과를 얻을 수 있었습니다. 천지가 개벽한다는 표현이라면 적절할 것 같은데요. 현재 챗GPT의 코딩 능력을 보고 있자니, 언젠가는 사람이 직접 프로그램을 만들지 않아도 될 날이 올 수도 있겠구나 싶네요. 해외의 한 스타트업 CEO가 언급한 ‘프로그래밍의 종말(The End of Programming)’이라는 표현이 정말 공감되는 수준이었습니다.

특히 저는 ‘자연어 입력 → 프로그램 코드’로 연결되는 진정한 의미의 노코드 툴(No-code Tool)*이 챗GPT를 통해 탄생한 것이 아닐까 싶을 정도로 감탄했습니다. 단순히 코드만 생성해주는 것이 아니라 코드에 대한 설명과 결괏값 예시까지 보여주기 때문에 더욱 놀라운 수준인 것이죠. 저는 프로그래밍은 결국 개발자가 원하는 결과를 얻기 위해 컴퓨터와 대화하는 과정이라고 생각하는데요. 컴퓨터와의 대화 수단으로 사용돼 왔던 것이 과거 ‘0101…’로 만들어지는 이진법으로 시작해 C언어, 파이썬과 같은 프로그래밍 언어를 넘어, 이제는 ‘자연어’가 활용되고 있는 것처럼 느껴졌습니다.

* 노코드 툴(No-code Tool) : 코딩을 모르는 비(非) 개발자, 일반인도 간단히 개발을 할 수 있게 도와주는 도구. 코딩을 최소화, 간소화해 일반인도 개발자와 유사한 수준의 개발이 가능하게 만들어준다.

Q. 현재 챗GPT의 코딩 능력은 어느 정도 수준인가요?

A. 위에서 보여드린 것처럼 간단한 입출력을 갖는 기능의 프로그램이나 널리 알려진 알고리즘 정도는 지금의 챗GPT로도 충분히 처리가 가능한 수준입니다. 챗GPT의 코딩 능력을 더 자세히 살펴보기 위해 유명 코딩 문제은행에서 구분하는 0~5단계의 난이도 별 문제들을 활용해 테스트해보니 현재 챗GPT의 코딩 수준은 2단계(한글 입력 기준) 정도인데요. 실제 IT 기업들이 개발자를 뽑을 때 진행하는 코딩 면접의 문제가 1~4단계 수준인 것을 감안하면 단 몇 초 만에 2단계 수준의 결과물을 만드는 것은 상당한 수준이죠. 더 놀라운 점은 챗GPT가 생성할 수 있는 프로그래밍 언어가 수십 개 이상*이라는 점입니다. 효율성 측면에서는 그야말로 압도적이라고 볼 수 있을 것 같습니다.

* 챗GPT로 생성할 수 있는 프로그래밍 언어 리스트 : C, Python, JAVA, JavaScript, PHP, Ruby, Swift, Kotlin, Rust, Go, Perl, Lua, TypeScript, Scala, Dart, Julia, Shell script, R, MATLAB, SAS, Visual Basic, COBOL, FORTRAN, Lisp, Prolog 등

특히 프로그래밍을 하다 보면 요구사항이 변경되기도 하고, 예외 처리를 추가해야 하거나 성능을 개선해야 하는 등 다양한 변화가 반복적으로 필요한데요. 이러한 변화를 시도하는 과정에서도 챗GPT는 과거에 입력했던 내용들을 잊지 않고 새롭게 생성하는 코드에도 적용해 주는 것이 정말 인상적이었습니다.

Q. 챗GPT에서 다소 아쉬웠던 점이나 개선이 필요한 점은 무엇이 있었나요?

A. 현재 챗GPT를 포함한 생성형 인공지능(Generative AI) 기반의 모든 대규모 언어 모델에는 몇 가지 해결해야 할 문제가 있는데요. 그중 가장 큰 문제는 ‘할루시네이션*’ 에러가 발생한다는 것입니다. 이러한 할루시네이션 현상은 인공지능 모델이 내는 결과가 확률(0~100%)에 기반하기 때문인데요. 사실관계의 확인보다는 다음에 오는 결과의 확률이 얼마나 높은가를 기준으로 하므로 사실관계와 달라도 이것을 사실인 것처럼 표현하는 것이죠.

이와 함께 ‘표절과 저작권’이라는 윤리 문제나, 현재 수준에서 한국어에 대한 부족한 지원과 같은 문제들은 아직도 해결이 필요한 상황입니다. 위에서 언급한 문제들은 아직 뾰족한 해결책이 없어서 아직은 더 지켜봐야 한다는 것이 저의 개인적인 생각입니다. 물론, 압도적으로 빠른 속도와 다양한 프로그래밍 언어를 지원한다는 점을 고려해본다면 확실히 엄청난 성능인 것은 분명하고요.

* 할루시네이션(Hallucinations, 환각) 에러 : 생성형 인공지능이 모르는 것을 그럴듯한 표현으로 아는 척하는 현상

Q. 더욱 발전된 챗GPT가 프로그래밍 분야에 끼칠 영향에 대해서 전망해주신다면?

A. 사실 이러한 혁신과 변화가 챗GPT가 처음은 아닙니다. 앞서 말씀드렸던 노코드 툴의 경우에도 몇 년 전부터 이미 유행하고 있고, 챗GPT의 이전 모델인 GPT-3를 활용한 코드 생성 인공지능도 이미 선보여진 바 있죠. 이외에도 구글(알파코드)이나 마이크로소프트(코덱스), 네이버(클로바스튜디오) 등에서도 인공지능을 활용한 프로그래밍 서비스를 제공하고 있습니다.

저는 이러한 변화가 긍정적으로 작용할 것으로 생각하는데요. 개발자들은 끝없는 반복 작업에 고생하지 않아도 될 것이며, 무한한 모방과 학습을 통해 얻어지는 이러한 창의성으로 혁신을 만들 수 있을 것입니다. 물론, 인공지능 기술이 더욱 발전함에 따라 향후에는 단순한 프로그래머보다는 인공지능과 잘 소통할 수 있는 인공지능 프롬프트 엔지니어(AI Prompt Engineer)가 더 주목받을 수도 있겠죠.

국내 기업도 챗GPT 서비스에서 ‘두각’

지금까지 세 가지 사례를 통해 챗GPT의 수준과 향후 성장성을 살펴보았다. 이러한 챗GPT의 뛰어난 성능을 적극 활용하는 국내 기업들도 있다. SK텔레콤은 챗GPT 기반의 인공지능 대화 서비스 에이닷(A.)을 통해 최적화된 인공지능 서비스를 제공하고 있다. 특히, 에이닷을 위해 자체 기술로 제작한 슈퍼컴퓨터 타이탄(TITAN)을 구축하기도 했다. 에이닷 서비스를 담당하는 김승식 SK텔레콤 GLM모델링팀 매니저는 “챗GPT가 자연어 처리 분야에서 큰 주목을 받고 있는데, 에이닷은 자연어 처리 능력에 더해 한국어에 특화된 모델인 점이 강점이다”라며 “한국어 학습에 있어서는 더 높은 이해력과 활용도를 기대할 수 있을 것”이라고 밝히기도 했다.

SK텔레콤, 에이닷, 타이탄

Q. 최근 뜨거운 관심을 받고 있는 챗GPT 기반의 인공지능 서비스 ‘에이닷’에 대한 간단한 설명 부탁드립니다.

A. 에이닷은 GPT-3 모델을 기반으로 하는 인공지능 대화 서비스인데요. 일상 대화 형식의 사용자 인터페이스를 통해 사용자와 인공지능의 자연스러운 대화를 이어갈 수 있습니다. 모델에 학습된 다양한 분야의 지식과 정보를 전달할 뿐 아니라 사용자 맞춤형 서비스로 원하는 콘텐츠를 제공하기도 합니다.

저희 에이닷은 ‘사용자 교감을 통해 성장하며 진화하는 서비스’를 지향하고 있는데요. 사용자와 높은 수준의 ‘지식 대화’, 친구와 대화하는 듯한 ‘감성 대화’ 사용자가 원하는 서비스를 더 쉽게 제공할 수 있도록 하는 ‘목적 대화’에 집중하고 있습니다.

SKT,SK텔레콤, 에이닷, A., 인공지능, AI

슈퍼컴퓨터 타이탄(TITAN)의 실제 모습(출처 : SK텔레콤)

Q. 인공지능 서비스를 위해 구축한 ‘타이탄’에 대해서도 자세히 설명해 주시겠어요?

A. 네. 앞서 말씀드린 대로 타이탄은 에이닷을 위해 구축한 슈퍼컴퓨터인데요. 국내에서 가장 강력한 GPU 기반의 슈퍼컴퓨터로 하드웨어와 소프트웨어 측면에서 봤을 때 과학 기술 연산에 초점이 맞춰진 그동안의 슈퍼컴퓨터와 다르게 인공지능 구동에 최적화된 슈퍼컴퓨터로 이해하시면 될 것 같습니다. 특히, 저희 SK텔레콤 자체 기술로 만든 슈퍼컴퓨터이기 때문에 추후 개발에 따른 인공지능의 변화에 발 빠르게 대응할 수 있다는 장점이 있습니다.

에이닷이 거대 언어 모델에 기반을 둔 서비스이기 때문에 모델을 학습하기 위해 대량의 GPU 리소스를 필요로 하는데요. 이 때문에 타이탄에서는 1,040개의 NVIDIA A100 80G 제품을 사용하고 있습니다. 해당 제품에는 SK하이닉스의 HBM2E가 적용돼 있는데요. HBM2E는 초당 2테라바이트(TB) 이상의 메모리 대역폭 제공을 통해 더 빠른 데이터 처리를 돕고 있습니다. 이는 용량뿐 아니라 대역폭 측면에서도 국내에 구축된 슈퍼컴퓨터 중 가장 뛰어난 수준입니다.

결국 ‘인공지능 반도체’가 핵심

결국 수많은 인공지능을 제대로 구현하기 위해선 반도체가 꼭 필요하다. 인공지능은 엄청난 양의 데이터를 최대한 빠르고 효율적으로 처리해야 하는데, 이러한 데이터 처리는 메모리 칩과 같은 하드웨어에서 담당하고 있기 때문이다.

그렇다면 인공지능을 구현하는 과정에서 반도체는 어떤 역할을 하게 될까? 인공지능과 반도체의 상관관계를 SK하이닉스의 제품을 기준으로 살펴보도록 하자.

SK하이닉스에서 생산하는 많은 반도체 중에서도 ‘인공지능 반도체’로 주목받고 있는 것은 HBM과 PIM이다. 이 두 반도체가 무엇인지 살펴보고, 인공지능을 구현하기 위해 어떤 역할을 하는지 알아보기 위해 SK하이닉스 이현배 TL(HBM기술전략)과 장택완 TL(Solution AT)과의 미니 인터뷰를 준비했다.

SK하이닉스, 인공지능, 반도체, 인공지능반도체

Q. 최근 챗GPT 등 인공지능이 높은 관심을 받으면서 PIM과 HBM 등 이른바 ‘인공지능 반도체’라 불리는 제품들이 주목받고 있는데요. 각각 해당 제품에 대해서 간단히 설명해주세요.

장택완 TL 지능형 메모리라고도 불리는 PIM(Processor-In-Memory)은 CPU에서 수행하는 연산 작업의 일부를 메모리에서 직접 수행할 수 있도록 만든 제품인데요. 엄청난 양의 데이터를 처리해야 하는 인공지능 컴퓨팅 과정에서 데이터 이동 간 발생하는 병목현상을 제거하는 데 아주 효과적인 제품입니다.

특히 PIM은 메모리에서 CPU로 데이터가 이동하는 것을 줄여, 컴퓨터의 전력 소모도 줄일 수 있는 제품이기도 합니다. 2022년 2월 저희 SK하이닉스가 개발한 PIM 제품인 GDDR6-AiM은 메모리 사용이 많이 필요한 연산에서 최대 16배 빠른 속도를 낼 수 있으며, 전력 소모 역시 80% 절감할 수 있습니다.

이현배 TL 여러 개의 DRAM Core를 TSV(Through Si Via, 실리콘 관통 전극) 적층이라는 고도의 기술로 구현한 것이 HBM(High Bandwidth Memory)인데요. 일반적인 DRAM보다 압도적으로 높은 성능의 제품이라고 생각하시면 좋을 것 같습니다. 챗 GPT와 같은 인공지능은 GPU(Graphic Process Unit) 등을 통해 아주 방대한 양의 데이터를 복잡한 연산을 통해 처리하는데요. 여기서 이런 방대한 양의 데이터를 일시적으로 처리할 수 있는 고효율/고성능 메모리인 것이죠.

더 많은 데이터를 더 빠르게 처리하는 과정에 가장 큰 문제는 데이터 이동 간 발생하는 병목현상인데요. HBM은 더 빠른 동작 속도를 자랑하면서도 고대역폭을 제공함으로써 더 많은 데이터가 동시에 이동할 수 있도록 하고 있습니다. 인공지능을 구현하기 위해 최적의 제품입니다.

Q. ‘인공지능 반도체’의 미래는 무엇이라고 생각하시나요?

장택완 TL 미래의 초거대 인공지능 모델에서는 학습뿐만 아니라 ‘추론’ 과정도 상당히 중요합니다. 추론 과정에서 메모리 접근이 빈번하게 발생하기 때문에 결국, 메모리 자체에서 연산이 가능한 PIM은 뛰어난 성능을 보일 수밖에 없죠. 결국 PIM과 같은 인공지능 반도체는 필수 요소이고 그 필요 수량은 지속 성장한다고 말할 수 있습니다.

Q. 챗GPT와 같은 인공지능의 열풍이 반도체 업계에 끼치는 영향은 무엇이 있을까요?

이현배 TL 우리 인류는 지속해 방대한 양의 데이터를 효과적으로 처리하고자 하는 니즈가 있었습니다. 방대한 데이터를 학습해 구현에 성공한 지금의 인공지능이 이러한 니즈를 방증하는 결과물이기도 하죠. 결국 더 많은 데이터를 생성하고, 처리하기 위해 메모리 반도체에 대한 수요는 더욱 늘어날 것으로 생각합니다.

]]>
/use-evaluate-chatgpt/feed/ 0