GPT-4 출시 | ChatGPT 달라진 점, GPT-3.5와 GPT-4 차이점

인사이트

GPT-4 출시 | ChatGPT 달라진 점, GPT-3.5와 GPT-4 차이점

2023년 03월 21일

ChatGPT(챗지피티)로 전 세계에 ‘생성형 인공지능(AI)’ 열풍을 일으킨 미국의 AI 연구재단 OpenAI(오픈에이아이)가 지난 3월 14일(현지 시간) GPT-4를 공개했습니다. GPT-4는 기존 ChatGPT의 업그레이드 버전으로, OpenAI는 인공지능 성능을 더욱 강화했다고 발표했죠.

OpenAI의 GPT-4 소개페이지

GPT-4란?

GPT란 ‘Generative Pre-trained Transformer’의 약자로 OpenAI가 개발한 인공지능 모델입니다. 특히 GPT는 자연어 처리를 위한 인공지능 모델로, 방대한 데이터를 머신러닝으로 ‘미리 학습(Pre-trained)’해 이를 문장으로 ‘생성(Generative)’합니다.

GPT 기술로 인공지능 챗봇 ChatGPT가 작동하는데요. 따라서 ChatGPT 사용자가 채팅 하듯 질문을 입력하면 ChatGPT는 학습한 데이터를 기반으로 ‘사람처럼 문장으로 답변’을 해줄 수 있는 것이죠.

2022년 11월, GPT-3.5 버전을 기반으로 만들어진 ChatGPT가 처음 출시되었습니다. 그리고 최근 GPT-4 버전으로 업그레이드된 것이고요. GPT-4는 현재 ChatGPT 유료 상품인 ‘ChatGPT 플러스’를 통해 사용 가능합니다.

GPT-3.5와 GPT-4 차이점

GPT가 어떤 기술인지 이해되셨나요? 그럼 이제부터 GPT-4가 이전 버전인 GPT-3.5와 비교해 무엇이 달라졌는지 자세히 알아보겠습니다.

1. 멀티 모달 도입

GPT-4의 가장 눈에 띄는 개선점은 이미지를 인식한다는 것입니다. GPT-4의 멀티 모달(multimodal) 기능으로 이미지를 인식・이해하고 처리할 수 있게 됐죠. 멀티 모달이란 다양한 종류의 데이터를 처리하고 이해할 수 있는 기능인데요. GPT-4는 이미지를 인식하고 해당 이미지에 관한 텍스트 정보를 생성할 수 있다고 합니다.

GPT-4 Technical Report

그리고 GPT-4가 표면적인 부분 외에 속뜻을 읽어야 하는 밈 이미지도 이해한다고 했죠.

GPT-4 Technical Report

또 OpenAI 회장 겸 공동 창립자인 그렉 브로크만(Greg Brockman)은 자신의 트위터에서 GPT-4를 통해 손으로 그린 웹사이트 스케치를 HTML 소스로 바꿔 실제 웹사이트를 구현한 이미지를 공유하기도 했습니다.

해당 기능은 아직 ChatGPT에 적용되지 않아 아쉬운데요. 공개된다면 무한한 가능성이 열릴 것 같아 빨리 사용할 날이 기다려집니다.

2. 지능과 지식 향상

GPT-4의 가장 큰 특징 중 하나는 더욱 정교한 언어 이해와 처리 능력을 가지게 된 것입니다. 이전 모델 GPT-3.5에서는 한 번에 영어 기준 3,000개 정도 단어를 처리 수 있었다면, GPT-4는 25,000개까지 가능합니다. 기억력도 좋아져 GPT-3.5에서 약 8,000개 단어(책 4~5페이지, 토큰 4,096개)를 기억해 대화를 나눴다면, GPT-4는 그 8배인 단편 소설 분량에 버금가는 64,000개 단어(책 50페이지, 토큰 32,768개)까지 기억해 사용자 질문에 더 적합하게 대답하는 것이죠.

GPT-3.5와 GPT-4 답변 비교

GPT-4는 미국 변호사 시험(Uniform Bar Exam)에서 298점(400점 만점)을 받아 상위 10%로 통과했는데요. 하위 10% 점수인 213점을 받는 데 그쳤던 GPT-3.5와 비교해 성능이 대폭 향상된 것을 알 수 있습니다.

외국어 이해력 기능도 크게 향상되어 한글로 ChatGPT를 사용하는 것도 훨씬 수월해졌는데요. OpenAI의 MMLU(Massive Multitask Language Understanding, 대규모 다중 작업 언어 이해) 벤치마크 테스트 결과, 한국어를 포함한 총 24개 언어 이해 성능이 GPT-3.5의 영어 이해 성능 70.1% 보다 더 좋아진 것을 확인할 수 있습니다.

GPT-4 Technical Report

GPT-4 한계

1. 여전한 오류 가능성

GPT-4가 여러 면에서 향상됐지만 인공지능으로서의 한계는 여전합니다. 인공지능의 대표적인 허점인 할루시네이션(Hallucination, 환각) 등 잠재적 위험에 대한 문제가 완전히 해결되지는 않은 것이죠. 할루시네이션은 인공지능이 오류가 있는 데이터를 학습해 틀린 답변을 맞는 말처럼 제시하는 현상입니다.

OpenAI는 이번에 발표된 GPT-4는 내부 평가를 통해 GPT-3.5보다 사실에 근거한 정보를 응답할 가능성이 40% 높아졌고, 위험요소 등 허용되지 않는 질문에 응답할 가능성은 82% 낮아졌다고 밝혔는데요.

그럼에도 OpenAI CEO 샘 알트만(Sam Altman)은 지난 17일 ABC 뉴스와의 인터뷰에서 “사람들에게 가장 주의를 주려고 하는 것은 할루시네이션 문제”라며 ChatGPT에 너무 많이 의존하고, ChatGPT의 답변을 확인하지 않는 점에 대해 경각심을 일깨우기도 했습니다.

ABC 뉴스와 인터뷰 중인 OpenAI CEO 샘 알트만
“The thing that I try to caution people the most is what we call the hallucinations problem.”

2. 폐쇄적인 GPT-4 기술 보고서

하지만 GPT-4 기술 보고서에서 모델의 크기, 학습 데이터, 학습 방법 등 초거대 AI 모델을 개발하는 데 필요한 핵심 정보는 보이지 않습니다. 엔진을 이루는 부품들은 사용할 수 있지만, 엔진을 만드는 기술은 숨겨둔 셈이죠.

OpenAI의 이러한 행보에 초거대 AI 모델 개발 경쟁이 치열해지면서 창립 초기 비전과 다르게 기술 독점으로 전략을 바꾼 것이 아니냐는 비판이 이어지고 있습니다. 개방과 공유를 강조하며 2015년 비영리 회사로 출범한 OpenAI는 ‘인류 모두를 위한 AI 개발’을 목표로 내걸고 기술 협력에 나섰기 때문입니다.

GPT-4 기술보고서에 핵심 연구 내용이 없음을 비판한 LightningAI의 CEO 윌리엄 팔콘의 트위터

GPT-4를 경험하고 싶다면,
Bing Chat

Bing Chat을 통해 AI에 기반한 검색을 손쉽게 할 수 있는데요. 21년 이후 데이터의 경우에는 ChatGPT와 달리 웹 검색 결과를 토대로 응답하며, 검색 결과에 실시간으로 참고한 출처를 알려줘 답변을 재확인할 수 있도록 돕습니다. 검색 결과를 바탕으로 더욱 자세한 결과를 알아보기 위한 추가 추천 검색도 제안해 주는데요. 이런 부분은 답변을 더욱 신뢰할 수 있는 요소가 되기도 하죠.

검색 답변 모델을 3가지(창작, 균형 잡힘, 정확함)로 구분해서 적용이 가능합니다. 동일한 프롬프트여도 선택한 모델에 따라서 검색 결과가 달라질 수 있습니다.

최근 대한상공회의소의 조사에 따르면 대한민국 국민 3명 중 1명이 ChatGPT를 사용해 본 적이 있는 것으로 나타났습니다. 미래 유망 산업으로 손꼽히는 인공지능, ChatGPT 열풍으로 전 세계적으로 경쟁과 발전이 더욱 가속화됐는데요. 하루가 다르게 사용자는 점점 많아지고, 발전하는 속도도 빨라지면서 ChatGPT에 대한 우려도 잇따릅니다.

GPT-4가 완벽하게 적용된 ChatGPT와 GPT-5도 벌써 기대되는데요. 인공지능에 무한한 가능성이 있는 만큼 아직은 ‘완벽’보다는 ‘과정’에 있다는 경각심을 갖고 사용할 때, 인공지능이 발전에 한 축이 될 수 있을 것 같습니다.

글・편집 최인성 Content Manager
원고 검수 노원재 Growth Manager (인공지능(AI) 부트캠프)


🧑‍💻 이론 학습부터 실전, 취업까지
확실한 IT 커리어의 시작

목록 보기

추천글