5단 분석법
순서 | 분석 | 단어 | 내용 |
1 | 일반 명사 | Chat | 담소, 이야기 |
GPT | - | ||
ChatGPT | - | ||
2 | 고유 명사 | Chat | 컴퓨터 통신에서, 키보드로 문자를 입력하는 방법으로 통신망상에서 실시간의 대화를 나누는 필담(筆談) 형식의 대화. |
GPT | Generative pre-trained transformer
(사전 학습된 생성형 변환기) | ||
ChatGPT | 데이터를 사전 학습하여 문장을 생성해주는 대화형 챗봇 | ||
3 | 사용 이유 | ChatGPT | 잘 모르는 내용에 대해서 실시간으로 질문을 하고 사용자가 원하는 문장을 만들기 위해서 |
4 | 사용 방법 | ChatGPT | 사용자가 질문이나 요청을 입력하고, AI가 제공하는 응답을 받음 |
5 | 다른 기술과의 비교 | ChatGPT | - |
ChatGPT의 정의
ChatGPT는 Chat + GPT 로 이루어진 합성어 입니다.
일반 명사
Chat | 담소, 이야기 |
Chat의 일반 명사는 “담소, 이야기” 입니다.
그렇다면 고유 명사는 무엇일까요?
고유 명사
Chat | 컴퓨터 통신에서, 키보드로 문자를 입력하는 방법으로 통신망상에서 실시간의 대화를 나누는 필담(筆談) 형식의 대화 |
GPT | Generative pre-trained transformer(사전 학습된 생성형 변환기) |
ChatGPT | 데이터를 사전 학습하여 문장을 생성해주는 대화형 챗봇 |
Chat의 고유 명사는 “컴퓨터 통신에서, 키보드로 문자를 입력하는 방법으로 통신망상에서 실시간의 대화를 나누는 필담(筆談) 형식의 대화”이고,
GPT의 고유 명사는 “Generative pre-trained transformer (사전 학습된 생성형 변환기)” 입니다.
즉, ChatGPT는 “데이터를 사전 학습하여 문장을 생성해주는 대화형 챗봇” 입니다.
ChatGPT는 OpenAI가 개발한 대화형 언어 모델인 GPT를 채팅 방식으로 사용할 수 있게끔 만든 서비스 입니다.
ChatGPT는 Chat + GPT 로 이루어진 서비스명 입니다.
GPT는 인공지능 모델이고, GPT를 자연스러운 대화를 통해 사용자의 질문에 답변하고 대화를 이어나갈 수 있게끔 서비스를 만든 것이 ChatGPT인 것입니다.
ChatGPT를 사용해서 대화를 하고 있는 것을 캡처한 이미지
위 이미지와 같이 대화를 하는 것처럼 GPT 모델을 사용할 수 있는 서비스가 ChatGPT 입니다.
사용자가 질문을 하면, 인공지능 GPT는 그에 맞는 대답을 출력해서 질문을 해결해주는 서비스입니다.
그렇다면, ChatGPT를 왜 사용해야할까요?
사용해야하는 이유
ChatGPT | 잘 모르는 내용에 대해서 실시간으로 질문을 하고 사용자가 원하는 문장을 만들기 위해서 |
ChatGPT를 사용하는 이유는 “잘 모르는 내용에 대해서 실시간으로 질문을 하고 사용자가 원하는 문장을 만들기 위해서” 입니다.
광범위한 접근성
ChatGPT는 다양한 데이터를 학습한 인공지능 모델이기 때문에 거의 모든 주제에 대한 정보를 제공할 수 있습니다. 사용자가 궁금한 점이 있을 때 시간을 들여 검색할 필요 없이, ChatGPT에게 질문을 하면 답변을 빠르게 얻을 수 있습니다.
사용자가 특정 재료를 사용한 요리법을 찾고 있을 때, ChatGPT에게 재료 목록을 제공하고 요리법을 질문할 수 있습니다.
사용자는 답변으로 새로운 요리 아이디어를 얻고, 가지고 있는 재료로 다양한 요리를 시도해볼 수 있습니다.
실시간 정보 제공
ChatGPT는 실시간으로 질문과 답변이 가능하기 때문에, 사용자가 필요한 정보와 도움을 실시간으로 받을 수 있습니다.
사용자가 특정 도시로 여행을 하고 있는 중에, 그 지역의 추천 관광지 또는 음식점 등에 대해 정보를 얻기 위해서 ChatGPT를 사용할 수 있습니다.
이 경우, 사용자는 큰 노력을 하지 않아도 양질의 여행 계획을 세울 수 있습니다.
맞춤형 답변
ChatGPT는 사용자의 질문에 맞춰 상세하고 개인화된 답변을 제공할 수 있습니다.
이는 학습이나 정보 탐색 과정에 있어 매우 유용합니다. 사용자는 자신이 필요한 내용에 따라 정보를 요청하고ChatGPT는 내용에 맞춰 최적화된 답변을 하게 됩니다.
사용자가 새로운 언어를 배우면서 발음, 어휘, 문법 등을 질문하면 ChatGPT는 해당 언어의 기본적 규칙부터 복잡한 문법 설명까지도 답변할 수 있습니다.
이를 통해 사용자는 언어 학습 정보를 빠르게 습득하여 실력을 빠르게 향상시킬 수 있습니다.
사용 방법
ChatGPT | 사용자가 질문이나 요청을 입력하고, AI가 제공하는 응답을 받음 |
ChatGPT 사용 방법은 “사용자가 질문이나 요청을 입력하고, AI가 제공하는 응답을 받음” 입니다.
ChatGPT는 대화형 인터페이스가 적용된 서비스입니다.
즉, 우리가 평소에 SNS를 사용하면서 서로 텍스트를 입력하고 답변을 받은 것처럼 사용하면 됩니다.
메인 페이지 접속
ChatGPT 메인 페이지, 24.02.07 기준
ChatGPT 페이지에 접속하고 Sign up 버튼을 눌러 회원가입을 진행합니다.
회원가입 방법 선택 / 이메일 입력
회원가입 페이지, 이메일 입력
구글, MS, 애플계정을 사용하여 소셜 회원가입을 진행하셔도 되고 이메일 주소를 사용해서 진행하셔도 무관합니다. 본 교재에서는 이메일 주소를 기입하여 가입하는 방법으로 진행하도록 하겠습니다.
이메일 주소를 작성하고 계속 버튼을 눌러줍니다.
비밀번호 설정
회원가입 페이지, 비밀번호 입력
사용할 비밀번호를 입력한 뒤 계속 버튼을 누릅니다.
이메일 인증
메일함, 인증메일 확인
메일함, 이메일 인증
자신이 사용한 이메일 계정의 메일함으로 이동하여 이메일 인증을 진행합니다.
메일함에서 OpenAI로 부터 도착한 메일을 확인하고 Verify email address 버튼을 눌러 인증합니다.
정보 입력
회원가입 페이지, 정보 입력
본인의 이름 전체와 생일을 입력합니다. 이름은 영문으로 입력하는 것을 권장합니다. 그다음 Agree 버튼을 눌러줍니다.
회원가입 완료
회원가입 완료
위와 같은 페이지로 이동되면 ChatGPT 회원가입이 모두 완료된 것입니다.
ChatGPT 사용
ChatGPT를 사용해서 질문하고 답변을 받는 것을 캡쳐한 이미지
GPT에게 질문하고 싶은 것을 생각해 질문하고 답변을 받으면 됩니다.
GPT의 특징
환각 현상 (Hallucination)
ChatGPT는 사용자의 질문에 대해서 어떻게든 답변을 내야합니다.
이 과정에서 환각 현상이 일어날 수 있습니다. 환각 현상은 사용자의 질문에 대해서 잘못된 내용을 답변하는 현상을 뜻 합니다.
예를 들어, 3 + 3 의 답을 물어봤는데 갑자기 ABC 라는 답변을 한다면 이는 환각 현상이 발생한 것입니다.
[이미지] 세종대왕 맥북프로 던짐 사건을 표현할 수 있는 이미지
제일 유명한 사례로는 세종대왕 맥북프로 던짐 사건이 있습니다.
ChatGPT에게 ‘조선왕조실록에 기록 된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘’ 라고 물어봤는데 정말로 조선왕조실록에 해당 사건이 기록된 것처럼 답변하는 것을 볼 수 있습니다.
이러한 현상이 대표적인 환각 현상이라고 할 수 있습니다.
GPT 모델은 학습된 데이터에 기반해서 답변을 찾아내기 때문에 환각 현상이 발생하게 됩니다.
그렇기에 “ChatGPT를 통해서 얻은 정보가 무조건 옳다.” 라고 생각하면 안되고 내가 모르는 부분에 있어서는 2번, 3번 검증을 해보는 과정이 꼭 필요합니다.
토큰
GPT는 기본적으로 사용자가 입력한 질문을 기반으로 토큰(token)을 생성합니다.
순서 | 분석 | 단어 | 내용 |
1 | 일반 명사 | 토큰 | 돈을 대신할 수 있는 동전 모양 주조물 |
2 | 고유 명사 | 토큰 | 사용자로부터 입력된 텍스트를 더 작은 단위로 분리한 것 |
3 | 사용 이유 | 토큰 | 자연어 텍스트를 모델이 처리할 수 있는 고정된 크기의 숫자로 바꾸기 위해서 |
4 | 사용 방법 | 토큰 | 텍스트를 미리 정의된 규칙에 따라 작은 단위로 나누고, 이를 모델이 이해할 수 있는 숫자 형태로 변환함 |
5 | 다른 기술과의 비교 | 토큰 | - |
I want to learn 이라는 문장이 있다면 우리는 이 문장 전체를 보며 문장이 뜻이 무엇인지 이해할 수 있습니다. 하지만 GPT는 사람이 이해하는 방법과는 다른 방식으로 이해를 합니다.
I | want | to | learn |
GPT는 위처럼 이해를 한다라고 생각하면 됩니다. 하지만 위는 예제일 뿐이고, 실제로 GPT는 사람이 이해할 수 없는 방식으로 토큰을 쪼개서 인식합니다.
OpenAI의 Tokenizer를 사용해서 토큰 수를 파악
이를 실질적으로 파악해보고 싶다면 OpenAI Platform에서 제공하는 툴인 ‘Tokenizer’와 같은 툴을 사용하면 내가 사용하는 프롬프트가 몇 개의 토큰으로 이루어져있는지 수치로 확인해볼 수 있습니다.
실제로 사용해봤을 때 ‘I want to learn’ 은 4토큰으로 계산된 것을 알 수 있습니다.
영어의 경우 간단한 문장을 4토큰으로 나눈다고 가정하면 한국어의 경우는 6~7토큰으로 나눈다고 합니다.
한국어는 자소 단위로 토큰을 나누는 경우도 있고, 한글은 영어와 비교했을 때 더 많은 자음과 모음으로 나뉘기 때문입니다.
GPT는 확률 예측 엔진입니다.
ChatGPT는 확률 예측 엔진을 채팅처럼 사용할 수 있게 만든 서비스입니다.
확률 예측이라는 것은 A라는 단어 다음에 올 확률이 가장 높은 단어를 뒤에 가져오고, 그 단어 뒤에 올 확률이 가장 높은 단어를 가져오는 방식으로 문장을 만들어내는 것입니다.
이때 토큰을 기준으로 작동을 하게 됩니다.
현재 토큰 뒤에 와야할 단어가 무엇일 지 나열하고 그 중에서 가장 확률이 높은 단어를 가져오는 것입니다.
OpenAI 의 Tokenizer를 사용해 토큰 계산 방식을 확인
GPT는 위와 같은 형식으로 토큰을 계산합니다.
GPT 의 종류
GPT 모델(이하 GPT)의 경우 매우 다양한 버전이 존재합니다. 우리가 ChatGPT를 통해 사용하는 버전은 크게 GPT 3.5 버전과 GPT 4 로 나뉘어집니다.
성능
GPT 3.5 는 기본적으로 무료로 제공되기 때문에 GPT 4보다는 다소 성능이 떨어집니다. 하지만 GPT 3.5도 충분히 사용성이 좋은 모델이기 때문에 프롬프트 엔지니어링을 처음 접하는 단계에서는 충분히 사용할 수 있습니다.
프롬프트 엔지니어링이란 GPT와 같은 생성ai로 부터 내가 원하는 답변을 얻어내기 위해서 프롬프트를 작성하는데 여러가지 기법들을 추가하는 기술입니다. 이와 관련해서는 이후의 섹션에서 추가로 배워볼 것이니 그쪽에서 자세한 설명 드리도록 하겠습니다.
학습 데이터
기본적으로 GPT는 인공지능입니다. 인공지능은 학습 데이터를 토대로 판단을 하게 됩니다. GPT 3.5는 21년 9월까지의 데이터가 학습되어 있었기 때문에 학습된 날짜 이후에 생겨난 데이터 또는 내용을 물어볼 경우 답변을 하기 위해서 거짓된 정보를 포함해서 진실처럼 표현해 답변을 해주는 문제가 있었습니다.
하지만 최근 22년 1월까지의 데이터가 추가로 학습되었기 때문에 많이 해결되었습니다.
GPT 4의 경우 23년 4월까지의 데이터가 학습되어 있는데 이와 별개로 웹 검색이 지원되는 모델이기 때문에 사실상 학습 데이터의 일자가 중요하지 않게 되었습니다.
언어별 성능
학습 데이터에 의존해서 작동하는 인공지능 모델인만큼 학습된 데이터가 어떠한 언어로 이루어져있는지가 굉장히 중요한 포인트입니다.
ChatGPT가 학습한 데이터에서 사용된 1순위 언어는 영어입니다.
그렇기 때문에 영어를 사용해서 질문을 하는 것이 보다 정확하고 더 풍부한 답변을 받을 수 있습니다.
프롬프트 길이 제한
프롬프트는 ChatGPT에게 답변을 얻기 위해서 사용자가 작성하는 문장을 뜻합니다.
프롬프트의 길이가 제한이 있습니다. 3.5의 경우 8,000 토큰, 4의 경우 129,000 토큰까지 프롬프트를 작성할 수 있습니다.
GPTs (GPT Store)
GPT 3.5에서는 사용할 수 없지만 GPT 4 부터는 GPTs 라는 스토어 기능을 사용할 수 있습니다.
프롬프트 엔지니어링을 통해서 GPT를 내가 원하는 방향대로 사용할 수 있도록 튜닝할 수 있습니다.
GPTs는 튜닝된 GPT를 누구나 사용할 수 있도록 배포하고 가져와서 사용할 수 있는 앱스토어와 같은 환경입니다.
커스텀 인스트럭션
ChatGPT의 커스텀 인스트럭션 UI를 캡처한
GPT에게 나 또는 GPT의 역할, 출력형식, 사전 정보를 기본값으로 지정할 수 있는 기능입니다. 첫 번째 칸에 역할에 관련된 시스템 프롬프트를 작성합니다. 두 번째 칸에 출력 형식과 사전 정보와 같은 내용들을 적습니다.
GPT 3.5 vs GPT 4
GPT 3.5 | GPT 4 | |
성능 | GPT 4에 비해서 빠르지만 답변이 질이 낮음 | GPT 3.5에 비해서 느리지만 답변의 질이 높음 |
가격 | 무료 | 유료 (구독형, 월 $20) |
학습 데이터 | 21년 9월까지의 데이터
(22년 1월로 최근 업테이트 됨) | 23년 4월까지의 데이터
(웹 검색 가능) |
사용량 제한 | 무제한 (변경될 수 있음) | 3시간 당 40개의 메시지까지 |
웹 검색 기능 | X | O |
프롬프트 엔지니어링 | 가능 | 가능 |
언어별 성능 | 영어 사용 시 성능 향상 | 영어 사용 시 성능 향상
(3.5 버전보다 다른 언어 성능 좋음) |
프롬프트 길이 제한 | (토큰 기준) 8,000 한도
(영어 기준) 대략 45,600 글자 한도 | (토큰 기준) 32,768 한도
(대략 영어 기준 196,608 글자) |
GPTs | 불가 | 가능 |
커스텀 인스트럭션 | 가능 | 가능 |