클래스: 생성형 AI를 위한 프롬프트 엔지니어링 소개

대규모 모델

대규모 언어 모델이란 무엇일까요? 일단 언어 모델이란 무엇일까요? 이해를 돕기 위해 GPT를 먼저 살펴보죠 ChatGPT와 관련된 모델이에요 여기서 문장을 하나 입력해 볼게요 'I try to learn something new.' 그리고 제출 버튼을 누를게요 그 다음으로는 'every day'가 오고요 여기서 'every'를 클릭하면 이런 비율 정보가 나오죠 퍼센테이지로요 이것은 무슨 의미일까요? new라는 단어에 도달하는 모델에 대해 생각해 보죠 일종의 교차점 또는 연결 지점이라 할 수 있는데요 모델은 다음 단어를 선택해야 합니다 파이 차트를 만들면 어떻게 될까요? 이 통계를 가지고요 every라는 단어는 거의 50%에 달하는 49%인 걸 알 수 있죠 \n은 21%이고요 새로운 줄이 시작된다는 의미입니다 그 다음 everyday라는 단어가 17%를 차지하네요 each는 약 6%이고요 그 외에는 나머지 것들이 모두 포함됩니다 이걸 룰렛처럼 만들어서 이렇게 돌리면 every가 나올 확률이 크겠죠 하지만 보장된 건 아니고요 아주 단순한 것처럼 보이지만 이런 비율을 만들어내는 건 아주 놀라운 일이에요 이걸 만들기 위해서 대규모 언어 모델이 엄청난 양의 텍스트를 학습하거든요 인터넷 전체에 해당하는 방대한 책을 읽는 것과 비슷하죠 무엇보다도 특정 태스크에 대해 미세 조정될 때가 있거든요 프롬프트는 "I try to learn something new"였죠 그러고 나서 "every day"로 완성됐죠 즉, 대규모 언어 모델은 입력을 받아들여 일종의 토큰 출력을 제공하는 것입니다

목차