
✨ 팀 소개
<aside>
💡
본 프로젝트의 목적은 한국어로 이루어지고 구축에 누구나 참여할 수 있으며 공개적으로 사용할 수 있는 Instruction 데이터셋을 구축하는 것입니다.
</aside>
🚩 빌더 소개

📢 일정 공지
<aside>
📢 **프로젝트 OT는 4/10, 월요일 20:00 에 예정되어 있습니다.
프로젝트 회의는 매주 화요일 20:00입니다.**
</aside>
🖱️ 기능 메뉴
출석 체크 (1)
관련 자료 (1)
⚽ Ground Rule
<aside>
📢 스터디 규칙
- 시간을 잘 지켜주세요.
- 출석체크를 위해 실명으로 참여 부탁드려요.
- 서로간의 Respect 부탁드립니다.
- 3회 이상 무단 불참시 제명 및 수료 불가합니다. (OT, 리뷰 제외)
</aside>
👟 프로젝트 활동
데이터셋 제작 의도
- Human Instruction과 Feedback이 반영된 데이터셋은 사전 학습된 언어 모델을 학습시켜 인간과 유사한 Text Instruction을 생성하는 데 유용한 리소스입니다.
- 언어 모델을 단순히 거대하게 만드는 것은 이를 사용하는 유저들의 의도를 파악하는데 효과적이지 않으며 사실이 아니고 유해하며 유저에게 도움이 되지 않는 답변을 생성하는 경향이 있습니다.
- 이에 OpenAI의 InstructGPT는 인간의 피드백을 이용하여 유저의 의도를 따르는 Aligning Language Model 방법론을 사용하여 이러한 문제를 해결하고 보다 유용한 답변을 출력하도록 합니다.
- 하지만 InstructGPT 방법론을 사용한 ChatGPT의 경우 학습에 사용한 데이터 570GB 중 한국어 데이터 비중이 1.3%에 불과하며, 공개되어 있지 않습니다.
- 따라서 가짜연구소에서는 한국어로 이루어지고 구축에 누구나 참여할 수 있으며 공개적으로 사용할 수 있는 Instruction 데이터셋과 Human Feedback 데이터셋을 구축하고자 합니다.
데이터셋 제작 목표
- 공개된 GPT-3 모델을 사용하여 InstructGPT과 동일한 Human Feedback이 적용된 데이터셋을 구축하는 것입니다.
- 모델의 방법론을 학습하고 이를 구현하는 것도 좋지만, 본 프로젝트는 데이터셋 구축이 목표입니다.
구축 데이터셋 형태
-
Supervised Fine-tuining Dataset
- 유저가 직접 작성한 한국어 프롬프트-컴플리션 데이터셋
-
The Dataset of Human-labeled Comparisons
- 동일한 프롬프트를 입력, 미세 조정된 GPT-3로부터 출력된 여러 결과에 대한 비교 점수 스칼라 데이터셋
- 리커트 척도 사용(1~7 or …)
-
GitHub → Star Please!!
-
Demo → 서버 구동 여부에 따라 접속하지 못할 수 있습니다.