Instruction tuning

Concept

Instruction tuning

ynnnxxi 2025. 9. 17. 15:11

Instruction tuning : finetuning language models on a collection of datasets described via instructions

☞ instruction(지시문)으로 설명된 dataset 모음을 이용해 language model을 finetuning하는 것

Finetuned Language Models are Zero-Shot Learners (ICML 2022) 논문에서 처음 소개된 개념이다.

Large Language Model은 few-shot에서는 잘하지만, zero-shot 성능은 부족하다. prompt가 pretrain data와 다르면 model이 잘 대응하지 못하기 때문이다. → format mismatch 문제

다양한 NLP(Natural Language Processing) task를 instruction(자연어 지시문)으로 표현해 model을 finetuning하는 것이

Instruction tuning이다.

예시
- 감정 분석 - 이 리뷰의 감정은 긍정적입니까? 부정적입니까?
- 번역 - "How are you?"를 일본어로 번역하시오.

이렇게 instruction-response pair를 여러 개의 task에서 모아서 학습시켜 model이 사람의 지시를 따르고 이해하는 일반화 능력을 얻게한다.

☞ ☞ Instruction tuning이란! 'pretrained language model을 instruction을 포함한 다양한 NLP task data로 finetuning하는 과정'이다.

instruction tuning을 통해서 language model의 zero-shot 성능이 크게 향상되었다.

'Concept' 카테고리의 다른 글

post-hoc (0)	2025.10.08
Atkinson-Shiffrin (0)	2025.09.24
VRAM (0)	2025.09.24

현재글Instruction tuning

ynnnxxi's 개 빡센 하루 시작 ❤︎

공부 기록 Blog | 맨날 까먹는 거 공부합니다 ^..♡⃛

commensense, VideoQA, paper, Video Question Answering, Review, Question-aware, vision transformer, Question Answering, VideoQuestionGrounding, CVPR, Tensor #Deeplearning #PyTorch #Tensorflow, VideoQG, post-hoc, VQA, Long video, MovieChat, llm, Multimodal, AVQA, TPAMI,

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

ynnnxxi's 개 빡센 하루 시작 ❤︎