Chain-of-Thought Prompting

Chain-of-Thought 프롬프팅 개요

•

정의: 생각의 사슬 프롬프팅은 중간 추론 단계를 연속적으로 생성하는 방법입니다. 이것은 복잡한 문제를 해결하기 위해 필요한 다단계 추론 과정을 모델링합니다.

•

중요성: 이 방법은 대규모 언어 모델이 더 복잡하고 정교한 추론을 수행할 수 있게 합니다.

연구 결과

•

실험 배경: 세 가지 큰 언어 모델을 대상으로 한 실험에서 생각의 사슬 프롬프팅의 효과를 조사했습니다.

•

적용 영역: 이 방법은 산술, 상식, 상징적 추론과 같은 다양한 작업에서 성능 향상을 보였습니다.

•

눈에 띄는 성과: 특히, 540B 파라미터를 가진 언어 모델에 단 8개의 생각의 사슬 예시를 프롬프팅한 결과, 수학 단어 문제 해결에서 최고의 정확도를 달성했습니다. 이는 검증기를 포함한 튜닝된 GPT-3보다도 우수한 결과였습니다.

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

We explore how generating a chain of thought -- a series of intermediate reasoning steps -- significantly improves the ability of large language models to perform complex reasoning. In particular,...

https://arxiv.org/abs/2201.11903

Prompt:

집합 {4, 8, 9, 15, 12, 2, 1}에서 홀수를 모두 더하면 짝수야.
답변: 홀수(9, 15, 1)를 모두 더하면 25가 돼. 위의 명제는 거짓이야.

집합 {17, 10, 19, 4, 8, 12, 24}에서 홀수를 모두 더하면 짝수야.
답변: 홀수(17, 19)를 모두 더하면 36이 돼. 위의 명제는 참이야.

집합 {16, 11, 14, 4, 8, 13, 24}에서 홀수를 모두 더하면 짝수야.
답변: 홀수(11, 13)를 모두 더하면 24가 돼. 위의 명제는 참이야.

집합 {17, 9, 10, 12, 13, 4, 2}에서 홀수를 모두 더하면 짝수야.
답변: 홀수(17, 9, 13)를 모두 더하면 39가 돼. 위의 명제는 거짓이야.

집합 {15, 32, 5, 13, 82, 7, 1}에서 홀수를 모두 더하면 짝수야.
답변:
Python
복사

Output:

홀수(15, 5, 13, 7, 1)를 모두 더하면 41이 돼. 위의 명제는 거짓이야.
Python
복사

AUTOMATIC CHAIN OF THOUGHT PROMPTING 프롬프팅 방법

개요

•

대규모 언어 모델(Large Language Models, LLMs)은 중간 추론 단계를 생성함으로써 복잡한 추론을 수행할 수 있습니다. 이러한 과정을 '생각의 사슬(Chain-of-Thought, CoT) 프롬프팅'이라고 합니다.

CoT 프롬프팅의 두 가지 패러다임

단순 프롬프트 활용: "한 단계씩 생각해보자"와 같은 간단한 프롬프트를 사용하여 질문에 답하기 전에 단계별로 생각을 유도합니다.

수작업 데모 활용: 질문과 그에 이르는 추론의 사슬을 포함하는 몇 가지 수작업 데모를 사용합니다. 이 두 번째 방식이 더 우수한 성능을 보이는데, 이는 작업별로 수작업으로 만들어진 데모에 의존하기 때문입니다.

AutoCoT의 제안

•

자동화된 접근 방식: "한 단계씩 생각해보자" 프롬프트를 사용하여 LLM이 데모를 위한 추론 사슬을 생성하도록 합니다. 즉, 단순히 단계별로 생각하는 것뿐만 아니라, 데모를 하나씩 자동으로 생성합니다.

•

오류 완화: 생성된 추론 사슬에 종종 오류가 있을 수 있습니다. 이러한 오류의 영향을 줄이기 위해, 다양성이 자동 데모 구축에 중요하다는 것을 발견했습니다.

•

AutoCoT 방법론: 다양성을 가진 질문을 샘플링하고, 추론 사슬을 생성하여 데모를 구성합니다.