๋ชฉ์ฐจ
- Frontend framework: ์ฌ์ฉ์๊ฐ ๋ํ/์์
์ ์์ฒญํ๋ UI (part1)
- Agent development framework: ์์ด์ ํธ ๋ก์ง(๋ฃจํ, ์ํ, ๋๊ตฌ ์ฐ๊ฒฐ)์ ๋ง๋๋ ํ๋ ์์ํฌ (part1)
- Agent memory: ๋ํ/์ธ์
์ํ์ ์ฅ๊ธฐ ๊ธฐ์ต ์ ์ฅ (part1)
- Agent tools: ๊ฒ์, DB, ์ฌ๋ด API ๋ฑ โํ๋โ์ ์ํํ๋ ๋๊ตฌ ๋ฌถ์ (part1)
- Agent design patterns: ์ฑ๊ธ ์์ด์ ํธ vs ๋ฉํฐ ์์ด์ ํธ ๋ฑ ๊ตฌ์กฐ ํจํด (part3)
- Agent runtim: ์์ด์ ํธ ์ ํ๋ฆฌ์ผ์ด์
์ด ์ค์ ๋ก ๋์๊ฐ๋ ์คํ ํ๊ฒฝ (part3)
- AI models: ์ถ๋ก /์์ฌ๊ฒฐ์ ์์ง(part 3)
- Model runtime: ๋ชจ๋ธ์ ์๋นํ๋ ์ธํ๋ผ(๊ด๋ฆฌํ API/์ปจํ
์ด๋/GKE ๋ฑ) (part 3)

Agentic AI๋ฅผ ํ ๋ฌธ์ฅ์ผ๋ก ์ ๋ฆฌํ๋ฉด,ย ์ฌ์ฉ์ ์๋๋ฅผ ์ดํดํ๊ณ โ ์ฌ๋ฌ ๋จ๊ณ ๊ณํ์ ์ธ์ฐ๊ณ โ ๋๊ตฌ๋ฅผ ํธ์ถํด ์คํ๊น์ง ๋๋ด๋ย ์์จ ์์คํ
์ด๋ค. ๋จ์ํ โ๋ต๋ณ์ ์์ฑํ๋ ๋ชจ๋ธโ์ด ์๋๋ผ,ย ๊ณํ(Planning)ย ๊ณผย ๋๊ตฌ(Tools)ย ๋ฅผ ํตํด ์ค์ ์
๋ฌด๋ฅผ ์๋ฃํ๋๋ก ์ค๊ณ๋ ์ํคํ
์ฒ์ธ ๊ฒ์ด๋ค.
์ด ์์
์ ์งํํ๊ธฐ ์ํด์๋, ์ด์ ์ ์ด๋ค ๋น์ทํ ์์
์ ํ๋์ง, ์ฌ์ฉ์์ ํน์ฑ์ ๋ฌด์์ธ์ง๋ฅผ agent๊ฐ ๋ฏธ๋ฆฌ ์ธ์งํ๊ณ ์์
์ ํ๋๊ฒ์ด ํจ์จ์ ์ด๊ณ ์ด๋ฅผ ์ํด Memory๊ธฐ๋ฅ์ ํ์์ ์ด๋ค.

(agent memory ๊ธฐ๋ฅ์ด ์๋ค๋ฉด ์ ์์์ฒ๋ผ, action, operation๊ณผ์ ์ด ๊ณ์ํด์ ๋์ด๋๊ณ , ์งํ์ด ๋๋ ค์ง๋ ์ํฉ์ด ๋ฐ์ํ๋ค)
๋จ๊ธฐ๊ธฐ์ต
Agent memory๋ ์ฌ๋์ ๊ธฐ์ต๊ณผ๋ ๊ฐ๋ค. ์ฐ๋ฆฌ๊ฐ ์ด๋ค ์ฌ๋๊ณผ ๋ํ๋ฅผ ์งํํ ๋, ๊ทธ ์ฌ๋๊ณผ์ ๋ํ ํ๋ฆ๊ณผ ๋ด์ฉ์ ๊ธฐ์ต์ ํ์ง๋ง, ์ฅ๊ธฐ์ ์ผ๋ก๋ ๋ชจ๋ ๋ํ๋ด์ฉ์ ๊ธฐ์ตํ ์๋ ์๋ค.
(์ฌ๋๋ค์ ๋์ ์ ์ฅ๊ณต๊ฐ์ ํ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ด๋ค).
์ฐ๋ฆฌ๊ฐ CHATGPT๋ฅผ ์ฌ์ฉํ๋ฉด, ๊ฒฝํ์ ์ํด์ ์๋ง ๋ชจ๋ ๋ถ๋ค์ด ์์ค ๊ฒ์ด๋ค. ์๋ก์ด ๋ํ์ฐฝ์ ์ด๊ฒ ๋๋ฉด, ๊ธฐ์กด์ ๋ํํ๋ ๊ฒ๋ค๊ณผ ๋ณ๊ฐ์ ๋ด์ฉ์ ๋ํด์ ์ด์ผ๊ธฐ ํ ์ ์๋ค. ์ฆ, ๋ํ ๊ธฐ์ต์ด reset๋๋ ๊ฒ์ด๋ค.
์ฌ๊ธฐ์ ์ค์ํ ๊ฐ๋
๋๊ฐ๋ฅผ ์ง๊ณ ๋์ด๊ฐ์.
1. Session: ์ฌ์ฉ์์ ์์ด์ ํธ๊ฐ ์ฃผ๊ณ ๋ฐ๋ โ๋ํ์ฐฝโ
- ํ ์ธ์
์์์๋ ์ด์ ๋ฉ์ธ์ง๋ค์ด ์ด์ด์ง ๋งฅ๋ฝ์ผ๋ก (๋จ๊ธฐ๊ธฐ์ต์ผ๋ก) ๊ธฐ์ต๋จ.
- ํ ์ธ์
์ ๋ค๋ฅธ ์ธ์
๋ด์ฉ๊ณผ ์์ด์ง ์์, ๋ค๋ฅธ๋ง๋ก ๋ค๋ฅธ ์ธ์
์ ๊ธฐ์ตํ์ง ์์.
2. State: ํ session์์ ๋ํ๋ฅผ ํตํด ์ ๋ฆฌ๋ โํ์ฌ ์์
์ ํต์ฌ ์ ๋ณดโ
- state type: ๋ชฉํ ์ ์ฝ, ์ด๋ฏธ ๊ฒฐ์ ๋ ์ฌํญ, ์งํ๋จ๊ณ, ๋ค์ ํ๋ ๊ฐ์ ๊ตฌ์กฐํ๋ ์์ฝ.

์ Chatpgt history์์ session์
- Opencalw Voice call ์ค์
- Twill Definition and Uses
- Openclaw ์ ํ์ค์
- etc.
state๋
- ์ฌ์ฉ์์ ๋ชฉํ: โํธ๊พธ์ฅ ๊ณตํญ ์ง ๋ณด๊ด ์์น/๊ฐ๊ฒฉ ์กฐ์ฌโ
- ์ ์ฝ์กฐ๊ฑด: โํ๊ตญ์ด๋ก ์์ฝ, ๊ฐ๊ฒฉ ๋น๊ต ํฌํจโ
- ์ด๋ฏธ ๊ฒฐ์ ๋ ์ ํ: โํ๋ณด๋ ํผํฌํ์ ์ฐ์ โ
- ํ์ฌ ์งํ ๋จ๊ณ: โ1) ํ๋ณด ๋ฆฌ์คํธ์
์๋ฃ โ 2) ๊ฐ๊ฒฉ/์์น ๊ฒ์ฆ ๋จ๊ณโ
- ํด์ผ ํ ๋ค์ ํ๋: โ๊ตฌ๊ธ๋งต ์์น ํ์ธ / ์ต์ ํ๊ธฐ 3๊ฐ ์์ฝโ
- ๋๊ตฌ ์ฌ์ฉ ๊ฒฐ๊ณผ ์์ฝ: โ๊ฒ์ ๊ฒฐ๊ณผ ํต์ฌ๋ง 5์ค๋ก ์ ๋ฆฌโ
์ฌ๊ธฐ์ ๊ต์ฅํ ์ค์ํ ์ ์ ๋๊ฐ์ง์ด๋ค:
- โ๋จ๊ธฐ๊ธฐ์ต์ โSession์์โ ๋งฅ๋ฝ์ ์ ์งํ๊ธฐ ์ํด ์์คํ
์ด ๊ด๋ฆฌํ๋ ๋ํ/์ํ(state)์ด๋ค.โ
- โLLM ์์ฒด๊ฐ ๊ธฐ์ตํ๋ ๊ฒ์ด ์๋๋ผ, ๋ํ ๊ธฐ๋ก/์ํ๋ฅผ ์ปจํ
์คํธ๋ก ์ฌ์ฃผ์
ํด์ ๊ธฐ์ตํ๋ ๊ฒ์ฒ๋ผ ๋์ํ๋ค.โ
- ๋ํ๋ด์ฉ์ โ๋ฌธ์โ๋ก ์ ๋ถ ๊ธฐ์ตํ๋ ๊ฒ์ ๋นํจ์จ ์ ์ด๋ฏ๋ก, ํต์ฌ์ ์ธ state๋ฅผ ์ค์ฌ์ผ๋ก ๊ธฐ์ตํ๋ค.
์ ์ฌ์ง์ ์์์์, โopenclaw voice call ์ค์ โ session๋ด๋ถ์์ ๋ํ๋ด์ฉ์ ๊ณ์ํด์ ๊ธฐ์ตํ๋ ๋ฅ๋ ฅ์ด ๋ฐ๋ก ๋จ๊ธฐ๊ธฐ์ต๋ฅ๋ ฅ์ธ ๊ฒ์ด๋ค.
์ฌ๋ฏธ ์๋ ์ฌ์ค์ LLM์ด ๊ธฐ์ต์ ํ๋๊ฒ ์๋๋ผ openai, antropic, google ๋ชจ๋ ํ์ฌ๋ค์ด ์๋์ ๊ตฌ์กฐ๋ก ์ค๊ณ๋ฅผ ํด์ ๊ทธ๋ ๋ค.
๋ค์ด๊ฐ๊ธฐ์ ์ context window๋ผ๋ ๊ฐ๋
์ ๋น ๋ฅด๊ฒ ์ง๊ณ ๋์ด๊ฐ์. ์ปจํ
์คํธ ์๋์ฐ(Context Window)๋ โ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ํ ๋ฒ์ ๋ํ๋ ์์
์์ ์ดํดํ๊ณ ๊ธฐ์ตํ ์ ์๋ ์ต๋ ์
๋ ฅ ๋ฐ ์ถ๋ ฅ ํ
์คํธ์ ์โ ์ด๋ค.
์๋์ LLM์ ๋ฃ์ด์ฃผ๋ prompt๋ฅผ ๋ณด๋ฉด words, imsage, videos๊ฐ ์๋ค. ํ์ง๋ง LLM ์ด ํ์ฌ ๊ฐ๋นํ ์ ์๋ ์ต๋ ์์ด ์กด์ฌ๋ฅผ ํ๋ค.

์๋ 2026.02์๋ฃ์ ๋ฐ๋ฅด๋ฉด Claude, gpt-codex์ context window๋ 1M, 400K token์ด๋ผ๊ณ ์ ํ ์๋ค. ์ฌ๊ธฐ์ ํ ํฐ์, ์ฐ๋ฆฌ๊ฐ prompt์ ์
๋ ฅํ๋ ๋ฐ์ดํฐ์ ์ข
๋ฅ๋ (๊ธ, ์ด๋ฏธ์ง, ๋น๋์ค)๋ก ๋ค์ํ์ง๋ง ์ด๋ฅผ LLM์ด ํก์ํ ๋๋ ํ๋์ ๋ฐ์ดํฐ์ด๋ค. ๋ฐ๋ผ์, ๊ณตํต๋ ๋จ์๋ฅผ ์ฌ์ฉํ๊ณ ๊ทธ ๋จ์๊ฐ token์ด๋ค. ๋ค์ ๋งํด์, LLM์ด ํก์ํ๋ ๋ฐ์ดํฐ์ ๋จ์์ด๋ค.
(์ฝ๊ฒ ๋งํด ๊ธ์ ๋ง์ด ์ฐ๊ณ , ์ด๋ฏธ์ง๋ฅผ ๋ง์ด ์ฐ๊ณ , ๋น๋์ค์ ์ฉ๋์ด ํฌ๋ค๋ฉด, ์ฌ์ฉ๋๋ ํ ํฐ์ด ๋ง๋ค ๋ผ๊ณ ์ดํดํ์๋ฉด ์ข๋ค.)

[Nivida blog]
โLLM (Large Language Model) token isย the fundamental unit of text or code that a model processes, analyzes, and generates. Think of tokens as the "Lego bricks" of languageโthey are the basic pieces used to break down input text into manageable units before converting them into numerical representations (vectors)โ
๋ค์ chatgpt๊ฐ ์ด๋ป๊ฒ ๋ํ์ฐฝ์ ์ด์ ๋ด์ฉ๋ค์ ๊ธฐ์ตํ๋๊ฐ? ๋ผ๋ ์ง๋ฌธ์ผ๋ก ๋์๊ฐ ๋ณด๋ฉด, context window ์ฆ ์
๋ ฅํด์ฃผ๋ prompt ๋ด๋ถ์ ์ด์ ๋ํ๋ด์ฉ๋ค์ ์ง์ด ๋ฃ๋ ๊ฒ์ด๋ค.์๋์ ์ฌ์ง์ ๋ณด๋ฉด turn2,3์์๋ turn1,2 ์ฆ ์ด์ ๋ํ์ ๋ด์ฉ๋ค์ ๊ฐ์ด ์ง์ด ๋ฃ๋๋ค.(์ฌ์ฉ์์ ์ง๋ฌธ๊ณผ ๋ต๋ณ๊น์ง ์ง์ด ๋ฃ๋๋ค).

ํ์ง๋ง, ์ด์ผ๊ธฐ ํ๋ค ์ถ์ด. context window์ ์ ํ ์ ์ฌ์ง์์๋ 200k token์ด ์กด์ฌํ๋ค. ๋ฐ๋ผ์, ๋ชจ๋ ๋ํ๋ฅผ ๋ฃ์ ์ ์๋ค. ๊ทธ๋์ openai docs์ ๋ฐ๋ฅด๋ฉด ๋๊ฐ์ง ๋ฐฉ์ ์ ์ฌ์ฉํ๋ค.
Context Engineering - Short-Term Memory Management with Sessions from OpenAI Agents SDK
Trimming
Trimming์ ์์ฃผ ๋จ์ํ๊ฒ time sequence์ ๋ฐ๋ผ ๋ํ๋ด์ฉ์ ์ ๋ ฌํํ, context windowํ๊ณ์น๊น์ง๋ง ๋ด๋ ๊ฒ์ด๋ค. (์ด์ ๋ด์ฉ์ ๋ค ์ง์ฐ๋ ๊ฒ)

Compaction
Compact (summarizing)์ ๋ํ๋ด์ฉ๋ค์ ์ ๋ถ ์์ฝํ๋ค์์ ํ๋์ compaction block์ผ๋ก createํ ํ์, Context window์ ์ง์ด ๋ฃ์ด ์ดํ ๋ํ๋ฅผ ์งํํ๋ ๊ฒ์ด๋ค.
Compaction

์ฅ๊ธฐ๊ธฐ์ต
๋จ๊ธฐ๊ธฐ์ต์ด โํ ์ธ์ ์์์ ์ ์ง๋๋ ๋ํ/์ํ(state)โ๋ผ๋ฉด, ์ฅ๊ธฐ๊ธฐ์ต์ ์ธ์ ์ด ๋ฐ๋์ด๋ ๊ณ์ ๋จ์์๋ โ์ง์ ์ ์ฅ(persistent storage)โ์ด๋ค. ์ฆ, ์์ด์ ํธ๊ฐ ๋งค๋ฒ ์ฒ์๋ถํฐ ๋ค์ ๋ฌป๊ณ ๋ฐฐ์ฐ์ง ์๋๋ก, ์ฌ์ฉ์ ์ ํธยทํ๋ก์ ํธ ์ง์ยท๊ณผ๊ฑฐ ๊ฒฐ์ ์ฌํญยท์์ฃผ ์ฐ๋ ๋ฌธ์ ๋ฑ์ ์ ์ฅํด๋๊ณ ํ์ํ ๋ ๊บผ๋ด ์ฐ๋ ๊ตฌ์กฐ๋ค.
wHY?
์์์ ์ค๋ช
ํ๋ค ์ถ์ด, ์ปจํ
์คํธ ์๋์ฐ๋ ๊ฒฐ๊ตญ ์ ํ์ด ์๊ธฐ ๋๋ฌธ์, ๋ํ๊ฐ ๊ธธ์ด์ง๋ฉด ๊ธธ์ด์ง์๋ก (์์ฝ, trim)์ผ๋ก โ๋ชจ๋ ๊ฒ์ ๋ํ ํ์คํ ๋ฆฌ๋ก ๋ค๊ณ ๊ฐ๋ ๋ฐฉ์โ์ ์ค๋ ๋ชป ๊ฐ๋ค. ๊ทธ๋์ ์ฅ๊ธฐ๊ธฐ์ต์ด ํ์ํด์ง๋ค.
- ๊ฐ์ธํ: ์ฌ์ฉ์์ ๋งํฌ/์ ํธ/๋ชฉํ๋ฅผ ๊ธฐ์ตํด์ ๋งค๋ฒ ์ค๋ช
์ ๋ฐ๋ณตํ์ง ์๊ฒ ํ๋ค.
- ์ง์ ์ ์ง: ํ๋ก์ ํธ์ ๋ฐฐ๊ฒฝ์ง์, ๋ด๋ถ ๋ฌธ์, ๊ณผ๊ฑฐ ๊ฒฐ์ ์ฌํญ์ ์ถ์ ํด โ์
๋ฌด ์ฐ์์ฑโ์ ๋ง๋ ๋ค.
- ์ ํ์ฑ/๊ทผ๊ฑฐ: ๋ชจ๋ธ์ด ํ์ต ๋ ๋ณด์ง ๋ชปํ ์ต์ ์ ๋ณด๋ ์ฌ๋ด ์ ๋ณด๋ฅผ, ์ ์ฅ์์์ ์ฐพ์์ ๋ต๋ณ์ โgrounding(๊ทผ๊ฑฐํ)โํ๋ค.
- ๋น์ฉ/์๋: ๊ธด ๋ํ ์ ์ฒด๋ฅผ ๋ฃ๋ ๋์ , ํ์ํ ๊ฒ๋ง ๊ฒ์ํด ๋ฃ์ผ๋ฉด ํ ํฐ ๋น์ฉ๊ณผ ์ง์ฐ์ด ์ค์ด๋ ๋ค. (RAG์ ๋ํ ์ฅ์ )
Method
์ฅ๊ธฐ๊ธฐ์ต์ โ์ธ๋ถ ์ ์ฅ์ + ๊ฒ์/ํ์(retrieval)โ๋ก ๊ตฌํ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ํฌ๊ฒ 3๊ฐ๋๊ฐ ์ค๋ฌด์์ ๋ง์ด ์ฐ์ธ๋ค.
(A) ํ์ผ ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ (๊ฐ์ฅ ๋จ์ยท์ง๊ด)
์๋ context engineering์ ์์๋ฅผ ๋ณด๋ฉด, ์ฌ์ค ์ฐ๋ฆฌ๊ฐ agent์๊ฒ โ์ค๋ ๋ ์จ๊ฐ ์ด๋โ ๋ผ๊ณ ์ง๋ฌธ์ ํ๋ค๋ฉด, ๋จ์ํ ๊ทธ ์ง๋ฌธ๋ง LLM(๋)์ ๋ค์ด ๊ฐ๋๊ฒ ์๋๋ผ, ํ์ฌ ๊ฐ์ง๊ณ ์๋ ๋๊ตฌ๋ค๊ทธ๋ฆฌ๊ณ ๊ธฐ์ต๋ ๊ฐ์ด prompt์ ๋ค์ด๊ฐ๋ค. ๋ฐ๋ผ์, ์ฐ๋ฆฌ๋ memory.mdํ์ผ์ ์ฅ๊ธฐ๊ธฐ์ตํด์ผํ ๋ด์ฉ๋ค์ ์์ฐ์ด๋ก ์์ฑํ๊ณ , prompt์ ๋ฃ์ด์ค๋ค.( Application๋จ๊ณ์์ ์ค๋ช
๋๋ฆฌ๊ฒ ์ง๋ง, memory.md์ ๋ด์ฉ์ ์๋์ผ๋ก ์ฝ๊ฒ ํ ์๋ ์๊ณ , ์๋์ผ๋ก ํ์ผ์ ์์น๋ฅผ ์ง๋ฌธํ ๋ ์๋ ค ์ค์๋ ์๋ค.)
- ์ฅ์ : ์์ฐ์ด๋ก ์ ๊ธฐ๋ง ํ๋ฉด ๋๋, ๊ตฌํ์ด ์ฝ๊ณ , ์ฌ๋์ด ์ง์ ์ด์ด๋ณด๊ณ ์์ ํ ์ ์์ด ๋๋ฒ๊น
์ด ํธํ๋ค.
- ํ๊ณ: ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด โํ์ํ ๋ถ๋ถ๋ง ๋น ๋ฅด๊ฒ ์ฐพ๊ธฐโ๊ฐ ์ด๋ ค์์ง๋ค. (๊ฒฐ๊ตญ์ ๋๋ค๋ฅธ context์ด๋ฏ๋ก, ๋ง์ด ์ธ์๊ฐ ์๋ค)

Claude memory
์ค์ Claude code docx (Manage Claude's memory - Claude Code Docs)๋ฅผ ์ดํด๋ณด๋ฉด, session์ ๋งจ ์ฒ์์ 200์ค์ memory.md๋ด์ฉ์ด ์๋ ๊ธฐ์
๋๋ค๊ณ ๋งํ๋ค. ์ฆ ๋ชจ๋ ๋ํ์์ memory.md๋ฅผ ๋ฃ์ผ๋ฉด ๋นํจ์จ์ ์ด๋ session์ ์ฒ์์ ๊ธฐ์
ํ๋ค.

(B) ๋ฒกํฐ DB(Vector Database) / ์๋ฒ ๋ฉ ๊ฒ์
(Exploring Vector Databases: Pinecone, Chroma, Weaviate, Qdrant, Milvus, PgVector, and Redis)

์ ๋๋ฒ์งธ๋ก, ์ธ๋ถ ์ ์ฅ๊ณต๊ฐ์ ์ด์ฉํ๋ memory ์ฅ๊ธฐ๊ธฐ์ต ๋ฐฉ์์ด๋ค. ์์ฌ์ง์ ๋ณด๊ฒ ๋๋ฉด, ๋ค์ํ ์ ํ/์คํ์์ค ํ๋ก์ ํธ๊ฐ ์กด์ฌํ๋ค. y์ถ์ ์์ /open source ๋ก ๊ตฌ๋ถ์ด ๋์ด ์์ผ๋ฉฐ, ์์ชฝ์ Dedicated = ๋ฒกํฐ ๊ฒ์์ด ์ฃผ์ (์ ์ฉ ์์ง), Support = ๋ณธ์ ์ ๋ฐ๋ก ์๊ณ ๋ฒกํฐ ๊ฒ์์ ์ต์ (์ถ๊ฐ ๊ธฐ๋ฅ) ๋ก ์ดํดํ๋ฉด ๋๋ค.
โRAG๋ โ์ธ๋ถ ์ง์์ ๊ฒ์ํด(์ฃผ๋ก ๋ฒกํฐ ๊ฒ์) LLM ์ ๋ ฅ์ ๋ถ์ธ ๋ค ์์ฑํ๋โ ํจํด์ด๋ค. ๋ฒกํฐ DB๋ RAG์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฐ์ด๋ retrieval ์ ์ฅ์ ์ค ํ๋๋ค.โ
Retrieval Augmented Generation (RAG) Process

An introduction to RAG and simple/ complex RAG
์ฌ์ฉ์์๊ฒ ์ง๋ฌธ์ ๋ฐ๊ธฐ ์ ์, ๋จผ์ Vector Database๋ฅผ ๊ตฌ์ถํด์ผํ๋ค. ์ดํด๋ฅผ ์ํด์, ๋ณ์์์ ์ฌ์ฉํ๋ RAG๋ผ๊ณ ๊ฐ์ ํ์.
- A: Raw Data Source
- e.g) ํ์์ ๋ฐ์ดํฐ์ ์น๋ฃ ๋ฐฉ์๋ค์ด ๋ด๊ธด ๋ฌธ์๋ค์ ์ค๋นํ๋ค.
- B: Information Extraction
- (๋ฐฉ๋ํ ๋ฐ์ดํฐ) โ ๊ฒ์ ๊ฐ๋ฅํ ํ
์คํธ/meta data๋ฅผ ๋ฝ์๋ (pdf โ text, image โ text)
- ํ์์ ์ง๋จ ๊ฒฐ๊ณผ ๋ฐ์ดํฐ medical image โ text, pdf โ text๋ก ์ ๋ถ ์ ํํ๋ค.
- C: Chunking
- pdf, ๋ฌธ์ โ ๋ฌธ๋จ, ์น์
/์์ ๋ชฉ ๋จ์
- ์ ํ๋ ์ ๋ณด๋ฅผ ์๋ฏธ์๋ ๋ ์์ ๋ฉ์ด์ด๋ก ์ชผ๊ฐ ๋ค. (๋๋ฌด ํฌ๋ฉด context window์ ๋ค์ด๊ฐ์ง ๋ชปํจ)
- Embedding
- chunk โ embedding vector (๋ฒกํฐํ์งํ)
- e.g) ํ์ ์ ๋ณด, ์ง๋จ ์ ๋ณด ๋ฉ์ด๋ฆฌ๋ค์ ๋ฒกํฐํ(์ซ์๋ก ๋ํ๋) ๊ทธ๋ฆฌ๊ณ database์ ์ง์ด ๋ฃ๋๋ค.
Example (RAG + LLM)
์ฌ์ฉ์๊ฐ ์ง๋ฌธ์ ํ๋ฉด, ์์คํ
์ ์ง๋ฌธ ์ ์ฒด๋ฅผ ์๋ฒ ๋ฉ(๋ฒกํฐํ) ํ๊ณ ๋ฒกํฐ DB์์ ์๋ฏธ์ ์ผ๋ก ๊ฐ์ฅ ๊ฐ๊น์ด chunk(top-k) ๋ฅผ ๊ฒ์ํ๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฒ์๋ chunk์ ์๋ฌธ(๋ฐ ๋ฉํ๋ฐ์ดํฐ)์ ์ปจํ
์คํธ ์๋์ฐ์ ์ฒจ๋ถํ ๋ค, LLM์ด ๊ทธ ๊ทผ๊ฑฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ต๋ณ์ ์์ฑํ๋๋ก ํ๋ค.
1. ์ฌ์ฉ์๊ฐ ์ง๋ฌธ์ ํจ.
e.g.) โ์ด ํ์ ์ผ์ด์ค์์ ์ฐธ๊ณ ํด์ผ ํ ํ๋กํ ์ฝ/์ฃผ์์ฌํญ์ ๊ทผ๊ฑฐ์ ํจ๊ป ์ ๋ฆฌํด์คโ
2. ํ์ ์์ฝ(์ง๋จ๋ช
/๊ฒ์ฌ๊ฒฐ๊ณผ/๊ธ๊ธฐ/๊ณผ๊ฑฐ๋ ฅ)์ ๊ตฌ์กฐํํด์ ์ฟผ๋ฆฌ๋ก ๋ง๋ ๋ค
3. ๋ณ์ ๋ด๋ถ ์ง์๋ฒ ์ด์ค(์น๋ฃ ํ๋กํ ์ฝ, ๊ฐ์ด๋๋ผ์ธ, ์ฝ๋ฌผ ๊ธ๊ธฐ ๋ชฉ๋ก, ์ ์ฌ ์ผ์ด์ค ์์ฝ)์์ top-k ๋ฌธ์๋ฅผ ๊ฒ์ ํ, ๊ฒ์๋ ๊ทผ๊ฑฐ ๋ฌธ์์ ํต์ฌ ๋ฌธ๋จ์ ์ปจํ
์คํธ์ ๋ถ์ธ๋ค
4. LLM์ด โ๊ทผ๊ฑฐ ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฅํ ์ต์
/์ฃผ์์ฌํญ/์ถ๊ฐ๋ก ํ์ธํ ์ ๋ณดโ๋ฅผ ์ ๋ฆฌํ๋ค
5. ์ฌ์ฉ์์๊ฒ ๋ต๋ณ์ ์งํ.
- ์ฅ์ : ๋ฌธ์๋ฅผ โ์๋ฏธ ๊ธฐ๋ฐโ์ผ๋ก ์ฐพ์ ์ ์์ด, ํค์๋๊ฐ ์ ํํ ์ผ์นํ์ง ์์๋ ๊ด๋ จ ๋ด์ฉ์ ์ ๋์ด์จ๋ค. RAG์์ ๊ฐ์ฅ ํํ ์ ์ฅ์ ํ์ ์ด๋ค.
Conclusion
Effective context engineering for AI agents

๋ง๋ฌด๋ฆฌ๋ก, antropic (claude)์ context window๋ฅผ ์ดํด๋ณด๊ณ ๋ง๋ฌด๋ฆฌํ์. ๊ฒฐ๊ตญ ๊ธฐ์ต์ ํ๋ ค๋ฉด prompt์ ์ ๋ ฅ์ ํด์ฃผ์ด์ผ ํ๋ค. ๋ฐ๋ผ์ prompt engineering์ด๋ผ๋ ์ข์ธก์ ์ฉ์ด๋ ์กด์ฌํ๋ค. โํ๋กฌํธ๋ฅผ ์ด๋ป๊ฒ ์ฐ๊ณ , ์กฐ์ํ๋์งโ
ํ์ง๋ง agentic ai์๋์์ ์ฌ์ฉํด์ผํ tool, ๊ธฐ์ตํด์ผํ memory๋ ๋ง์์ง๊ณ context window๋ ํ์ ์ ์ด๋ฏ๋ก, ์ด๋ ํ ์กฐํฉ์ผ๋ก tool, memory๋ค์ ์ต์ํ์ผ๋ก ๋ฃ์ด์ ์ต๋ํ์ ํจ์จ์ ์ธ action์ ํ ์ ์์๊น? ๋ผ๋ context engineering์ antropic์ ์๋กญ๊ฒ ์ ์ํ๋ค.
์ฌ๋ฏธ์๋ ์ฌ์ค: ๋๋ฌด ๋ง์ด ์ง์ด ๋ฃ์ด๋ ๋ถ์ฐ๋๋ค.
๊ธ์ ์ปจํ
์คํธ๋ฅผ โ๋ฌดํํ ๋ฃ์ผ๋ฉด ์ข๋คโ๊ฐ ์๋๋ผ, ๋ฃ์์๋ก ์ง์ค๋ ฅ์ด ๋จ์ด์ง ์ ์๋ ์์์ผ๋ก ๋ด
๋๋ค.
- ํ ํฐ์ด ๋์๋ก ๋ชจ๋ธ์ด ์ค์ํ ์ ๋ณด๋ฅผ ์ ๋ชป ์ง์ด๋ด๋ context rot(๋ฌธ๋งฅ ๋ถํจ) ๊ฐ์ ํ์์ด ๊ด์ฐฐ๋๋ค๊ณ ์ธ๊ธํฉ๋๋ค.
- ๊ทผ๋ณธ ์ด์ ๋ ํธ๋์คํฌ๋จธ๊ฐ ํ ํฐ๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๋ชจ๋ ๋ณด๋ ค๋ค ๋ณด๋(์ํธ attention), ๊ธธ์ด์ง์๋ก โ์ฃผ์(Attention) ์์ฐโ์ด ์์์ง๋ค๋ ์ค๋ช
์ ํฉ๋๋ค.
๊ทธ๋์ ๋ชฉํ๋ โ๊ฐ์ฅ ์์ ํ ํฐ์ผ๋ก ๊ฐ์ฅ ๋์ ์ ํธ(signal)๋ฅผ ๋ง๋ค๊ธฐโ์
๋๋ค

์ด๋ฒ์๊ฐ์๋ ์ context window์์ memory ๋ถ๋ถ์ ์ด๋์ ๊ฐ์ ธ์์ ์ฑ์๋ฃ๋์ง. DOC1,2๋ ์ ์ ์ database์์ ์ด๋ป๊ฒ ๊ฐ์ ธ์ค๋์ง์ ๋ํด์ ์์๋ณด์๋ค.
โ ๋ค์ ์๊ฐ์ tool์ ๋ํด์ ์ดํด๋ณด์.