October 13, 2025 in context engineering, agent, anthropic, claude 4 minutes
Effective context engineering for AI agents (Anthropic, 2025-09-29)
Context๋ LLM์์ ์ํ๋ง(sampling)ํ ๋ ํฌํจ๋๋ ํ ํฐ(token) ์งํฉ ์ ์ฒด๋ฅผ ์๋ฏธํ๋ค. ์ฌ๊ธฐ์๋ system prompt, message history, examples, tool outputs, ์ธ๋ถ ๋ฐ์ดํฐ๊น์ง ํฌํจ๋๋ค. Context engineering(์ปจํ ์คํธ ์์ง๋์ด๋ง)์ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ผ๊ด๋๊ฒ ์ป๊ธฐ ์ํด ์ด๋ฌํ ์ ์ฒด ํ ํฐ์ ์ ์ฉ์ฑ์ ์ต์ ํํ๋ ๊ฒ์ด๋ค.
LLM์ ์ ๋ค๋ฃจ๊ธฐ ์ํด์๋ thinking in context๊ฐ ํ์ํ๋ค. ์ด๋ ์ ์ฒด ์ํ๋ฅผ ์ดํด๋ณด๊ณ ๊ฐ ์ํ๊ฐ ์ด๋ค ์ ์ฌ์ ์ธ ํ๋์ ๋์ถํ ์ ์์์ง ๊ณ ๋ คํ๋ ๋ฐฉ์์ ๋งํ๋ค. ๋งค ํด๋ง๋ค ์ด๋ค ํ ํฐ์ ์ถ๊ฐํ๊ณ , ์ ์ธํ ๊ฒ์ธ์ง ๊ฒฐ์ ํ๋ ๊ฒ์ด ์ค์ํ๋ค.
Anthropic์์๋ context engineering์ prompt engineering์ ์์ฐ์ค๋ฌ์ด ์ง๋ณด๋ก ๋ณธ๋ค.
Prompt engineering์ด ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ์ํด system prompt๋ฅผ ์์ฑํ๊ณ ์ฒด๊ณํํ๋ ๊ฒ์ด๋ผ๋ฉด,
Context engineering์ LLM inference๋์ prompt ์ธ๋ถ์ ์ ๋ณด๊น์ง ํฌํจํ์ฌ ์ต์ ์ ์ ๋ณด ํ ํฐ๋ค์ ์ ๋ต์ ๋ง์ถฐ ์กฐ์ํ๋ ๊ฒ์ด๋ค.
prompting์ system prompt๋ฅผ ์ ์์ฑํ๋ ๊ฒ์ ์ด์ ์ ๋๋ค. ๋ฐ๋ฉด Context engineering์ ๋จ์ํ ์ข์ ํ๋กฌํํธ๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋์ด, ์ฌ๋ฌ ๋ฒ์ ์ถ๋ก , ๊ธด ์ถ๋ก ์๊ฐ์ ์๊ตฌํ๋ agent์ ์ ์ฒด์ ์ธ context state (system instructions, tools, MCP ๋ฑ)์ ์ง์์ ์ผ๋ก ๊ด๋ฆฌํด์ผํ๋ค.
์์ด์ ํธ ๋ฃจํ๊ฐ ๊ธธ์๋ก ๋ค์ ํด์ ์ด๋ค ํ ํฐ์ ํฌํจํ ์ง๊ฐ ์์ด์ ํธ์ ์ฑ๋ฅ์ ์ข์ฐํ๋ค. Context engineering์ ์ง์์ ์ผ๋ก ๋ฐ์ ํ๋ ์ ๋ณด๋ค๋ก๋ถํฐ ์ ํ๋ context window๋ฅผ ์ด๋ป๊ฒ ์ ๋ต์ ์ผ๋ก ์กฐ์ํ ์ง ๊ณ ๋ คํ๋ค.
Context Rot : How increasing Input Tokens Impacts LLM Performance
ํด๋น ์ฐ๊ตฌ์ ์ํ๋ฉด, ํ ํฐ ์๊ฐ ์ฆ๊ฐํ ์๋ก ๋ชจ๋ธ์ด ํด๋น ์ปจํ ์คํธ์์ ์ ๋ณด๋ฅผ ์ ํํ ํ์ ํ๋ ๋ฅ๋ ฅ์ด ๋จ์ด์ง๋ ํ์์ด ๋ฐ์ํ๋ค๊ณ ํ๋ค.
์ด๋ Transformer์ ๊ตฌ์กฐ์ ํ๊ณ๋๋ฌธ์ด๋ค. Transformer๋ ๋ชจ๋ ํ ํฐ์ ๋ค๋ฅธ ๋ชจ๋ ํ ํฐ๊ณผ์ ๊ด๊ณ๋ฅผ ๊ณ์ฐํด์ผํ๋ค. ์ ์ฒด context์์ $N^2$์์ ๊ด๊ณ๊ฐ ๋ฐ์ํ๊ฒ ๋๋๋ฐ, attention budget์ ์ ํํ๋ค. context ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก context rot(์ปจํ ์คํธ ๋ถ์)์ผ๋ก recall ์ ํ๋๊ฐ ๋จ์ด์ง๋ค. ๊ทธ๋์ ๊ฐ๊ฒฐํ์ง๋ง ์ ๋ณด ๋ฐ๋๋ ๋์ context์ ๋ฌด์์ ์์ ๋๊ณ ๋ฌด์์ ์ ์ธํ ๊ฒ์ธ์ง (๋ฐฐ์น/์ ๋ณ)์ด ์ค์ํ๋ค.
์ข์ context engineering์ด๋ ์ํ๋ ๊ฒฐ๊ณผ์ ๊ฐ๋ฅ์ฑ์ ๊ทน๋ํํ๋ high-signal ํ ํฐ๋ค์ ๊ฐ๋ฅํ ์งํฉ๋ค ์ค ๊ฐ์ฅ ์์ ์งํฉ์ ์ฐพ๋ ๊ฒ์ด๋ค. ์ฆ, ๊ฐ์ฅ ์ ์ ํ ํฐ์ผ๋ก ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ต๋ํ ์ป๋ ๊ฒ์ด๋ค.
system prompt๋ ๋ฐ๋์ minimalํด์ผ ํ๋ค. ์ฌ๊ธฐ์์ minimal์ ์งง๊ฒ ์์ฑํ๋ผ๋ ์๋ฏธ๊ฐ ์๋๋ผ, ๋ถํ์ํ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ๊ณ ํ์ํ ์ ๋ณด๋ง ๊ฐ๊ฒฐํ๊ฒ ํฌํจํ๋ผ๋ ๋ป์ด๋ค.
์ ๋ณด๊ฐ ๋๋ฌด ๊ณผ๋ํ๋ฉด ๋๋ฌด ๋ณต์กํ๊ณ , ๋๋ฌด ๋ชจํธํ๋ฉด ์ ๋ณด๊ฐ ๋ถ์กฑํ๋ค. specific ๊ณผ vague ์ฌ์ด์ ์ ์ ํ ๊ท ํ์ ์ฐพ์์ผ ํ๋ค.
๋ค์๊ณผ ๊ฐ์ด ๋ช ํํ ์น์ ๊ตฌ๋ถ์ ์ถ์ฒํ๋ค:
<background_information>
<instructions>
## Tool guidance
## Output description
XML ํ๊น ์ด๋ Markdown ํค๋๋ฅผ ํ์ฉํด ํ๋กฌํํธ๋ฅผ ๊ตฌ์กฐํํ๋ ๊ฒ์ ๊ถํ๋ค.
์ต์ํ์ ํ๋กฌํํธ๋ก ์์ํ์ฌ ์ง์ ์คํํด๋ณด๋ฉด์ ์ ์ง์ ์ผ๋ก ๋ณด๊ฐํ๋ ๊ฒ์ด ํจ๊ณผ์ ์ด๋ค.
๋๊ตฌ๋ Token efficient , agent behavior efficientํด์ผํ๋ค.
์ฒ ๋ง๋ ๋ง๋ณด๋ค๋ ํ ์ฅ์ ๊ทธ๋ฆผ์ด ๋์ ๊ฒ์ฒ๋ผ few-shot examples์ ๊ทธ๋ฆผ์ ์ญํ ์ ํ ์ ์๋ค. ๊ตฌ์ฒด์ ์ธ ์์๋ฅผ ํตํด ๋ชจ๋ธ์ด ์ํ๋ ๋์์ ์ดํดํ ์ ์๋๋ก ๋๋๋ค.
Claude Code๋ ์ด ์ ๊ทผ๋ฒ(CLAUDE.md
)์ ์ฌ์ฉํด ๋ณต์กํ ๋ฐ์ดํฐ ๋ถ์์ ์ํํ๋ค. ์ ํต์ ์ธ embedding ๊ธฐ๋ฐ ์ ๊ทผ ๋์ ๊ฐ๋ฒผ์ด ์ฐธ์กฐ (ํ์ผ ๊ฒฝ๋ก, ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฟผ๋ฆฌ ๋ฑ)์ ์ ์งํ๊ณ ๋ฐํ์์ ๋์ ์ผ๋ก ์ ๋ณด๋ฅผ ๊ฐ์ ธ์ค๋ ๊ฒ์ด๋ค.
Just In Time์ ์ธ๊ฐ์ ์ธ์ง ๋ฐฉ์์ ๋ฐ์ํ ์ ๊ทผ๋ฒ์ผ๋ก, ์ฐ๋ฆฌ๊ฐ ๋ชจ๋ ์ ๋ณด๋ฅผ ๋จธ๋ฆฟ์์ ์ ์ฅํ์ง ์๊ณ , ํ์ํ ๋๋ง๋ค ์ธ๋ถ ์๋ฃ๋ฅผ ์ฐพ๋ ๊ฒ๊ณผ ๊ฐ์ด ์์ด์ ํธ๋ฅผ ์ค๊ณํ๋ ๊ฒ์ด๋ค.
Agent ๊ฐ๋จํ ์ ์ : An LLM agent runs tools in a loop to achieve a goal.
Long-Horizon์ ์๊ตฌํ๋ ๋ณต์กํ ์ฅ๊ธฐ ํ ์คํธ๋ฅผ ์ํํ๋ ์์ด์ ํธ๋ฅผ ์ํ ์ ๋ต
์ ํ๋ context window์ ํ๊ณ๋๋ฌธ์ compaction(์์ถ)์ ์ค์ํ๋ค. ์ฑ๋ฅ ์ ํ๋ฅผ ์ต์ํํ๋ฉด์ content๋ฅผ ์ฆ๋ฅํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค.
Claude Code์์๋ ๋ฉ์์ง ํ์คํ ๋ฆฌ๋ฅผ ๋ชจ๋ธ์๊ฒ ์ ๋ฌํ์ฌ ๊ฐ์ฅ ์ค์ํ ์ธ๋ถ์ฌํญ์ ์์ฝํ๊ณ ์์ถํ๋๋ก ๊ตฌํํ๋ค. ๋ชจ๋ธ์ ์ํคํ ์ฒ ๊ฒฐ์ ์ฌํญ, ๋ฏธํด๊ฒฐ๋ ๋ฒ๊ทธ, ๊ตฌํ ์ธ๋ถ์ฌํญ์ ๋ณด์กดํ๋ฉด์ ์ค๋ณต๋ tool ์ถ๋ ฅ์ด๋ ๋ฉ์์ง๋ ํ๊ธฐํ๋ค.
(Claude Code ์ฌ์ฉํ ๋ ์ผ์ ๋ํ๋ฅผ ์งํํ ํ์๋ /clear
๋ช
๋ น์ผ๋ก context ์ด๊ธฐํํด์ฃผ๋ ๊ฒ์ด ์ข๋ค.)
์ด๊ธฐ์๋ recall๋ฅผ ์ต๋ํํ์ฌ ์ ๋ณด๋ฅผ ๋์น์ง ์๋ ๊ฒ์ด ์ค์ํ๊ณ (์ฆ, ์ถํ์ ์ฌ์ฉ๋ ์ ๋ณด๊ฐ ์ ๊ฑฐ๋์ง ์๋๋ก), ๊ทธ ์ดํ์๋ ํ์ฌ ์์ ๊ณผ ๊ด๋ จ ์๋ ๋ถํ์ํ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ์ฌ precision์ ๊ฐ์ ํ๋ ๋ฐฉ์์ผ๋ก ๋ฐ๋ณตํ๋ ๊ฒ์ด ์ข๋ค. (recall๋ฅผ ํ๋ณดํ ํ์ precision์ ํ๋ณดํ๋ ๊ฒ์ ๊ถ์ฅํ๋ค.)
context ๋ฐ์ ํ์ผ ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ๋ก ์งํ ์ํฉ์ ์ถ์ ํ๊ณ , ์ง์์ ๋์ ํ๋ค. ํ์ ์์๋ง ๋ค์ ๋ก๋ฉํ๊ณ , ์ฅ๊ธฐ์ ์ธ ์์ ์์ ์ผ๊ด์ฑ์ ์ ์งํ๊ณ , context๊ฐ ์ด๊ธฐํ๋์ด๋ ์์ ์ ์ด์ด๊ฐ ์ ์๋๋ก ํ๋ค.
Claude Sonnet 4.5๋ built-in memory tool์ ์ ๊ณตํ์ฌ ์ปจํ ์คํธ๊ฐ ์ด๊ธฐํ๋์ด๋ ์ด์ ์ํ๋ฅผ ๋ณต์ํ๊ณ ์์ ์ ์ด์ด๊ฐ ์ ์๋ค.
*Agent์ 4๊ฐ์ง ํต์ฌ ๊ตฌ์ฑ์์(Perception, Planning, Action, Memory) ์ค Memory๋ ํ์๋ก, ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ๋ ์ค์ํ๋ค.
A Survey on Large Language Model based Autonomous Agents (2023)
๋ณต์กํ ํ ์คํฌ์๋ multi-agent ์ํคํ ์ฒ๊ฐ ์ ํฉํ๋ค. Main agent๋ planning & synthesis์ ์ง์คํ๊ณ , Sub-agents๋ ํน์ ์์ญ์ ๊น์ด ํ์ํ ํ ์์ฝ์ ์ฐ์ถํ๋ค. ์ด๋ฌํ ๊ณ์ธต์ ๊ตฌ์กฐ๋ ๊ฐ ์์ด์ ํธ๊ฐ ์์ ์ context ๋ด์ ํจ์จ์ ์ผ๋ก ํ๋ํ๋ฉด์๋ ๋ณต์กํ ์ต์ข ๋ชฉํ๋ฅผ ๋ฌ์ฑํ ์ ์๋๋ก ํ๋ค.