프롬프트를 대충 써도 AI가 알아서 잘 해주던 시절이 끝나고 있어요. 2026년 4월, Anthropic이 내놓은 Claude Opus 4.7은 지시를 문자 그대로 해석하고, OpenAI의 GPT-5.5는 목표만 던져주면 알아서 계획하고 도구를 쓰고 검증까지 합니다. 같은 "AI"인데 프롬프트 접근법이 정반대예요. 모호하게 쓰면 한쪽은 너무 좁게 해석하고, 다른 쪽은 너무 넓게 달려갑니다.
Claude Opus 4.7, 왜 예전 프롬프트가 안 먹히나?
이전 Claude 모델은 지시가 좀 허술해도 알아서 보완해줬어요. "이메일 정리해줘"라고 하면 문법도 고치고, 구조도 바꾸고, 논리 흐름까지 손봐줬죠. Opus 4.7은 다릅니다.
Anthropic 공식 발표문에 이런 문구가 있어요. "where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally. Users should re-tune their prompts and harnesses accordingly." 말 그대로, 시키는 것만 합니다.
"이메일 정리해줘"라고 하면? 문법과 포맷만 고치고 끝이에요. 논점을 재구성하거나 톤을 바꾸는 건 하지 않습니다. 그걸 원하면 명시적으로 써줘야 하죠.
GPT-5.5는 왜 반대 방향으로 갔을까?
GPT-5.5는 자율성을 크게 키운 모델이에요. OpenAI 공식 발표문 원문을 보면 이렇습니다. "you can give GPT-5.5 a messy, multi-part task and trust it to plan, use tools, check its work, navigate through ambiguity, and keep going."
실제로 Lenny's Newsletter에 실린 Claire Vo의 테스트 리뷰가 인상적이에요. 200만 행짜리 비정형 데이터 마이그레이션 작업을 GPT-5.5에 맡겼더니, 후속 프롬프트 없이 6시간 동안 자율적으로 작업을 완료했습니다. 중간에 승인 요청 한 번, 그게 전부였다고 해요.
과거에는 단계별로 지시를 나눠 써야 했다면, GPT-5.5에는 오히려 너무 상세한 단계별 지시가 방해가 됩니다. Cursor CEO Michael Truell도 "It stays on task for significantly longer without stopping early"라고 평가했죠.
같은 프롬프트, 완전히 다른 결과
이 차이가 실무에서 어떤 의미인지 정리하면 이래요.
| 항목 | Claude Opus 4.7 | GPT-5.5 |
|---|---|---|
| 지시 해석 방식 | 문자 그대로 (literal) | 의도를 추론해서 확장 |
| 모호한 프롬프트 결과 | 최소한의 범위만 실행 | 스스로 판단해서 넓게 실행 |
| 좋은 프롬프트 스타일 | 범위·형식·기준을 명시적으로 | 목표와 제약만 간결하게 |
| 위험 요소 | 원하는 걸 안 적으면 빠짐 | 원치 않는 것도 알아서 추가할 수 있음 |
| 적합한 작업 | 정밀한 코딩, 문서 검토, 규칙 기반 작업 | 복잡한 멀티스텝 작업, 자율 에이전트 |
기존 프롬프트, 그대로 쓰면 안 되는 이유
Anthropic이 공식적으로 "기존 프롬프트를 재조정하라"고 권고하고 있어요. 4.6에서 잘 돌아가던 프롬프트가 4.7에서는 예상과 다른 결과를 낼 수 있거든요. 느슨하게 해석해주던 부분이 사라졌으니까요.
GPT 쪽도 마찬가지입니다. GPT-5.5의 자율성이 높아지면서 과거처럼 "1단계: ~해줘, 2단계: ~해줘, 3단계: ~해줘" 식으로 쪼개서 지시하면 오히려 모델이 제약을 느끼고 비효율적으로 동작한다는 실사용 피드백이 나오고 있어요.
모델을 바꿨으면 프롬프트도 바꿔야 합니다.
그러면 프롬프트를 어떻게 써야 하나?
모델이 똑똑해질수록, 길고 복잡한 프롬프트 기술보다 "내가 뭘 원하는지 정확히 아는 것"이 더 중요해졌어요. Anthropic의 프롬프트 엔지니어링 공식 문서도 첫 번째 단계로 "성공 기준(success criteria)을 먼저 명확히 정의하라"고 안내하고 있죠.
실무에서 바로 적용할 수 있는 원칙을 정리하면 이렇습니다.
- Claude 계열: "뭘 해줘"가 아니라 "이 범위에서, 이 형식으로, 이 기준에 맞게 해줘"로 써야 해요. 안 적은 건 안 합니다.
- GPT 계열: 목표와 제약 조건만 명확히 주고, 중간 단계는 맡기세요. 너무 쪼개면 오히려 역효과예요.
- 공통: 프롬프트를 쓰기 전에 "이 작업이 성공하면 어떤 모습이지?"를 먼저 정의하세요. 그게 곧 프롬프트의 뼈대가 됩니다.
AI가 똑똑해질수록 프롬프트의 길이가 아니라 생각의 명확함이 결과를 좌우해요. 여러분의 프롬프트, 마지막으로 점검한 게 언제인가요? 더 자세한 내용은 휴미즈에서 확인하세요.
이 글은 기업 데이터 관리 및 컴플라이언스 전문 기업 휴미즈가 작성했습니다.


0 댓글