AI와 대화하는 법, 프롬프트로 배우다
한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.

- 원제 : Prompt Engineering for Generative AI: Future-Proof Inputs for Reliable AI Outputs
- 저자 : James Phoenix, Mike Taylor
- 출판 : 한빛미디어, 2025 / O’Reilly Media, 2024
AI 시대와 문맥
이제는 더이상 생성형 AI 를 사용하지 않는 사람들은 없다. 단순히 대화형, 생성형 AI 를 넘어 여러 에이전트와 LLM을 묶은 A2A, MCP 같은 개념들도 나오고 있다. 채이닝, 조합을 통해 AI는 더욱 강력한 도구로 자리매김하고 있다. 개인적으로 AI 를 활용해본 것은 작년에 이미지 생성을 위한 AI 를 시작해 평소에는 글쓰기에 많이 활용하고 있고 가장 최근에는 MCP를 활용한 개발 프로젝트에 활용하고 있다. 그런데 이러한 AI 생산 활동에 참여해보니 가장 중요한것은 ‘맥락’을 ‘잘’, 그리고 ‘전략적’으로 전달해야 하는것이였다. 어떤 요청을 보내느냐에 따라 결과물이 천차만별이 되기 때문에 AI가 아무리 발전하더라도 이 부분은 크게 변함이 없을것 같다는게 요즘의 생각이다.
그래서 프롬프트 엔지니어링이라는 주제로 좋은 책을 소개하고자 이렇게 자리를 마련하게 되었다. ‘생성형 AI를 위한 프롬프트 엔지니어링’은 프롬프트와 프롬프트 엔지니어링의 원리, 텍스트 생성과 이미지 생성을 위한 엔지니어링 전략, 두가지를 합쳐 실제로 활용해보는 내용들을 담고 있다.
프롬프트 엔지니어링?
프롬프트 엔지니어링이라는 말은 그 자체로 뭔가 기술적이고, 도구 중심적인 어감을 준다. 하지만 이 책의 시작은 그 기술 너머, 생성형 AI의 본질을 꿰뚫는 사유에서 출발한다. 왜 프롬프트를 설계해야 하는가? 왜 그 ‘말 걸기’ 방식이 결과를 좌우하는가? 나는 그 질문이야말로 지금의 AI 시대에서 우리가 먼저 던져야 할 물음이라 생각한다.
1~2장은 그런 의미에서 단순한 원리 설명을 넘어서, 생성형 AI의 ‘언어 감각’이 어떻게 구성되어 있는지를 상세하게 풀어준다. 특히 ‘트랜스포머 아키텍처’라는 구조가 단어 사이의 거리와 관계를 어떻게 벡터로 환산해 의미를 예측하는지, 그리고 그 예측이 반복되면서 결국 하나의 문장을 어떻게 완성해내는지를 시각적으로, 수학적으로, 그리고 사례 중심으로 정리해낸 점이 인상 깊었다.

예를 들어 “고양이가 매트 위에 앉았다(The cat sat on the mat)”라는 문장을 분석하며, 단어 간의 관계가 단순히 순서가 아닌 ‘맥락적 연결’로 해석된다는 설명은 AI가 ‘의미’를 어떻게 재구성하는지에 대한 직관을 잘 제공한다. 단어 하나하나가 독립적인 정보가 아니라, 각자의 위치에서 서로를 참조하면서 문장의 구조적 완성도를 높여가는 과정은 마치 인간의 사고 흐름을 반영하듯 자연스럽다.
또한 텍스트를 처리하는 데 있어 중요한 개념으로 등장하는 ‘토크나이징’ 과 ‘어텐션’ 에 대한 설명도 알차다. 특히 ‘byte pair encoding (BPE)’을 통해 단어를 세분화하고 재구성하는 원리는, 우리가 AI에게 무언가를 요청할 때 왜 단어 선택과 표현 방식이 중요한지를 실감케 한다. 결국, AI는 말을 듣는 방식이 인간과는 다르며, 그 방식에 맞춰 말해야 원하는 답을 얻을 수 있다는 사실을 깨닫게 된다.
텍스트 프롬프트 엔지니어링
이 장에서는 프롬프트의 문장 하나하나가 어떻게 결과물의 형태와 품질을 좌우하는지 상세히 다룬다. 특히, 짧고 단순한 문장으로 구성된 프롬프트가 정확하고 구체적일수록 원하는 결과를 얻을 가능성이 높다는 점을 실무적 사례들을 통해 명쾌히 제시한다.

무엇보다도 이 장에서는 AI 모델이 언어를 어떻게 인식하고 처리하는지를 구체적으로 설명한다. JSON이나 YAML과 같은 특정 데이터 포맷으로 결과물을 얻기 위한 프롬프트 구성법, 간단한 리스트부터 복잡한 문서 구조에 이르기까지 다양한 사례를 통해 실무에서 바로 적용 가능한 노하우를 전달한다. 또한 AI의 응답이 사용자의 요구를 정확히 충족하도록 하기 위한 ‘포맷 지정’, ‘지시문의 명확화’, ‘예시를 통한 맥락 제공’과 같은 전략적 접근법은 실무 환경에서 매우 유용하다. 예를 들어, “디즈니 캐릭터 목록을 주석 없이 리스트로 간결히 제공하라”와 같이 출력 형태를 정확히 지정할 경우, 불필요한 정보나 오해의 소지가 없고 명료한 결과를 얻을 수 있다.
이 책의 중요한 메시지 중 하나는 결국 프롬프트 설계가 기술적인 도구 사용 이상의 의미를 지닌다는 점이다. 책이 보여준 여러 예시 중 JSON 형태로 응답을 요구하거나 특정 문서 형식을 지정하는 방법 등은 AI가 인간의 의도를 최대한 정확히 이해하도록 돕는다. 이는 단순히 효율적인 프롬프트 설계가 아니라, AI와 사용자 간의 원활한 커뮤니케이션을 위한 언어 설계라는 점에서 더 큰 가치를 지닌다. 이 장을 통해 독자들은 프롬프트 엔지니어링이 모델의 능력을 최대한 끌어내는 전략적 사고 과정이라는 점을 분명히 인지하게 된다.
결국 프롬프트 엔지니어링은 AI를 ‘잘 사용하는’ 기술을 넘어 AI와의 ‘효과적인 대화’를 만드는 과정이다. 모델에게 건네는 간단한 한 문장이 사용자의 의도를 정확히 전달할 때, 비로소 우리는 생성형 AI의 진정한 잠재력을 이끌어낼 수 있게 된다. 이 책은 그 과정에서 요구되는 사고의 깊이와 세밀한 전략을 매우 잘 보여준다.
이미지 프롬프트 엔지니어링
텍스트를 넘어 이미지라는 영역에 이르면, 프롬프트 엔지니어링은 한층 더 흥미로워진다. 이미지 프롬프트 파트는, 확산 모델(diffusion model)을 기반으로 한 대표적인 이미지 생성 AI 기술들을 명확하게 비교하고 설명해준다. DALL·E, 미드저니(Midjourney), 스테이블 디퓨전(Stable Diffusion)과 같은 AI가 이미지 생성 분야에서 어떻게 경쟁력을 갖추었는지 구체적인 사례를 통해 독자에게 생생히 전달한다.

특히 이 장에서는 각 모델이 가진 고유의 특징과 한계, 그리고 이를 최대한 활용하는 프롬프트 설계 방법을 다룬다. 예를 들어 DALL·E는 텍스트와 이미지의 창의적 융합을 강조한 반면, 미드저니는 고품질의 예술적 이미지에 초점을 맞춰 상업적 활용성을 높였다는 설명은, 독자가 자신의 필요에 맞는 도구를 선택할 때 매우 유용한 기준이 된다. 스테이블 디퓨전은 접근성 높은 오픈 소스 모델로서 빠르게 개발자 커뮤니티의 인기를 얻고 있으며, 실질적인 프롬프트 활용 노하우를 구체적으로 제시하여 독자가 직접 자신의 컴퓨터에서 이미지를 생성하고 활용할 수 있도록 돕는다.
이 책은 생성형 AI의 작동 원리부터 실전 응용까지를 관통하며, 단순한 기술 설명을 넘어 전략적 사고를 자극하는 구성으로 이루어져 있다. 특히 프롬프트를 설계하는 행위가 곧 AI와의 대화 방식이며, 그 대화의 질이 결과의 품질을 좌우한다는 메시지가 인상 깊다. 실무에서 AI를 도구로 활용하는 사람이라면 누구나 한 번쯤 이 책을 통해 ‘어떻게 질문할 것인가’를 되돌아보게 될 것이다. 나 또한 이 책을 통해 AI와의 상호작용이 단순한 명령이 아니라 일종의 ‘설계된 의사소통’이라는 사실을 새삼 깨달았다. 결국 프롬프트 엔지니어링은 단지 입력값을 다듬는 일이 아니라, 우리가 원하는 세계를 AI와 함께 그려나가는 새로운 문법이 된다.
한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다.