작성일 댓글 남기기

[휴먼 인 더 루프(Human-in-the-Loop): AI 시대, 사람만 할 수 있는 일] 10/12화: AI가 답을 다 줘도, 신입은 ‘왜’부터 배워야 한다

AI 시대 선배와 신입의 멘토링 장면

올해 들어온 신입이 다르다

올해 3월, 우리 팀에 신입이 한 명 들어왔다. 금융IT 경력 20년 동안 수많은 신입을 맞이했지만, 이번에는 확실히 달랐다. 입사 첫 주부터 그 차이를 느꼈다.

온보딩 과제로 간단한 내부 관리 화면을 하나 만들어보라고 했다. 예전 신입들은 보통 이 과제에 2주를 썼다. 기획 문서 읽고, 기존 코드 뒤지고, 선배한테 이것저것 물어보고, 한두 번 삽질하고, 그러다 어느 순간 “아, 이 구조가 이래서 이렇게 된 거구나” 하는 깨달음의 순간이 온다. 그게 보통의 성장 과정이었다.

그런데 올해 신입은 사흘 만에 완성본을 들고 왔다. 화면 구성도 깔끔했고, 예외 처리도 나름 되어 있었고, 심지어 코드 스타일이 우리 팀 컨벤션과 꽤 비슷했다. 놀라서 물었다.

“이거 어떻게 이렇게 빨리 했어?”

신입은 아무렇지 않게 대답했다. “AI한테 기존 코드 패턴 분석시키고, 요구사항 넣어서 초안 뽑은 다음에 수정했습니다.” 당당했고, 실제로 결과물의 품질도 나쁘지 않았다.

첫 반응은 순수한 감탄이었다. ‘세상 많이 변했구나. 요즘 애들은 정말 다르네.’ 팀원들도 비슷한 반응이었다. 일부는 “우리도 저렇게 했으면 야근 줄었을 텐데”라고 농담 섞인 부러움을 표했다. 한 달 정도는 모든 것이 순조로워 보였다.

신입의 생산성은 확실히 높았다. 코드 작성 속도, 문서 정리 속도, 심지어 회의록 작성까지 — 이전 세대 신입들과는 비교가 안 될 정도였다. 수치로만 보면 2~3년차 못지않은 아웃풋이었다. 팀 리더로서 뿌듯한 마음이 있었다.

하지만 어떤 불안이 마음 한구석에서 자라고 있었다. 처음에는 그 불안의 정체를 정확히 짚지 못했다. 결과물은 좋은데 뭐가 문제란 말인가. 구체적으로 꼬집어 말하기 어려운, 그런 종류의 불편함이었다.

놀라움 뒤에 찾아온 불안

불안의 정체가 드러나기까지 오래 걸리지 않았다. 입사 두 달째, 작은 장애가 하나 터졌다.

신입이 만든 관리 화면에서 특정 조건으로 조회하면 데이터가 중복 표시되는 버그였다. 심각한 건 아니었지만, 금융 시스템에서 숫자가 두 번 보이는 건 사용자에게 공포를 준다. 바로 수정해야 했다.

“여기 중복 조회 건, 원인 파악해서 수정해줄 수 있어?”

신입이 고개를 끄덕였다. 그리고 반나절이 지났다. 보통 이 정도 버그는 한두 시간이면 원인을 찾는다. 궁금해서 자리에 가봤다.

신입은 AI에게 에러 로그를 통째로 붙여넣고 “이 버그의 원인과 해결책을 알려줘”라고 물어보고 있었다. AI가 세 가지 가능한 원인을 제시했고, 신입은 첫 번째 해결책을 그대로 적용했다. 하지만 버그는 사라지지 않았다. 두 번째 해결책을 적용했다. 역시 안 됐다. 세 번째도 마찬가지.

그 다음에 신입이 한 행동이 결정적이었다. AI에게 다시 물었다. “방금 알려준 세 가지가 다 안 되는데, 다른 원인 알려줘.” AI가 또 세 가지를 제시했다. 신입은 다시 순서대로 적용하기 시작했다.

나는 조용히 지켜보다가 물었다.

“잠깐. 그 쿼리에서 조인이 왜 두 번 걸려 있는지 이해하고 있어?”

신입이 멈칫했다. 잠시 침묵이 흘렀다.

“…사실 이 테이블 관계가 정확히 어떻게 되는지 잘 모르겠습니다.”

그 순간 깨달았다. 불안의 정체는 이것이었다. 결과물은 있는데 이해가 없었다. 아웃풋은 나오는데 과정이 빠져 있었다. AI가 과정을 통째로 건너뛰게 해준 것이다.

신입을 탓하는 게 아니다. 그 신입은 똑똑했고 성실했다. 다만 이 시대가 만든 새로운 종류의 함정에 빠져 있었을 뿐이다. 그리고 사실 그 함정은 신입 혼자 만든 것이 아니었다. AI가 모든 답을 내려주는 환경에서, “답을 빨리 내라”고 재촉하는 조직 문화가 함께 만든 것이었다.

AI 숏컷과 과정 경험의 차이 다이어그램

AI가 가려주는 것 — ‘과정의 공백’

이 에피소드를 팀 회고에서 공유했을 때, 10년차 시니어 한 명이 정곡을 찔렀다.

“예전에 신입이 삽질하면서 이상한 코드 짜면, 그걸 고쳐주면서 왜 이렇게 해야 하는지 가르칠 수 있었잖아요. 근데 지금은 AI가 처음부터 꽤 괜찮은 코드를 짜주니까, 뭘 모르는지를 모르는 거예요.”

정확한 진단이었다. AI 시대의 신입 교육에서 가장 어려운 점은 바로 이것이다. AI가 과정을 가려버린다. 예전에는 과정이 눈에 보였다. 삽질의 흔적이 코드에 남았고, 질문의 수준이 이해의 깊이를 드러냈다. 선배는 그 흔적을 보고 “아, 이 부분을 아직 모르는구나” 하고 개입 시점을 잡을 수 있었다.

지금은 다르다. AI가 중간 과정을 통째로 대행하기 때문에, 겉으로 드러나는 결과물만으로는 신입이 무엇을 알고 무엇을 모르는지 판단하기 어렵다. 마치 계산기를 주고 수학 시험을 보게 한 것과 같다. 답은 맞는데, 풀이 과정이 머릿속에 없다.

과정의 공백이 만드는 구체적인 문제들을 정리하면 이렇다.

  • 디버깅 능력의 부재: 코드를 직접 짜보지 않았으니, 버그가 생겼을 때 어디를 의심해야 하는지 감이 없다. AI에게 물어봐도 AI는 실제 시스템의 맥락을 모르기 때문에 일반적인 답만 나열한다.
  • 설계 감각의 결여: 왜 이 구조가 이렇게 되어 있는지, 왜 이 패턴을 쓰는지 이해하지 못한다. 기존 코드를 모방할 수는 있지만, 새로운 상황에서 적절한 판단을 내리지 못한다.
  • 장애 대응 불능: 순조로울 때는 문제가 드러나지 않는다. 하지만 무언가 깨졌을 때 — 금융 시스템에서는 반드시 깨지는 순간이 온다 — 과정을 건너뛴 사람은 문자 그대로 얼어붙는다.
  • 소통의 단절: 자기가 만든 코드를 설명하지 못한다. 코드 리뷰에서 “왜 이렇게 했어?”라고 물으면 “AI가 이렇게 해주길래요”라는 답이 돌아온다. 이 시리즈의 5화에서 말한 “AI가 시킨 대로 했어요”가 가장 처음 나타나는 지점이 바로 여기다.

오해하지 말아달라. AI를 쓰지 말라는 이야기가 아니다. AI는 분명히 강력한 도구다. 문제는 AI를 쓰는 타이밍이다. 기초가 잡히기 전에 AI에게 과정을 통째로 위임하면, 겉으로는 빠르게 성장하는 것 같지만 실제로는 모래 위에 건물을 올리는 것과 같다.

결과와 역량의 착시 — ‘달리기 전에 걷는 법을 배워야 한다’는 진부한 말이 진부하지 않은 이유

한 가지 비유를 들어보겠다. 내비게이션 앱이 없던 시절, 처음 운전면허를 따고 도로에 나서면 지도를 보면서 길을 찾았다. 길을 잘못 들어서 30분을 헤매기도 했고, 일방통행 골목에 갇혀서 식은땀을 흘리기도 했다. 그 삽질을 통해 도로 체계가 머릿속에 새겨졌다. ‘아, 이 동네는 이런 구조구나. 큰길에서 좌회전하면 여기로 나오는구나.’

내비게이션이 보편화된 후의 운전자는 다르다. 목적지를 찍으면 알아서 안내해준다. 매일 출퇴근하는 길조차 내비게이션 없이는 불안한 사람이 많다. 평소에는 문제가 없다. 하지만 앱이 먹통이 되거나, 도로가 통제되거나, 처음 가는 곳에서 내비 신호가 잡히지 않을 때 — 길에 대한 감각이 있는 사람과 없는 사람의 차이가 극명하게 드러난다.

코드를 짜는 일도 같다. AI가 내비게이션이라면, 기초 과정에서의 삽질은 도로 체계를 체득하는 시간이다. 삽질 없이 AI에게 목적지만 찍어주는 사람은, 내비게이션이 작동하는 한 빠르고 정확하다. 하지만 내비가 꺼지는 순간 — 시스템에 장애가 나고, 로그가 꼬이고, 문서에 없는 상황이 벌어지는 순간 — 스스로 길을 찾지 못한다.

금융IT에서 그런 순간은 반드시 온다. 연말 정산 시즌의 트래픽 폭주, 규제 변경에 따른 긴급 시스템 수정, 보안 사고 대응. 이런 상황에서 “AI한테 물어볼게요”는 통하지 않는다. 실시간으로 판단하고, 맥락을 읽고, 책임지는 결정을 내려야 한다. 그 능력은 과정을 경험한 사람에게만 있다.

20년 전, 내가 삽질로 배운 것

나도 한때 신입이었다. 2006년, 금융IT 업계에 첫 발을 디딘 해다. 그때는 AI는커녕 구글 검색도 지금처럼 만능이 아니었다. 스택오버플로우는 존재하지도 않았다(2008년 출범). 모르는 게 있으면 책을 뒤지거나, 선배한테 물어보거나, 직접 삽질하는 수밖에 없었다.

입사 3개월째 되던 날, 첫 번째 야근 장애 대응을 경험했다. 야간 배치 작업이 실패했다. 수만 건의 거래 데이터가 정상적으로 이관되지 않은 것이다. 새벽 2시에 전화가 왔고, 잠결에 사무실로 나갔다.

선배가 옆에 있었지만, 먼저 해보라고 했다. “로그부터 봐. 어디서 끊겼는지 찾아.” 나는 수천 줄의 로그를 눈으로 훑었다. 한 시간이 지나도 원인을 못 찾았다. 선배가 힌트를 줬다. “그 로그 말고, 이 로그를 봐. 시간 순서대로 따라가봐.” 또 한 시간. 겨우 의심가는 지점을 찾았다. “여기 이 쿼리가 타임아웃 난 것 같은데요.” “왜 타임아웃이 났을까?” “…데이터가 많아서요?” “데이터는 항상 이만큼이야. 왜 오늘만 느렸을까?”

결국 원인은 당일 적용된 인덱스 변경 때문이었다. 다른 팀에서 성능 개선을 위해 인덱스를 재구성했는데, 그게 우리 배치 쿼리의 실행 계획을 바꿔버린 것이다.

그 새벽에 배운 것은 인덱스 지식이 아니었다. 그건 나중에 문서로도 배울 수 있는 것이었다. 내가 진짜 배운 것은 ‘왜’를 끝까지 묻는 습관이었다.

  • 로그에서 에러를 찾았다 → 왜 에러가 났지?
  • 쿼리가 느려졌다 → 왜 오늘만 느렸지?
  • 인덱스가 바뀌었다 → 왜 인덱스 변경이 이 쿼리에 영향을 줬지?
  • 실행 계획이 달라졌다 → 왜 옵티마이저가 다른 경로를 택했지?

매 단계에서 ‘왜’를 물었고, 선배는 정답을 직접 알려주는 대신 “왜”를 더 물어보게 유도했다. 그 과정이 괴로웠지만, 그 새벽의 4시간이 이후 20년 커리어의 기반을 만들었다. 시스템 장애 앞에서 얼어붙지 않고 침착하게 원인을 추적하는 능력, 겉으로 드러난 현상 뒤에 숨은 진짜 원인을 찾아가는 감각 — 그것은 삽질 없이는 절대 체득할 수 없는 것이었다.

삽질이 ‘낭비’가 아닌 이유

20년이 지난 지금, 나는 그 새벽의 경험을 자주 떠올린다. 단순히 “옛날에는 힘들었지” 같은 향수가 아니다. 그 경험이 만들어준 사고 패턴이 여전히, 아니 AI 시대인 지금 오히려 더 중요해졌기 때문이다.

AI가 내놓는 답을 평가하려면, 그 답이 맞는지 틀린지 판단할 수 있는 기저 경험이 필요하다. 직접 삽질해본 사람은 AI의 답이 맞을 때 “맞아, 이건 이래서 맞는 거야”라고 확신할 수 있고, 틀렸을 때 “잠깐, 이건 좀 이상한데”라고 직감이 작동한다. 삽질 없이 AI의 답만 받아온 사람에게는 그 직감 자체가 없다.

이 시리즈의 6화에서 판단에 대해, 8화에서 맥락에 대해, 9화에서 창의적 도약에 대해 이야기했다. 그 모든 ‘사람만 할 수 있는 일’의 공통 전제 조건이 바로 과정의 체험이다. 과정을 겪어보지 않은 사람에게 판단력은 자라지 않고, 맥락을 읽는 감각은 형성되지 않으며, 기존 패턴 너머로 도약하는 창의성도 발현되지 않는다.

삽질은 낭비가 아니라 투자다. 다만 AI 시대의 삽질은 과거와 같아서는 안 된다. 방향 없이 헤매게 하는 것이 아니라, 의미 있는 방향으로 질문하게 만드는 것이 핵심이다. 그리고 그 질문의 출발점이 바로 ‘왜’다.

가르쳐야 할 단 하나 — ‘왜’를 끝까지 묻는 힘

금융IT 20년, 챗봇 운영 8년을 돌아보면서, AI 시대의 신입에게 가르쳐야 할 것이 무엇인지 오래 고민했다. 프로그래밍 언어? 프레임워크? 프롬프트 엔지니어링? 모두 중요하지만, 모두 시간이 지나면 바뀐다. 올해 배운 프레임워크가 3년 후에도 살아있을 거라는 보장은 없다.

결론은 의외로 단순했다. AI의 답 앞에서 ‘왜’를 묻는 습관. 이것 하나다.

‘왜’를 묻는다는 것은 단순히 의심하라는 뜻이 아니다. AI의 답을 받아들이기 전에 그 답의 구조를 이해하라는 뜻이다. AI가 “이렇게 하세요”라고 했을 때, “왜 이렇게 해야 하지? 다른 방법은 없나? 이 방법의 전제 조건은 뭐지? 우리 시스템에서도 이게 맞나?”를 묻는 것이다.

신입에게 이런 이야기를 하면 가장 많이 듣는 반응이 있다. “그러면 AI를 쓰는 의미가 없지 않나요?” 아니다. AI를 더 잘 쓰기 위해 ‘왜’를 묻는 것이다.

비유를 하나 더 들겠다. 좋은 요리사는 레시피를 따르되, 왜 이 순서로 조리하는지, 왜 이 온도가 필요한지, 왜 이 재료가 들어가는지를 이해한다. 그래서 재료가 바뀌거나 도구가 달라져도 응용할 수 있다. 레시피만 따르는 사람은 레시피에 없는 상황을 만나면 멈춘다. AI는 세상에서 가장 방대한 레시피북이다. 하지만 레시피 뒤에 숨은 원리를 이해하는 것은 요리사 — 즉 사람 — 의 몫이다.

‘왜’를 묻는 힘은 태생적인 재능이 아니다. 훈련으로 만들어지는 습관이다. 그리고 습관은 환경이 만든다. 신입이 ‘왜’를 묻는 환경을 만들어주는 것, 그것이 AI 시대에 선배가 할 수 있는 가장 가치 있는 일이다.

왜(Why)가 키우는 세 가지 역량의 나무

‘왜’가 키우는 세 가지 근육

이 시리즈를 1화부터 읽어오신 분들은 눈치챘을 수 있다. 내가 말하는 ‘왜’를 묻는 힘은, 사실 지난 아홉 편에 걸쳐 이야기한 ‘사람만 할 수 있는 일’들의 공통 뿌리다. ‘왜’를 습관적으로 묻는 사람에게는 세 가지 근육이 자란다.

첫 번째 근육: 판단력 — 답의 무게를 재는 힘

6화에서 다뤘던 주제다. AI는 답을 주지만 결정은 사람이 한다. 그 결정을 내리려면, 답이 얼마나 신뢰할 수 있는지 무게를 잴 수 있어야 한다.

챗봇 운영 8년 동안 겪은 일이다. 금융 상품 추천 챗봇이 고객에게 특정 상품을 추천했다. 알고리즘상으로는 맞는 추천이었다. 고객의 연령, 자산 규모, 투자 성향 — 모든 데이터가 그 상품을 가리키고 있었다. 하지만 운영팀의 시니어가 개입했다. “이 고객 최근 가족 관련 상담 이력 있지 않았나? 지금 이 상품을 추천하면 시기적으로 부담스러울 수 있어.”

데이터에는 없는 판단이었다. AI가 내놓은 ‘정답’에 ‘왜 이게 맞다고 확신할 수 있나?’를 물었기 때문에 가능한 개입이었다. 이 판단력은 하루아침에 생기지 않는다. 수많은 상황에서 ‘왜’를 물어보고, 답이 틀렸던 경험과 맞았던 경험이 쌓여서 형성된다.

신입이 이 판단력을 키우려면, AI의 답을 받았을 때 최소한 세 가지를 스스로에게 물어야 한다.

  • 이 답의 전제 조건은 무엇인가?
  • 우리 시스템에서 그 전제 조건이 성립하는가?
  • 이 답이 틀렸다면 어떤 결과가 발생하는가?

이 세 질문만 습관화해도, AI를 ‘받아쓰기’하는 단계에서 ‘AI와 협업’하는 단계로 넘어갈 수 있다.

두 번째 근육: 맥락 — 행간을 읽는 감각

8화에서 이야기한 것처럼, AI는 행간을 읽지 못한다. 회의에서 팀장이 “이 건은 천천히 가자”라고 했을 때, 그 말이 정말 ‘천천히 하자’는 뜻인지, ‘다른 우선순위가 있다’는 뜻인지, ‘상위 보고가 끝나야 한다’는 뜻인지는 맥락을 아는 사람만 읽을 수 있다.

맥락을 읽는 감각은 어디서 오는가? 직접 그 맥락 안에 있어본 경험에서 온다. 비슷한 상황을 여러 번 겪어본 사람은, 표면적인 말 뒤에 숨은 의도를 감지하는 안테나가 생긴다. 그 안테나는 AI가 만들어줄 수 없다.

‘왜’를 묻는 습관이 맥락 읽기와 어떻게 연결되는가? 예를 들어보겠다.

신입이 코드 리뷰에서 “이 함수는 왜 이렇게 복잡하게 되어 있어요?”라고 물었다고 하자. 단순한 기술 질문이다. 하지만 이 ‘왜’를 따라가면 기술 너머의 맥락에 도달한다. “3년 전에 규제가 바뀌면서 이 로직이 추가됐어.” “왜 규제가 바뀌었어요?” “고객 보호 강화 정책 때문이야.” “그러면 이 복잡한 로직을 단순화하면 규제에 걸릴 수도 있는 건가요?” — 이 대화를 통해 신입은 코드가 아니라 코드 뒤에 있는 사업 맥락을 배운다.

금융IT에서 맥락을 모르는 코드 수정은 위험하다. “이 코드 비효율적인데요, AI가 더 깔끔한 방법을 알려줬어요”라고 하면서 규제 관련 로직을 건드리는 순간, 시스템은 규제 위반 상태가 된다. AI는 코드의 효율만 보지, 그 코드가 왜 그 자리에 있는지는 모른다. 왜를 물어본 사람만이 “이건 건드리면 안 돼”를 직감할 수 있다.

세 번째 근육: 도약 — 보간 너머의 창의

9화에서 다뤘던 보간(interpolation)과 외삽(extrapolation)의 구분이다. AI는 기존 데이터 사이를 채우는 보간의 천재다. 하지만 기존에 없던 영역으로 뛰어넘는 외삽 — 즉 창의적 도약 — 은 사람의 영역이다.

‘왜’를 묻는 습관은 창의의 씨앗이다. “왜 우리는 이 방식으로 하고 있지?” → “꼭 이래야 하나?” → “다르게 하면 어떨까?” 이 사고의 흐름이 기존 패턴 너머의 도약을 가능하게 한다.

사내 시스템 개선 사례가 있었다. 기존 보고서 생성 프로세스가 번거롭다는 불만이 오래됐다. AI에게 “보고서 생성 프로세스를 개선해줘”라고 물으면, 기존 프로세스를 최적화하는 방향의 답이 나온다 — 단계를 줄인다, 자동화한다, 템플릿을 만든다 등. 전부 기존 패턴 ‘안에서의’ 개선이다.

하지만 팀에서 한 사람이 “왜 보고서를 이 형식으로 만들어야 하지?”를 물었다. 추적해보니 5년 전 특정 상위 부서의 요청으로 시작된 형식이었는데, 그 부서는 이미 다른 방식으로 데이터를 보고 있었다. 즉, 아무도 읽지 않는 보고서를 매주 만들고 있었던 것이다. ‘왜’를 끝까지 추적한 결과, 프로세스 개선이 아니라 프로세스 자체를 없애는 것이 답이었다.

AI는 이런 판단을 하지 못한다. AI에게 “보고서 프로세스를 개선해줘”라고 물으면 보고서를 더 잘 만드는 방법을 알려주지, “그 보고서 자체가 필요 없어요”라고는 절대 말해주지 않는다. 기존 프레임 밖으로 나가는 것은 ‘왜’를 끝까지 물어본 사람만이 할 수 있는 일이다.

“그래도 AI가 더 빠르잖아요” — 가장 흔한 반론에 답하다

이 이야기를 하면 반드시 나오는 반론이 있다. 신입에게서도, 때로는 관리자에게서도 나온다.

“AI가 10분이면 해주는 걸, 왜 사흘씩 삽질하게 합니까? 비효율 아닙니까?”

맞는 말이다. 단기적으로는 비효율이다. 오늘 해야 할 업무를 놓고 보면, AI를 써서 빠르게 끝내는 것이 합리적이다. 나도 그렇게 일한다. 반복적인 코드 생성, 데이터 정리, 문서 초안 — 이런 건 AI에게 맡기는 것이 당연히 효율적이다.

하지만 신입 교육에는 다른 시간 지평이 적용된다. 오늘의 산출물이 아니라 3년 후의 역량을 보는 것이다.

간단한 사고 실험을 해보자. 두 명의 신입이 있다.

신입 A: 첫 6개월간 모든 업무에 AI를 적극 활용했다. 산출물 품질 높았고, 업무 속도 빨랐다. 팀에서 “에이스”라는 평가를 받았다. 하지만 기초를 직접 다진 적이 없다.

신입 B: 첫 6개월 중 절반은 AI 없이 기초를 다지는 데 썼다. 의도적으로 손으로 코드를 짜고, 버그를 직접 잡고, 시스템 구조를 하나씩 파악했다. 나머지 절반에서 AI를 도구로 활용하기 시작했다. 초반 속도는 A보다 느렸다.

1년 후, 두 사람에게 이런 상황이 닥친다. 프로덕션 환경에서 원인 불명의 성능 저하가 발생했다. 기존에 없던 패턴의 문제다. AI에게 물어봐도 일반적인 답만 돌아온다. 로그를 직접 분석하고, 시스템 아키텍처를 머릿속에 그리고, 가설을 세우고 검증해야 한다.

A와 B 중 누가 이 상황을 해결할 수 있을까? 대부분의 경험 있는 개발자는 B라고 답할 것이다. 왜냐하면 B는 기초 과정에서 ‘왜’를 직접 추적한 경험이 있기 때문이다.

여기서 핵심은, “삽질”과 “AI 활용”이 양자택일이 아니라는 점이다. 삽질을 통해 기초를 다진 후에 AI를 활용하면, AI의 답을 평가하고 맥락에 맞게 적용하는 능력이 비약적으로 올라간다. 반대로, 기초 없이 AI를 쓰면 AI가 주는 답을 넘어서는 것이 구조적으로 불가능하다.

또 하나 간과하기 쉬운 점이 있다. AI의 능력 자체가 급변한다. 올해 최고 성능을 내는 AI 도구가 내년에도 같을 거라는 보장이 없다. 특정 AI 도구에 종속된 워크플로우는 그 도구가 바뀌면 무너진다. 하지만 ‘왜’를 묻는 습관은 도구가 바뀌어도 유효하다. 새로운 AI가 나와도 “이 답이 왜 이러한가, 내 상황에 맞는가”를 물을 수 있으니까.

비효율의 반론에 대한 나의 답은 이것이다. “처음 6개월의 비효율이 이후 20년의 효율을 만든다.” 신입 교육에서 아끼면 안 되는 것이 바로 이 기초 투자 시간이다.

선배가 먼저 바뀌어야 한다

여기까지 읽으면 “그래, ‘왜’가 중요한 건 알겠어. 그런데 실제로 어떻게 가르치지?”라는 의문이 들 것이다. 솔직히 말하겠다. 이건 선배의 변화 없이는 불가능하다.

지난 20년간 신입 교육의 패러다임이 여러 번 바뀌는 것을 봐왔다.

  • 2000년대: “모르면 책 봐.” 선배가 가르쳐주는 문화 자체가 약했다. 알아서 배우는 것이 미덕이었다.
  • 2010년대: “구글링해봐.” 검색의 시대. 질문 전에 검색했냐고 되묻는 것이 일상이었다.
  • 2020년대 초: “이 강의 들어봐.” 온라인 교육 플랫폼의 시대. 체계적인 커리큘럼이 풍부해졌다.
  • 2025년~: “AI한테 물어봐.” 가장 편하고, 가장 위험한 시대.

각 시대에서 선배의 역할은 달랐다. 하지만 AI 시대에 선배의 역할은 이전 어느 때보다 중요하다고 나는 확신한다. 왜냐하면 AI가 모든 “답”을 주는 환경에서, “질문”을 가르칠 수 있는 것은 사람뿐이기 때문이다.

변화 1: ‘답’을 가르치는 선배에서 ‘질문’을 가르치는 선배로

과거에 선배는 답을 알려주는 사람이었다. “이건 이렇게 해.” “이 패턴을 써.” “이 라이브러리가 좋아.” AI 시대에 이런 역할은 의미가 줄었다. AI가 더 빠르고 더 많은 답을 가지고 있으니까.

이제 선배의 핵심 역할은 좋은 질문을 하게 만드는 것이다. 신입이 “이거 어떻게 해요?”라고 물으면, 답을 주는 대신 “왜 이걸 해야 하는지 먼저 생각해봤어?”라고 되묻는 것이다. 신입이 AI의 답을 가져오면, “그래서 이 답이 맞다고 생각해? 왜?”라고 묻는 것이다.

이것은 예전의 “나한테 묻기 전에 구글링부터 해”와는 다르다. 그때는 ‘정보 접근’이 병목이었다. 지금은 정보가 넘쳐난다. 병목은 ‘정보를 판단하는 힘’이다. 선배는 그 판단의 과정을 보여주는 롤모델이 되어야 한다.

변화 2: 삽질할 시간을 ‘허락’해야 한다

현실적으로 가장 어려운 부분이 이것이다. 프로젝트 일정은 빠듯하고, 신입도 바로 투입해야 하는 상황에서 “천천히 기초부터 해봐”라고 말하기가 쉽지 않다.

하지만 방법이 있다. 업무의 일부를 “학습 구간”으로 명시적으로 지정하는 것이다. 예를 들어, 한 주에 하루는 “AI 없이 직접 해보는 날”로 정한다. 또는 신입이 맡은 업무 중 비(非)긴급한 한 건은 AI를 쓰지 않고 처음부터 끝까지 직접 해보게 한다. 그리고 그 과정에서 막히는 부분을 기록하게 한다.

이때 중요한 것은, 삽질의 결과를 성과 평가에서 분리하는 것이다. 학습 구간에서 느리게 일한 것을 “생산성이 낮다”고 평가하면, 아무도 삽질하지 않는다. “이 기간은 투자다”라는 공감대가 팀 전체에 있어야 한다.

우리 팀에서는 올해부터 신입의 첫 3개월을 “기초 투자 기간”으로 공식화했다. 이 기간에는 산출물의 양보다 “왜 이렇게 했는지 설명할 수 있는가”를 평가 기준으로 삼는다. 이 변화만으로도 신입들의 학습 태도가 눈에 띄게 달라졌다.

변화 3: AI 활용을 ‘설명 가능한 수준’으로 가르친다

AI를 완전히 배제하라는 것이 아니다. 오히려 AI를 적극 쓰되, AI가 준 답을 설명할 수 있는 수준에서 쓰게 하는 것이다.

구체적으로는 이런 규칙이다. “AI를 써서 코드를 작성해도 좋다. 단, 코드 리뷰에서 모든 줄을 자기 입으로 설명할 수 있어야 한다.” 설명하지 못하는 코드는 AI가 짠 것이든 자기가 짠 것이든 허용하지 않는다.

이 규칙은 단순해 보이지만 강력하다. AI의 답을 그대로 복사-붙여넣기 하면 설명이 안 되니까, 필연적으로 ‘왜’를 물어야 한다. “AI가 이 패턴을 썼는데, 왜 이게 다른 방법보다 나은 거지?” 이 질문을 스스로 던지는 순간, 학습이 시작된다.

현장에서 바로 쓰는 실천법 다섯 가지

지금까지의 이야기를 구체적인 실천법으로 정리한다. 선배든 신입이든, 내일부터 바로 적용할 수 있는 다섯 가지다.

1. “5 Whys” 루틴 도입

토요타 생산 시스템에서 유래한 “5 Whys”를 코드 리뷰와 장애 복기에 적용한다. AI가 준 답이든 자기가 쓴 코드든, “왜?”를 다섯 번 연속으로 물어본다. 대부분 세 번째 “왜”에서 진짜 이유에 도달하고, 다섯 번째에서 시스템 전체의 맥락이 보인다.

예시:

  • 이 변수는 왜 전역으로 선언했어? → “여러 함수에서 쓰니까요.”
  • 왜 여러 함수에서 같은 값을 쓰지? → “같은 설정값을 참조해야 해서요.”
  • 왜 설정값이 코드 안에 있어? 설정 파일에 빼면 안 돼? → “…아, 그렇게 하는 게 맞겠네요.”
  • 왜 설정 파일을 쓰는 게 나을까? → “배포 없이 설정을 바꿀 수 있으니까요.”
  • 왜 배포 없이 바꿀 수 있어야 하지? → “금융 시스템이라 점검 시간이 제한되어 있어서요.”

다섯 번의 “왜”를 거치니, 단순한 코딩 스타일 문제가 금융 시스템의 운영 제약이라는 맥락에 도달했다. 이런 경험이 쌓이면 신입도 자연스럽게 맥락을 고려하는 습관이 생긴다.

2. “AI 답안 분해” 연습

AI가 코드를 생성하면, 그 코드를 한 줄씩 분해해서 각 줄의 역할과 이유를 적어보게 한다. 문서 한 장이면 된다. 시간은 걸리지만, 이 과정을 3~4번만 반복하면 AI의 코드를 “읽는 눈”이 생긴다. 이후에는 AI 코드를 받아도 자연스럽게 “이 부분은 이래서 맞고, 이 부분은 우리 환경에 안 맞으니 수정해야겠다”는 판단이 가능해진다.

3. “AI-Free Day” 운영

주 1회, 특정 업무를 AI 도움 없이 수행하는 날을 정한다. 전체 업무를 AI 없이 하라는 것이 아니다. 한 가지 업무, 예를 들어 “이번 주 금요일 오전은 이 기능의 버그 수정을 AI 없이 해보자” 정도면 충분하다. 핵심은 AI 없이 일해보면서 “내가 실제로 아는 것과 모르는 것”을 스스로 파악하는 것이다. 자신의 지식 공백(knowledge gap)을 인식해야 학습의 방향이 잡힌다.

4. “설명 우선” 코드 리뷰

코드 리뷰의 첫 번째 질문을 “이 코드 설명해줄 수 있어?”로 바꾼다. 기존의 코드 리뷰가 “이 코드의 문제점은?”이었다면, AI 시대의 코드 리뷰는 “이 코드를 네가 이해하고 있는지”를 확인하는 데 초점을 맞춘다. 설명이 막히는 부분이 곧 학습이 필요한 부분이다.

이때 선배가 주의할 점이 있다. 설명을 못 한다고 질책하면 안 된다. “모르는 게 드러나는 것이 좋은 것”이라는 인식을 심어줘야 한다. 장기적으로 이것이 심리적 안전감과 학습 문화를 동시에 만든다.

5. “장애 복기” 공유 세션

실제 장애 사례(자사·타사 불문, 익명화된 것)를 가지고 팀 내 복기 세션을 진행한다. 장애의 현상부터 시작해서, “왜?”를 반복적으로 물으며 근본 원인에 도달하는 과정을 함께 경험한다. 신입이 직접 장애를 겪지 않아도, 이 세션을 통해 사고의 프로세스를 간접 체험할 수 있다.

이 다섯 가지를 모두 하지 않아도 된다. 팀 상황에 맞게 한두 가지만 골라서 시작해도 충분하다. 중요한 것은 “왜”를 묻는 행위가 팀의 일상에 자연스럽게 녹아드는 것이다.

AI 시대 신입 교육 실천법 5가지 요약

신입도 알아야 할 것 — 성장의 주체는 결국 자신이다

여기까지 선배의 역할을 주로 이야기했지만, 신입 본인에게도 할 말이 있다.

AI 시대에 신입으로 입사한다는 것은 축복이자 위험이다. 축복인 이유는 분명하다. 이전 세대가 수년에 걸쳐 쌓아야 했던 지식에 AI를 통해 빠르게 접근할 수 있다. 하지만 위험한 이유도 분명하다. 빠른 접근이 깊은 이해를 대체할 수 있다는 착각에 빠지기 쉽다.

솔직히 말해서, 선배가 “왜를 물어라”라고 아무리 강조해도, 본인이 그 필요성을 느끼지 못하면 습관이 되지 않는다. 그래서 한 가지 현실적인 질문을 던지고 싶다.

“지금 AI 없이, 자기가 맡은 업무를 처음부터 끝까지 할 수 있는가?”

이 질문에 자신 있게 “예”라고 답할 수 없다면, 그것이 바로 학습이 필요한 지점이다. AI를 쓰되, AI 없이도 할 수 있는 자신을 만들어가는 것 — 이것이 AI 시대 신입의 생존 전략이다.

모순적으로 들릴 수 있다. AI를 쓰면서 동시에 AI 없이도 할 수 있어야 한다니. 하지만 생각해보면 당연하다. 자동차가 있어도 걸을 줄 알아야 한다. 계산기가 있어도 산수를 알아야 한다. 도구에 대한 이해 없이 도구를 쓰는 것은 의존이지 활용이 아니다.

그리고 한 가지 더. AI 시대에 커리어에서 차별화되는 것은 “AI를 얼마나 잘 쓰는가”가 아니라 “AI가 할 수 없는 것을 얼마나 잘 하는가”다. AI를 잘 쓰는 것은 곧 모두의 기본 소양이 된다. 모두가 AI를 쓸 수 있는 세상에서, 경쟁력은 AI 너머에 있다. 판단, 맥락, 신뢰, 창의 — 이 시리즈에서 계속 이야기해온 것들이다. 그리고 그 모든 것의 출발점이 ‘왜’를 묻는 힘이다.

챗봇 운영에서 배운 역설 — AI가 똑똑할수록 사람의 기초가 중요해진다

챗봇을 8년 운영하면서 목격한 역설이 하나 있다. 챗봇이 똑똑해질수록, 챗봇 운영자에게 요구되는 역량 수준이 낮아지는 게 아니라 높아졌다.

초기의 챗봇은 단순했다. 키워드 매칭으로 FAQ를 내보내는 수준이었다. 운영자의 역할은 FAQ를 관리하고, 자주 묻는 질문 패턴을 정리하는 것이었다. 기초적인 업무였다.

챗봇이 자연어를 이해하고 맥락을 파악하는 수준으로 올라오면서, 역설적으로 운영자에게 더 높은 수준의 판단력이 요구되기 시작했다. 왜냐하면 AI가 “그럴듯하게” 틀리는 빈도가 높아졌기 때문이다.

단순한 챗봇이 틀리면 답이 아예 엉뚱해서 고객도 운영자도 바로 알 수 있었다. 하지만 고도화된 챗봇이 틀리면, 답이 99% 맞는 것처럼 보이는데 치명적인 1%가 잘못되어 있는 경우가 생긴다. 금융 상품의 수수료를 미묘하게 잘못 안내한다든지, 특정 조건에서만 적용되는 예외 규정을 빠뜨린다든지.

이런 “그럴듯한 오류”를 잡아내려면, 운영자 자신이 해당 금융 상품과 규정을 깊이 이해하고 있어야 한다. AI가 내놓은 답을 읽고 “이건 맞아, 이건 아니야”를 순간적으로 판단할 수 있어야 한다. 그 판단력은 직접 공부하고, 실수하고, 교정받은 경험에서 온다.

챗봇 운영에서 배운 이 교훈은 모든 AI 활용 영역에 적용된다. AI의 성능이 올라갈수록, AI를 감독하는 사람에게 요구되는 기초 역량의 수준도 올라간다. “AI가 다 해주니까 사람은 덜 알아도 돼”라는 생각은 완전히 거꾸로다. AI가 다 해줄수록 사람은 더 깊이 알아야 한다. 왜냐하면 AI가 미묘하게 틀릴 때 그것을 잡아내는 것이 사람의 역할이고, 그 역할은 기초가 탄탄해야만 수행할 수 있으니까.

3화에서 다뤘던 “피드백 루프”를 떠올려보자. AI가 답을 내놓으면 사람이 검증하고, 검증 결과를 다시 시스템에 반영한다. 이 루프가 제대로 돌아가려면 검증하는 사람의 역량이 충분해야 한다. 역량이 부족하면 루프가 돌아가는 것처럼 보이지만 실제로는 아무것도 걸러지지 않는 형식적 루프가 된다.

그래서 신입 교육이 중요하다. 오늘의 신입이 내일의 검증자이고, 모레의 판단자이고, 1년 후의 의사결정자다. 기초가 없는 검증자는 루프를 형식적으로 만들고, 기초가 없는 판단자는 7화에서 말한 신뢰 자산을 쌓지 못하며, 기초가 없는 의사결정자는 5화에서 경고한 “AI가 시킨 대로 했어요”의 함정에 빠진다.

가르침의 본질은 바뀌지 않았다

어쩌면 “AI 시대 신입에게 가르쳐야 할 단 하나”라는 제목이 거창해 보일 수 있다. 결론이 ‘왜를 물어라’라니, 너무 단순하지 않은가?

단순하다. 의도적으로 단순하게 만들었다. 왜냐하면 도구가 바뀌어도 변하지 않는 원칙은 단순해야 살아남기 때문이다.

돌이켜보면, 좋은 선배들이 나에게 가르쳐준 것도 결국 같은 것이었다. “왜 그렇게 생각해?” “다른 방법은 없을까?” “이게 정말 최선이야?” 도구는 메모장에서 IDE로, IDE에서 AI 어시스턴트로 바뀌었지만, 가르침의 본질 — 스스로 생각하게 만드는 것 — 은 20년 전이나 지금이나 같다.

달라진 것은 하나다. AI 시대에는 이 가르침이 더 의식적으로 이루어져야 한다는 것이다. AI가 없던 시절에는 과정을 건너뛸 방법 자체가 없었기 때문에, ‘왜’를 묻는 습관이 자연스럽게 형성됐다. 막히면 직접 해결해야 했고, 해결하는 과정에서 자연히 ‘왜’를 추적하게 됐다.

하지만 AI가 과정을 통째로 대행해주는 지금, ‘왜’를 묻지 않고도 결과를 얻을 수 있게 됐다. 따라서 ‘왜를 물어라’는 더 이상 자연스럽게 발생하지 않는다. 의도적으로, 체계적으로 가르치고 연습시켜야 하는 것이 됐다.

이것이 AI 시대 교육의 역설이다. 가장 오래되고 가장 기본적인 원칙이, 가장 새롭고 가장 절실한 교육 과제가 되었다.

사람은 과정으로 만들어진다

이 글을 쓰면서, 아까 이야기했던 올해의 신입이 다시 떠올랐다. 입사 두 달째의 그 장애 이후, 우리 팀은 신입에게 조금 다른 방식을 제안했다.

“일단 이번 한 건은 AI 없이 처음부터 해볼래? 막히면 물어보고. 대신 ‘뭘 모르겠다’가 아니라 ‘왜 이런지 모르겠다’로 물어봐.”

신입은 일주일을 썼다. AI로 사흘이면 끝냈을 일에 일주일이 걸렸다. 하지만 그 일주일 동안 “왜”를 아홉 번 물었고, 그중 세 번은 선배들도 한 번 더 생각해봐야 하는 좋은 질문이었다. “이 테이블이 왜 이렇게 분리되어 있어요?” “이 로직이 여기에 있는 이유가 규제 때문인 건 알겠는데, 왜 이 방식으로 구현했어요?” “다른 팀 API를 호출하는 이 부분이 실패하면 우리 쪽 트랜잭션은 왜 롤백하지 않아요?”

마지막 질문은 실제로 잠재적인 버그를 짚어낸 것이었다. 수년 동안 아무도 발견하지 못한, 특수한 조건에서만 발생할 수 있는 데이터 불일치 가능성이었다. AI는 이 코드를 수천 번 봐도 이 질문을 하지 못했을 것이다. 왜냐하면 이 질문은 “이 코드가 왜 이렇게 돼 있지?”라는 인간의 의문에서만 출발할 수 있는 것이었으니까.

그 순간, 나는 확신했다. 이 신입은 잘 자랄 것이다.

AI가 아무리 발전해도, 사람의 성장은 과정에서 이루어진다. 과정을 겪으면서 ‘왜’를 묻고, 답을 찾고, 틀리고, 다시 묻는 — 그 순환 속에서 판단력이 자라고, 맥락을 읽는 눈이 트이고, 기존에 없던 것을 상상하는 힘이 생긴다.

AI 시대에 신입에게 가르쳐야 할 단 하나. 그것은 특정 기술이나 도구가 아니다. ‘왜’를 끝까지 묻는 습관이다. 이 습관 하나가 판단의 뿌리가 되고, 맥락의 안테나가 되고, 창의의 발판이 된다. 그리고 이 습관은 선배가 ‘답을 가르치는 사람’에서 ‘질문을 가르치는 사람’으로 스스로를 바꿀 때, 비로소 전해진다.

다음 화에서는 시선을 개인에서 팀과 조직으로 넓힌다. AI 시대에 루프가 돌아가는 팀은 어떤 모습인지, 리더는 이 루프를 어떻게 설계하는지 — “AI 시대, 팀이 살아남는 루프의 조건”을 이야기해보겠다.


이번 주 한 줄 노트: AI가 답을 다 줘도, ‘왜’를 묻는 사람만이 그 답 너머를 볼 수 있다.

이미지는 Leonardo AI 로 생성되었습니다.

이미지는 Claude AI 로 생성되었습니다.


📚 시리즈: 휴먼 인 더 루프(Human-in-the-Loop): AI 시대, 사람만 할 수 있는 일 (총 12화 중 10화)
이전 9화  (다음 차수는 아직 게시되지 않았습니다)
작성일 댓글 남기기

AI 에이전트 활용법, 일상이 편해지는 자동화 시작 가이드

AI 에이전트 생활 자동화 일러스트

스마트폰에 알람을 맞추고, 캘린더에 일정을 등록하고, 장보기 목록을 메모장에 적어두던 시절이 있었습니다. 지금도 많은 분이 그렇게 하루를 관리하고 계실 텐데요. 그런데 2026년 현재, 이 모든 반복 작업을 AI 에이전트가 대신 처리해 주는 시대가 열렸습니다. ‘에이전트’라는 단어가 어렵게 느껴지실 수도 있지만, 실은 우리가 매일 쓰는 앱보다 훨씬 직관적인 경우가 많습니다.

이 글에서는 프로그래밍을 전혀 모르는 분도 오늘 당장 시작할 수 있는 AI 에이전트 활용법을 구체적으로 알려드리겠습니다. 단순한 챗봇 대화를 넘어, 여러 앱과 서비스를 연결해서 실제로 ‘일’을 대신 해주는 에이전트의 세계를 함께 살펴보겠습니다.

AI 에이전트, 챗봇과 뭐가 다른 건가요?

AI 에이전트를 이해하려면, 먼저 우리가 익숙한 AI 챗봇과의 차이를 아는 것이 중요합니다. 챗봇은 사용자가 질문하면 답변을 내놓는 ‘대화형’ 도구입니다. 맛집을 물어보면 추천 목록을 알려주고, 영어 문장을 넣으면 번역을 해주죠. 하지만 챗봇은 거기서 멈춥니다. 추천받은 맛집을 실제로 예약하거나, 번역한 문장을 이메일로 보내주지는 않습니다.

반면 AI 에이전트는 한 단계 더 나아갑니다. 사용자가 ‘이번 주 토요일 저녁에 강남 이탈리안 레스토랑 예약해줘’라고 말하면, 에이전트는 스스로 여러 단계를 수행합니다. 먼저 캘린더에서 토요일 저녁 일정을 확인하고, 강남 지역 이탈리안 레스토랑을 검색한 뒤, 평점과 리뷰를 비교하고, 예약 가능 여부를 체크해서 실제 예약까지 완료하는 것이죠.

챗봇과 AI 에이전트 차이 비교 다이어그램

정리하면 이렇습니다.

  • 챗봇: 사용자의 질문에 텍스트로 답변 → 실행은 사용자 몫
  • AI 에이전트: 사용자의 목표를 이해하고 → 필요한 도구를 스스로 선택해 → 여러 단계를 자율적으로 실행 → 결과를 보고

핵심 차이는 ‘자율성’‘도구 사용 능력’입니다. 에이전트는 웹 검색, 이메일 발송, 파일 생성, 앱 조작 같은 외부 도구를 직접 활용할 수 있습니다. 마치 경험 많은 비서가 큰 방향만 알려주면 세부 사항을 알아서 처리하는 것과 비슷합니다.

에이전트가 ‘똑똑하게’ 작동하는 원리

AI 에이전트의 작동 방식을 간단히 이해하면 활용할 때 훨씬 수월합니다. 에이전트는 크게 네 가지 요소로 구성됩니다.

  • 두뇌(LLM): 대규모 언어 모델이 사용자의 요청을 이해하고 판단합니다. 어떤 도구를 쓸지, 어떤 순서로 진행할지를 결정하는 핵심입니다.
  • 기억(Memory): 이전 대화 내용이나 사용자 선호를 기억합니다. ‘지난번에 예약했던 그 식당’이라고 말해도 알아듣는 이유입니다.
  • 도구(Tools): 외부 서비스와 연결되는 통로입니다. 캘린더 API, 이메일 서비스, 웹 검색 엔진 등이 도구에 해당합니다.
  • 계획(Planning): 복잡한 목표를 작은 단계로 쪼개고, 각 단계를 순서대로 실행합니다. 중간에 오류가 생기면 대안을 찾기도 합니다.

이 네 가지가 유기적으로 작동하면서, 단순한 대화를 넘어 실제 ‘행동’을 수행하는 것이 AI 에이전트의 본질입니다. 이제 어떤 도구들이 있는지 살펴보겠습니다.

2026년 봄, 주목할 AI 에이전트 플랫폼 4가지

AI 에이전트를 활용하기 위해 코딩을 배울 필요는 전혀 없습니다. 이미 많은 플랫폼이 클릭 몇 번으로 자동화 워크플로우를 만들 수 있는 환경을 제공하고 있거든요. 2026년 봄 기준으로 일반 사용자가 가장 쉽게 접근할 수 있는 플랫폼 네 가지를 소개합니다.

AI 에이전트 플랫폼 4종 비교 인포그래픽

1. 마이크로소프트 코파일럿 (Microsoft Copilot)

윈도우 PC를 쓰고 계신다면 이미 손끝에 있는 에이전트입니다. 마이크로소프트 365에 통합된 코파일럿은 단순한 문서 작성 보조를 넘어, 이메일 초안 작성, 회의록 정리, 엑셀 데이터 분석, 파워포인트 슬라이드 생성까지 자동으로 처리합니다. 특히 2026년 업데이트에서 강화된 ‘에이전트 모드’는 여러 앱을 넘나들며 작업을 수행하는 능력이 크게 향상되었습니다.

이런 분께 추천합니다: 직장에서 마이크로소프트 오피스를 주로 사용하는 분, 이메일과 문서 작업이 많은 사무직 종사자

시작 비용: 마이크로소프트 365 구독에 포함 (개인 플랜 월 약 8,900원부터)

2. 구글 제미나이 (Google Gemini)

구글 생태계를 이용하고 계신다면 제미나이가 자연스러운 선택입니다. 지메일에서 이메일을 요약하고 답장 초안을 만들어 주고, 구글 캘린더와 연동해서 일정을 관리하며, 구글 맵스와 연결해서 여행 계획까지 세워줍니다. 안드로이드 스마트폰에서는 음성으로 에이전트에게 지시할 수 있어 이동 중에도 활용하기 편리합니다.

이런 분께 추천합니다: 지메일, 구글 드라이브, 구글 캘린더를 생활 기반 도구로 쓰는 분, 안드로이드 사용자

시작 비용: 기본 기능 무료, 고급 에이전트 기능은 구글 원(Google One) AI 프리미엄 플랜 (월 약 29,000원)

3. 재피어 (Zapier) + AI 에이전트

재피어는 원래 ‘앱과 앱을 연결하는 자동화 도구’로 유명했는데, 최근 AI 에이전트 기능을 대폭 강화했습니다. 재피어의 강점은 6,000개 이상의 앱과 연동된다는 점입니다. 슬랙, 노션, 트렐로, 구글 시트, 드롭박스 등 우리가 일상적으로 쓰는 거의 모든 서비스를 에이전트가 제어할 수 있습니다. 코드 없이 드래그 앤 드롭으로 자동화 흐름을 만들 수 있어, 비개발자에게 특히 인기가 높습니다.

이런 분께 추천합니다: 여러 앱을 동시에 사용하는 분, 반복적인 데이터 이동 작업이 많은 프리랜서나 소규모 사업자

시작 비용: 월 100건 자동화까지 무료, 유료 플랜 월 약 26,000원부터

4. 애플 시리 (Apple Siri) + 앱 인텐트

아이폰과 맥을 사용하고 계신다면, 2026년에 크게 달라진 시리를 주목해 보세요. 과거의 시리는 단순 음성 명령 수준이었지만, 최근 업데이트에서 앱 내부 기능까지 깊이 제어하는 에이전트 역할을 하기 시작했습니다. 사진 앨범 정리, 메시지 요약, 건강 데이터 분석 같은 작업을 음성 한마디로 처리하고, 단축어(Shortcuts) 앱과 결합하면 상당히 복잡한 자동화도 가능합니다.

이런 분께 추천합니다: 아이폰 + 맥 조합을 사용하는 분, 음성 명령을 선호하는 분

시작 비용: 애플 기기 보유 시 무료 (애플 인텔리전스 기본 포함)

어떤 플랫폼을 선택해야 할까?

결론부터 말씀드리면, 이미 사용 중인 생태계의 에이전트부터 시작하세요. 윈도우 + 오피스 환경이면 코파일럿, 구글 중심이면 제미나이, 애플이면 시리가 학습 비용이 가장 낮습니다. 여러 플랫폼을 넘나드는 고급 자동화가 필요하다면 재피어를 추가하는 것이 좋고요. 처음부터 모든 플랫폼을 다 쓰려고 하면 오히려 혼란만 커지니, 하나를 충분히 익힌 뒤 확장하는 것을 추천합니다.

오늘 바로 따라 하는 생활 자동화 시나리오 7가지

이론만으로는 와닿지 않으실 테니, 실제로 바로 설정해서 사용할 수 있는 구체적인 시나리오를 준비했습니다. 각 시나리오는 특별한 기술 지식 없이도 10분 이내에 설정할 수 있는 것들입니다.

AI 에이전트 생활 자동화 7가지 시나리오

시나리오 1: 아침 브리핑 자동화

매일 아침 일어나면 날씨를 확인하고, 오늘 일정을 체크하고, 뉴스를 훑어보시죠? 이 과정을 에이전트에게 맡기면 매일 정해진 시간에 ‘오늘의 브리핑’을 자동으로 받아볼 수 있습니다.

설정 방법 (구글 제미나이 기준)

  • 구글 제미나이 앱을 열고 ‘루틴’ 메뉴로 이동합니다
  • ‘아침 루틴’을 선택하고 원하는 시간을 지정합니다 (예: 오전 7시)
  • 포함할 정보를 선택합니다: 날씨, 캘린더 일정, 뉴스 카테고리 (IT/경제/사회 등)
  • 출력 방식을 정합니다: 음성 읽기, 화면 카드, 또는 이메일 발송

한 번 설정하면 매일 자동으로 실행되며, ‘오늘 우산 필요해?’라고 물을 필요 없이 미리 알려줍니다. 봄철처럼 날씨 변화가 잦은 시기에 특히 유용합니다. 꽃가루 농도 정보를 추가하면 알레르기가 있는 분들에게도 도움이 됩니다.

시나리오 2: 이메일 자동 분류와 요약

하루에 수십 통의 이메일을 받는 분이라면, 중요한 메일을 놓치거나 스팸 속에서 허우적거리신 경험이 있을 겁니다. AI 에이전트는 이메일을 자동으로 분류하고 핵심만 요약해 줍니다.

설정 방법 (마이크로소프트 코파일럿 기준)

  • 아웃룩에서 코파일럿 패널을 활성화합니다
  • ‘이메일 규칙’ 섹션에서 AI 분류를 켭니다
  • 카테고리를 설정합니다: 긴급, 업무, 개인, 뉴스레터, 프로모션
  • 매일 오전 9시에 ‘읽지 않은 긴급 메일 요약’을 받도록 자동화를 만듭니다

에이전트가 메일 내용을 분석해서 ‘계약서 서명 요청 — 내일까지 회신 필요’, ‘팀 회의 시간 변경 — 목요일 3시로’처럼 한 줄로 요약해 주니, 50통의 이메일을 하나하나 열어볼 필요가 없어집니다. 지메일 사용자라면 제미나이에서 동일한 기능을 활용할 수 있습니다.

시나리오 3: 장보기 목록 자동 생성

냉장고 속 재료가 뭐가 남았는지 파악하고, 이번 주 식단에 맞춰 장보기 목록을 만드는 일은 생각보다 시간이 많이 걸립니다. AI 에이전트에게 이 과정을 맡겨보세요.

설정 방법 (재피어 + AI 에이전트 기준)

  • 재피어에서 새 ‘Zap’을 만들고, 트리거를 ‘매주 일요일 오전 10시’로 설정합니다
  • AI 에이전트 액션을 추가합니다: ‘이번 주 4인 가족 한식 위주 식단을 짜고, 필요한 재료 목록을 만들어줘’
  • 출력을 구글 시트 또는 노션에 자동 기록되도록 연결합니다
  • 선택적으로 가족 공유 캘린더에 식단을 등록합니다

매주 자동으로 식단과 장보기 목록이 생성되니, 마트에서 ‘뭘 사야 하더라’ 하고 고민하는 시간이 줄어듭니다. 봄철 제철 식재료(봄나물, 딸기, 주꾸미 등)를 반영해 달라고 조건을 추가하면 더욱 실용적입니다. 알레르기 유발 식품이나 가족 구성원별 선호도를 미리 에이전트에게 알려두면 맞춤형 목록이 나옵니다.

시나리오 4: 가계부 자동 정리

카드 명세서를 하나하나 엑셀에 옮기는 건 정말 번거로운 일이죠. AI 에이전트를 활용하면 이 과정을 크게 줄일 수 있습니다.

설정 방법

  • 카드사에서 월별 이용 내역을 CSV나 엑셀로 다운로드합니다
  • 다운로드한 파일을 구글 드라이브에 업로드합니다
  • 제미나이 또는 코파일럿에게 ‘이 파일의 지출 내역을 식비/교통/쇼핑/문화/기타로 분류하고, 카테고리별 합계와 지난달 대비 증감을 분석해줘’라고 요청합니다
  • 결과를 구글 시트에 자동 기록하도록 재피어로 연결하면 월간 가계부가 자동 완성됩니다

에이전트는 ‘스타벅스’를 카페/식비로, ‘카카오T’를 교통비로 자동 분류하며, 분류 기준을 한 번 알려주면 이후에는 같은 기준으로 계속 처리합니다. 봄철 야외 활동이 늘면서 지출 패턴이 바뀌는 시기에 특히 유용하겠죠.

시나리오 5: 여행 계획 자동화

봄 여행 계획을 세우고 계신다면, AI 에이전트의 진가를 체험할 수 있는 최적의 시나리오입니다. 여행 계획은 숙소 검색, 교통편 확인, 맛집 조사, 일정 배분 등 여러 단계가 필요한 복잡한 작업이니까요.

활용 방법

  • ‘5월 넷째 주 주말, 2박 3일, 경주 여행, 성인 2명, 예산 50만 원 이내’처럼 구체적인 조건을 제시합니다
  • 에이전트가 숙소 옵션, 이동 경로, 관광지별 소요 시간, 맛집 목록을 포함한 상세 일정표를 생성합니다
  • 생성된 일정을 구글 캘린더에 자동 등록하고, 동행자에게 공유합니다
  • 출발 전날 날씨 예보와 준비물 체크리스트를 자동으로 알림 받습니다

에이전트에게 ‘벚꽃이 아직 남아있는 곳 위주로’, ‘아이 동반이라 유모차 접근 가능한 곳으로’처럼 세부 조건을 추가하면 훨씬 맞춤화된 계획이 나옵니다. 한 번에 완벽한 계획이 나오지 않더라도 ‘숙소를 한옥 스테이로 바꿔줘’, ‘둘째 날 오후 일정을 좀 여유롭게 조정해줘’처럼 대화하면서 다듬을 수 있다는 점이 큰 장점입니다.

시나리오 6: 운동 루틴 관리

봄이 되면 겨울 동안 미뤄뒀던 운동을 다시 시작하려는 분이 많으실 텐데요. AI 에이전트가 개인 트레이너 역할을 해줄 수 있습니다.

활용 방법 (애플 시리 + 건강 앱 기준)

  • 건강 앱에 기본 신체 정보와 운동 목표를 입력합니다 (예: 주 3회 러닝, 5km 완주)
  • 시리에게 ‘이번 주 운동 계획 짜줘’라고 요청합니다
  • 날씨, 일정, 현재 컨디션을 고려한 맞춤 운동 계획이 생성됩니다
  • 운동 완료 후 기록이 자동으로 건강 앱에 반영되고, 다음 계획에 반영됩니다

비가 오는 날은 실내 운동으로 대체 일정을 제안하고, 전날 수면 시간이 짧았으면 강도를 낮춰주는 등 상황에 맞는 조정이 자동으로 이루어집니다. 안드로이드 사용자는 구글 피트니스와 제미나이 연동으로 비슷한 환경을 만들 수 있습니다.

시나리오 7: 봄맞이 디지털 정리

봄 대청소를 집 안에서만 하실 건가요? 스마트폰과 컴퓨터 속 디지털 공간도 정리가 필요합니다. AI 에이전트를 활용하면 사진, 파일, 이메일, 앱 등을 효율적으로 정리할 수 있습니다.

활용 방법

  • 사진 정리: 에이전트에게 ‘최근 6개월 사진 중 흐릿한 사진, 중복 사진을 찾아서 정리해줘’라고 요청합니다. 구글 포토의 AI 기능이나 애플 사진 앱의 정리 기능을 활용할 수 있습니다.
  • 파일 정리: 바탕화면이나 다운로드 폴더에 쌓인 파일을 날짜별, 유형별로 자동 분류합니다.
  • 구독 정리: 이메일에서 뉴스레터와 구독 서비스를 추출해, 실제로 읽는 것과 안 읽는 것을 구분하고 구독 해지 링크를 모아줍니다.
  • 앱 정리: 최근 3개월간 사용하지 않은 앱 목록을 만들고, 저장공간 확보를 위해 삭제할 앱을 추천합니다.

이런 디지털 정리를 한 번 해두면 기기가 쾌적해질 뿐 아니라, 클라우드 저장공간도 절약되어 추가 용량 구매 비용을 줄일 수 있습니다.

에이전트 활용, 이것만은 꼭 지켜주세요

AI 에이전트가 편리한 건 분명하지만, 아무런 주의 없이 사용하면 예상치 못한 문제가 생길 수 있습니다. 안전하고 효과적으로 활용하기 위해 반드시 알아두셔야 할 사항들을 정리했습니다.

AI 에이전트 보안 체크리스트 다이어그램

개인정보 보호, 가장 먼저 챙기세요

AI 에이전트에게 이메일을 읽게 하고, 캘린더를 관리하게 하고, 가계부를 분석하게 한다는 것은 상당히 민감한 개인정보를 맡긴다는 뜻입니다. 다음 원칙을 지켜주세요.

  • 공식 플랫폼만 사용하세요: 구글, 마이크로소프트, 애플 같은 대형 플랫폼은 데이터 보호 정책이 투명하고, 사용자 데이터를 AI 학습에 사용하지 않겠다는 약관을 명시하고 있습니다. 출처가 불분명한 에이전트 앱은 피하세요.
  • 권한은 최소한으로 부여하세요: 에이전트가 캘린더 읽기만 필요한데 캘린더 수정 권한까지 줄 필요는 없습니다. 처음에는 읽기 권한만 주고, 신뢰가 쌓이면 쓰기 권한을 추가하세요.
  • 주민등록번호, 카드 전체 번호, 비밀번호 같은 민감 정보는 절대 에이전트에게 직접 전달하지 마세요: 에이전트가 처리할 수 없는 영역이기도 하고, 보안 사고의 가장 흔한 원인입니다.
  • 정기적으로 연결된 서비스를 점검하세요: 한 달에 한 번, 에이전트에 연결한 앱과 권한을 검토하고, 더 이상 필요 없는 연결은 해제하세요.

에이전트의 결과를 무조건 신뢰하지 마세요

AI 에이전트는 매우 유능하지만 완벽하지는 않습니다. 특히 다음 상황에서는 사람의 확인이 필요합니다.

  • 금전이 관련된 결정: 에이전트가 추천한 보험 상품이나 투자 정보를 그대로 따르지 마세요. 참고 자료로만 활용하고 최종 결정은 직접 하세요.
  • 의료 및 건강 관련 조언: 운동 루틴 정도는 괜찮지만, 질병 진단이나 약물 복용에 관한 에이전트의 답변은 의사의 상담을 대체할 수 없습니다.
  • 중요한 약속이나 예약: 에이전트가 만든 예약이 실제로 완료되었는지 확인 알림을 받도록 설정하세요. 간혹 시스템 오류로 예약이 누락될 수 있습니다.
  • 팩트 체크: 에이전트가 제시하는 통계나 사실 정보는 때때로 부정확할 수 있습니다. 중요한 정보라면 원본 출처를 직접 확인하세요.

자동화의 범위를 점진적으로 넓히세요

처음부터 모든 것을 자동화하려고 하면 오히려 혼란이 커집니다. 효과적인 접근법을 알려드릴게요.

  • 1주 차: 하나의 단순 자동화만 설정합니다 (예: 아침 날씨 브리핑)
  • 2주 차: 첫 번째 자동화가 잘 작동하는지 확인하고, 필요하면 조건을 수정합니다
  • 3주 차: 두 번째 자동화를 추가합니다 (예: 이메일 분류)
  • 4주 차 이후: 필요에 따라 하나씩 추가하며, 전체 흐름을 점검합니다

이렇게 천천히 늘려가면 각 자동화의 효과를 제대로 체감할 수 있고, 문제가 생겼을 때 어디서 발생했는지 쉽게 파악할 수 있습니다.

비용 관리도 잊지 마세요

무료 플랜으로 시작하더라도, 자동화 횟수가 늘어나면 유료 플랜이 필요할 수 있습니다. 재피어의 경우 무료 플랜은 월 100건의 자동화 실행으로 제한되어 있고, 이를 넘기면 월 구독료가 발생합니다. 에이전트를 여러 플랫폼에서 동시에 사용하면 구독료가 쌓일 수 있으니, 실제 활용 빈도를 따져보고 정말 필요한 서비스만 유료로 업그레이드하세요.

실전 팁: 에이전트에게 ‘잘’ 지시하는 법

같은 에이전트를 사용해도, 어떻게 지시하느냐에 따라 결과 품질이 크게 달라집니다. 에이전트에게 효과적으로 지시하는 방법을 알아보겠습니다.

구체적으로 말하세요

에이전트에게 ‘좋은 식당 찾아줘’라고 하면 너무 막연합니다. 대신 이렇게 말해보세요.

  • 나쁜 예: ‘주말에 갈 만한 곳 추천해줘’
  • 좋은 예: ‘이번 토요일 오후에 서울 성수동에서 30대 커플이 갈 만한 브런치 카페 3곳 추천해줘. 예약 가능한 곳이면 좋겠어. 주차 가능 여부도 알려줘.’

누가, 언제, 어디서, 무엇을, 얼마나, 어떤 조건으로 — 이 요소를 최대한 포함할수록 에이전트의 결과물이 정확해집니다.

맥락을 알려주세요

에이전트는 사용자의 상황을 모르면 일반적인 답변밖에 줄 수 없습니다. 배경 정보를 함께 제공하면 훨씬 맞춤화된 결과를 얻을 수 있습니다.

  • 나쁜 예: ‘운동 계획 짜줘’
  • 좋은 예: ‘평소 주 2회 30분씩 걷기 운동을 하고 있고, 올 봄부터 조깅을 시작하려 해. 무릎이 좀 약한 편이라 충격이 적은 운동을 선호해. 주 3회, 회당 40분 정도의 운동 계획을 짜줘.’

피드백을 주세요

에이전트의 결과가 마음에 들지 않으면, 무엇이 아쉬운지 구체적으로 알려주세요. ‘다시 해줘’보다는 ‘숙소 가격대가 너무 높아, 1박 10만 원 이하로 다시 찾아줘’가 훨씬 효과적입니다. 에이전트는 이런 피드백을 기억하고 다음번에 반영합니다.

단계를 나눠서 요청하세요

복잡한 작업은 한 번에 요청하기보다 단계별로 나누는 것이 좋습니다.

  • 1단계: ‘5월 마지막 주 제주도 2박 3일 여행 일정 초안을 만들어줘’
  • 2단계: ‘둘째 날 일정에 해녀 체험을 추가하고, 이동 시간을 반영해서 조정해줘’
  • 3단계: ‘확정된 일정을 구글 캘린더에 등록해줘’

이렇게 하면 각 단계에서 결과를 확인하고 수정할 수 있어, 최종 결과물의 품질이 훨씬 높아집니다.

앞으로 에이전트는 어떻게 발전할까?

2026년 현재도 AI 에이전트는 빠르게 발전하고 있습니다. 앞으로 어떤 변화가 기대되는지 간단히 짚어보겠습니다.

멀티 에이전트 협업이 일상화될 전망입니다. 지금은 하나의 에이전트가 여러 작업을 수행하지만, 곧 여러 전문 에이전트가 팀을 이루어 작업하게 됩니다. 여행 전문 에이전트가 일정을 짜면, 재무 전문 에이전트가 예산을 관리하고, 건강 전문 에이전트가 여행지 의료 정보를 제공하는 식이죠.

개인화 수준도 더욱 깊어질 것입니다. 사용자의 습관, 선호, 패턴을 학습해서 요청하기 전에 먼저 제안하는 ‘선제적 에이전트’가 보편화되고 있습니다. 매주 금요일 저녁이면 영화를 보는 습관이 있다면, 금요일 오후에 이번 주 개봉작과 예매 링크를 자동으로 보여주는 식입니다.

오프라인 환경과의 연결도 확대되고 있습니다. 스마트홈 기기, 자동차, 웨어러블 디바이스와 에이전트가 연결되면서 디지털 영역을 넘어 물리적 공간까지 에이전트의 활동 범위가 넓어지고 있습니다. 퇴근길에 ‘집 도착 10분 전에 에어컨 켜고 조명 밝기 50%로 맞춰줘’라는 요청이 자연스러운 시대가 이미 시작됐습니다.

작은 자동화 하나가 하루를 바꿉니다

AI 에이전트라는 단어가 거창하게 들릴 수 있지만, 본질은 단순합니다. 매일 반복하는 작은 작업들을 기계에게 맡기고, 그 시간을 더 가치 있는 일에 쓰는 것입니다. 아침 날씨 확인 2분, 이메일 분류 10분, 장보기 목록 작성 15분 — 하루에 이 세 가지만 자동화해도 거의 30분을 절약할 수 있습니다. 한 달이면 15시간, 그 시간에 책을 읽거나, 산책을 하거나, 가족과 대화를 나눌 수 있겠죠.

오늘 소개한 7가지 시나리오 중 딱 하나만 골라서 시작해 보세요. 에이전트가 첫 번째 작업을 대신 처리해 주는 순간, ‘이걸 왜 이제야 시작했지?’ 하는 생각이 드실 겁니다. 봄이 지나기 전에, 나만의 AI 비서를 한 명 두어 보시는 건 어떨까요.

이미지는 Leonardo AI 로 생성되었습니다.

이미지는 Claude AI 로 생성되었습니다.

작성일 댓글 남기기

내 문서에 AI로 질문하기, RAG 활용 실전 가이드

AI가 문서를 검색해 답변하는 RAG 개념 일러스트

쌓이기만 하는 디지털 문서, AI가 대신 읽어준다면?

봄이 오면 옷장도 정리하고 집 안 구석구석도 깔끔하게 치우게 됩니다. 그런데 정작 매일 쓰는 컴퓨터와 스마트폰 속 디지털 파일은 어떤가요? 하드디스크에 쌓인 수백 개의 PDF, 클라우드 드라이브에 흩어진 회의록, 카카오톡으로 받은 계약서 사진, 메모 앱에 적어둔 각종 정보들. 분명 어딘가에 저장해뒀는데 막상 필요할 때는 도무지 찾을 수가 없는 경험, 누구나 한 번쯤 해보셨을 겁니다.

최근 AI 기술이 빠르게 발전하면서 이 문제를 해결할 수 있는 아주 실용적인 방법이 등장했습니다. 바로 RAG(Retrieval-Augmented Generation, 검색 증강 생성)라는 기술인데요. 이름이 좀 어렵게 느껴지실 수 있지만, 핵심은 단순합니다. 내가 가진 문서를 AI에게 읽혀놓고, 나중에 자연어로 질문하면 그 문서 내용을 바탕으로 정확한 답변을 해주는 것이죠.

“지난달 팀 회의에서 마케팅 예산이 얼마로 결정됐지?”, “이 보험 약관에서 입원비 청구 조건이 뭐야?”, “작년에 제주도 가서 맛있었던 식당 이름이 뭐였더라?” 이런 질문들을 AI에게 던지면 내 문서에서 해당 내용을 찾아 깔끔하게 정리해줍니다. 마치 내 파일만 전담하는 개인 비서가 생긴 것과 같은 효과입니다.

이 글에서는 RAG가 정확히 무엇이고 어떻게 작동하는지 쉽게 풀어드리고, 지금 바로 사용할 수 있는 도구들을 비교해드립니다. 그리고 직장, 학교, 일상생활에서 RAG를 실제로 활용하는 구체적인 방법과 꿀팁까지 빠짐없이 정리했으니 끝까지 읽어보시면 디지털 생활이 한결 편해질 거예요.

RAG, 도대체 뭔가요? 비전공자도 이해하는 쉬운 설명

기존 AI가 가진 근본적인 한계

ChatGPT나 클로드 같은 대화형 AI를 써보신 분들은 아시겠지만, 이 AI들은 정말 똑똑하면서도 가끔 황당한 실수를 합니다. 존재하지 않는 논문을 인용하거나, 지어낸 정보를 그럴듯하게 말하는 경우가 있죠. 이런 현상을 할루시네이션(환각)이라고 부릅니다.

이런 문제가 생기는 이유는 근본적으로 단순합니다. AI 모델은 학습 시점까지의 일반적인 지식만 갖고 있기 때문이에요. 여러분의 회사 내부 문서나 개인 노트, 올해 바뀐 세법 같은 것은 AI가 알 수 없습니다. 그래서 이런 내용을 물어보면 일반적인 지식으로 대충 추론하거나, 최악의 경우 지어내서 답하게 되는 것이죠.

또한 AI 모델에는 학습 데이터 마감일이라는 것이 있습니다. 아무리 최신 모델이라도 특정 시점까지의 정보만 학습되어 있어서, 어제 발표된 뉴스나 최신 법률 개정 사항은 모릅니다. 그리고 설령 관련 정보를 학습했더라도, 수십억 개의 데이터 속에서 정확한 출처를 찾아 인용하는 것은 기존 AI의 구조적 한계였습니다.

RAG가 이 문제를 해결하는 방법

RAG는 이런 한계를 아주 우아한 방식으로 해결합니다. 핵심 아이디어는 AI가 답변하기 전에 먼저 관련 문서를 검색해서 읽게 하는 것입니다. 쉽게 비유하자면 이렇습니다.

일반 AI에게 질문하는 것은 마치 아무 참고 자료 없이 기억에만 의존해서 시험을 보는 것과 같습니다. 아는 것은 잘 답하지만, 모르는 것은 추측하거나 틀린 답을 적을 수밖에 없죠. 반면 RAG를 적용한 AI는 오픈북 시험을 보는 것과 같습니다. 질문을 받으면 먼저 교재에서 관련 내용을 찾아본 다음, 그 내용을 바탕으로 답변을 작성합니다. 당연히 정확도가 훨씬 높아지겠죠.

RAG 검색 증강 생성 작동 원리 3단계 다이어그램

RAG의 작동 과정은 크게 세 단계로 이루어집니다.

첫 번째, 문서 준비 단계(인덱싱)입니다. 여러분이 올린 PDF, 워드 파일, 텍스트 등을 AI가 이해할 수 있는 형태로 잘게 쪼갭니다. 긴 문서를 의미 단위의 작은 조각(청크)으로 나누고, 각 조각의 의미를 수학적 벡터로 변환해서 저장합니다. 이 과정을 임베딩이라고 하는데, 비유하자면 도서관에서 새 책이 들어오면 분류 번호를 매기고 적절한 서가에 꽂아두는 것과 같습니다.

두 번째, 검색 단계(리트리벌)입니다. 여러분이 질문을 던지면, 그 질문의 의미와 가장 관련 있는 문서 조각들을 벡터 유사도를 기반으로 빠르게 찾아냅니다. 키워드가 정확히 일치하지 않아도 의미가 비슷하면 찾아주는 것이 기존 검색과의 큰 차이점입니다. 예를 들어 “연봉 인상률”이라고 질문해도 문서에 “급여 조정 비율”이라고 적혀 있으면 관련 내용으로 인식합니다.

세 번째, 생성 단계(제너레이션)입니다. 검색된 문서 조각들을 AI 모델에게 함께 전달하면, AI는 이 정보를 참고해서 질문에 맞는 답변을 생성합니다. 여기서 중요한 것은 AI가 자기 기억이 아니라 실제 문서의 내용을 근거로 답한다는 점입니다. 그래서 출처도 함께 알려줄 수 있고, 환각이 크게 줄어듭니다.

일반 AI 검색과 RAG, 뭐가 다를까?

혹시 “그냥 AI한테 파일 첨부해서 물어보면 되는 거 아니야?”라고 생각하실 수 있습니다. 물론 ChatGPT나 클로드에 파일을 첨부해서 질문하는 것도 넓은 의미에서는 RAG의 일종입니다. 하지만 몇 가지 중요한 차이가 있어요.

파일을 직접 첨부하는 방식은 한 번 대화할 때 올릴 수 있는 파일 수와 크기에 제한이 있습니다. 대화가 끝나면 그 내용을 잊어버리기 때문에 다음에 또 같은 파일을 올려야 하죠. 반면 제대로 된 RAG 시스템은 문서를 한번 등록해두면 언제든 그 지식 기반에 질문할 수 있고, 수백 수천 개의 문서도 다룰 수 있습니다. 마치 개인 도서관에 사서를 고용해둔 것처럼요.

또 하나의 차이는 검색의 정밀도입니다. 단순 파일 첨부 방식에서는 AI가 전체 문서를 한꺼번에 읽으려다 긴 문서의 중간 부분을 놓치는 경우가 있습니다. 이를 학계에서는 “lost in the middle” 문제라고 부르는데요. RAG 시스템은 미리 문서를 잘게 나눠서 인덱싱해두기 때문에 문서가 아무리 길어도 관련된 부분을 정확하게 찾아냅니다.

지금 바로 쓸 수 있는 RAG 도구 총정리

RAG의 개념을 이해하셨다면, 이제 실제로 사용할 수 있는 도구들을 살펴볼 차례입니다. 기술적 지식이 전혀 없어도 바로 시작할 수 있는 서비스부터, 조금 더 자유도가 높은 도구까지 단계별로 소개해드릴게요.

구글 노트북LM: 가장 쉽고 강력한 시작점

RAG를 처음 경험해보고 싶은 분에게 가장 먼저 추천하는 도구는 구글 노트북LM(NotebookLM)입니다. 구글 계정만 있으면 무료로 사용할 수 있고, 사용법도 직관적입니다.

노트북LM에 접속하면 “소스 추가”라는 버튼이 보입니다. 여기에 PDF, 구글 문서, 웹 링크, 유튜브 영상 URL, 텍스트 파일 등을 올릴 수 있습니다. 소스를 올리면 AI가 자동으로 내용을 분석하고, 이후 채팅창에서 자유롭게 질문할 수 있죠. 답변에는 항상 어떤 소스의 몇 번째 부분에서 가져온 것인지 인용 표시가 붙어서 직접 확인해볼 수도 있습니다.

특히 매력적인 기능은 오디오 요약입니다. 올린 문서 내용을 팟캐스트처럼 두 명이 대화하며 설명하는 오디오를 자동 생성해주는데요, 출퇴근길에 논문이나 보고서 내용을 귀로 들으며 파악할 수 있어서 직장인과 대학원생 사이에서 큰 인기를 끌고 있습니다. 한국어 오디오도 자연스럽게 생성되니 꼭 한번 써보세요.

다만 노트북LM은 노트북 하나당 올릴 수 있는 소스 수에 제한이 있고, 문서 간 교차 분석보다는 올려놓은 문서 범위 안에서의 질의응답에 최적화되어 있다는 점은 알아두세요.

ChatGPT와 클로드의 파일 분석 기능

이미 ChatGPT Plus나 클로드 Pro를 구독하고 계신 분들은 별도의 도구 없이도 파일 기반 질의응답을 할 수 있습니다. ChatGPT의 경우 대화창에 파일을 드래그 앤 드롭하거나, GPT-4의 파일 분석 기능을 통해 PDF나 엑셀 파일을 올리고 질문할 수 있습니다. 클로드도 프로젝트(Projects) 기능에서 여러 파일을 미리 올려두고 대화할 수 있죠.

이 방식의 장점은 별도의 서비스 가입이나 학습 없이 이미 익숙한 AI 인터페이스에서 바로 파일 분석을 시작할 수 있다는 것입니다. 특히 클로드의 프로젝트 기능은 파일을 영구적으로 저장해두고 반복 질문이 가능해서, 간이 RAG 시스템으로 활용하기에 좋습니다.

하지만 올릴 수 있는 파일 크기와 수에 한계가 있고, 수백 페이지가 넘는 대용량 문서나 수십 개 이상의 파일을 다루기에는 전문 RAG 도구에 비해 부족한 면이 있습니다. 3~5개 정도의 핵심 문서를 중심으로 질문하는 용도에 적합합니다.

노션 AI: 이미 노션 쓰고 계시다면

업무나 개인 정리 도구로 노션을 사용하고 계신 분들에게는 노션 AI가 자연스러운 선택입니다. 노션 AI는 여러분이 노션에 쌓아둔 페이지, 데이터베이스, 위키 전체를 지식 기반으로 활용해서 질문에 답해줍니다.

예를 들어 “지난 분기 마케팅 팀 회의에서 결정된 예산 배분 내용을 정리해줘”라고 물으면, 관련 회의록 페이지를 찾아서 내용을 요약해줍니다. 팀 위키에 문서화해둔 사내 규정, 프로젝트 히스토리, 고객 피드백 등을 한꺼번에 검색하고 종합해서 답할 수 있다는 것이 큰 장점이에요.

특히 팀 단위로 노션을 사용하는 조직이라면 효과가 배가됩니다. 팀원들이 각자 작성한 문서들이 모두 AI의 지식 기반이 되기 때문에, 신입 사원이 “우리 팀의 코드 리뷰 프로세스가 어떻게 되나요?”라고 물으면 관련 가이드 문서를 찾아 답해줄 수 있죠.

단점은 노션 외부의 문서(로컬 PDF, 다른 클라우드의 파일 등)는 직접 다루지 못한다는 것입니다. 노션 생태계 안에서만 작동하므로, 모든 문서를 노션에 모아두는 습관이 필요합니다.

옵시디언 + AI 플러그인: 프라이버시를 중시한다면

개인 문서를 외부 서버에 올리는 것이 꺼려지는 분들도 있을 겁니다. 특히 민감한 업무 문서, 개인 일기, 의료 기록 같은 것들은 클라우드에 올리기 부담스럽죠. 이런 분들에게는 옵시디언(Obsidian)과 AI 플러그인 조합을 추천합니다.

옵시디언은 모든 노트를 로컬 마크다운 파일로 저장하는 지식 관리 도구입니다. 커뮤니티에서 만든 Smart Connections, Copilot 같은 AI 플러그인을 설치하면 로컬 노트 전체를 대상으로 RAG 기반 질의응답이 가능해집니다. 일부 플러그인은 임베딩 자체도 로컬에서 수행할 수 있어서 문서가 외부로 전송되지 않는다는 장점이 있어요.

다만 초기 설정에 약간의 기술적 이해가 필요하고, 무료 플러그인의 경우 상용 서비스만큼 매끄럽지 않을 수 있습니다. 그래도 한번 설정해두면 내 컴퓨터에 완전한 개인 RAG 시스템을 구축할 수 있다는 것은 큰 매력입니다.

RAG 도구 5종 비교 인포그래픽

기업용 및 전문 RAG 서비스

개인 사용을 넘어 조직 차원에서 RAG를 도입하고 싶은 경우에는 전문 서비스를 살펴볼 필요가 있습니다. 대표적으로 Perplexity Enterprise, Glean, Guru 등의 서비스가 있는데요, 이들은 회사의 구글 워크스페이스, 슬랙, 컨플루언스, 드라이브 등 다양한 업무 도구와 연동해서 조직의 모든 지식을 AI로 검색할 수 있게 해줍니다.

개인이 사용하기에는 비용이 부담될 수 있지만, 조직 내에서 “이 정보가 어디 있었지?”라는 질문이 빈번하다면 도입을 검토해볼 만합니다. 특히 원격 근무가 많은 팀에서는 암묵지의 공유 도구로서 큰 가치가 있습니다.

이렇게 쓰면 인생이 편해집니다: 실전 활용 시나리오

도구를 알았으니 이제 실제로 어떤 상황에서 RAG를 활용할 수 있는지 구체적인 시나리오를 살펴보겠습니다. 아마 한두 가지는 “아, 나도 이런 적 있었는데!”라고 공감하실 거예요.

직장인의 업무 효율화

회의록 활용이 달라집니다. 매주 쌓이는 회의록, 솔직히 다시 꺼내 읽어보는 경우가 얼마나 될까요? RAG 도구에 회의록을 모아두면 “3월에 신규 프로젝트 담당자가 누구로 정해졌지?”라고 물어보는 것만으로 해당 회의 내용을 찾아줍니다. 전체 회의록을 뒤질 필요 없이 딱 필요한 결정 사항만 추출해서 보여주죠.

사내 규정과 매뉴얼 검색이 빨라집니다. 경비 처리 규정이 바뀌었는데 정확한 한도가 기억이 안 날 때, 새로 온 인턴에게 보안 교육 자료를 찾아줘야 할 때, HR 정책에서 연차 산정 기준을 확인하고 싶을 때. 이런 상황에서 RAG는 관련 규정 문서를 정확히 찾아 해당 조항을 인용해줍니다.

이전 프로젝트의 교훈을 활용할 수 있습니다. 과거 프로젝트의 결과 보고서, 포스트모템 문서, 기술 검토서 등을 RAG에 등록해두면 비슷한 프로젝트를 시작할 때 “이전에 비슷한 프로젝트에서 겪었던 문제점이 뭐가 있었지?”라고 물어볼 수 있습니다. 같은 실수를 반복하지 않게 도와주는 조직의 학습 메모리가 되는 셈이죠.

카페에서 노트북으로 문서를 AI 검색하는 직장인

학생과 연구자의 학습 도우미

논문 리뷰가 효율적으로 바뀝니다. 학위 과정이나 연구를 하다 보면 수십 편의 논문을 읽고 정리해야 하는데요. 관련 논문들을 노트북LM에 올려두면 “이 분야에서 가장 많이 사용된 연구 방법론을 정리해줘”, “논문 A와 논문 B의 결론이 어떻게 다른지 비교해줘” 같은 질문이 가능합니다. 수작업으로 하면 반나절이 걸릴 교차 분석을 몇 분 만에 할 수 있어요.

시험 준비의 게임 체인저입니다. 한 학기 치 강의 자료와 교재를 RAG 도구에 올려두면 나만의 AI 과외 선생님이 됩니다. “5장에서 다룬 핵심 개념을 퀴즈 형태로 만들어줘”, “이 개념이 이해가 안 되는데 쉽게 설명해줘”처럼 교재 내용을 기반으로 한 맞춤형 학습이 가능합니다. 단순히 인터넷에서 검색하는 것과 달리 내가 배운 교재의 맥락에서 설명해주기 때문에 시험 대비에 훨씬 효과적이에요.

독서 노트가 살아있는 지식이 됩니다. 책을 읽으며 밑줄 긋고 메모한 것들, 시간이 지나면 어디에 적었는지 까먹기 일쑤입니다. 독서 노트를 디지털로 정리해서 RAG에 올려두면 “리더십에 대해 내가 읽은 책들에서 공통적으로 강조하는 것은?” 같은 통합적 질문에도 답을 얻을 수 있습니다.

일상생활 속 문서 관리

계약서와 약관, 이제 꼼꼼히 안 읽어도 됩니다. 아파트 임대차 계약서, 보험 약관, 통신사 이용 약관처럼 길고 복잡한 문서들이 있죠. 이런 문서를 RAG 도구에 올리고 “이 계약서에서 중도 해지 시 위약금 조건이 뭐야?”, “보험 약관에서 통원 치료비 청구 한도가 얼마야?” 같은 구체적인 질문을 하면 해당 조항을 정확하게 찾아줍니다. 수십 페이지 약관을 눈으로 훑어가며 찾는 것보다 훨씬 빠르고 정확합니다.

봄맞이 레시피 정리에도 활용해보세요. 인스타그램에서 캡처해둔 레시피 사진, 블로그에서 복사한 요리법, 엄마한테 받은 손글씨 레시피까지. 이런 것들을 텍스트로 변환해서 RAG에 모아두면 “냉장고에 닭가슴살이랑 파프리카가 있는데 만들 수 있는 요리가 뭐가 있어?”라는 식으로 재료 기반 검색이 가능합니다.

여행 계획도 스마트하게. 지난 여행의 일정표, 숙소 예약 확인서, 맛집 리스트, 여행 후기를 모아두면 다음 여행 계획 시 “부산에서 갔던 해산물 맛집 중 가격 대비 만족도가 높았던 곳은?” 같은 질문으로 과거 경험을 활용할 수 있습니다. 봄 여행 시즌을 앞두고 지난 여행 기록을 정리해보시는 건 어떨까요?

RAG 200% 활용하는 실전 팁

문서를 잘 준비하는 것이 반입니다

RAG의 성능은 올리는 문서의 품질에 크게 좌우됩니다. 같은 도구를 사용하더라도 문서를 어떻게 준비하느냐에 따라 답변의 정확도가 천차만별이에요.

  • 스캔 PDF보다 텍스트 PDF를 사용하세요. 종이 문서를 스캔한 이미지 기반 PDF는 OCR(광학 문자 인식) 과정에서 오류가 생길 수 있습니다. 가능하면 원본 디지털 문서를 사용하고, 스캔본밖에 없다면 OCR 정확도가 높은 도구(어도비 스캔, 네이버 클로바 OCR 등)로 먼저 변환하세요.
  • 파일 이름을 의미 있게 지어주세요. “문서1.pdf”, “최종_최종_진짜최종.docx” 같은 이름 대신 “2026-03-마케팅팀-분기보고서.pdf”처럼 날짜와 내용을 포함하면 AI가 문맥을 더 잘 파악합니다.
  • 하나의 주제는 하나의 지식 기반으로 분리하세요. 업무 문서와 개인 레시피를 같은 RAG 공간에 넣으면 검색 정확도가 떨어집니다. 주제별로 노트북이나 프로젝트를 나눠서 관리하는 것이 좋습니다.
  • 문서에 구조를 부여하세요. 제목, 소제목, 목차가 있는 문서는 RAG가 내용을 훨씬 잘 이해합니다. 회의록이라면 “일시”, “참석자”, “안건”, “결정사항” 같은 섹션으로 나눠 작성하는 습관을 들이면 나중에 검색 효과가 배가됩니다.

질문을 잘하는 것이 나머지 반입니다

문서를 잘 준비했다면 이제 질문하는 요령이 중요합니다. 같은 내용이라도 어떻게 물어보느냐에 따라 답변 품질이 달라집니다.

  • 구체적으로 질문하세요. “마케팅에 대해 알려줘”보다 “2026년 1분기 마케팅 예산 중 디지털 광고 비중이 몇 퍼센트였어?”가 훨씬 정확한 답을 가져옵니다. 시기, 주체, 범위를 명시할수록 좋습니다.
  • 비교 질문을 활용하세요. “A 방안과 B 방안의 장단점을 비교해줘”, “지난 달과 이번 달의 매출 변화를 분석해줘”처럼 여러 문서를 교차로 참조해야 하는 질문은 RAG의 진가를 보여줍니다.
  • 출력 형식을 지정하세요. “표로 정리해줘”, “핵심만 3가지로 요약해줘”, “타임라인 순서로 나열해줘”와 같이 원하는 답변 형식을 명시하면 정리된 형태로 답을 받을 수 있습니다.
  • 후속 질문으로 파고드세요. 첫 번째 답변에서 더 궁금한 부분이 있으면 “방금 말한 3번 항목을 좀 더 자세히 설명해줘”처럼 이어서 질문하세요. RAG 도구들은 대화 맥락을 유지하기 때문에 점점 더 정밀한 정보를 얻을 수 있습니다.

알아두면 좋은 주의사항

RAG가 아무리 편리해도 맹신은 금물입니다. 몇 가지 주의할 점을 알아두세요.

  • 정확도를 항상 확인하세요. RAG는 환각을 크게 줄여주지만 완전히 없애지는 못합니다. 특히 여러 문서의 정보를 종합할 때 간혹 맥락을 잘못 연결하는 경우가 있어요. 중요한 의사결정에 활용할 때는 AI가 제시한 출처를 직접 확인하는 습관을 들이세요.
  • 민감한 문서는 신중하게 다루세요. 클라우드 기반 RAG 서비스에 문서를 올린다는 것은 그 내용이 외부 서버로 전송된다는 뜻입니다. 개인정보, 기업 기밀, 의료 정보 등 민감한 문서는 해당 서비스의 개인정보 처리 방침을 꼼꼼히 확인하세요. 정말 민감한 문서는 로컬 RAG 솔루션을 사용하는 것을 고려해보세요.
  • 문서를 주기적으로 업데이트하세요. RAG는 올려놓은 문서만 검색합니다. 정책이 바뀌었는데 예전 문서만 올려놓으면 틀린 정보를 답할 수 있어요. 분기에 한 번 정도는 올려둔 문서가 최신 상태인지 점검하는 것이 좋습니다.
  • RAG의 한계를 인식하세요. 현재 RAG 기술은 텍스트 기반 검색에 최적화되어 있습니다. 복잡한 표, 수식, 이미지 안의 텍스트는 정확하게 처리하지 못할 수 있습니다. 또한 문서에 없는 내용은 당연히 답할 수 없으므로 “이 문서에 관련 내용이 있어?”라고 먼저 확인하는 것도 좋은 습관입니다.

봄맞이 디지털 정리, RAG로 시작해보세요

지금까지 RAG의 개념부터 실전 활용법까지 폭넓게 살펴보았습니다. 핵심을 정리하면 이렇습니다. RAG는 내 문서를 AI의 지식 기반으로 삼아서 자연어로 질문하고 정확한 답을 얻는 기술입니다. 구글 노트북LM이나 노션 AI처럼 오늘 당장 시작할 수 있는 무료 도구들이 이미 충분히 성숙해 있고, 업무·학습·일상 어디서든 활용할 수 있습니다.

이번 주말, 컴퓨터에 흩어져 있는 중요한 문서들을 한 곳에 모아보시는 건 어떨까요? 봄 대청소를 옷장이 아니라 하드디스크부터 시작하는 겁니다. 회의록 10개만 올려서 한번 질문해보세요. “아, 이런 거였구나” 하는 순간이 분명 올 거예요. 그 작은 경험 하나가 여러분의 디지털 생활 방식을 완전히 바꿔놓을 수 있습니다.

앞으로도 AI를 일상에서 실용적으로 활용하는 다양한 방법을 소개해드리겠습니다. 궁금한 점이 있으시면 댓글로 남겨주세요. 특히 “이런 문서에 RAG를 적용해봤는데 잘 안 됐어요”라는 경험담도 환영합니다. 함께 해결 방법을 찾아볼게요.

이미지는 Leonardo AI 로 생성되었습니다.

이미지는 Claude AI 로 생성되었습니다.

작성일 댓글 한 개

[휴먼 인 더 루프(Human-in-the-Loop): AI 시대, 사람만 할 수 있는 일] 6/12화: AI가 정답을 줘도 결정은 사람이 해야 하는 이유

AI의 답과 사람의 판단이 만나는 결정의 갈림길

지난 5화에서 “AI가 시킨 대로 했어요”라는 한마디가 얼마나 위험한지 이야기했습니다. 책임이 증발하는 순간, 조직 전체가 흔들릴 수 있다고요. 그런데 그 글을 올리고 나서 의외의 반응을 하나 받았습니다. 같은 업계에서 일하는 후배가 이런 메시지를 보내왔거든요.

“형, 그러면 AI가 내놓은 답을 매번 의심해야 한다는 거예요? 그럼 뭐하러 AI를 쓰는 건데요?”

솔직히, 이 질문에 바로 답하지 못했습니다. 5초쯤 멈칫했어요. 왜냐하면 이 질문이야말로 이번 6화에서 다루려던 주제의 정확히 핵심을 찌르고 있었으니까요. AI를 의심하라는 게 아닙니다. AI의 답을 활용하되, 결정의 순간에는 사람이 서야 한다는 이야기를 하려는 겁니다.

이 차이가 미묘해 보이지만, 실무에서는 하늘과 땅 차이입니다. 20년 가까이 금융IT 시스템을 만들고, 8년 동안 챗봇이 고객과 나누는 대화를 지켜보면서 깨달은 건 이겁니다. AI가 아무리 정확한 답을 내놓아도, 그것을 ‘결정’으로 전환하는 과정에는 반드시 사람의 판단이 개입해야 한다. 오늘은 그 ‘판단’이라는 행위의 정체를 파헤쳐보겠습니다.

답과 결정은 같은 말이 아니다

우리는 일상에서 ‘답’과 ‘결정’을 거의 같은 의미로 씁니다. “답 나왔어?” “응, 이걸로 결정했어.” 이런 식으로요. 하지만 AI 시대에 이 두 단어의 차이를 이해하는 것은 단순한 말장난이 아니라 일하는 방식의 근본적인 전환을 의미합니다.

답(Answer)은 데이터에서 나온다

AI가 잘하는 것, 아니 압도적으로 잘하는 것이 바로 ‘답’을 내놓는 일입니다. 방대한 데이터를 분석하고, 패턴을 찾고, 통계적으로 가장 그럴듯한 결과를 도출합니다. 이상거래를 탐지하고, 고객의 다음 행동을 예측하고, 최적의 포트폴리오 배분을 계산합니다.

예를 들어볼게요. 제가 관여했던 한 시스템에서는 고객의 거래 패턴을 분석해서 이상 징후를 점수화합니다. 0점에서 100점 사이의 숫자로요. AI 모델은 수만 건의 과거 사기 거래 데이터를 학습해서, 새로운 거래가 들어올 때마다 “이 거래의 이상 점수는 87점입니다”라는 답을 내놓습니다. 이건 답이에요. 매우 정확한 답이고, 사람이 일일이 계산하는 것보다 훨씬 빠르고 일관된 답입니다.

또 다른 예로, 챗봇이 고객의 문의 내용을 분석해서 “이 고객은 해외송금 수수료에 대해 불만을 가지고 있으며, 이탈 확률이 72%입니다”라고 알려줍니다. 이것도 답이에요. 과거 데이터에서 비슷한 패턴을 가진 고객들이 실제로 이탈한 비율을 기반으로 산출한, 통계적으로 유의미한 답입니다.

이런 답들은 그 자체로 대단한 가치를 가집니다. 사람이 직감만으로는 절대 도달할 수 없는 정밀함이 있거든요. AI를 의심하라는 게 아닌 이유가 여기 있습니다. 답 자체는 존중해야 해요.

결정(Decision)은 맥락에서 나온다

하지만 “이상 점수 87점”이라는 답을 받았을 때, 실제로 해야 하는 일은 결정입니다. 이 거래를 차단할 것인가? 고객에게 확인 전화를 걸 것인가? 일단 통과시키되 모니터링 대상에 올릴 것인가? 아니면 무시할 것인가?

이 결정에는 AI의 답에 포함되지 않은 수많은 맥락이 개입합니다.

  • 이 고객은 최근에 해외 출장을 간다고 미리 알려온 VIP 고객인가?
  • 지금 시간대가 고객센터 운영 시간 외라 확인 전화가 불가능한가?
  • 이번 달에 이미 오탐(false positive)으로 인한 고객 불만이 급증하고 있는가?
  • 규제 당국의 감사가 다음 주에 예정되어 있어 보수적으로 가야 하는 시기인가?
  • 이 거래 금액이 고객의 월 평균 거래 대비 어느 정도인가?

AI는 이 맥락 중 일부를 데이터로 가지고 있을 수도 있습니다. 하지만 이 모든 맥락을 종합하고, 우선순위를 매기고, 상충하는 가치 사이에서 균형을 잡는 일은 현재의 AI가 할 수 없는 영역입니다. 아니, 좀 더 정확히 말하면 — AI에게 맡겨서는 안 되는 영역입니다.

답은 “무엇이 사실인가”에 대한 것이고, 결정은 “무엇을 해야 하는가”에 대한 것입니다. 사실과 당위 사이에는 언제나 간극이 있고, 그 간극을 메우는 것이 바로 판단(Judgment)이라는 인간 고유의 능력입니다.

AI 답에서 사람의 판단을 거쳐 결정에 이르는 흐름도

판단이라는 보이지 않는 근육

판단이 무엇인지 좀 더 깊이 들여다보겠습니다. 사전적 의미야 “사물을 인식하여 논리나 기준에 따라 판정하는 것”이지만, 실무에서의 판단은 이보다 훨씬 복잡하고 미묘합니다.

20년 동안 금융IT 현장에서 관찰한 바로는, 판단에는 최소한 네 가지 층위가 있습니다.

첫째, 상황 인식(Situational Awareness)

판단의 첫 번째 층위는 “지금 무슨 상황인지”를 총체적으로 파악하는 능력입니다. 이것은 단순히 데이터를 읽는 것과는 다릅니다. 데이터가 말해주지 않는 것, 데이터 사이의 빈 공간, 데이터가 수집되기 전의 배경까지 포함하는 넓은 인식이에요.

예를 한번 들어볼게요. 어느 날 아침, 시스템 모니터링 AI가 “서버 응답 시간이 평소 대비 340% 증가”라는 경보를 보냅니다. 데이터만 보면 심각한 상황입니다. 하지만 상황 인식이 있는 사람은 이렇게 생각합니다. “아, 오늘이 월급날이고 오전 9시인데, 매달 이맘때 급여 조회 트래픽이 폭증하지. 게다가 이번 달에는 성과급 지급 안내가 어제 나갔으니 평소보다 더 몰릴 수 있겠다.”

이 상황 인식은 시스템에 입력된 적 없는 조직의 급여 일정, 인사팀의 공지 타이밍, 직원들의 행동 패턴 같은 것들이 복합적으로 작용한 결과입니다. AI가 이 모든 맥락을 학습할 수 있을까요? 이론적으로야 가능하겠지만, 현실에서는 “어떤 맥락이 관련 있는지”를 판단하는 것 자체가 이미 인간의 판단을 필요로 합니다. 순환 논증이 되어버리는 거죠.

둘째, 불확실성 감내(Tolerance for Ambiguity)

AI는 본질적으로 확률의 언어로 말합니다. “87% 확률로 이상거래”, “72% 확률로 고객 이탈”. 하지만 현실의 결정은 이 확률이 100%도 0%도 아닌 애매한 지점에서 내려야 하는 경우가 대부분입니다.

금융 현장에서 가장 어려운 판단은 “반반”일 때 내리는 겁니다. 이상거래 점수가 50점인 경우요. 차단하자니 정상 거래일 수 있고, 통과시키자니 사기일 수 있어요. 이때 AI는 “50점입니다”라는 답만 줄 수 있을 뿐, “그래서 어떻게 하시겠습니까?”라는 질문에는 침묵합니다.

사람의 판단은 이 불확실성을 감내하면서도 행동을 선택할 수 있다는 데 그 특별함이 있습니다. “완벽한 정보가 없지만 현재까지의 정보와 경험을 종합하면, 이 방향이 최선이다”라고 말할 수 있는 능력. 이것이 판단의 두 번째 층위입니다.

셋째, 가치 판단(Value Judgment)

아마 이것이 판단의 가장 핵심적인 층위일 겁니다. 모든 결정에는 가치의 우선순위가 숨어 있거든요.

고객 편의성과 보안 중 어느 것을 우선할 것인가? 단기 수익과 장기 신뢰 중 어느 쪽에 무게를 둘 것인가? 개인 고객의 요구와 전체 시스템의 안정성이 충돌할 때 어떤 기준으로 판단할 것인가?

이런 질문들에는 객관적인 정답이 없습니다. 조직의 미션, 산업의 규범, 시대의 가치관, 그리고 판단하는 개인의 윤리 의식이 복합적으로 작용합니다. AI는 과거 데이터에서 어떤 선택이 어떤 결과를 낳았는지 알려줄 수 있지만, “어떤 결과가 더 바람직한가”를 판단하는 것은 궁극적으로 인간의 몫입니다.

3화에서 이야기했던 피드백 루프를 떠올려보세요. 피드백의 질을 좌우하는 것은 결국 “무엇이 좋은 결과인가”에 대한 판단입니다. 이 판단이 없으면 피드백 루프 자체가 공회전합니다.

넷째, 책임 수용(Acceptance of Accountability)

5화에서 깊이 다뤘던 주제와 맞닿는 부분입니다. 진정한 판단에는 “이 결정의 결과를 내가 감당하겠다”는 의지가 포함됩니다. 결과가 좋으면 공로를, 나쁘면 책임을 지겠다는 각오 없이는 판단이 아니라 그저 선택에 불과합니다.

제가 현장에서 본 최고의 판단자들은 하나같이 이 특징을 공유합니다. 결정을 내리기 전에 충분히 고민하지만, 일단 결정을 내리면 그 결과를 온전히 자신의 것으로 받아들입니다. AI의 답이 틀렸더라도 “AI 탓”을 하지 않아요. “AI의 답을 바탕으로 최종 결정을 내린 것은 나이므로, 결과도 내 책임”이라고 말합니다.

이 네 가지 — 상황 인식, 불확실성 감내, 가치 판단, 책임 수용 — 가 결합될 때 비로소 우리가 ‘판단’이라 부르는 것이 완성됩니다. 그리고 이것이 2026년 현재, AI가 대체할 수 없는 인간의 가장 핵심적인 능력입니다.

현장에서 마주한 판단의 순간들

이론만으로는 와닿지 않을 수 있으니, 제가 금융IT 현장에서 실제로 경험하거나 가까이서 지켜본 판단의 순간들을 몇 가지 나누겠습니다. 물론 익명화하고 일반화했지만, 핵심적인 판단의 구조는 그대로입니다.

사례 1: 새벽 3시의 이상거래 경보

어느 날 새벽 3시, 이상거래 탐지 시스템이 한꺼번에 47건의 경보를 쏟아냈습니다. 모두 같은 시간대에, 비슷한 패턴으로 발생한 소액 해외 결제 건이었어요. AI 모델의 이상 점수는 평균 91점. 매우 높습니다.

야간 당직자는 두 가지 선택지 앞에 섰습니다.

  • 선택 A: 즉시 모든 카드를 일괄 정지한다. 사기 피해를 최소화할 수 있지만, 만약 오탐이라면 47명의 고객이 새벽에 갑자기 카드가 막히는 불편을 겪는다.
  • 선택 B: 일단 모니터링 강화 상태로 두고, 아침 출근 시간에 각 건을 개별 확인한다. 오탐일 경우 고객 불편은 없지만, 실제 사기라면 몇 시간 동안 추가 피해가 발생할 수 있다.

AI의 답은 명확했습니다. “91점, 고위험.” 하지만 결정은 명확하지 않았어요.

당직자는 몇 가지를 더 확인했습니다. 47건의 카드가 모두 같은 지역에서 발급된 것인지(아니었습니다), 해당 해외 가맹점이 최근 유출 이력이 있는 곳인지(확인 중이었습니다), 그리고 결정적으로 — 지난달에 비슷한 패턴의 경보가 있었는데 그때는 현지 시간대의 합법적인 세일 이벤트 때문이었다는 사실을 기억해냈습니다.

결국 당직자는 선택 C를 만들어냈습니다. 선택지에 없던 제3의 길이었어요. 47건 중 거래 금액이 일정 기준 이상인 12건만 즉시 정지하고, 나머지 35건은 실시간 모니터링으로 전환하되 추가 거래 발생 시 자동 정지되도록 임시 룰을 설정한 겁니다.

이 판단에는 AI의 답(91점이라는 높은 위험도)이 기초가 되었지만, 최종 결정은 과거 경험, 고객 영향 범위, 새벽 시간대라는 운영 맥락, 그리고 “전부 아니면 전무”가 아닌 중간 지대를 창조하는 유연성이 함께 작용한 결과였습니다.

나중에 확인해보니, 47건 중 11건이 실제 사기 거래였고 나머지 36건은 정상이었습니다. 당직자의 판단이 12건을 즉시 정지한 덕에 사기 11건 중 9건을 막았고, 정상 거래 36건 중 33건은 아무런 불편 없이 처리되었습니다. 완벽한 결과는 아니었지만, 선택 A나 B보다 압도적으로 나은 결과였어요.

여기서 핵심은 “선택 C를 만들어낸 것” 자체가 판단이라는 점입니다. AI는 A와 B 중 어느 것이 나은지 비교해줄 수는 있지만, 존재하지 않는 C를 창조하지는 못합니다.

사례 2: 챗봇이 추천한 상품의 적합성

금융 챗봇을 8년 운영하면서 수없이 겪은 유형의 사례입니다. 한 고객이 챗봇에게 “여유자금 3천만원을 굴리고 싶다”고 문의했습니다. 챗봇은 고객의 투자 성향 평가 결과(공격투자형), 현재 포트폴리오 분석, 시장 상황을 종합해서 특정 유형의 펀드 세 가지를 추천했습니다.

답으로서는 합리적이었습니다. 고객의 투자 성향에 부합하고, 분산 투자 원칙에도 맞고, 수수료 효율성도 좋았어요. 하지만 이 대화를 리뷰하던 담당자가 한 가지를 발견했습니다.

대화 맥락을 처음부터 읽어보니, 고객이 “사실 내년에 아이가 대학에 가는데”라는 말을 중간에 한 적이 있었습니다. 챗봇은 이 문장을 자연어 처리로 인식하긴 했지만, 투자 추천 로직에 반영하지 못했어요. 왜냐하면 “내년에 아이가 대학 간다”는 정보가 투자 기간이나 유동성 필요와 연결되는 맥락적 추론은 해당 시스템의 범위 밖이었거든요.

담당자의 판단은 이랬습니다. “이 고객은 공격투자형으로 분류되어 있지만, 1년 내에 큰 지출이 예정된 상태다. 3천만원 전액을 공격적 상품에 넣으면 안 된다. 최소한 등록금 예상액만큼은 안전자산에 배분해야 한다.”

이 판단은 기술적으로 간단해 보이지만, 실제로는 여러 층위가 겹쳐 있습니다. 대화 전체의 맥락 파악, “대학 등록금”이라는 한국 사회의 일반적 비용 추정, 공격투자형 성향 평가가 장기적으로는 맞지만 단기적으로는 위험하다는 시간 축의 전환, 그리고 “고객이 명시적으로 요청하지 않았더라도 알려야 하는 것이 있다”는 직업 윤리까지.

4화에서 다뤘던 “AI가 끝맺지 못하는 일”이 정확히 이런 것입니다. 챗봇은 질문에 답하는 데는 탁월하지만, 질문 뒤에 숨어 있는 진짜 필요를 판단하는 것은 아직 사람의 영역입니다.

데이터 화면 앞에서 깊이 사고하는 판단의 순간

사례 3: 시스템 장애 시 AI의 복구 제안

이 사례는 개발자로서 가장 뼈저리게 느낀 판단의 순간입니다.

대규모 시스템 장애가 발생했을 때, 요즘은 AI 기반 운영 도구가 장애 원인을 분석하고 복구 방안을 제안합니다. 어느 날 오후, 핵심 서비스 중 하나가 멈췄습니다. AI 운영 도구는 로그를 분석해서 두 가지 복구 방안을 제시했어요.

  • 방안 1: 최근 배포를 롤백한다. 예상 복구 시간 5분. 하지만 그날 오전에 반영한 규제 대응 패치도 함께 롤백된다.
  • 방안 2: 문제가 되는 특정 모듈만 재시작한다. 예상 복구 시간 15분. 하지만 재시작 과정에서 처리 중이던 거래 약 200건이 유실될 수 있다.

AI의 추천은 방안 1이었습니다. 복구 시간이 짧고, 성공 확률이 더 높다는 과거 데이터를 근거로요. 하지만 운영팀장은 잠깐 생각한 뒤 방안 2를 선택했습니다.

이유가 있었어요. 오전에 반영한 규제 대응 패치는 당일 자정까지 적용이 완료되어야 하는 법적 의무사항이었습니다. 롤백하면 패치를 다시 반영해야 하는데, 테스트와 승인 절차를 고려하면 자정까지 완료할 수 있을지 불확실했어요. 반면 200건의 거래 유실은 심각하지만, 거래 원장에서 복구 가능한 건이 대부분이었고, 최악의 경우에도 고객에게 직접적인 금전 피해는 발생하지 않는 구조였습니다.

“5분 vs 15분”이라는 AI의 답은 정확했습니다. 하지만 “규제 컴플라이언스 리스크 vs 거래 유실 리스크”라는 가치의 우선순위를 판단한 것은 사람이었어요. 그리고 이 판단에는 법적 기한, 재반영 절차의 현실적 소요 시간, 거래 원장 복구 가능성, 고객 피해 범위 같은 AI에게 입력된 적 없는 맥락이 총동원되었습니다.

사례 4: “아무것도 하지 않기”라는 판단

판단의 중요한 형태 중 하나는 “아무것도 하지 않기”를 선택하는 것입니다. AI는 기본적으로 무언가를 제안하도록 설계되어 있어요. 분석 결과를 내놓고, 추천을 하고, 행동을 제안합니다. 하지만 때로는 “지금은 아무것도 하지 않는 것이 최선”인 순간이 있습니다.

시장이 급변하는 날, 투자 관련 AI 시스템은 끊임없이 리밸런싱을 제안합니다. “현재 포트폴리오 대비 최적 배분이 변경되었으니 이렇게 조정하라”고요. 하지만 경험 많은 운용역은 알고 있습니다. 시장이 극도로 변동성이 클 때 빈번한 매매는 오히려 손실을 키울 수 있다는 것을. 거래 비용이 누적되고, 감정적 패닉 매도에 편승하게 되고, 무엇보다 변동성이 지나간 뒤 돌아보면 그냥 가만히 있는 것이 최선이었던 경우가 많다는 것을.

“AI가 하라는 걸 안 하는 것”도 판단입니다. 어쩌면 가장 어려운 판단일 수 있어요. 왜냐하면 AI의 제안을 무시했다가 결과가 나쁘면 “왜 AI 말을 안 들었냐”는 비판을 받을 수 있고, 결과가 좋아도 “아무것도 안 한 것이니 공로도 없다”가 될 수 있거든요. 그럼에도 “지금은 가만히 있는 것이 맞다”고 결정하는 것, 이것이 진짜 판단의 힘입니다.

AI가 판단할 수 없는 구조적 이유

사례를 통해 판단이 실무에서 어떻게 작동하는지 살펴봤으니, 이제 한 발 물러서서 왜 AI가 구조적으로 판단할 수 없는가를 생각해보겠습니다. 이건 “아직 기술이 부족해서”가 아닙니다. 판단의 본질적인 속성과 AI의 작동 원리 사이에 존재하는 근본적인 간극에 대한 이야기입니다.

AI가 구조적으로 판단할 수 없는 네 가지 이유 인포그래픽

이유 1: 프레임 문제(Frame Problem)

인공지능 철학에서 오래된 난제 중 하나가 프레임 문제입니다. 간단히 말하면, “어떤 상황에서 무엇이 관련 있고 무엇이 관련 없는지를 어떻게 결정하는가”의 문제예요.

사례 2의 챗봇 이야기를 떠올려보세요. “내년에 아이가 대학 간다”는 말이 투자 추천과 관련 있는 정보라는 걸 판단하려면, 먼저 “대학 = 큰 지출”, “큰 지출 예정 = 유동성 필요”, “유동성 필요 = 투자 기간 제약”이라는 연쇄적인 추론이 필요합니다. 이 추론 자체는 AI도 할 수 있어요.

문제는 이런 추론을 시작할지 말지를 결정하는 것입니다. 고객이 대화 중에 한 모든 말이 투자 추천과 관련 있을 수 있습니다. “요즘 날씨가 좋네요”는 관련 없을 확률이 높지만, “요즘 건강이 안 좋아서”는 관련 있을 수 있어요(의료비 지출 가능성). “아이가 유학을 생각하고 있어요”는 확실히 관련 있고요.

인간은 이 판단을 거의 무의식적으로, 순식간에 합니다. 대화의 흐름 속에서 “아, 이건 중요한 정보다”라고 직감적으로 포착해요. 하지만 AI에게 이것을 프로그래밍하려면 “세상의 모든 정보 중 현재 맥락에 관련 있는 것을 선별하라”는 거의 무한한 과제를 줘야 합니다. 이것이 프레임 문제의 핵심이고, 아직 완전히 풀리지 않은 난제입니다.

이유 2: 가치는 계산할 수 없다

AI는 최적화 문제를 풀도록 설계되어 있습니다. 목적 함수를 최대화하거나 손실 함수를 최소화하는 거죠. 하지만 현실의 판단에서는 목적 함수 자체가 명확하지 않거나, 여러 개의 목적 함수가 서로 충돌합니다.

“고객 만족도를 최대화하라”와 “리스크를 최소화하라”는 거의 항상 충돌합니다. 고객이 원하는 것을 다 해주면 리스크가 커지고, 리스크를 줄이려면 고객에게 제약을 가해야 하니까요. 이 둘 사이의 균형점을 어디에 둘 것인가는 수학적으로 결정할 수 없는 가치의 문제입니다.

물론 “고객 만족도에 0.6, 리스크에 0.4의 가중치를 부여하라”고 프로그래밍할 수 있습니다. 하지만 그 0.6과 0.4를 결정하는 것 자체가 이미 인간의 가치 판단이에요. 그리고 이 가중치는 상황에 따라 달라져야 합니다. 평상시에는 고객 만족도에 무게를 두지만, 금융 위기 시에는 리스크 관리에 무게를 둬야 하거든요. “언제 가중치를 바꿀 것인가”를 판단하는 것도 역시 인간의 몫입니다.

결국 AI가 아무리 정교해져도, 최종적으로 “무엇을 중요하게 여길 것인가”라는 질문에 답하는 것은 인간일 수밖에 없습니다. 이것은 기술의 한계가 아니라, 가치란 주관적이고 맥락 의존적인 것이기 때문입니다.

이유 3: 결정에는 ‘때(timing)’가 있다

판단에서 종종 간과되는 요소가 타이밍입니다. 같은 결정이라도 월요일 아침에 내리는 것과 금요일 저녁에 내리는 것은 완전히 다른 결과를 만들어낼 수 있어요.

AI는 “현재 데이터 기준으로 최적의 답”을 제시합니다. 하지만 사람은 “지금이 이 결정을 내리기에 적절한 시점인가”를 추가로 판단할 수 있습니다.

예를 들어, 시스템 개선이 필요하다는 AI의 분석이 정확하더라도, 연말 결산 시즌에 대규모 변경을 가하는 것은 현명하지 않을 수 있습니다. “무엇을 할 것인가”만큼 “언제 할 것인가”가 중요한데, 타이밍에 대한 감각은 조직의 리듬, 사람들의 에너지 수준, 외부 환경의 변화 속도 같은 극도로 미묘한 요소들에 의해 좌우됩니다.

숙련된 판단자는 “지금은 아니다”라고 말할 줄 알고, “바로 지금이다”라고 말할 줄도 압니다. 이 타이밍 감각은 수년간의 경험에서 나오는 것이지, 데이터 분석에서 나오는 것이 아닙니다.

이유 4: 전례 없는 상황에서의 판단

AI는 본질적으로 과거 데이터에서 학습합니다. 과거에 비슷한 상황이 있었고, 그때 어떤 결과가 나왔는지를 바탕으로 현재의 답을 도출합니다. 하지만 진짜 중요한 판단은 대개 전례가 없는 상황에서 필요합니다.

코로나19 팬데믹 초기를 생각해보세요. 전 세계적인 봉쇄, 비대면 거래의 급증, 정부의 긴급 지원금 지급, 금리의 급격한 변동 — 이 모든 것이 동시에 일어났을 때, 과거 데이터에 기반한 AI 모델은 대부분 무력했습니다. 이상거래 탐지 모델은 갑자기 증가한 온라인 거래를 전부 이상거래로 분류했고, 고객 이탈 예측 모델은 완전히 빗나갔어요.

그때 필요한 것은 “과거에 이런 일이 있었으니 이렇게 하면 된다”가 아니라, “전례 없는 상황이니 기본 원칙으로 돌아가서 생각하자”는 판단이었습니다. 고객의 안전이 최우선이고, 서비스 연속성이 그 다음이고, 효율성은 나중 문제라는 가치의 우선순위를 다시 세우는 것. 이것은 데이터가 아니라 원칙에서 나오는 판단입니다.

판단을 잘하기 위한 실전 프레임워크

지금까지 판단이 무엇인지, 왜 AI가 대신할 수 없는지를 이야기했습니다. 그렇다면 실제로 AI 시대에 판단을 잘하려면 어떻게 해야 할까요? 20년간의 현장 경험에서 추출한 몇 가지 프레임워크를 공유합니다.

프레임워크 1: “답-맥락-결정” 삼단계

AI의 답을 받았을 때, 바로 행동으로 옮기지 않고 세 단계를 거치는 습관을 들이세요.

1단계 — 답 확인: AI가 무엇을 말하고 있는지 정확히 이해합니다. 숫자의 의미, 추천의 근거, 확신도(confidence level)를 파악합니다. “이상 점수 87점”이라면, 87점이 의미하는 바가 무엇인지, 어떤 요소가 점수를 올렸는지를 확인하는 단계입니다.

2단계 — 맥락 보충: AI의 답에 포함되지 않은 맥락을 의식적으로 떠올립니다. 시간적 맥락(지금이 어떤 시기인가), 인적 맥락(관련된 사람들의 상황은 어떤가), 조직적 맥락(현재 조직의 우선순위는 무엇인가), 외부 맥락(규제 환경, 시장 상황 등)을 체크리스트처럼 점검합니다.

3단계 — 결정과 근거 명시: 최종 결정을 내리되, “왜 이 결정을 내렸는가”를 한두 문장으로 정리합니다. 이것이 중요한 이유는 두 가지입니다. 첫째, 근거를 명시하면 나중에 결과를 복기할 때 판단의 품질을 평가할 수 있습니다. 둘째, 다른 사람에게 결정을 전달할 때 설득력이 생깁니다.

이 삼단계가 처음에는 번거롭게 느껴질 수 있지만, 익숙해지면 거의 자동으로 돌아갑니다. 마치 운전할 때 “미러 확인 → 방향지시등 → 차선 변경”이 처음에는 의식적이지만 나중에는 무의식적으로 되는 것처럼요.

프레임워크 2: 반대 시나리오 점검

AI가 A를 추천했을 때, 의식적으로 “만약 B를 하면 어떻게 되지?”를 생각해보는 습관입니다. 이것은 AI를 의심하라는 게 아니라, 판단의 견고함을 높이기 위한 사고 도구입니다.

구체적으로 세 가지 질문을 던집니다.

  • “AI의 추천과 반대로 했을 때 최악의 시나리오는?” — 이것이 감당 가능한 수준인지 확인합니다.
  • “AI의 추천대로 했을 때 최악의 시나리오는?” — AI의 추천이 틀렸을 때의 리스크를 미리 상정합니다.
  • “두 최악 중 어느 쪽이 더 치명적인가?” — 이 비교가 최종 결정의 방향을 잡아줍니다.

예를 들어, AI가 “이 고객에게 대출을 승인하라”고 추천했을 때:

  • 반대(거절)의 최악: 우량 고객을 놓치고 경쟁사에 뺏긴다.
  • 추천대로(승인)의 최악: 부실 대출이 되어 원금을 회수하지 못한다.
  • 비교: 금융기관에서는 보통 부실 대출의 피해가 고객 이탈의 피해보다 훨씬 크다(비대칭 리스크). 따라서 AI의 확신도가 높지 않다면 추가 확인이 필요하다.

이 프레임워크는 AI의 답을 맹목적으로 따르지도, 맹목적으로 거부하지도 않게 해줍니다. 판단에 구조를 부여하는 거예요.

AI 시대 판단을 위한 네 가지 실전 프레임워크

프레임워크 3: “5년 후 테스트”

결정이 특히 어려울 때 써보면 좋은 방법입니다. “5년 후의 내가 이 결정을 돌아보면 뭐라고 할까?”를 상상해보는 거예요.

이 질문의 효과는 두 가지입니다.

첫째, 단기 압박에서 벗어나게 해줍니다. 지금 당장의 KPI, 이번 분기 실적, 상사의 눈치 같은 단기적 요인이 판단을 왜곡하는 경우가 많습니다. 5년 후의 시점에서 바라보면 이런 단기 요인들이 적절한 크기로 축소돼요.

둘째, 가치의 우선순위가 명확해집니다. 5년 후의 내가 후회할 것은 대개 “원칙을 어긴 것”, “사람을 무시한 것”, “안전을 경시한 것”이지, “조금 느리게 처리한 것”이나 “AI의 추천을 따르지 않은 것”은 아닙니다.

저는 중요한 결정을 내릴 때마다 이 질문을 스스로에게 던지는 습관이 있습니다. 그리고 놀랍게도, 이 간단한 질문 하나가 판단의 품질을 극적으로 높여줍니다. 시간 축을 늘리는 것만으로도 더 나은 판단을 내릴 수 있다니, 생각보다 단순한 도구가 강력한 결과를 만들어내는 셈이죠.

프레임워크 4: 판단의 문서화

이건 프레임워크라기보다 습관에 가깝습니다. 중요한 결정을 내릴 때마다 짧게라도 기록을 남기세요.

  • AI가 뭘 추천했는가
  • 내가 어떤 결정을 내렸는가
  • 왜 그렇게 결정했는가 (AI를 따랐든 따르지 않았든)
  • 결과는 어땠는가 (나중에 추가)

이 기록이 쌓이면 놀라운 일이 일어납니다. 자신의 판단 패턴이 보이기 시작해요. “나는 리스크를 과대평가하는 경향이 있구나”, “나는 AI의 추천을 따를 때보다 따르지 않을 때 결과가 더 좋았네”, “이런 유형의 상황에서는 내 판단이 AI보다 정확하고, 저런 유형에서는 AI가 더 낫구나” 같은 메타 인지가 생기는 겁니다.

2화에서 ‘휴먼 인 더 루프’의 진짜 의미를 이야기했는데요, 이 판단 문서화야말로 루프를 ‘학습하는 루프’로 만드는 실질적인 방법입니다. AI의 성능이 데이터가 쌓일수록 좋아지듯, 사람의 판단도 기록이 쌓일수록 좋아집니다.

판단 근육을 키우는 일상의 훈련

프레임워크가 “판단의 도구”라면, 이번 섹션은 “판단의 체력”에 대한 이야기입니다. 판단은 근육과 같아서, 쓰지 않으면 퇴화합니다. AI가 점점 더 많은 답을 대신 내놓는 시대에, 의식적으로 판단 근육을 단련하지 않으면 정작 필요한 순간에 판단력이 무뎌져 있을 수 있어요.

훈련 1: 의도적으로 AI 없이 판단하는 시간 갖기

일주일에 한 번쯤은 AI의 도움 없이 스스로 분석하고 결론을 내려보세요. 작은 것이어도 좋습니다. 점심 메뉴를 AI에게 추천받지 않고 직접 고르는 것부터 시작해도 돼요.

중요한 것은 “AI 없이도 판단할 수 있다”는 자기 확신을 유지하는 것입니다. AI에 대한 의존도가 높아지면, 어느 순간 “AI 없이는 결정을 못 하겠다”는 심리적 상태에 빠질 수 있어요. 이건 도구에 대한 건강한 활용이 아니라 의존입니다.

업무에서도 가능합니다. 주간 보고서를 작성할 때 AI의 초안 생성을 쓰기 전에, 먼저 5분만 직접 핵심 포인트를 정리해보세요. 그다음 AI가 생성한 것과 비교해보면, 자신의 판단이 AI와 어디서 같고 어디서 다른지를 확인할 수 있습니다. 이 비교 자체가 판단 훈련이 됩니다.

훈련 2: 다른 사람의 판단을 관찰하기

회의에서 상사나 동료가 결정을 내리는 과정을 의식적으로 관찰해보세요. “이 사람은 어떤 정보를 중시하는가?”, “어떤 기준으로 우선순위를 매기는가?”, “불확실한 상황에서 어떻게 대처하는가?”를 주의 깊게 보는 겁니다.

판단력이 뛰어난 사람들에게는 공통된 특징이 있습니다. 결론을 서두르지 않되, 필요할 때는 과감하게 결단합니다. 데이터를 존중하되, 데이터에 매몰되지 않습니다. 자신의 판단에 확신을 갖되, 새로운 정보가 들어오면 유연하게 수정합니다.

이런 관찰을 통해 자신만의 판단 모델을 만들어갈 수 있어요. 복싱에서 다른 선수의 경기를 분석하며 기술을 익히듯, 판단도 타인의 판단을 관찰하면서 배울 수 있습니다.

훈련 3: 사후 복기 (After-Action Review)

군대에서 유래한 이 방법은 판단력 향상에 가장 효과적인 훈련 중 하나입니다. 중요한 결정을 내린 후, 결과가 나왔을 때 세 가지 질문으로 복기합니다.

  • 무엇을 기대했는가? (결정 시점의 예상)
  • 실제로 무엇이 일어났는가? (결과)
  • 차이가 왜 발생했는가? (원인 분석)

이 복기를 정기적으로 하면, 자신의 판단에 있는 체계적 편향(systematic bias)을 발견할 수 있습니다. “나는 낙관적으로 판단하는 경향이 있어서 리스크를 과소평가한다”든지, “나는 최근 경험에 과도하게 영향받는다”든지 하는 패턴이 드러나요.

AI와 함께 일할 때는 이 복기가 특히 중요합니다. “AI를 따른 판단”과 “AI에 반해 내린 판단” 각각의 정확도를 추적하면, 어떤 영역에서는 AI를 더 신뢰해야 하고 어떤 영역에서는 자신의 판단을 더 신뢰해야 하는지가 데이터로 드러나니까요. 이것이야말로 진정한 의미의 휴먼 인 더 루프입니다. 사람과 AI가 서로의 부족함을 보완하며 함께 나아지는 학습 루프.

훈련 4: 판단의 언어화

머릿속에서 내린 판단을 말이나 글로 표현해보는 훈련입니다. “왜 그렇게 결정했어?”라는 질문에 명확하게 대답할 수 있는지 스스로 테스트해보세요.

판단을 언어화하는 것이 중요한 이유는, 언어화 과정에서 자신의 판단에 있는 논리적 허점이 드러나기 때문입니다. 머릿속에서는 그럴듯했던 논리가 입으로 말하거나 글로 쓸 때 “어, 이게 좀 이상한데?”하고 깨달아지는 경험, 다들 있으시죠?

동료에게 “나 이렇게 판단하려고 하는데 어떻게 생각해?”라고 물어보는 것도 좋은 방법입니다. 이건 확인 편향(confirmation bias)을 방지하는 효과도 있어요. 자기 혼자 판단하면 자신에게 유리한 정보만 선택적으로 고려하는 경향이 있는데, 다른 사람의 관점이 개입하면 이 편향이 어느 정도 교정됩니다.

판단을 포기하면 일어나는 일

지금까지 판단의 중요성을 여러 각도에서 이야기했는데, 마지막으로 “판단을 포기하면 어떤 일이 벌어지는가”를 생각해보겠습니다. 이것은 단순히 개인의 문제가 아니라 조직, 더 나아가 사회 전체의 문제입니다.

개인 차원: 판단력의 퇴화

AI에게 결정을 맡기는 것이 편하다보니, 자주 그러다 보면 진짜로 판단력이 약해집니다. 마치 에스컬레이터만 타다 보면 계단 오르기가 힘들어지는 것처럼요. 처음에는 “사소한 결정은 AI한테 맡기고 중요한 건 내가 하면 되지”라고 생각하지만, 문제는 어디까지가 사소하고 어디부터가 중요한지를 판단하는 것 자체가 판단이라는 점입니다.

판단 근육이 약해진 사람은 결정적인 순간에 두 가지 증상을 보입니다. 결정 마비(decision paralysis) — 정보가 충분한데도 결정을 내리지 못하고 계속 더 많은 데이터를 요구하거나, 무비판적 수용(uncritical acceptance) — AI가 뭘 말하든 그냥 따르는 것. 둘 다 건강하지 않은 상태예요.

조직 차원: 집단적 판단 위축

조직 전체가 AI의 답에 의존하기 시작하면, 조직 내에서 “나는 다르게 생각하는데”라고 말하기가 점점 어려워집니다. AI의 분석과 다른 의견을 제시하는 사람은 “데이터에 반하는 주관적인 판단을 하는 사람”으로 취급받을 수 있으니까요.

하지만 역사적으로 가장 큰 재앙은 “모두가 같은 방향으로 생각했을 때” 발생했습니다. 금융위기 때 모든 모델이 안전하다고 했지만 실제로는 안전하지 않았던 것처럼요. AI의 답에 모두가 동의하는 것이 반드시 좋은 것은 아닙니다. 오히려 누군가가 “잠깐, AI 분석은 이렇지만 내 경험으로는 좀 이상한데”라고 말할 수 있는 문화가 건강한 조직의 징표입니다.

3화에서 AI를 잘 쓰는 팀과 못 쓰는 팀의 차이가 피드백 루프에 있다고 했는데요, 그 피드백 루프가 작동하려면 “AI에 대해 이의를 제기해도 괜찮다”는 심리적 안전감이 전제되어야 합니다. AI의 답을 존중하면서도 의문을 제기할 수 있는, 건강한 긴장감 말이에요.

사회 차원: “시스템이 그렇게 했다”의 확산

5화의 주제였던 “AI가 시킨 대로 했어요”가 사회 전체로 확산되면, 책임의 진공 상태가 만들어집니다. 대출이 거절되었을 때 “시스템 판단입니다”, 보험금이 지급되지 않았을 때 “AI 분석 결과입니다”, 채용에서 탈락했을 때 “알고리즘 평가입니다” — 모든 결정이 시스템 뒤에 숨으면, 이의를 제기할 대상이 사라집니다.

이것은 단순히 불편한 것을 넘어서, 민주 사회의 근간인 설명가능성(explainability)과 이의제기 권리(right to contest)를 위협합니다. 누군가의 삶에 영향을 미치는 결정에 대해 “왜 그런 결정을 내렸습니까?”라고 물었을 때, “AI가 그렇게 판단했습니다” 이상의 답을 할 수 있는 사람이 있어야 합니다. 그 사람이 바로 ‘루프 안의 인간’이고, 그 사람이 하는 일이 바로 ‘판단’입니다.

그래서, 어떻게 할 것인가

글이 길어졌습니다. 지금까지의 이야기를 한 줄로 요약하면 이겁니다.

AI의 답을 신뢰하되, 결정의 주인은 당신이어야 한다.

후배의 질문으로 돌아가겠습니다. “AI가 내놓은 답을 매번 의심해야 하냐”고 물었죠. 제 대답은 이렇습니다.

“의심하라는 게 아니라, 답과 결정 사이에 네 판단을 넣으라는 거야. AI의 답은 훌륭한 재료지만, 그걸로 뭘 만들지 정하는 건 너야. 요리사가 좋은 재료를 의심할 필요는 없지만, 어떤 요리를 만들지 결정하는 건 요리사 자신이잖아.”

AI 시대에 경쟁력 있는 사람은 AI를 가장 잘 다루는 사람이 아닙니다. AI의 답을 재료로 삼아 최선의 결정을 내릴 수 있는 사람입니다. 그리고 그 능력의 이름이 ‘판단’입니다.

판단은 타고나는 것이 아니라 기르는 것입니다. 오늘 소개한 프레임워크와 훈련법이 여러분의 판단 근육을 키우는 데 작은 도움이 되길 바랍니다.

오늘 하나만 실천해보시면 좋겠습니다. AI가 답을 줄 때, 바로 실행하지 말고 3초만 멈춰서 스스로에게 물어보세요. “이 답을 결정으로 바꾸기 전에, 내가 알고 있지만 AI는 모르는 게 뭐지?”

그 3초가 당신을 단순한 AI 사용자에서 AI 시대의 판단자로 바꿔줄 겁니다.

📝 이번 주 한 줄 노트
AI의 답은 지도 위의 경로 안내다. 하지만 핸들을 잡고, 신호를 보고, 멈출지 갈지를 판단하는 건 운전석에 앉은 사람의 몫이다.

다음 화 예고 — 7화: 감정이라는 데이터
“감정적으로 판단하지 마세요”라는 말, 직장에서 많이 들으시죠? 하지만 AI 시대에 감정은 정말로 판단에 방해만 되는 걸까요? 다음 7화에서는 감정이 판단에 미치는 영향, 그리고 AI에게 없는 감정이 오히려 인간 판단의 강점이 되는 순간들을 이야기합니다. 금융 현장에서 ‘직감’이 데이터를 이긴 사례도 함께요.

이미지는 Leonardo AI 로 생성되었습니다.

이미지는 Claude AI 로 생성되었습니다.


📚 시리즈: 휴먼 인 더 루프(Human-in-the-Loop): AI 시대, 사람만 할 수 있는 일 (총 12화 중 6화)
이전 5화  (다음 차수는 아직 게시되지 않았습니다)