앤트로픽이 2025년 10월부터 2026년 4월까지 자사 코딩 도구 ‘클로드 코드’ 세션 40만 건을 분석한 연구를 공개했다. 결론은 흔한 통념을 뒤집는다. AI가 얼마나 많은 일을 자율적으로 처리하느냐를 가르는 것은 사용자의 ‘프로그래밍 실력’이 아니라 ‘도메인 전문성’이었다.
연구에 따르면, 자신이 다루는 문제 영역을 깊이 아는 사용자가 코드를 더 잘 쓰는 사용자보다 클로드 코드에서 더 많은 결과를 얻었다. 무엇을 만들어야 하는지, 어떤 제약이 있는지를 명확히 이해할수록 AI에 더 많은 일을 맡길 수 있었다는 의미다. 7개월에 걸친 대규모 사용 로그를 바탕으로 한 결론이라는 점에서 무게가 실린다.
이 발견은 팀이 AI 코딩 작업을 어떻게 설계해야 하는지에 직접적인 함의를 준다. ‘검토석에 앉는 사람’이 반드시 모든 줄을 검토하는 시니어 엔지니어일 필요는 없다. 비즈니스 로직과 도메인 제약을 깊이 이해하는 사람이면 충분하다는 것이다. 코딩 인력이 부족한 조직이라도, 현업의 도메인 전문가를 검토 과정에 두면 AI 코딩의 성과를 끌어올릴 수 있다.
앤트로픽은 클로드 코드 도입이 부진하다면 해법은 더 나은 프롬프트나 더 큰 모델이 아니라, 도메인을 잘 아는 전문가를 검토 과정에 두는 것일 가능성이 높다고 짚었다. 이는 회사가 꾸준히 내놓아 온 ‘AI가 일자리와 업무에 미치는 영향’ 연구의 연장선이기도 하다. 누가 AI를 다루느냐에 따라 같은 도구라도 성과가 갈린다는 메시지다.
AI 코딩을 들여오는 국내 기업들에도 ‘누가 AI를 검토하느냐’라는 질문을 다시 던지는 결과다. 도구와 모델만 도입하는 것이 아니라, 도메인 전문가를 AI 작업의 중심에 두는 조직 설계가 성과를 좌우할 전망이다.
이 연구는 ‘AI를 잘 쓰는 조직’의 조건을 다시 정의한다. 그동안 많은 기업이 더 좋은 모델, 더 정교한 프롬프트, 더 많은 라이선스에서 답을 찾으려 했다. 그러나 40만 건의 실제 사용 데이터가 가리키는 방향은 사람에 가깝다. 자신의 업무와 데이터를 가장 잘 아는 현업 전문가가 AI의 결과를 판단하고 방향을 잡아 줄 때, 같은 모델이라도 더 많은 일을 안전하게 맡길 수 있다는 것이다. 앤트로픽은 이런 분석을 통해 ‘AI 도입은 기술 구매가 아니라 일하는 방식의 재설계’라는 메시지를 던지고 있다.
AI 코딩 도입을 검토하는 기업이라면, 모델 선택만큼이나 ‘누가 검토하고 방향을 잡을지’를 먼저 정하는 것이 성과를 가른다. 도구를 들이기 전에, 도메인을 가장 잘 아는 사람을 AI 작업의 한가운데에 배치하는 조직 설계가 우선이라는 점을 이번 연구가 다시 일깨운다.
자세한 내용은 앤트로픽에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
AI Matters 뉴스레터 구독하기




[