
챗GPT랑 제미나이 유료 구독을 하고 있는데
문득 이런 생각이 들었습니다.
"둘 중에 어떤 놈이 이미지 생성을 잘할까?"
그래서 비교해봤습니다.
총 4가지 버전으로 테스트해봤는데요.
1번 : 한국어 생성 능력
2번 : 실사 이미지 생성 능력
3번 : 복잡한 조건 및 구도 생성 능력
4번 : 부분 수정 능력
* 챗 GPT 5.5 / 제미나이 3.5 FLASH로 대결
일단 1번 테스트 입니다.
한국어 생성 능력을 테스트 해보려고
아래와 같은 동일한 프롬프트를 넣어봤답니다.
"우리 카페 영업합니다"라고 적혀있는 입간판이 세워진
성수동에 있을 법한 힙한 느낌의 카페 만들어줘."
챗GPT 버전

제미나이 버전

첫 번째 승부는 챗GPT 승
제미나이 버전은 말귀를 너무 알아먹었는지
간판에 '성수'를 딱 박아놨네요
둘 다 카페에 식물을 배치한 모습을 보면
힙한 카페 = 식물이 많이 있는 카페로 인식하나 봅니다
제미나이는 시키지도 않은 주변 상가의 간판도 추가했는데
확대해보니 '오리식정', '장임시맘', '사참반'
말도 안되는 한글 텍스트로 만들었습니다.
다음으로 2번 테스트 : 실사 느낌 구현
실사 느낌 구현을 위해 프롬프트를 이렇게 입력했습니다
햇빛이 들어오는 창가에 앉아 있는 장모 고양이를 실제 사진처럼 만들어줘.
고양이는 털이 풍성한 회색과 흰색이 섞인 장모종이며, 카메라를 바라보고 있음. 얼굴과 가슴 주변의 긴 털이 매우 섬세하게 보여야 하고, 털 한 올 한 올이 자연광을 받아 부드럽게 빛나는 느낌이어야 함. 수염은 얇고 선명하게 표현되어야 하며, 눈동자에는 창문에서 들어오는 빛이 작게 반사되어야 함.
배경은 아늑한 실내 창가. 뒤쪽에는 흐릿하게 보이는 커튼, 나무 창틀, 작은 화분이 있음. 카메라는 고양이 얼굴 높이에서 촬영한 클로즈업 사진 느낌. 얕은 심도, 자연스러운 배경 흐림, 현실적인 그림자. 실제 미러리스 카메라로 찍은 반려동물 사진처럼 표현.
챗GPT 버전

제미나이 버전

두 번째는 무승부
동일한 프롬프트인데 지피티는 클로즈업, 제미나이는 풀샷으로 만들었네요.
고양이가 갖고 있는 털의 질감을 둘 다 비슷하게 재현해서
승부를 결정하기 어려웠습니다.
저는 무승부라고 판단했는데 여러분은 차이가 느껴지시나요?
세 번째 테스트 : 복잡한 구도 및 조건 테스트
인물의 수와 사물의 위치, 색감을 다양하게 하기 위해
사용한 프롬프트 입니다
성수동에 있을 법한 힙한 카페 내부를 실제 사진처럼 만들어줘.
이미지는 16:9 가로 비율.
카메라는 카페 입구에서 안쪽을 바라보는 시점.
화면 왼쪽 전경에는 회색과 흰색이 섞인 장모 고양이가 나무 의자 위에 앉아 있고, 카메라를 바라보고 있음.
화면 중앙에는 원목 카운터와 커피 머신이 있음.
카운터 뒤에는 검은 앞치마를 입은 바리스타 한 명이 커피를 내리고 있음.
화면 오른쪽에는 손님 두 명이 작은 원형 테이블에 마주 앉아 있음.
한 명은 노트북을 보고 있고, 다른 한 명은 커피잔을 들고 있음.
카운터 위에는 흰색 컵 3개와 작은 유리병 2개가 있어야 함.
입구 근처에는 크기가 다른 화분 5개가 있어야 함.
뒤쪽에는 큰 창문, 얇은 흰 커튼, 오래된 벽돌 벽, 따뜻한 조명이 보여야 함.
빛은 왼쪽 창문에서 들어오고, 바닥에는 창문 프레임 그림자가 자연스럽게 생겨야 함.
고양이 털은 햇빛을 받아 섬세하게 보여야 함.
전체 분위기는 실제 카페에서 찍은 자연스러운 사진처럼 표현.
일러스트, 3D 렌더링, CG 느낌은 금지.
텍스트는 넣지 말 것.
챗GPT 버전

제미나이 버전

세 번째 대결은 챗GPT 승
둘 다 프롬프트로 제시한 디테일들은 대부분 구현했는데
차이가 있습니다
일단, 카운터 위에는 흰색 컵 3개와 작은 유리병 2개가 있어야 함.
요 조건은 둘 다 반영 못했네요
고양이 털은 햇빛에 받아 표현하라고 했는데 제미나이는 어색하게 표현했습니다
인물의 경우 한 명은 노트북, 한 명은 커피 잔을 들고 있게 했는데
제미나이 녀석은 한 사람이
왼손으로 커피를, 오른손으로 다른 커피 잔을 건드리고 있게 해서
식탐 많은 욕심쟁이로 만들어 놨습니다.
전체적으로 채도와 선명도가 높게 나온 제미나이의 결과물도 별로네요
마지막 대결은 부분 수정 테스트
수정 요청을 하면 말귀를 잘 알아먹냐 인데요.
세 번째 프롬프트 내용에서 일부를 수정해봤습니다
화면 왼쪽 전경에는 장모 고양이가 아니라 스핑크스 고양이가 나무 의자 위에 앉아 있고, 카메라를 바라보고 있음.
화면 중앙에는 원목 카운터와 커피 머신이 있음.
카운터 뒤에는 흰색 앞치마를 입은 바리스타 한 명이 커피를 내리고 있음.
화면 오른쪽에는 손님 두 명이 작은 원형 테이블에 마주 앉아 있음.
한 명은 아이폰을 보고 있고, 다른 한 명은 커피잔을 들고 있음.
카운터 위에는 흰색 컵 3개와 작은 유리병 2개가 있어야 함.
입구 근처에는 크기가 다른 화분 3개가 있어야 함.
뒤쪽에는 큰 창문, 얇은 흰 커튼, 오래된 벽돌 벽, 따뜻한 조명이 보여야 함.
빛은 왼쪽 창문에서 들어오고, 바닥에는 창문 프레임 그림자가 자연스럽게 생겨야 함.
고양이 털은 햇빛을 받아 섬세하게 보여야 함.
전체 분위기는 실제 카페에서 찍은 자연스러운 사진처럼 표현.
일러스트, 3D 렌더링, CG 느낌은 금지.
텍스트는 넣지 말 것.
변경한 내용은 요렇습니다
- 장모 고양이 -> 스핑크스 고양이
- 검은색 앞치마 -> 흰색 앞치마
- 노트북 -> 아이폰
- 5개 화분 -> 3개 화분
결과는 이렇습니다.
GPT 버전

제미나이 버전

네 번째 대결은 무승부
챗GPT는 모두 반영했는데 원본 상태는 유지 못했고
제미나이는 원본 상태는 유지했는데 일부 내용은 누락했거든요
챗GPT의 경우
바리스타의 앞치마 색상을 흰색으로 바꾸긴 했는데
입고 있는 옷 색상도 바꿔버렸네요
노트북을 하고 있는 사람을 아이폰을 사용하도록 바꾸긴 했는데
사람은 두 명인데 커피 잔은 세 잔입니다
추가 주문을 했다는 의도일까요
아리송 합니다
제미나이는 화분 개수만 반영하지 못했고 나머지는 모두 반영했습니다
최종 결과
2승 2무로 챗GPT가 우승했습니다
여러분도 제가 써본 프롬프트 활용해서 이미지 대결 해보세요
생각보다 차이가 있더라구요







