※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.
[IT동아 남시현 기자] 2022년 8월, 스태빌리티 AI가 스테이블 디퓨전을 처음 공개했고, 2023년 9월에는 오픈AI가 DALL-E 3를 공개했다. 이를 시작으로 많은 기업들이 이미지 생성형 AI를 출시했고, 최근에는 이미지 생성 서비스 정도는 무료화됐다. 그중에서도 가장 접근성과 성능, 활용도가 좋은 것은 구글 제미나이의 이미지 생성 기능이다. 구글 제미나이에 기본 탑재된 이미지 생성형 AI는 자연어 입력을 통해 원하는 사진을 만들 수 있다.

제미나이 이미지의 가장 큰 장점은 이미지 생성 횟수에 제약이 없다는 점이다. 이미지 생성 개수에 제약이 있으면 세세하게 수정하기 어렵지만, 제미나이로 만들면 ‘참치김밥의 참치를 덜어줘’라던가 ‘그릇을 원형 접시에서 긴 직사각형 형태로 바꿔줘’ 같은 명령을 계속 내려가며 원하는 이미지를 만들 수 있다. 특히 유료 이미지 사용에 부담스러운 자영업자나 소상공인에게는 큰 도움이 된다. 제미나이를 활용해 원하는 이미지를 만드는 법을 알아보자.
제미나이, 구글 검색창에 입력하거나 스마트폰으로 접속

제미나이는 현재 2.5 플래시 버전이 기본 제공되며, 여기에 프롬프트를 입력하는 방식으로 이미지를 만듭니다. 이때 사람을 제외한 모든 사물이나 풍경 등의 이미지, 일러스트, 디자인은 무료로 무제한 생성할 수 있다. 물론 무엇을 어떻게 입력하는지에 따라 결과물이 천차만별이고, 예상하지 못한 세세한 부분까지 반영이 된다는 점도 고려해야 한다.
예를 들어 ‘라면을 끓여줘’라고 하면 어디서든 볼 수 있는 라면을 끓인다. 본인이 원하는 이미지로 만들고 싶다면 ‘콩나물을 넣어줘’, ‘나무젓가락을 오른쪽에 둬’ 같은 상세한 설명을 넣는 것은 물론, ‘조명은 따뜻한 색감으로’, ‘1미터 정도 원거리에서 주변 배경이 잘 나오게’, ‘자연스럽게’, ‘스포트라이트 조명을 받도록’ 같은 세세한 설명까지 다 넣어줘야 한다. 일단은 무제한이므로 가볍게 자연어로 설명하고, 원하는 이미지가 나올 때까지 세세하게 문구를 바꾸는 것을 추천한다.
말로 설명할 수 있는 모든 음식 이미지로 생성

제미나이 이미지 생성AI는 자연어로 입력하는 모든 이미지를 만든다. 다만 데이터가 많은 이미지일수록 품질이 높으므로 한식보다는 서양 음식의 이미지 품질이 높다. 김치찌개나 불고기같은 대중적인 음식은 문제없이 생성하지만 두릅 쌈밥이라던가 멸치회 같이 우리나라에서만 먹는 음식을 만들어달라고 하면 기대한 결과가 잘 나오지 않는다. 소상공인이라면 자기 가게만의 독특한 음식들을 만들 텐데, 이 이미지를 만들려면 이미지의 재료부터 배치까지 상세히 설명해야 한다.

제미나이에 ‘짜장면을 그려줘’라고 요청했다. 이 경우 매번 무작위로 짜장면 이미지가 생성되며 재료 역시 제멋대로다. 소상공인이 가게 메뉴판 내 이미지로 사용할 생각이라면 가게 레시피대로 이미지가 만들어져야 한다. 따라서 ‘짜장면을 그려줘. 나무로 된 테이블에 오른쪽에 젓가락이 있어. 그 뒤로 단무지가 흰 그릇에 담겨있고. 짜장면 위에는 오이채 썰은 거랑 완두콩이 올라가 있어야 해’라고 구체적으로 명령을 내리자 정확하게 상상한 이미지대로 제공됐다. 어떤 음식을 만들든 본인이 상상하는 그림과 재료까지 세부적으로 요청해야 한다.

또한 원하는 음식 이미지가 나올때 까지 생성하는 것도 중요하다. 나무 테이블 배경에 탕수육을 그리고, 소스 그릇만 따로 빼달라고 요청했는데 탕수육 그릇 내에 양념 종지가 올라가 있다. 그래서 이번에는 목이버섯과 양파가 들어간 양념을 다른 그릇으로 빼달라고 했는데 역시 낯선 모양이다. 탕수육이 조금 둥근 것 같아 길게 해달라고 했더니 또 예상과 다른 이미지가 나온다. 따라서 자연어로 설명할 때는 450자 이내로 매우 자세하게 하나하나 설명하는 게 좋다.

만약 제미나이가 명령어를 제대로 인식하지 못하거나, 예상외의 결과가 나온다면 참고할만한 이미지를 첨부하는 게 좋다. 이미지는 드래그 앤 드롭으로 ‘Gemini 프롬프트 입력’ 란에 끌어다 놓고, 그다음 이 이미지를 기반으로 원하는 음식 이미지를 만들어달라고 요청한다. 사진 첨부 전에는 ‘간짜장’을 거듭 요청했는데 모두 양념이 같이 올라가 있거나 다른 음식이 나왔었다.
이후 사진을 첨부하자 처음으로 면과 양념이 분리된 짜장면이 생성됐고, 추가로 양념을 그릇에서 빼달라고 요청하자 제대로 된 간짜장이 만들어졌다. 가게 레시피에 따라 무순 대신 오이채를 올리거나 계란 프라이를 빼는 등으로 응용하면 된다.
예시에서는 중국집 요리로 했지만 카페나 양식당, 일식당 등 어떤 음식에 대한 이미지도 생성할 수 있다. 메뉴판 내 이미지가 스마트폰으로 촬영해 품질이 떨어지거나, 추가로 이미지를 사용할 일이 있을 때 만들자.
이미지는 저장해서 사용, 스마트폰으로도 생성돼

완성된 이미지는 우측 상단의 ‘원본 크기 다운로드’를 누르면 다운로드할 수 있다. 이미지는 2048x2048 픽셀 정사각형 이미지며 디지털 파일 형태로 인쇄물이나 애플리케이션 첨부 등의 용도로 쓰기 좋다. 다운로드한 이미지는 브라우저에서 지정한 다운로드 위치로 가며, 별다른 설정이 없다면 내 컴퓨터의 ‘다운로드’ 폴더로 이동한다.
제미나이로 생성된 이미지는 저작권이 불분명하므로 책임 소재가 발생할 수 있다. 물론 음식이나 제품 등은 문제가 생길 가능성이 거의 없고, 상표권이 등록된 캐릭터나 브랜드 같은 것을 생성해서 붙이면 문제가 된다.

꼭 컴퓨터로 사용하지 않더라도 스마트폰 상에서 이미지를 생성할 수도 있다. 갤럭시 스마트폰은 최신 업데이트부터 구글 제미나이를 기본 탑재하고 있으며, 이전 버전이거나 애플 아이폰 사용자라면 스토어에서 구글 제미나이를 다운로드할 수 있다. 그다음 구글 계정에 로그인한 다음, 컴퓨터에서 질문한 것과 동일하게 이미지 생성을 요청하면 된다. 생성된 이미지는 다운로드해서 스마트폰에서 바로 사용하거나 공유할 수 있다.
IT동아 남시현 기자 (sh@itdonga.com)