앞으로 이 블로그에 적을 여러가지에 앞서 AI로 그림을 그리는 것에 대한 이야기를 적지 않을 수 없습니다. 이 이야기도 약간 타이밍이 늦었다는 생각이 드는 게, 이 글에 적을 내용 중 8할은 이미 5월 1일 시점에 만들어졌지만- 뭔가 글 하나로는 부족하다는 느낌이었다가 얼마 전에 겨우 채울 수 있었습니다.
저는 인공지능이 사람의 할 일을 대체한다면 글쓰기나 기계적인 연구 같은 것부터 바꿀 줄 알았고 예술은 쉽지 않을 거라고 생각했는데 현실은 그렇지 않았습니다. 회사에서 있었던 일들이라 자세히 적을 수는 없지만.. AI가 글쓰고 연구하는 게 안 되는 건 아닌데 사람의 ‘잔머리'(..)를 따라갈 수가 없다보니 인간의 퀄리티가 안 나오더군요. 오히려 그림이나 음악이 더 직관적인 것이었습니다. 그래서 어느 정도 퀄리티가 나오다보니 요즘 많은 사람들의 관심을 갖는 주제인데.. 저는 올해 초에 Bing image creator로 접해보게 되었습니다.
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_BingCreator.png)
‘아이디어 탐색’이란 곳의 밑에 있는 예시를 보시다시피 상당히 그럴싸한 그림이 그려진다는 걸 알 수 있었고..
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_Com_byDall.png)
일반인에게도 어느 정도 개방되었다는 걸 알게 된 후 그림을 목적으로 chatGPT도 유료결제하고 써봤습니다. (실제 486세대 컴퓨터는 저 컴퓨터 그림보다는 훨씬 세련된 모습이었습니다. 이런 바보 chatGPT..) 눈치채셨을지 모르겠지만 이 블로그의 favicon도 저때 chatGPT로 그린 것에서 잘라서 만든 것입니다.
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_Girl_byDall.png)
그리고 예쁜 거 그려본다면 으레 시도하게 되는 ‘a beautiful woman’.. chatGPT의 그림 수준이 높다보니 짧은 지시문을 바탕으로 해도 이 정도는 됩니다.
그런데 chatGPT에서 쓰는 DALL-E는 조금만 성적인 키워드가 들어가면 경고를 띄우며 거부하고 기능의 제약이 있더군요. 악용될 소지가 있다보니 어쩔 수 없긴 한데 뭔가 아쉬움이 있던 차에 stable diffusion을 만나게 되었습니다. chatGPT에 비해서 자연어 소화능력은 떨어지지만.. 그림 하나는 제대로 처리해주더군요. 그래서 이제부터 나오는 그림은 모두 stable diffusion에서 얻은 것입니다.
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_default.png)
흠.. 저는 도서관에 있는 노란 머리의 소녀를 그려달라고 한 것 같은데 말이죠.. 위에서 ‘그림 하나는 제대로 처리해주는데요’라는 말이 무색하지 않나 싶지만,
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_replicantV30.png)
짠~ 이런 그림도 그릴 수 있습니다. 노란 머리를 한 도서관에 있는 소녀.. 이건 약간 만화풍으로 그린 것이고
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/240604_realPonycuteJP.png)
이런 그림도 가능합니다. 샛노란 머리는 아니고 갈색 정도 되는군요.
![](https://gem486h.pe.kr/wp-content/uploads/2024/06/moneyshot_10.png)
ㅎㅎ 노란머리를 한 도서관에 있는 소녀..이긴 합니다.
이 stable diffusion이라는 게 정말 멋진 게.. 비슷한 조건설정으로 위의 4가지 예제처럼 전혀 다른 느낌이 가능합니다. (물론 chatGPT도 명령 잘 내리면 어느 정도 가능합니다.) 그런데 이건 정말 신세계더군요. 어떤 것을 학습(training)시키느냐에 따라 결과물이 그에 맞춰서 나오는데.. 그 학습이란 것을 제가 원하는 대로 시킬 수 있는 방법을 최근 알게 되었습니다. 알면 알수록 수치보정 프로그래밍의 영역이고- 대상이 그림이 아니라도 상관없는 메커니즘이란 생각이 들어서 소름이 끼치더군요.
더 중요한 건, 인터넷에 보면 예쁜 그림들을 이미 학습한 파일을 찾을 수 있습니다. stable diffusion에서는 check-point model 이라고 하는데 저 위의 그림들은 마음에 드는 화풍을 인터넷에서 받아서 그린 것이죠. model 파일 받아서 그림을 그리는 방법을 알게 된 건 5월 초인데, 그림 그릴 때의 키워드를 예쁘게 정돈하는 법이랑 학습시키는 방법을 최근 익혔습니다. 이제야 서로 다른 model로도 비슷한 주제의, 제가 원하는 주제의 그림을 그릴 수 있게 되었으니 100% 활용한다는 느낌입니다.
그리고 stable diffusion은 PC에 설치하는 ‘프로그램’이라서 그런지 자유도가 높고 폭력적인 쪽, 선정적인 쪽 모두에서 성인물이 가능합니다! 유○브에서 볼 수 있는 많은 AI 그림들이 chatGPT로는 그릴 수 없는 수위이다보니 뭘로 그렸을까 궁금했는데 적어도 일부 채널에서 stable diffusion을 사용했다고 적어놓은 것을 봤습니다. 그리고 제가 직접 nudity 같은 키워드에 대해서 거절없이 잘 그려주는 것을 확인했습니다.
chatGPT는 인터넷에 접속해서 대화하듯 요청하면 그림이 뿅-하고 나오는 느낌이라면 stable diffusion은 자기 컴퓨터에 설치하다보니 python library 중 하나 같은 느낌이고.. 제 컴퓨터에서 돌려보니 왜 AI기술이 전기세를 걱정하나 알겠더군요. 그림 요청하면 컴퓨터 CPU 사용량이 100%로 올라가면서 팬이 웽~~하고 도는데, PC에서도 그림 한 장에 1-20분 이상 걸립니다. 컴퓨터 망가질까 무서워서 많이는 못 그리겠지만 종종 쓸 듯 합니다.
이제부터는 뭔가 글을 쓰면서 그림이 필요하면 AI를 통해서 짠~하고 그림을 그려서 첨부하게 될 듯 합니다. 이거, 세상이 너무나 좋아져서.. 적응이 안 되네요.