그림을 몰라도 그림이 나오는 시대

앞으로 이 블로그에 적을 여러가지에 앞서 AI로 그림을 그리는 것에 대한 이야기를 적지 않을 수 없습니다. 이 이야기도 약간 타이밍이 늦었다는 생각이 드는 게, 이 글에 적을 내용 중 8할은 이미 5월 1일 시점에 만들어졌지만- 뭔가 글 하나로는 부족하다는 느낌이었다가 얼마 전에 겨우 채울 수 있었습니다.
저는 인공지능이 사람의 할 일을 대체한다면 글쓰기나 기계적인 연구 같은 것부터 바꿀 줄 알았고 예술은 쉽지 않을 거라고 생각했는데 현실은 그렇지 않았습니다. 회사에서 있었던 일들이라 자세히 적을 수는 없지만.. AI가 글쓰고 연구하는 게 안 되는 건 아닌데 사람의 ‘잔머리'(..)를 따라갈 수가 없다보니 인간의 퀄리티가 안 나오더군요. 오히려 그림이나 음악이 더 직관적인 것이었습니다. 그래서 어느 정도 퀄리티가 나오다보니 요즘 많은 사람들의 관심을 갖는 주제인데.. 저는 올해 초에 Bing image creator로 접해보게 되었습니다.

‘아이디어 탐색’이란 곳의 밑에 있는 예시를 보시다시피 상당히 그럴싸한 그림이 그려진다는 걸 알 수 있었고..

일반인에게도 어느 정도 개방되었다는 걸 알게 된 후 그림을 목적으로 chatGPT도 유료결제하고 써봤습니다. (실제 486세대 컴퓨터는 저 컴퓨터 그림보다는 훨씬 세련된 모습이었습니다. 이런 바보 chatGPT..) 눈치채셨을지 모르겠지만 이 블로그의 favicon도 저때 chatGPT로 그린 것에서 잘라서 만든 것입니다.

그리고 예쁜 거 그려본다면 으레 시도하게 되는 ‘a beautiful woman’.. chatGPT의 그림 수준이 높다보니 짧은 지시문을 바탕으로 해도 이 정도는 됩니다.

그런데 chatGPT에서 쓰는 DALL-E는 조금만 성적인 키워드가 들어가면 경고를 띄우며 거부하고 기능의 제약이 있더군요. 악용될 소지가 있다보니 어쩔 수 없긴 한데 뭔가 아쉬움이 있던 차에 stable diffusion을 만나게 되었습니다. chatGPT에 비해서 자연어 소화능력은 떨어지지만.. 그림 하나는 제대로 처리해주더군요. 그래서 이제부터 나오는 그림은 모두 stable diffusion에서 얻은 것입니다.

흠.. 저는 도서관에 있는 노란 머리의 소녀를 그려달라고 한 것 같은데 말이죠.. 위에서 ‘그림 하나는 제대로 처리해주는데요’라는 말이 무색하지 않나 싶지만,

짠~ 이런 그림도 그릴 수 있습니다. 노란 머리를 한 도서관에 있는 소녀.. 이건 약간 만화풍으로 그린 것이고

이런 그림도 가능합니다. 샛노란 머리는 아니고 갈색 정도 되는군요.

ㅎㅎ 노란머리를 한 도서관에 있는 소녀..이긴 합니다.

이 stable diffusion이라는 게 정말 멋진 게.. 비슷한 조건설정으로 위의 4가지 예제처럼 전혀 다른 느낌이 가능합니다. (물론 chatGPT도 명령 잘 내리면 어느 정도 가능합니다.) 그런데 이건 정말 신세계더군요. 어떤 것을 학습(training)시키느냐에 따라 결과물이 그에 맞춰서 나오는데.. 그 학습이란 것을 제가 원하는 대로 시킬 수 있는 방법을 최근 알게 되었습니다. 알면 알수록 수치보정 프로그래밍의 영역이고- 대상이 그림이 아니라도 상관없는 메커니즘이란 생각이 들어서 소름이 끼치더군요.

더 중요한 건, 인터넷에 보면 예쁜 그림들을 이미 학습한 파일을 찾을 수 있습니다. stable diffusion에서는 check-point model 이라고 하는데 저 위의 그림들은 마음에 드는 화풍을 인터넷에서 받아서 그린 것이죠. model 파일 받아서 그림을 그리는 방법을 알게 된 건 5월 초인데, 그림 그릴 때의 키워드를 예쁘게 정돈하는 법이랑 학습시키는 방법을 최근 익혔습니다. 이제야 서로 다른 model로도 비슷한 주제의, 제가 원하는 주제의 그림을 그릴 수 있게 되었으니 100% 활용한다는 느낌입니다.

그리고 stable diffusion은 PC에 설치하는 ‘프로그램’이라서 그런지 자유도가 높고 폭력적인 쪽, 선정적인 쪽 모두에서 성인물이 가능합니다! 유○브에서 볼 수 있는 많은 AI 그림들이 chatGPT로는 그릴 수 없는 수위이다보니 뭘로 그렸을까 궁금했는데 적어도 일부 채널에서 stable diffusion을 사용했다고 적어놓은 것을 봤습니다. 그리고 제가 직접 nudity 같은 키워드에 대해서 거절없이 잘 그려주는 것을 확인했습니다.

chatGPT는 인터넷에 접속해서 대화하듯 요청하면 그림이 뿅-하고 나오는 느낌이라면 stable diffusion은 자기 컴퓨터에 설치하다보니 python library 중 하나 같은 느낌이고.. 제 컴퓨터에서 돌려보니 왜 AI기술이 전기세를 걱정하나 알겠더군요. 그림 요청하면 컴퓨터 CPU 사용량이 100%로 올라가면서 팬이 웽~~하고 도는데, PC에서도 그림 한 장에 1-20분 이상 걸립니다. 컴퓨터 망가질까 무서워서 많이는 못 그리겠지만 종종 쓸 듯 합니다.

이제부터는 뭔가 글을 쓰면서 그림이 필요하면 AI를 통해서 짠~하고 그림을 그려서 첨부하게 될 듯 합니다. 이거, 세상이 너무나 좋아져서.. 적응이 안 되네요.

그림을 몰라도 그림이 나오는 시대

Comments

Leave a Reply Cancel reply