Stable Diffusion AI그림을 뽑는 방식
페이지 정보
본문
아마 다들 스테이블 디퓨전이나 미드저니 니지저니 이런것들은 많이 들어봤을거임. 그런데 얘네들이 작동방식이 다름. 그래서 첫 튜토리얼에서는 AI그림 뽑는 방식에 대해서 짧게 이야기 할거임. 깊게는 이야기 안함. 왜냐면 나도 깊게는 모름
현재 나와있는 방식들 중 대표적인 것은 Diffusion방식과 GAN방식임. diffusion방식은 뭔가 이름만 봐도 스테이블 디퓨전과 연관 있을 것 같지 않음? 맞음. 스테이블 디퓨전 모델은 diffusion방식으로 그림을 뽑아냄. 그리고 SD는 오픈소스라서 제약이 없고 무료임!!! 그래서 한국의 커뮤니티 플랫폼에서도 SD소스 넣어서 그림출력 서비스를 하고 있음. 물론 커뮤니티 운영자가 소스에 제약 걸어서 서비스하는 것도 가능함.
GAN방식을 사용하는 곳은 미드저니, dall-e2 모델등이 있음. GAN방식은 소스가 풀리지 않았고 회사에서 컨트롤하기 때문에 제약이 발생할 수 있음. 요즘 미드저니에 다양한 금지 프롬프트가 생기는 것이 이 때문임
Diffusion방식은 먼저 노이즈를 왕창 끼얹은 다음 학습된 방식으로 노이즈를 점차 제거해나가면서 최종 결과물을 산출해내는 것임. 그리고 GAN방식은 위조지폐 찾기라는 방식으로 이뤄지는데, 좀만 간단히 풀어서 설명해보겠음. GAN방식은 어떤 결과를 내놓으면 그 결과물이 왜 위조인지 코멘트를 달아서 돌려보냄. 그럼 해당 코멘트를 수용해서 다시 위조 결과를 만들어냄. 이 단계를 계속 거쳐가면서 완벽에 가까운 위조결과물을 만들어내는 것임.
참고로 AI그림 회사와 모델명을 적어두겠음.
Stability AI : stable diffusion
Midjourney : Midjourney, nijijourney
Open AI : Dall-e2
Google : Imagen
댓글목록
등록된 댓글이 없습니다.