본문 바로가기
교육/AI 이미지

미드저니 AI 이미지 만들어서 목소리를 입혀봤습니다~

by 매일매일 여러가지 이유로 좋은 날 2023. 6. 25.
반응형

시험도 다 끝났겠다~ 꼭 만들어보고 싶었던 AI 이미지 생성에 대해 본격적으로 알아보기 시작했습니다. 여러모로 서치를 해봤더니 파이썬을 이용해서 복잡한 코딩언어를 직접 사용해야 하는 것도 있었지만(결과물의 퀄리티는 월등함)  노트북 사양에서는 webui(?) 사용이 불가능한 걸로 나와서 미드저니로 간단하게 만드는 방법을 택했습니다.
 
 
 
미드저니는 안타깝게도 현재는 무료로 이미지 생성이 불가능합니다. 그래서 공부할 겸 우선 한 달만 10달러를 주고 사용해 보려고 결제를 했습니다. 참고로 1년치로 끊으면 한 달에 8달러로 가능해요. 
 
 
 
사용 방법은 너무나 간단합니다. CHAT GPT에 넣을 필요도 없습니다. 그냥 구글 번역기에 한글로 최대한 자세하게 원하는 이미지에 대해 묘사를 해줍니다.
 
 
 
그리고 미드저니 입력창에 /imagine prompt를 선택해서 복붙하면 짜라란~

 
이렇게 4개의 샘플 이미지를 생성해 줍니다. 여기서 만약 상단 왼쪽의 첫번째 이미지 1개를 세심하게 만들고 싶으면  U1을 선택합니다. 혹은 3번째 이미지를 좀 더 다른 방식으로 렌더링하길 원하면 V1을 선택하면 됩니다.
 
 

저는 첫번째 이미지를 세심하게 그리고 전신이 보이게 줌 아웃을 두 번 실행해봤습니다. 그렇게 나온 결과물은 아래와 같아요~
 
 
 
 

 
 
 
그 다음 텍스트를 치는대로 음성을 뽑아주는 일레븐랩스 사이트에서 영어로 "I love you."를 타이핑하고 원하는 샘플 목소리를 선택했습니다. 처음엔 스파이 패밀리 아냐의 일본 성우 목소리를 음원 추출하려고 했지만 역시나 저작권 쫄보라서 그냥 일레븐랩스에서 제공하는 목소리 중 하나로 선택했어요...

ElevenLabs_2023-06-25T06_49_58.000Z_Myriam - Teen Girl_0IpIbUhAywnOrLnENDfR
0.01MB

 
 
 
그 다음 스튜디오 D-ID로 가서 음원파일과 사진 파일을 올려준 뒤 합성하는 과정을 거칩니다~
 
 
https://studio.d-id.com/ 

D-ID Studio

Create professional videos using just a still image with text or audio powered by AI.

studio.d-id.com

 
아래는 원본 사진이고요~

 
 
GIF 이미지~

 
 
 
 

 
아~ 재밌습니다~ 살짝 아쉬운 점은 원래는 웃고 있는 이미지가 입을 다문 채로 시작하고 끝나서 초큼 덜 밝아 보인다는 것이어요.
 
 
 
그치만 역시나 저는 뭔가 새로운 걸 배우고 만들기를 해야 즐거워지는 타입이라서 넘나 즐겁네요~ 뭐 사실 AI가 다 해줬지만 사용방법을 알게 된 것만해도 넘나 즐겁습니다. 발렌시아가 해리포터처럼 이미지가 눈을 깜빡이려면 좀 더 말이 길어져야 하는지 테스트 해보고 또 올리도록 하겠습니다~
 
 
 
 
아 그리고 혹시나 해서 말하는데 미드저니는 돈을 내고 생성된 AI 이미지는 만든 사람에게 저작귄을 준다고 해요. 참고하세요~
 
 

반응형

댓글