최근 AI 분야에서는 디퓨전 기반 생성형 모델이 주목받고 있습니다. 디퓨전 모델은 이미지를 포함한 다양한 데이터를 생성하는 데 활용되며, ChatGPT 같은 생성형 AI도 이 원리를 따릅니다.
문제점 – 높은 비용과 긴 학습 시간
디퓨전 모델을 학습하려면 막대한 자원이 필요합니다. 예를 들어, OpenAI의 CLIP 모델은 256개의 V100 GPU로 12일이 걸릴 정도로 연산 비용이 큽니다.
해결책 – Distillation을 활용한 최적화
*Distillation(지식 증류)**은 크고 무거운 AI 모델(teacher)의 지식을 유지하면서도 가볍고 빠른 student 모델을 학습시키는 기법입니다.
ADD 모델의 차별점
이 논문에서는 Distillation 기법과 GAN 학습 방식을 결합해 디퓨전 모델의 추론 속도를 대폭 개선했습니다.
진짜/가짜 판별 정보 활용 → student 모델이 점점 더 실제와 유사한 이미지를 생성
teacher 모델과의 차이값 학습 → student 모델이 teacher의 결과물과 가까워지도록 최적화
이 방식 덕분에 ADD 모델은 기존 모델보다 적은 연산(step)으로 아래와 같이 더 높은 성능을 달성했습니다.
📢 AI 기술에 대해 궁금한 점이 있으신 분들은 플랫폼실 AI팀으로 문의주시면
언제든 상담이 가능합니다. 💡
네이버, 버추얼 스튜디오 '모션스테이지' 오픈 🎥
네이버는 11일 스트리밍 서비스 치지직의 버추얼 스튜디오 '모션스테이지'를 정식 공개하고 활용을 희망하는 스트리머들의 신청을 접수한다고 밝혔습니다. 3D 애니메이션, 영화 등 제작에 활용 가능한 수준의 HDR 비디오, 이머시브 오디오(Immersive Audio) 등 네이버 미디어 기술력이 집약됐다고 하는데요. 특히 전문 슈트를 착용한 후 전신의 움직임까지 3D화 할 수 있는 수준의 모션캡처(동작분석) 기술력 활용이 가능해 다양한 콘텐츠 제작이 가능하다는 설명입니다. [더보기]
메타, AI·로봇공학 연구용 스마트 글래스 '아리아 젠2' 공개 👓
메타가 인공지능(AI), 로봇 공학 및 기계 인식 연구를 위한 최신 실험용 스마트 글래스 '아리아 젠2'(Aria Gen 2)을 발표했습니다. 아리아 젠2는 메타가 지난 2020년 발표한 1세대 아리아보다 개선된 기능을 갖추고 있는데요. 아리아 젠2는 업그레이드된 센서, 심박수 측정 기능, 복잡한 계산을 수행할 수 있는 메타의 맞춤형 컴퓨터 칩이 탑재됐다고 합니다. 메타는 앞으로 몇 달 내로 학술 및 상업 연구실에 이 안경을 제공할 계획이며, 초기 테스트 기관 중 하나인 이미진 솔루션 스타트업 앤비젼(Envision) 시각 장애인과 청각 장애인을 위한 솔루션을 개발하기 위해 아리아 젠2를 시범 운영 중이라고 밝혔습니다. [더보기]
"AI가 95% 완성"… 소형 제작사도 쉽게 애니 만든다 🎡
일본 애니메이션 제작사 카카 크리에이션과 프런티어 웍스가 함께 제작하는 ‘트윈스 히나히마’가 이달 29일부터 일본 지상파 방송사 MBS에서 방영됩니다. 트윈스 히나히마는 제작의 95%를 생성형 AI(인공지능)로 만들었습니다. 생성형 AI로 만든 애니메이션이 일본 지상파에서 방영되는 것은 처음인데요. 배경과 구도 등을 담은 간단한 콘티를 입력하면, AI가 선(線) 정리부터 채색은 물론 눈과 입 등 인물의 간단한 움직임까지 자동으로 구현합니다. 이 밖에도 사람의 손동작을 영상으로 찍으면 AI가 이를 2D 캐릭터 움직임으로 변환하고, 실사 사진을 배경에 넣기만 해도 AI가 알아서 캐릭터와 어울리는 그림체로 바꿔주는 식으로 제작 과정을 단순화했습니다. 업계 관계자는 “기획과 연출을 제외한 제작에 드는 비용과 시간만 따졌을 때, AI로 60~70% 정도는 줄일 수 있었을 것”이라고 말했습니다. [더보기]
"30년 전 필름을 AI로 복원"…'원본 없는 영화' 🎞
촬영 원본이 유실된 영화가 인공지능을 통해 되살아나면서 28년 만에 대중에게 공개됐습니다. 성균관대는 연기예술학과 윤용아 교수의 독립 장편영화 'In The Land Of the Blind'가 미국에서 개봉하며 화제를 모으고 있다고 밝혔습니다. 촬영 원본인 네거티브 필름과 사운드트랙 원본이 모두 유실된 상황에서도 윤 교수는 상영이 가능한 수준으로 남은 자료를 영화화했는데요. 윤용아 교수는 "30년 전 필름이고 남은 건 화질이 형편없는 DVD 몇 장뿐이었다"며 "AI 기술 덕분에 복원에 성공하긴 했지만 결국 영화가 만들어지는 데는 사람의 열정과 끈기가 가장 큰 것 같다"고 전했습니다. [더보기]