MTN NEWS
 

최신뉴스

GIST, 컬러 사진·영상 전문가 수준 흑백 보정하는 AI 기술 개발

AI대학원 전해곤 교수팀, 전문가 수준 흑백 사진·영상 누구나 생성 가능
세계 최고 비전 학회 'CVPR'에서 6월 발표
김준원 기자

왼쪽부터 전해곤 교수, 신지수 석박통합과정생, 신승현 석박통합과정생. (사진=GIST)


광주과학기술원(GIST)은 AI대학원 전해곤 교수 연구팀이 인공지능 기술을 활용해 흑백 사진작가들의 포트폴리오로부터 흑백 사진의 보정 기법을 모사하는 알고리즘을 개발했다고 15일 밝혔다.

흑백 사진이 색으로부터 벗어나 질감, 선, 패턴, 대비 등에 초점을 맞춰 사진을 표현할 수 있는 특징을 살려 최근 SNS에서 심미적 효과를 연출하는 데 널리 활용되면서 흑백 사진이 새롭게 주목받고 있다.

그동안 심미적 목적의 흑백 사진을 얻기 위해서는 일반적인 컬러 사진보다 더 많은 시간과 비용이 들어 실용성 측면에서 아쉬운 점이 있었다. 이점에 착안해 연구팀은 컬러 사진으로부터 전문 사진사의 미학적 요소를 매우 정밀하게 재현하는 흑백 사진 생성 알고리즘을 개발했다.

연구팀은 학습 데이터를 구축하기 위해 3명의 국내 전문 사진작가를 섭외해 그들 고유의 스타일로 컬러 사진을 흑백으로 변환하는 작업을 의뢰하여 작가 특유의 개성이 담긴 흑백 사진 데이터셋(작가별 5000장, 총 1만5000장)을 구축했다.

연구팀은 이를 바탕으로 사진 데이터셋을 각각 어느 사진작가가 보정했는지와 작가별 사진 중에서도 대상 피사체가 무엇인지에 따른 계층화 분류 작업을 추가로 수행했다.

이후 연구팀은 딥매트릭러닝(Deep Metric Learning) 기반의 인공신경망을 적용하여 심미적으로 뛰어난 흑백 사진을 생성했다. 알고리즘은 사진작가의 포트폴리오로부터 작가 고유의 스타일 특징을 추출하는 ‘제1신경망’과 실제 전문가의 보정 방법에 매우 근접한 수준의 리터칭(retouching)을 미학적 요소로 재현하는 ‘제2신경망’으로 구성된다.

‘제1신경망’은 각 계층을 대표하는 벡터인 프록시를 생성한다. 연구팀은 피사체별 세부 군집을 형성하는 프록시를 학습하도록 했다. 학습된 ‘제1신경망’은 사진작가 고유의 스타일 차이를 계층적 구조로 분류하고, 세부 군집은 피사체별 보정 스타일을 반영하는 벡터로서 활용하도록 알고리즘을 설계했다.

다음으로 이전 과정에서 정의된 프록시가 입력 영상과 함께 ‘제2 신경망’에 제공되었을 때 각 프록시가 내포하고 있는 스타일에 맞는 흑백 영상을 추출했다. 이때 사진 보정이 사진 전체에 동일하게 적용되는 것뿐만 아니라 각 영역별로도 다르게 진행되는 문제를 해결하기 위해 사진을 의미론적 부분으로 나누어 영역별 보정이 가능하도록 제2신경망을 설계했다.

이렇게 학습된 알고리즘은 사용자가 개인적으로 선호하는 사진들에 맞춰 ‘제1신경망’을 미세조정 할 수 있다. 즉, 제안한 데이터셋으로 학습한 네트워크의 파라미터를 기반으로 새로운 사진작가의 스타일을 모사하는 것이 가능하다.

연구팀이 개발한 알고리즘을 통해 얻은 흑백 사진과 갤럭시/아이폰/인스타그램 필터들과 일반인 선호도를 조사한 결과, 대부분의 사람들이 연구팀에서 제안한 알고리즘의 결과를 선호하는 것으로 확인됐다.

나아가 영화 ‘기생충’과 ‘매드맥스’를 대상으로 △두 영화의 원본 흑백판과 △연구팀의 알고리즘으로 두 영화의 컬러판을 재생성한 흑백 영상에 대한 선호도를 비교한 결과, 마찬가지로 연구팀이 개발한 알고리즘에 따른 결과물의 선호도가 압도적으로 높게 나왔다.

전해곤 교수는 “이번 연구 성과를 통해 기존 사진에 대한 높은 배경지식과 고가의 카메라를 사용해야 얻을 수 있던 미학적으로 가치가 높은 흑백 사진을 우리 알고리즘을 통해 일반인도 쉽게 얻는 것이 가능해졌다”며 “향후 사진 보정 어플리케이션 및 미디어 산업계의 영상 후처리 과정 등에서 활용될 것으로 기대된다”고 말했다.

이번 연구는 과학기술정보통신부의 ‘AI혁신 허브’과제 및 ‘지역의 미래를 여는 과학기술 프로젝트’사업과 과학기술정보통신부(연구개발특구)와 광주광역시의 지원으로 GIST가 주관하는 ‘인공지능 기반 메타버스 구현을 위한 융·복합 문화 가상 스튜디오’ 과제의 지원을 받았으며, 컴퓨터 비전 분야 세계 최고 학회인 ‘CVPR(Computer Vision and Pattern Recognition)’에서 2024년 6월19일 발표될 예정이다.


김준원 MTN 머니투데이방송 기자

머니투데이방송의 기사에 대해 반론·정정추후 보도를 청구하실 분은 아래의 연락처로 연락주시길 바랍니다.

고충처리인 : 콘텐츠총괄부장 ombudsman@mtn.co.kr 02)2077-6288

MTN 기자실

경제전문 기자들의 취재파일
전체보기

    Pick 튜브

    기사보다 더 깊은 이야기
    전체보기

    엔터코노미

    more

      많이본뉴스