MTN NEWS
 

최신뉴스

데이터 활용도 높이는 ‘비식별화·라벨링’ 시장 커진다

한국인터넷기업협회 굿인터넷클럽 개최…‘데이터가 만드는 산업’ 논의
김태환 기자

클라우드 서비스가 구동되는 데이터 센터 내부 모습(출처=뉴스1)

인공지능(AI) 적용이 확산됨에 따라 AI가 해석하고 적용할 수 있도록 데이터를 정제하는 ‘데이터 라벨링’ 시장이 확산될 것으로 전망된다. 특히 의료, 법률과 같은 전문 분야에 데이터에 대한 수요가 높아질 것으로 보인다.

개인정보와 같이 민감한 내용이 포함된 데이터를 외부에서 식별할 수 없도록 만드는 데이터 비식별화에 대한 필요성도 커질 수 있다는 분석도 나온다.

한국인터넷기업협회는 31일 온라인 상에서 정기포럼 ‘굿인터넷클럽’을 개최하고 ‘데이터가 만드는 산업, 데이터로 가능한 것들’이라는 주제로 패널 토의를 진행했다.

토의는 고학수 서울대 교수가 사회를 맡았으며, 김태훈 딥핑소스 대표, 류재준 네이버비즈니스플랫폼 이사, 이정수 플리토 대표가 참석했다.

이정수 플리토 대표는 “과거 학교가 없던 시대에는 아이를 낳으면 부모가 가르쳤지만 학교가 생기면서 외부에서 교육하게 됐다”면서 “마찬가지로 AI도 만든 회사에서 직접 데이터를 수집해 가르쳤지만, 외부에서 데이터를 모아 정제한 것들을 마치 학습지나 교육기관처럼 제공하는 방식으로 변하고 있다”고 설명했다.

이 대표는 “AI 산업이 발전할수록 더 많은 데이터 업체가 생겨나게 될 것”이라며 “지금까지는 일반적인 대화와 같은 범용적인 분야에 많이 기술이 개발됐지만 미래에는 의료나 법률과 같은 특수분야에 대한 수요가 높아지면서, 전문적인 데이터를 정제하는 쪽으로 상당한 발전이 예상된다”고 덧붙였다.

김태훈 딥핑소스 대표는 데이터 비식별화에 대한 전망을 소개했다.

김 대표는 “과거에는 데이터가 거래되는 물건이 아니라 기업이나 단체 소유물로 생각하며 거래대상이 아니라 여겼지만 최근 분위기가 완전히 바뀌었다”면서 “작년부터 데이터가 거래될 수 있다는 인식이 커지면서 데이터에 대한 권리와 보호에 대한 중요성도 함께 커지고 있는 상황”이라고 분석했다.

그는 “최근 비식별화 기술은 데이터를 원본으로 복원해 사용하는 것이 아니라 비식별 처리가 된 데이터 그대로 AI가 사용하는 형태로 제공되고 있으며, 한번 소멸된 개인정보를 다시 복원 못하도록 돼 있다”면서 “데이터를 파편처럼 쪼개서 조각을 모으는 방식으로 개인정보를 노출하지 않으면서 데이터를 라벨링할 수 있는 기술도 제공될 예정”이라고 전망했다.

류재준 네이버비즈니스플랫폼 이사는 데이터 산업에서 클라우드의 중요성을 강조했다. 필요에 따라 용량을 늘리고 줄일수 있어 유연한 대처를 지원할 수 있다는 설명이다.

류 이사는 “기존에는 어떤 사업을 진행한다면 1년 전 예산을 잡고 거기 필요한 인프라 준비, 구축을 쭉 진행하게 되는데, 이 프로세스대로라면 서버 용량을 늘리거나 줄이려면 다시 1년을 기다려야 했다”면서 “탄력적 대응이 굉장히 어려웠지만 클라우드의 경우 트래픽이 유동적이어도 바로 용량을 늘리거나 줄이는 등 실시간으로 대응할 수 있게 된다”고 설명했다.



한편 굿인터넷클럽은 인기협이 전문가들을 초청해 인터넷의 긍정적인 사용에 대해 함께 생각하고 논의하는 행사다. 2014년부터 시작돼 매월 개최되고 있다.



김태환 머니투데이방송 MTN 기자

머니투데이방송의 기사에 대해 반론·정정추후 보도를 청구하실 분은 아래의 연락처로 연락주시길 바랍니다.

고충처리인 : 콘텐츠총괄부장 ombudsman@mtn.co.kr 02)2077-6288

MTN 기자실

경제전문 기자들의 취재파일
전체보기

    Pick 튜브

    기사보다 더 깊은 이야기
    전체보기

    엔터코노미

    more

      많이본뉴스