닫기 공유하기

'AI 슈퍼맨' 키우는 '데이터댐' 척척…LG·퀄컴도 반했다

토종 스타트업 슈퍼브에이아이, 데이터 라벨링 기술 두각
정확도 99.3%로 비정형 데이터 '라벨링' 시간 10배 단축

[편집자주]

김현수 슈퍼브에이아이 대표(왼쪽)가 장석영 과기정통부 차관으로부터 장관표창을 받는 모습.(정보통신산업진흥원 제공)© 뉴스1
김현수 슈퍼브에이아이 대표(왼쪽)가 장석영 과기정통부 차관으로부터 장관표창을 받는 모습.(정보통신산업진흥원 제공)© 뉴스1

"디지털뉴딜의 핵심은 데이터댐입니다. 인공지능(AI)을 학습시킬 데이터를 모으고, 가공해 구축하면 질 좋은 일자리를 당장 확보할 수 있고 우리나라의 미래 먹거리, 4차산업혁명의 핵심인 AI 산업의 토대를 닦을 수 있습니다."

지난 6월18일 춘천으로 간 문재인 대통령은 디지털뉴딜 핵심 사업을 발표하면서 직접 AI 오토라벨링을 시연했다. 환갑이 넘은, 비전문가 문 대통령이 그 자리에서 간단한 숙지 만으로도 할 수 있을만큼 쉽고 간편하게 구성된 오토라벨링 기술은 설립된지 불과 2년밖에 안된 토종 신생벤처기업(스타트업) 슈퍼브에이아이의 솔루션이었다. 

이날 김현수 슈퍼브에이아이 대표는 자율주행 자동차 등의 서비스 개발 시 필요한 인공지능 데이터 라벨링을 자동으로 진행하는 모습을 공개했다. 김 대표는 인공지능이 사람과 도로, 차량 등을 이미지 상에서 구별할 수 있도록 사람 및 차량 여부, 사람 위치, 차량 종류와 상태 등 특징을 표현하는 데이터 라벨링 작업을 선보였다.

◇'슈퍼맨 AI' 개발 위한 '데이터댐', 토종 기술로 만든다 

인공지능(AI) 기술은 현대 사회와 미래 산업에서 '만능키'처럼 여겨진다. 풀기 힘든 난제나 현존 기술로 해결하기 어려운 복잡한 계산도 AI를 적용하면 모두 해결할 수 있을 것만 같은 '슈퍼맨' 같은 존재로도 여겨진다.

AI 전문가들은 이같은 AI 기술개발의 3요소로 '하드웨어, 알고리즘, 데이터'를 꼽는다.

하드웨어는 고성능 GPU를 구입하거나 클라우드를 사용할 수도 있고, 처리 속도를 높여주는 전용 칩을 각종 제조사에서 구입해서 효율을 높일 수도 있다. 알고리즘에 대한 연구도 단계적으로 진행되고 있으며, 우수한 성능을 보이는 알고리즘을 조금씩 변형해 상용화된 서비스를 개발할 수도 있다. 

문제는 데이터다. 하드웨어나 알고리즘은 범용으로 개발, 적용할 수 있지만 이를 현장에 적용하려면 개발 시나리오에 딱 맞는 데이터를 매번 새로 구축해야 한다. 즉 각자의 입맛에 맞는 좋은 성능의 인공지능을 개발하기 위해서는, 해결하고자 하는 문제와 관련한 요소를 골고루 갖춘 고품질의 충분한 데이터가 구축되는 것이 필수다.

하지만 현재 라벨링 등의 데이터 전처리는 비효율적인 수작업으로 진행되고 있고 데이터를 관리 및 분석하는 마땅한 도구가 존재하지 않아 AI 개발자들의 효율성을 저하시키고 있다.

이에 과학기술정보통신부는 정보통신산업진흥원(NIPA), 한국지능정보사회진흥원(NIA)과 함께 디지털뉴딜에 따른 '데이터댐' 구축 사업을 올 하반기부터 적극적으로 진행하고 있다. 

사람이 새로운 것을 배우려면 지식이 잘 정리된 책을 읽고 공부를 해야 하듯, AI도 학습용 데이터 세트를 통해 새로운 것을 배워야 이에 근거한 지능적인 추론을 할 수 있다.

특히 AI가 학습해야 하는 데이터들은 텍스트 뿐만 아니라 정제되지 않은 수많은 종류의 데이터(비정형데이터)가 존재하는데 이는 사진, 동영상, 음성 메모 등 다양한 형태로 존재한다.

이에 따라 데이터를 AI가 학습할 수 있도록 만들어주는 과정을 라벨링(labeling)이라고 한다.

과기정통부는 "상황에 맞지 않는 데이터 세트나 양과 깊이가 부족한 데이터 세트로 학습한 AI는 우수한 성능을 낼 수가 없기 때문에 정부는 디지털뉴딜을 통해 AI 학습용 라벨링 작업을 대폭 확대하고 우수 기술을 선정해 시상함으로써 관련 산업 진흥을 동시에 도모하고 있다"고 강조했다. 

슈퍼브에이아이의 오토라벨링 솔루션 시연모습(슈퍼브에이아이 제공)© 뉴스1
슈퍼브에이아이의 오토라벨링 솔루션 시연모습(슈퍼브에이아이 제공)© 뉴스1

◇정확도 99.3%로 비정형 데이터 '라벨링' 시간 10배 단축

이같은 데이터라벨링 기술에 탁월한 성과를 보여 장관 표창을 받은 곳이 바로 토종 스타트업 슈퍼브에이아이다.

슈퍼브에이아이는 지난 2018년 4월, 5명의 공동창업자들에 의해 설립됐다. 설립 한달 만에 특허를 출원하고, 5개월 만에 제품을 출시해 기업고객을 유치하는 성과를 거뒀다. 1년 만에 손익 분기를 달성하는 등 빠른 속도로 성장하고 있다. 

슈퍼브에이아이가 보유한 오토라벨링(데이터 자동분석 및 구축기술)은 세계 최고 수준으로 평가받으며 국내 시장은 물론 세계 최고 AI 강국 미국에서도 '러브콜'을 받는 상황이다. 현재 LG전자와 글로벌 기업 퀄컴 등이 슈퍼브에이아이의 고객사다. 

슈퍼브에이아이의 기술은 데이터를 수집, 가공, 분석, 관리하는 모든 단계의 올인원(All-in-One) 플랫폼을 제공한다는 점에서 높은 평가를 받고 있다. 이전까지는 이런 올인원 솔루션이 없었기 때문이다. 

AI 개발기업은 데이터를 라벨링하는 작업 그 자체에만 집중하고 있는 실정이고, 데이터 라벨링을 전문적으로 하는 기업들은 자체 작업을 위해 개발한 라벨링 도구만 있지 라벨링된 데이터를 실제로 활용해야 하는 엔지니어들의 생산성 향상까지 도모하지 못했다.

물론 데이터의 품질을 향상시키며 규모 있는 데이터 작업을 하는 것에도 한계가 있었다.

슈퍼브에이아이는 이러한 AI 업계의 고질적인 난제인 데이터 문제를 해결해, 인공지능 개발 장벽을 낮춰 누구나 손쉽게 인공지능을 개발할 수 있도록 돕는다. 현재 머신러닝 데이터를 구축, 관리, 분석하는 플랫폼이자 생산성 도구인 슈퍼브에이아이 스위트(Superb AI Suite)를 개발해 제공하고 있다. 국내에서는 1건의 특허를, 미국에서는 5건의 특허를 보유하고 있기도 하다. 

이같은 기술을 토대로 현재까지 약 5000만개 이상의 라벨데이터를 구축하고 있으며 500만건 이상의 데이터 누적처리를 진행하는 등 AI 기술의 기반인 오토라벨링을 위한 데이터 구축을 확대하는 중이다. 

지난 2019년에는 NIA 데이터 구축 과제로 수행한 '한글 이미지 데이터' 구축 과제를 통해 현대 한글 1만1172자에 대해 손글씨 370만자, 인쇄체 280만자 등의 데이터를 구축했으며 이 과정에서 99.3%의 높은 품질정확도를 기록했다. 
로딩 아이콘