슈퍼브에이아이가 인공지능(AI) 도입 비용과 시간을 대폭 줄인 산업용 비전 파운데이션(VFM) 모델을 통해 전 산업의 디지털 전환 가속화에 나선다. 기술 부담 없이 누구나 AI를 쓸 수 있도록 만들겠다는 전략이다.
슈퍼브에이아이는 24일 서울 콘래드호텔에서 기자간담회를 열고 산업 특화형 비전 파운데이션 모델 '제로(ZERO)'를 공개했다. 이날 행사에는 김현수 최고경영자(CEO)를 비롯해 차문수 최고기술책임자(CTO), 김진회 최고사업책임자(CBO)가 참석해 슈퍼브에이아이의 기술 전략과 시장 계획을 상세히 밝혔다.
김현수 CEO는 "AI 도입 비용을 완전히 '0'으로 만들겠다"는 선언과 함께 슈퍼브에이아이가 개발한 '제로'를 소개했다. 회사에 따르면 '제로'는 학습 데이터 없이도 즉시 활용 가능한 영상 AI 모델로, 기존 AI 개발에 요구되던 데이터 구축과 모델 학습 과정 자체를 생략할 수 있는 것이 핵심이다. 영상 속 객체 탐지, 추적, 질의응답까지 다양한 작업을 단일 모델로 처리할 수 있어 산업 적용성도 강조됐다.
김현수 CEO (사진=슈퍼에이아이)
산업용 범용 기반 모델 '제로'…AI 도입 병목 해소한다
이날 행사를 시작하며 김 CEO는 슈퍼브에이아이가 AI 도입에 있어 ▲전문 인력 부족 ▲데이터 부족 ▲기술 인프라 부재라는 세 가지 병목을 확인했다고 설명했다. 이를 해결하기 위해 이미 개발한 것이 머신러닝 기반의 'MLOps 플랫폼'과 '버티컬 솔루션'이다. 데이터 라벨링 자동화와 AI 개발 전 과정을 하나의 플랫폼에서 처리할 수 있는 이 플랫폼은 AI 개발 기간을 6개월에서 2주로 줄이는 데 성공했다.
'버티컬 솔루션'은 개발 역량이 부족한 산업 현장에서 AI를 즉시 활용할 수 있도록 만든 제품군이다. CCTV 기반 화재 감지, 안전 모니터링 솔루션은 실제로 발전소, 공항, 지자체 등에서 쓰이고 있다.
김 대표는 "이제는 더 높은 목표를 설정할 시점"이라며 "이에 '제로' 모델을 개발할 필요성을 느꼈다"고 강조했다.
슈퍼브에이아이에 따르면 '제로'는 마치 '챗GPT'처럼 프롬프트 입력만으로 다양한 작업을 실행하는 멀티모달 인터페이스를 갖췄다. 예시 이미지 하나로 생산 현장의 결함 탐지나 수량 계산이 가능하고 프롬프트를 통해 다양한 산업 과업을 정의할 수 있다. 기존 AI의 한계였던 '사전 정의된 카테고리만 인식 가능' 문제도 해결한다는 설명이다.
김현수 CEO (사진=슈퍼에이아이)
김 대표는 제로가 지닌 '제로샷' 능력을 핵심 경쟁력으로 꼽았다. 학습 없이도 기존 지식만으로 새로운 상황을 추론할 수 있는 점은 제조업 기반이 강한 한국이 비전 AI 분야에서 세계 시장을 주도할 수 있는 전략적 교두보가 될 수 있다는 의미이기도 하다.
산업용 비전 데이터는 대부분 기업 내부에 있고 공개되지 않는다. 텍스트 기반의 언어 모델과 달리 접근이 어렵다.
김 대표는 "바로 이 점이 우리가 경쟁력을 가질 수 있는 이유"라며 "한국의 제조·조선·방산 같은 고도화된 산업 인프라 위에서 비전 파운데이션 모델은 세계 1등을 노릴 수 있다"고 말했다.
김 대표는 "AI의 3대 축으로 거대언어모델(LLM), 비전 파운데이션 모델(VFM), 피지컬 AI(로보틱스 등)가 제시된다"며 "이 가운데 비전 AI가 산업 현장의 눈이 될 것"이라고 말했다. 이어 "산업용 비전 AI가 한국의 국가 경쟁력에 기여하도록 '제로'를 통해 AI 민주화와 함께 산업 혁신의 속도를 끌어올리겠다"고 밝혔다.
구글·MS·중국 모델 제쳤다…국산 비전 '제로'로 CVPR 2위
이어 차문수 CTO는 '제로'의 기술적 배경과 성능 성과를 설명했다. 그는 기존 비전 AI의 구조적 한계부터 짚으며 제로가 어떤 기술 혁신을 통해 이를 극복했는지를 순차적으로 소개했다.
차 CTO는 기존 비전 AI가 ▲새 객체 인식 불가 ▲환경 변화에 취약 ▲작업마다 별도 모델이 필요한 복잡성 등 세 가지 태생적 한계를 안고 있다고 설명했다. 산업 현장에서는 이 같은 제약이 반복적인 데이터 수집과 학습 비용으로 이어졌고 AI 도입 자체를 가로막아 왔다고 진단했다.
그는 슈퍼브에이아이가 이 같은 구조적 병목을 해결하기 위해 '제로'를 설계했다고 밝혔다. 제로가 가진 '제로샷'이란 대규모 언어 데이터와 이미지 데이터를 함께 학습해 학습되지 않은 객체도 추론 가능한 능력이다.
더불어 정해진 분류 없이도 작동하는 '오픈월드' 구조로 설계됐다. 이미지나 텍스트 등 다양한 형태의 프롬프트를 지원하는 멀티모달 인터페이스와 수십 개의 태스크를 하나의 모델로 처리할 수 있는 멀티태스크 구조를 채택했다.
차문수 CTO (사진=슈퍼브에이아이)
무엇보다도 산업현장에서 필요로 하는 문제를 곧바로 다룰 수 있도록 퍼블릭 웹 데이터 외에 슈퍼브에이아이 자체 구축 데이터와 국내 AI허브 데이터 등 산업용 특화 데이터를 중심으로 학습시킨 점이 특징이다. 추가 학습 없이 바로 제조, 유통, 건설 등 다양한 분야에서 사용 가능한 형태로 만들었다는 점에서 기술적 실용성이 강조됐다.
'제로'는 벤치마크에서도 뚜렷한 성과를 냈다. 산업용 영상 AI 벤치마크에서 경쟁 모델들을 제치고 1위를 기록했다. 글로벌 비전학회인 국제 컴퓨티 비전 및 패턴 인식 학회(CVPR)의 객체 탐지 및 퓨샷 챌린지에서도 각각 2위, 4위를 기록했다. 중국의 '티렉스-2(T-Rex2)', 마이크로소프트의 '플로센스-2(Florence-2)', 구글 '오더블유엘브이2(OWLv2)' 등과 비교해도 성능 격차를 크게 벌린 것으로 나타났다.
또 차 CTO는 '제로'가 적은 리소스로 고성능을 구현한 점을 강조했다. 'A100' 그래픽 처리장치(GPU) 8장만으로 학습했으며 수집한 1억 장 규모의 데이터에서 약 90만 장만을 선별 학습에 사용했다. 이를 가능하게 한 것은 슈퍼브가 보유한 MLOps 플랫폼의 데이터 선별 기술이었다는 설명이다.
모델 경량화도 특징이다. 10억 파라미터 미만으로 설계돼 연산량이 작아 엣지 디바이스나 클라우드 등 다양한 환경에서 가볍게 배포 가능하다. 응용 프로그램 인터페이스(API) 호출 방식뿐 아니라 엣지AI 형태로도 쉽게 연동 가능하며 실제 산업 환경에서의 AI 도입을 빠르고 간편하게 만든다는 것이 슈퍼브에이아이의 설명이다.
차 CTO는 "'제로'는 단일 모델에 그치지 않는다"며 "하드웨어-플랫폼-모델-버티컬 솔루션을 포괄하는 '제로 스택'으로 풀스택 생태계를 구성하겠다"고 밝혔다.
'제로'로 200조 시장 노린다…"지능형 비전, 모든 산업의 표준 될 것"
이어 김진회 CBO는 '제로'가 실제 비즈니스 현장에 어떻게 가치를 창출하는지 설명하며 기술 중심 전략에서 '고객 중심 전환'으로의 구체적 비전을 제시했다. 그는 '제로'의 활용이 단순한 AI 도입을 넘어 산업 전체의 운영 구조를 바꾸는 촉매가 될 수 있다고 강조했다.
김 CBO는 "AI가 중요한 게 아니라 여러분의 자연지능이 중요하다"며 기존 AI 도입 방식의 비효율성과 제로의 실용적 전환 능력을 대비해 설명했다. 학습 없이도 객체 탐지, 결함 검출, 수량 카운팅이 가능한 '제로샷'의 현장 데모를 통해 복잡한 모델 설계와 라벨링 없이도 AI 도입이 가능함을 시연했다.
데모에서는 리테일 환경에서는 변화가 잦은 제품군을 사전 학습 없이도 인식하고 분류할 수 있는 능력도 선보였다. 영상 속 인물의 행동을 추론하고 사고 현장을 이해해 답변을 제공하는 지능형 에이전트 형태로 확장된 기능도 함께 시연됐다.
김 CBO는 '제로'가 기존 AI 도입에서 필연적으로 요구되던 '문제 정의→데이터 수집→라벨링→모델 학습→배포'의 전 과정을 무력화했다고 밝혔다.
김진회 CBO (사진=슈퍼브에이아이)
그는 "이제는 아이디어만 있으면 AI를 바로 쓸 수 있게 된다"며 "기술검증(PoC)에 수천만 원을 쓰지 않아도 된고 전문가를 고용하는데 소요되는 시간도 필요 없게 하는 것이 우리의 궁극적 목적이었다"고 말했다.
시장 확장 전략으로는 '플랫폼 중심 생태계 공급' 구조를 제시했다. 아마존웹서비스(AWS) 같은 글로벌 플랫폼에서 손쉽게 제로를 호출할 수 있는 구조를 갖춰 사용자가 가장 익숙하고 신뢰하는 환경에서 AI를 접할 수 있도록 하겠다는 것이다. 실제로 제로는 이날 오후부터 AWS를 통해 공개될 예정이다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28