MS, 청소·요리 가능한 멀티모달 AI 공개…가사 로봇 시대 '성큼'

컴퓨팅입력 :2025-02-24 10:44:13    수정:

마이크로소프트가 청소와 요리 등 현실의 가사 노동까지 수행할 수 있는 로봇을 위한 신형 인공지능(AI) 모델을 공개했다.

24일 마이크로소프트는 신형 멀티모달 AI인 '마그마AI(MagmaAI)'를 깃허브를 통해 선보였다.

마이크로소프트는 마그마AI에 대해 단순히 언어와 이미지를 이해하는 수준을 넘어서 실제 환경을 해석하고, 주어진 목표를 스스로 계획해 실행할 수 있는 첫 번째 AI라고 강조했다.

마이크로소프트에서 공개한 멀티모달AI '마그마AI'(이미지=마이크로소프트)

이용자들은 '마그마AI'를 통해 앞으로 청소나 요리와 같은 일상적인 작업을 수행할 수 있다. 또 인간의 사고방식에 더 가까워지며 현실적인 대화가 가능해질 것으로 보인다.

마그마AI의 핵심은 대규모 언어 모델(LLM)과 비전 모델을 결합한 멀티모달 기술이다. 기존의 AI가 텍스트와 이미지를 각각 이해했다면, 마그마AI는 두 가지 요소를 동시에 분석하며 상호 연관성을 파악해 더 자연스럽고 직관적인 응답을 제공한다.

로봇이 집안 환경을 카메라로 스캔하면 마그마AI가 해당 정보를 분석해 의자와 테이블의 위치를 인식하며 '테이블 위의 접시를 싱크대로 옮겨줘'라는 음성 명령을 이해하고 해당 작업을 수행할 수 있다는 설명이다.

마이크로소프트는 관련 시연 영상을 공개하며 이 과정에서 로봇이 단순히 미리 프로그래밍된 작업을 반복하는 것이 아니라 실제 환경에 맞춰 자율적으로 판단하고 행동할 수 있다고 설명했다.

더불어 마그마AI가 단순한 정보 분석을 넘어서 주어진 목표를 달성하기 위해 계획을 세우고 실행할 수 있다는 점에서 기존 AI와 차별화된다고 강조했다.

예를 들어 요리를 준비할 때 '카레를 만들어줘'라고 지시하면 AI는 레시피를 분석해 필요한 재료를 시각적으로 인식하고, 단계별 조리 과정을 시간 순서에 맞게 안내하거나 로봇팔을 제어해 실제로 요리를 만들 수 있다는 설명이다.

마이크로소프트는 언어와 시각 정보를 결합해 언어적, 공간적, 시간적 지능을 통합한 마그마를 통해 청소와 요리보다 더욱 복잡한 작업도 처리할 수 있다고 설명했다.

더불어 이를 활용해 다양한 산업 분야의 업무를 자동화할 수 있는 로봇 개발의 핵심 기술로 자리매김할 계획이라고 밝혔다.

예를 들어 물류와 제조업에서는 로봇이 물건을 분류하고 포장하며, 의료 분야에서는 로봇이 의료 이미지를 분석해 초기 진단을 돕고 간단한 의료 절차를 수행할 수도 있다. 자율주행 차량에 적용하면 차량이 도로 상황을 실시간으로 분석해 더 안전하고 효율적인 주행 경로를 선택 가능하다.

김홍일 방통위원장

관련기사