📰 AI로봇 2대가 협업 … 인간 집안일서 해방
피겨AI, 새 로봇용 AI공개
사람이 장 봐오면 알아서 분류
물건 전달하고 그릇 건네며
2대가 사람처럼 집안일 협력
노르웨이 1X, 네오 감마 공개
커피 내리고 창문 청소까지
집안일에서 인간이 해방되는 날이 머지않은 미래로 다가오고 있다. 인공지능(AI)의 급속한 발전과 함께 사람 같아진 '휴머노이드(인간형) 로봇'이 잇따라 탄생하고 있어서다.
휴머노이드 로봇 스타트업 피겨AI는 지난 20일(현지시간) 로봇용 AI 모델 '헬릭스(Helix)'를 소개하는 영상을 유튜브에 공개했다. 헬릭스는 로봇이 주변을 인식하고 이용자의 명령을 이해한 뒤 행동할 수 있는 시각언어행동(VLA) 모델이다.
이날 공개된 영상에는 피겨AI의 최신 휴머노이드 로봇 '피겨02' 두 대가 등장한다. 사람이 장을 본 물건을 선반에 두고 "둘이 협력해서 정리해줘"라고 명령하자 로봇들은 물건을 응시한 뒤 냉장고 안에 넣을 것과 선반에 둘 것을 알아서 분류한 뒤 정리하기 시작했다.
냉장고 앞에 배치된 로봇은 냉장고 문을 열어 달걀, 치즈, 케첩을 차례로 안쪽에 수납했고, 선반 쪽 로봇은 선반 문을 연 뒤 쿠키를 넣었다. 움직이는 속도는 사람보다 느리지만, 손목이나 팔을 회전하거나 손가락으로 물건을 집는 등의 동작은 사람 못지않게 자연스러운 것이 특징이다.
다른 로봇이 있는 쪽에 가까운 곳에 넣어야 할 물건을 자연스럽게 전달하는 모습도 보였다. 실제 영상에서 로봇 한 대가 사과를 집어 건네자 다른 로봇은 그릇을 가져다 사과를 담은 뒤 선반 쪽에 갖다 놓았다. 이 과정에서 두 로봇은 마치 의사소통하는 것처럼 서로 눈을 마주치기까지 했다.
피겨AI는 "헬릭스는 두 대의 로봇을 동시에 제어하도록 설계됐다"며 "한 로봇이 다른 로봇을 도와 다양한 가사 작업을 수행할 수 있도록 한다"고 설명했다.
2022년 탄생한 피겨AI는 설립 당시만 해도 물류·창고 분야에서 활약하는 이족보행 로봇 개발에 중점을 뒀다. 그러다 최근 기술 발전에 맞춰 가사노동을 대체하는 로봇 개발로 사업 분야를 확대했다. 기술력을 인정받아 지난해에는 마이크로소프트(MS), 오픈AI, 엔비디아를 비롯해 아마존 창업자 제프 베이조스에게서 투자를 유치했다.
블룸버그에 따르면 이 회사는 최근 395억달러(약 56조8200억원)의 기업가치를 인정받았는데, 이는 지난해 26억달러(약 3조7400억원) 대비 15배 이상 급등한 것이다.
노르웨이 로봇 스타트업 1X도 최근 가사노동을 대신할 수 있는 가정용 휴머노이드 로봇 '네오 감마'를 공개했다. 네오 감마는 두 발로 걸으며 다양한 집안일을 해낸다. 1X가 공개한 영상에 따르면 네오 감마는 커피포트의 스위치를 내려 커피를 만든 뒤 가져다주는 것은 물론이고 사람의 지시에 맞춰 벽에 걸린 비뚤어진 액자의 균형을 맞추고 창문·선반 닦기와 청소기 돌리기도 혼자 수행한다.
1X는 "로봇은 가정 내 테스트를 거친 후 실험실 밖으로 나갈 예정"이라면서도 실제 판매까지는 상당한 시간이 걸릴 수 있다고 밝혔다.
사람과 비슷한 휴머노이드 로봇 개발에 AI 빅테크도 잇따라 뛰어들면서 판이 커지고 있다.
블룸버그에 따르면 메타는 최근 공개된 내부 메모에서 "라마(Llama) 플랫폼 기능을 극대화하는 것을 목표로 컨슈머 휴머노이드 로봇 관련 연구개발에 집중할 것"이라고 밝히며 이를 위한 새로운 부서를 구성하고 있는 것으로 알려졌다.
우선 집안일을 하는 자체 휴머노이드 로봇 하드웨어를 개발하고, 향후 관련 AI와 센서 및 소프트웨어를 만드는 것을 목표로 최근 중국의 유니트리로보틱스, 피겨AI 등과 협업 논의에 착수했다.
구글도 최근 테슬라의 휴머노이드 로봇 '옵티머스'의 경쟁자로 꼽히는 로봇 개발사 앱트로닉에 투자했다.
오픈AI는 지난달 당국에 제출한 상표 등록 신청서에 '로봇' 분야를 포함하며 "사람들을 돕고 즐겁게 하기 위한 소통 및 학습 기능을 갖춘 인간형 로봇"이라고 명시했다.
✍ 정리
인공지능(AI) 기술이 급격히 발전하며 가정용 휴머노이드 로봇이 현실화되고 있다. 피겨AI와 1X 같은 스타트업들이 협업이 가능한 AI 로봇을 공개하며 가사 노동에서 인간을 해방시키는 기술을 선보이고 있다. 빅테크 기업들도 휴머노이드 로봇 개발에 뛰어들며 향후 시장이 크게 성장할 것으로 전망된다.
1️⃣ 휴머노이드 로봇의 발전
- AI 기술이 발전하면서 가정 내 가사 노동을 돕는 인간형 로봇이 등장
- 로봇이 물건을 정리하고 전달하며 협업하는 수준까지 진화
2️⃣ 피겨AI의 ‘헬릭스’ 및 ‘피겨02’
- 피겨AI는 로봇용 AI 모델 '헬릭스' 공개
- 두 대의 로봇이 협력하여 냉장고 정리, 물건 분류 등의 작업 수행 가능
- 피겨AI는 창고·물류 분야에서 가사 노동 대체로 사업 확장
- MS, 오픈AI, 엔비디아, 제프 베이조스 등으로부터 투자 유치
3️⃣ 노르웨이 1X의 ‘네오 감마’
- 가정용 휴머노이드 로봇 ‘네오 감마’ 발표
- 커피 제조, 창문 청소, 벽 액자 정리 등의 집안일 수행 가능
- 현재 가정 내 테스트 단계
4️⃣ 빅테크 기업들의 휴머노이드 로봇 개발 경쟁
- 메타, 자체 휴머노이드 로봇 연구개발 추진
- 구글, 테슬라 ‘옵티머스’ 경쟁 로봇 개발사 앱트로닉에 투자
- 오픈AI, 인간형 로봇 개발을 위한 상표 등록 신청
🔍 추가 조사: Figure AI의 VLAM, Helix
📌 Helix란?
Helix는 시각(Vision), 언어(Language), 행동(Action)을 통합하는 범용 VLA(Vision-Language-Action) 모델로 로봇이 자연어를 이해하고 다양한 행동을 수행할 수 있도록 개발되었습니다.
🚀 Helix의 주요 기능
- 전신 제어: 손목, 몸통, 머리 및 개별 손가락을 포함한 전체 휴머노이드 상체를 고속으로 정밀하게 제어
- 다중 로봇 협업: 두 대의 로봇이 함께 작업 가능하며 이전에 본 적 없는 물체도 협력하여 조작
- 무엇이든 집기: 자연어 명령만으로 처음 보는 수천 개의 물체를 집고 조작 가능
- 단일 신경망 학습: 특정 작업을 위한 추가 학습 없이 하나의 신경망으로 모든 동작을 학습
- 상업용 준비 완료: 저전력 임베디드 GPU에서 실행 가능하여 상용화 가능
🧠 Helix의 시스템 구조
Helix는 두 개의 독립적인 시스템 S1, S2를 조합하여 최적의 성능을 제공합니다.
✅ 시스템 2 (S2)
- 인터넷에서 사전 학습된 VLM(Vision Langauge Model, 비전 언어 모델)
- 7-9Hz 속도로 동작
- 장면 이해 및 언어 해석을 수행하여 다양한 객체와 상황에서의 광범위한 일반화를 가능하게 함
✅ 시스템 1 (S1)
- S2가 생성한 잠재 의미 정보를 200Hz 속도로 정밀한 동작으로 변환
- 빠른 반응을 위한 시각-운동 정책(Visuomotor Policy)
📈 Helix의 장점
- 속도 & 일반화: 빠른 속도를 유지하면서 제로샷 학습(사전 학습 없이 새로운 작업 수행) 가능
- 확장성: 복잡한 행동 토큰화 없이 고차원 행동 공간을 직접 제어
- 아키텍처 단순화: 오픈소스 모델을 활용하여 더 쉽게 개선 가능
- 책임 분리: 두 시스템 S1과 S2이 독립적으로 동작하여 업데이트가 용이
📊 학습 및 최적화
✅ 데이터 학습
- 다양한 원격 조작 행동을 포함하는 고품질 데이터 500시간 수집
- 자동 라벨링된 자연어 명령 데이터를 활용
- 학습된 데이터는 펴악에서 제외하여 데이터 오염 방지
✅ 아키텍처
- S2는 VLM 백본, S1은 시각-운동 트랜스포머
- 단안(모노큘러) 카메라 이미지 & 로봇 상태 정보로 학습
- 자연어 명령을 단일 연속 벡터로 변환하여 S1에 전달
✅ 최적화된 추론 방식
- S2는 고수준 계획, S1은 실시간 제어 수행
- 각 프로세스가 독립적으로 동작하여 빠른 피드백 루프 제공
- 임베디드 GPU 기반으로 실시간 실행 가능
🤖 Helix의 실제 성능
- 정밀한 상체 제어
- 35개 자유도(DoF) 동작을 200Hz 속도로 정밀하게 조정
- 손가락, 머리, 몸통 움직임을 실시간으로 조율
- 제로샷 다중 로봇 협업
- 두 대의 로봇이 자연어 명령만으로 처음 보는 물체를 협력하여 정리
- "오른쪽 로봇에게 쿠키 봉지를 건네줘" 등의 명령을 수행
- 무엇이든 집기 기능
- 학습되지 않은 새로운 물체도 자연어 명령으로 집을 수 있음
- "디저트 아이템을 집어"라고 하면 추상적인 개념도 이해하여 해당 물체를 선택 가능
🔬 Helix의 연구적 의의
✅ 효율적인 학습
- 기존 VLA 모델보다 훨씬 적은 데이터(500시간)만으로도 강력한 성능 발휘
✅ 단일 가중치 모델
- 특정 작업별 미세 조정 없이 단일 모델로 모든 동작 수행
- 다양한 환경에서도 일관된 성능 유지
🔗 연관 링크
Helix: A Vision-Language-Action Model for Generalist Humanoid Control | Figure AI 공식 홈페이지
Helix: Figure AI가 공개한 범용 휴머노이드 제어를 위한 시각-언어-행동(VLA) 모델 | 파이토치 한국 사용자 모임
💡현직자에게 할 질문
1️⃣ Helix의 제어 시스템과 인간과의 협업 가능성
Helix는 S1(빠른 반응형 제어)과 S2(고차원 목표 설정)를 분리하여 최적의 성능을 구현하는 것으로 보입니다. 그러나 인간과의 협업을 고려할 때 인간의 예측 불가능한 행동이나 맥락적 변화에 실시간으로 적응하는 것이 중요한데 현재 Helix의 구조가 이러한 인간과의 자연스러운 협업에 최적화되어 있다고 볼 수 있을까요?
2️⃣ Helix의 학습 데이터와 제로샷 성능의 한계
Helix는 500시간의 고품질 학습 데이터만으로도 강력한 제로샷 일반화 성능을 보이는 것으로 설명됩니다. 그러나 가정 환경에서는 지역별 문화 차이, 다양한 주방 기구, 독특한 가구 배치 등이 존재하는데 이러한 환경적 차이를 고려한 추가적인 데이터 수집이나 모델 적응 전략은 어떻게 진행되고 있나요?
3️⃣ 로봇의 물리적 한계와 행동 실행의 현실적 문제
Helix는 35개 자유도(DoF) 동작을 200Hz 속도로 정밀하게 조정하는 것으로 알려져 있습니다. 하지만 현재 공개된 영상에서는 로봇의 동작 속도가 인간보다 현저히 느린 것으로 보입니다. 로봇의 기계적 한계를 고려했을 때 Helix가 사람이 기대하는 수준의 속도와 유연성을 확보하기 위해 어떤 추가적인 연구와 개선이 필요할까요?
4️⃣ AI 로봇의 윤리적 문제와 데이터 편향 문제
Helix는 인터넷 규모의 데이터를 활용하여 사전 학습된 VLM을 기반으로 작동하는데 인터넷 데이터에는 편향(bias)이 포함될 가능성이 있습니다. 특히 인간과 상호작용하는 로봇의 경우 사회적 편향(예: 특정 인종, 성별, 문화에 대한 차별적 행동)을 최소화하기 위해 어떤 데이터 검증 및 모델 평가 프로세스를 거치나요?
5️⃣ Helix의 상업화 및 실제 소비자 도입 가능성
Helix는 저전력 임베디드 GPU에서 실행 가능하여 상업적으로 배포될 수 있다고 설명되었지만 현재 로봇 하드웨어 비용이 높은 점을 고려할 때 실제 소비자들이 가정에서 사용할 수 있을 정도로 가격이 낮아질 가능성이 있는지 궁금합니다. 현재 예상되는 상용화 시점과 가격 책정 전략, 그리고 초기 도입 시장(기업 vs 일반 소비자)에 대한 전략은 어떻게 계획되고 있나요?
6️⃣ 가정 내 안전 문제와 규제 대응
가정용 로봇이 상용화되면 물리적인 안전 문제(로봇이 실수로 사람을 다치게 하는 경우)가 발생할 가능성이 있습니다. 로봇이 예기치 않은 상황에서 안전하게 작동하도록 보장하기 위해 어떤 안전 프로토콜이 설계되었으며, 각국의 규제에 어떻게 대응하고 있나요?
'취준 > 경제신문스크랩' 카테고리의 다른 글
[매일경제] 서울 강남 누비는 '배달 로봇' (0) | 2025.02.26 |
---|---|
[전자신문] 현대차그룹, SW 브랜드 '플레오스' 공개…SDV 가속 (1) | 2025.02.25 |
[매일경제] K-방산 총출동 … 첨단 방공망 선보인다 (1) | 2025.02.24 |
[전자신문] 삼성전자·LG전자, 상업용 사이니지에 'AI 기반 타깃 광고' 새바람 (0) | 2025.02.19 |
[전자신문] 코난테크놀로지, 기업용 신규 AI솔루션 '코난 RAG-X' 선봬 (1) | 2025.02.18 |