📰 A4 100쪽 한번에 해석…LG '엑사원' 진화
LG AI연구원, 추론 강화한
엑사원 3.5 오픈소스 공개
넉달만에 또 업그레이드
스마트폰·태블릿에도 탑재
"메타 라마보다 성능 우수"
구광모, AI 혁신·실행 가속도
LG AI연구원이 오픈소스 기반 '엑사원(EXAONE) 3.5'를 공개했다. 엑사원 3.0을 발표한 지 4개월 만의 업그레이드로, 각종 벤치마크 평가에서 메타의 라마 3.2를 능가했다고 LG는 밝혔다. 또한 LG AI연구원은 내년에 대규모행동모델(LAM)을 기반으로 자율행동이 가능한 'AI(인공지능) 에이전트' 개발을 목표로 하고 있다.
9일 LG AI연구원은 엑사원 3.5 모델 3종을 발표했다. 이들 모델은 고사양 환경에서 고난도 작업을 처리할 수 있는 32B(320억파라미터), 범용적인 용도로 사용할 수 있는 7.8B(78억파라미터), 스마트폰·태블릿PC에 내장할 수 있는 초경량 2.4B(24억파라미터)로 구성됐다.
엑사원 3.5는 △최대 3만2000토큰(1토큰은 영문 4~5자 또는 국문 2~3개 음절)의 길이를 처리할 수 있으며 △적은 학습 비용으로 동급 모델 대비 우수한 성능을 발휘하고 △AI 안전성과 신뢰성을 강화한 점이 특징이다. LG AI연구원은 "엑사원 3.5는 입력되는 문장 길이에 따라 다르지만, A4 용지 100쪽 분량 텍스트도 한 번에 처리할 수 있다"고 설명했다.
현재 3만2000토큰을 처리할 수 있는 파운데이션 모델(대규모언어모델·LLM)은 오픈AI의 GPT-4나 구글의 제미나이에 한정돼 있다. LG는 기술력을 통해 세계적 수준에 도달했다고 강조했다. 엑사원 3.5는 검색증강생성(RAG·Retrieval-Augmented Generation), 복잡한 문제를 단계적으로 분석하고 추론하는 다단계추론(MSR·Multi-Step Reasoning), 모델이 인간 선호도에 맞춰 응답을 생성하도록 학습한 선호도 최적화(Preference Optimization) 기술을 탑재했다. 또한 AI 윤리 문제를 개선하기 위해 데이터 지침을 준수하고 윤리적 평가를 시행했다.
벤치마크 테스트 결과도 공개했다. LG AI연구원은 엑사원 3.5로 7개 활용 사례, 4개 장문 처리, 9개 범용 도메인을 비롯해 총 20개 테스트를 수행했다. 엑사원 2.4B 모델 기준으로 장문 처리에서 63.4점, 사용 성능에서 61.1점을 기록했다. 이는 메타 라마(44.2점·36.7점)와 알리바바 큐원(40.7점·44.5점)에 비해 월등한 성능이다. LG AI연구원은 "논리적 사고력 평가와 한국어 평가에서도 뛰어난 점수를 기록하며 한국어와 영어 모두에서 우수한 이중언어 처리 능력을 입증했다"고 설명했다. 특히 엑사원 32B 모델은 코딩 테스트에서 87.2점을 기록해 뛰어난 성능을 보였다.
LG AI연구원은 2020년 설립된 이후 올해 4주년을 맞았다. 내년에는 LAM 기반으로 AI 에이전트를 개발하는 것을 목표로 삼고 있다. 배경훈 LG AI연구원장은 "생성형 AI 모델의 발전이 빠르게 진행되고 있는 만큼 업그레이드 속도가 중요하다"며 "산업 현장에서 활용할 수 있는 초인공지능을 목표로 혁신 속도를 높여 한국을 대표하는 프런티어 모델로 발전시켜 나가겠다"고 말했다.
한편 LG는 구광모 LG그룹 회장이 미래 사업으로 집중 투자하고 있는 AI 분야에서 LG AI연구원을 중심으로 'AI 대전환'을 추진 중이다. 이를 위해 LG AI연구원은 임직원을 대상으로 '챗엑사원(ChatEXAONE)' 서비스를 정식 제공하기 시작했다. 챗엑사원은 엑사원을 기반으로 구축된 모델로, 정보 암호화와 개인정보 보호 기술을 적용해 임직원이 사내 보안 환경에서 데이터 유출 걱정 없이 활용할 수 있다.
✍ 요약
LG AI연구원이 엑사원(EXAONE) 3.5를 공개하며 생성형 AI 기술의 선두를 목표로 다양한 기능과 성능을 강화했습니다. 엑사원 3.0 발표 이후 단 4개월 만에 업그레이드된 이 모델은 메타의 라마 3.2를 능가하는 성능을 벤치마크 테스트에서 입증하며, 글로벌 경쟁력을 강조했습니다.
엑사원 3.5의 특징
1. 다양한 크기의 모델 제공
- 32B (320억 파라미터): 고사양 환경에서 고난도 작업 처리
- 7.8B (78억 파라미터): 범용 작업에 적합
- 2.4B (24억 파라미터): 스마트폰·태블릿 PC에 내장 가능한 초경량 모델
2. 주요 기술적 강점
- 장문 처리 능력: 최대 3만2000 토큰(A4 100쪽 분량) 처리 가능
- 검색증강생성(RAG): 검색과 생성 기능을 결합해 더욱 정확한 결과 제공
- 다단계추론(MSR): 복잡한 문제를 단계적으로 분석해 해결
- 선호도 최적화: 인간 선호도에 맞춘 응답 생성
- AI 윤리: 데이터 지침 준수 및 윤리적 평가 시행
3. 벤치마크 테스트 성과
- 20개 테스트에서 메타 라마(44.2점)와 알리바바 큐원(40.7점)을 압도하는 성능 기록
- 코딩 테스트에서 87.2점 달성, 이중언어(한국어·영어) 처리에서 뛰어난 성능 입증
LG AI연구원의 목표와 계획
1. 내년 목표: AI 에이전트 개발
- 대규모행동모델(LAM)을 기반으로 자율행동 가능한 AI 개발
2. 산업 활용 확대
- 초인공지능을 목표로 AI를 산업 현장에 적용해 실질적 혁신 제공
3. 내부 활용: 챗엑사원
- LG 임직원용 챗엑사원(ChatEXAONE) 도입, 보안 환경에서 데이터 유출 걱정 없이 활용
LG의 AI 전략
- 구광모 회장의 AI 혁신 비전: LG AI연구원을 중심으로 AI 기술에 대한 대대적인 투자 및 혁신 추진
- 한국 대표 프런티어 모델: 빠른 업그레이드와 기술 혁신으로 글로벌 AI 생태계에서 경쟁력 확보
🔍 추가 조사한 내용
대규모행동모델(LAM, Large Action Model)
사용자 행동 패턴을 학습해 웹과 앱을 직접 조작할 수 있는 AI입니다.
기존의 대규모 언어 모델(LLM)이 텍스트 생성 및 이해에 중점을 두었다면, LAM은 이러한 언어적 능력에 더해 실제 행동을 수행하는 능력을 갖추고 있습니다. 이를 통해 단순한 정보 제공을 넘어, 사용자의 지시에 따라 다양한 작업을 자동으로 수행할 수 있습니다.
주요 특징
- 행동 수행 능력
- LAM은 사용자로부터 받은 자연어 명령을 이해하고 이를 기반으로 웹사이트 탐색, 애플리케이션 조작 등 실제 행동을 수행할 수 있습니다.
- 예: 특정 상품을 온라인으로 주문하거나, 일정 관리를 자동으로 처리하는 등의 작업이 가능합니다.
- 사용자 행동 패턴 학습
- LAM은 사용자 개개인의 행동 패턴과 선호도를 학습하여, 보다 개인화된 서비스를 제공합니다.
- 이를 통해 사용자의 의도를 정확하게 파악하고, 최적의 결과를 도출할 수 있습니다.
- 다양한 환경에서의 적용성
- 웹과 모바일 앱 등 다양한 플랫폼에서 적용 가능하며, 이를 통해 여러 산업 분야에서 활용될 수 있습니다.
- 예: 고객 서비스 자동화, 스마트 홈 제어, 개인 비서 역할 등
활용 사례
- 래빗 R1: CES 2024에서 공개된 래빗 R1은 LAM을 기반으로 음성 인식과 컴퓨터 비전 기술을 결합하여 사용자의 명령에 따라 다양한 작업을 수행할 수 있는 디바이스
- Adept AI의 ACT-1: Adept AI는 LAM을 활용하여 디지털 환경에서 사용자의 지시에 따라 다양한 작업을 수행할 수 있는 모델을 개발 중
🔗 연관 링크
2024년 AI 업계를 달굴 핫 키워드 LAM(대규모 행동 모델)
💡 현직자에게 할 질문
1. LAM(대규모행동모델)과 엑사원의 결합 가능성
LG가 LAM 기반의 자율행동 AI 에이전트를 목표로 하고 있다고 들었습니다. 엑사원 3.5의 강력한 언어 처리 및 추론 능력이 LAM과 결합된다면, 어떤 새로운 응용 사례가 가능할 것으로 보시나요? 특히 LAM이 필요로 하는 행동 데이터를 학습시키는 과정에서 엑사원이 제공할 수 있는 기술적 기여는 무엇인가요?
2. 엑사원의 윤리적 평가와 글로벌 AI 기준
엑사원 3.5는 데이터 지침 준수와 윤리적 평가를 시행했다고 밝히셨습니다. 그러나 글로벌 AI 시장에서는 각국마다 윤리적 기준이 상이한 상황인데요. LG AI연구원은 글로벌 윤리 기준을 어떻게 수용하고 있으며, 이러한 윤리적 평가가 엑사원의 글로벌 확장 전략에 어떤 영향을 미치고 있나요?
'취준 > 경제신문스크랩' 카테고리의 다른 글
[한국경제] "AI 혁명, 이제 출발선…종착지는 인간화 로봇" (0) | 2024.12.12 |
---|---|
[매일경제] SK텔레콤, AI 에이전트 본격 도입 (2) | 2024.12.12 |
[매일경제] 문서 작성·데이터 검색까지 한컴, AI 솔루션 2종 선보여 (0) | 2024.12.09 |
[매일경제] 전세계 날씨 8분내 예측한다 구글 AI 기상예보 모델 공개 (1) | 2024.12.06 |
[매일경제] 엔씨, 한국어 특화 AI모델 콘텐츠 제작시간 대폭 단축 (0) | 2024.12.05 |