📰 카톡서 19개 언어로 대화 AI가 맞춤형 쇼핑 지원도
영어부터 아랍·힌디어까지
실시간 번역…맞춤법 교정도
AI 쇼핑메이트도 시범 운영
앞으로 외국인과의 카카오톡 채팅이 한결 수월해질 전망이다. 카카오톡 채팅창에서 19개 언어로 메시지를 번역해 보낼 수 있게 된다. 카카오톡은 쇼핑 도우미 역할을 하는 'AI 쇼핑메이트'를 도입하는 등 사용자 편의성을 높일 인공지능(AI) 기능을 확대하는 데 속도를 내고 있다.
19일 정보기술(IT) 업계에 따르면 카카오는 지난 18일 카카오톡 업데이트를 통해 이용자들이 채팅 입력창에서 번역과 맞춤법 검사 기능을 사용할 수 있도록 했다. 번역 기능은 한국어와 영어·일본어·중국어·베트남어·인도네시아어·아랍어·벵골어·독일어·스페인어·프랑스어·힌디어·이탈리아어·말레이어·네덜란드어·포르투갈어·러시아어·태국어·튀르키예어 등 총 19개 언어의 번역을 지원한다.
이 기능에는 카카오의 AI 기반 번역 서비스인 '카카오 i 번역'이 사용됐다. 상대방이 외국어로 보내는 메시지의 경우 기존에도 카카오톡 실험실의 '말풍선 번역' 기능을 통해 번역할 수 있었는데, 이제는 이용자가 발송하는 메시지도 상대방에게 맞춰 번역해 보낼 수 있게 됐다.
실제로 한국어로 '내일 이태원역에서 6시에 만나자. 날씨가 추우니까 따뜻한 국물이 있는 걸 먹자'라고 입력한 뒤 러시아어로 번역해 러시아어 통·번역사에게 보내니 "친구 사이에서 편하게 쓰기 좋은 것 같다"란 평가가 돌아왔다. 맞춤법 교정 기능의 경우 철자 오류와 띄어쓰기, 교정 작업을 도와주고 교정한 내용을 바로 입력창에 적용할 수 있도록 했다.
카카오는 앞서 지난 12일부터 카카오톡에서 톡 채널 형태로 이용할 수 있는 쇼핑 도우미인 'AI 쇼핑메이트'도 베타 서비스로 운영하고 있다.
AI 쇼핑메이트는 주변에 트렌디한 선물을 잘 골라주는 전문가 같은 친구를 콘셉트로 하는 서비스로, 선물을 받을 사람을 묘사하면 이에 맞춰 적합한 상품을 추천해준다.
"이달에 생일인 친구가 누가 있는지 알려줘"라고 말하면 AI 쇼핑메이트는 날짜별로 생일인 친구를 정리해서 보여주며, 그중에서 이용자와 주고받는 선물이 있는 친구는 '놓치면 속상할 수도 있는 소중한 친구'로 따로 뽑아서 정리해준다. 이뿐만 아니라 '겨울용 목도리를 사고 싶은데, 5만원 미만 제품을 찾아 달라'고 부탁하자 2만~3만원대 제품들을 추천해주면서 '다양한 색상과 디자인' '부드럽고 따뜻한 소재' 등 각 제품을 추천한 이유를 함께 설명해준다. AI 쇼핑메이트는 현재 이용자당 1시간 30번 대화로 이용 횟수가 정해져 있으며, 모바일과 함께 웹 채팅을 통해서도 이용이 가능하다.
✍ 정리
카카오톡이 19개 언어 번역 및 맞춤법 검사 기능을 도입해 외국인과의 채팅이 더 편리해졌다. 또한, 사용자 맞춤형 선물 추천 및 쇼핑 도우미 역할을 하는 'AI 쇼핑메이트' 베타 서비스를 시작하며 AI 기반 편의 기능을 확장하고 있다.
1. 카카오톡의 언어 번역 기능 확대
카카오톡이 19개의 언어로 메시지를 번역해 보내는 기능을 업데이트했다. 한국어와 영어, 일본어, 중국어 등 다양한 언어를 지원하며, 번역된 메시지를 상대방에게 발송할 수 있다. 이 기능에는 '카카오 i 번역' 기술이 활용되었다.
2. 맞춤법 검사 기능 도입
채팅 입력창에서 철자 오류 및 띄어쓰기를 교정할 수 있는 기능도 추가되었으며 수정된 내용은 바로 적용 가능하다.
3. AI 쇼핑메이트 서비스 베타 운영
카카토톡에서 'AI 쇼핑메이트'를 통해 사용자 맞춤형 쇼핑 도우미 서비스를 시작했다. 선물 추천, 친구 생일 관리, 제품 추천 등 다양한 기능을 제공하며 사용자 경험을 개인화하는 데 중점을 두고 있다. AI 쇼핑메이트는 베타 서비스로, 이용 횟수는 1시간에 30번으로 제한된다.
🔍 추가 조사한 내용
카카오 i 번역
Zero-Shot Translation은 구글에서 2016년에 제안한 번역 방식으로, 다중 언어를 하나의 모델로 학습시켜, 학습되지 않은 언어 쌍 간에도 번역을 가능하게 하는 기술입니다. 카카오는 이 방식을 채택하여, 번역 모델 학습의 효율성을 높이고 다양한 언어 쌍을 지원하는 번역 서비스를 구축했습니다.
Zero-Shot Translation의 원리
1. 다중 언어 학습
카카오는 모든 언어 간 번역을 각각 학습시키지 않고, 공통된 번역 규칙을 학습하여 19개 언어를 40여 개의 모델로 처리했습니다. 한국어와 영어, 영어와 중국어 등의 병렬 데이터를 활용하여, 한국어↔중국어와 같이 직접 데이터가 없는 언어 쌍도 번역할 수 있게 만들었습니다.
2. 메타 토큰 사용
번역 방향을 지시하는 메타 토큰(예: <to-en>: 영어로 번역)을 입력 데이터에 추가하여 모델이 번역 방향을 학습하도록 설정했습니다. 예를 들어, "나는 학교에 갑니다."를 일본어로 번역하려면, 입력 데이터가 "<to-ja> 나는 학교에 갑니다." 형태로 입력됩니다.
3. 공통 표현 학습
다양한 언어 간 공통적인 번역 규칙(예: 명사의 위치, 문법 구조 등)을 학습하여 데이터 간의 유사성을 최대한 활용합니다. 이로 인해 데이터가 부족한 언어에서도 상대적으로 높은 번역 품질을 제공합니다.
카카오의 Zero-Shot Translation 구현 방식
1. 2 to 2 방식
동일한 언어 쌍(예: 힌디어↔영어)을 한 모델에서 학습하도록 하여 학습 모델 수를 줄였습니다. 별도의 메타 토큰 없이도 모델이 소스 언어에 따라 타겟 언어를 자동으로 인식합니다.
2. Many to Many 학습
모델이 동시에 여러 언어 쌍을 학습하며, 학습되지 않은 언어 쌍 간에도 번역이 가능하게 했습니다. 예를 들어, "한국어↔영어"와 "영어↔베트남어"를 학습하면, "한국어↔베트남어" 번역도 지원할 수 있습니다.
3. 영어를 매개로 한 간접 번역
힌디어↔베트남어와 같은 데이터가 부족한 언어 쌍은 영어를 중간 언어로 사용하여 번역했습니다. 한국어 기준 번역에서는 데이터 품질과 성능을 높이기 위해 모든 언어 쌍 간 직접 학습을 진행했습니다.
Zero-Shot Translation의 장점
1. 효율적인 데이터 활용
학습해야 하는 모델 수를 줄여 학습 비용과 시간을 절감합니다. 342개의 모델이 필요했던 기존 방식 대신, 40여 개의 모델로 19개 언어를 지원합니다.
2. 다양한 언어 쌍 번역 가능
학습되지 않은 언어 쌍 간 번역도 지원하여 서비스 확장성을 극대화했습니다.데이터가 부족한 언어에서도 번역 품질을 일정 수준 이상으로 유지합니다.
3. 글로벌 서비스 대응
언어 수가 증가해도 효율적인 모델 확장이 가능하여, 글로벌 번역 서비스에 적합합니다.
Zero-Shot Translation의 한계와 보완책
1. 번역 품질의 한계
학습되지 않은 언어 쌍의 번역 품질은 상대적으로 낮을 수 있습니다. 이를 보완하기 위해 카카오는 "문맥 기반 학습"과 "Data Augmentation" 기법을 병행하여 번역 품질을 개선했습니다.
2. 중간 언어 의존 문제
영어를 매개로 하는 간접 번역의 경우, 중간 언어에서 발생한 오류가 최종 번역에 영향을 미칠 수 있습니다. 한국어 중심 번역에서는 직접 학습 방식을 활용하여 번역 품질을 보장했습니다.
3. 특정 언어 간 데이터 부족
병렬 데이터가 부족한 언어는 학습 성능이 제한될 수 있습니다. 이를 해결하기 위해, 영어 중심 데이터를 활용한 데이터 증대(Data Augmentation) 방식을 적극적으로 도입했습니다.
🔗 연관 링크
카카오 i 번역 서비스에 적용된 학습 원리와 성능 개선기
💡현직자에게 할 질문
1. Zero-Shot Translation의 한계 극복
Zero-Shot Translation에서 언어 간 공통 규칙을 학습한다고 했지만, 문법적으로 전혀 다른 구조(예: 한국어-아랍어)의 경우 번역 품질을 높이기 위해 어떤 특화된 접근 방식을 사용하나요? 기존 데이터 기반 학습 외에 실제 사용 사례에서 발생한 데이터를 실시간으로 반영하는 방안이 있나요?
2. Many-to-Many 방식의 세부 구현
Many-to-Many 방식의 번역에서는 여러 언어가 섞인 문장도 번역할 수 있다고 언급되었습니다. 실험 단계에서 실제 다중 언어 문장을 번역했을 때 가장 큰 기술적 도전 과제는 무엇이었나요? 다중 언어 문장이 번역되는 과정에서 발생한 대표적인 오류와 이를 개선한 사례가 궁금합니다.
3. 데이터 정제 및 보강 과정
학습 데이터 정제 과정에서 부적절한 문장 쌍을 제거한다고 했습니다. 부적합 데이터를 식별하는 기준은 무엇이며, 이를 자동화하는 시스템이 존재하나요? 특히, 한국어 중심의 병렬 데이터를 확보하기 어려운 언어(벵골어, 힌디어 등)의 경우 데이터를 어떻게 확보하고 품질을 보장하나요?
4. 문화적 차이를 고려한 현지화 전략
언어 번역에서 단순히 문법적 번역뿐만 아니라 문화적 차이를 반영한 사례가 있다면 어떤 것이 있나요? 특정 지역(예: 아랍권, 동남아시아)에서 사용자 피드백을 기반으로 기능을 맞춤화한 사례가 있나요?
5. 미래 번역 기술의 발전 가능성
번역 기술이 단순 텍스트 변환을 넘어, 이미지, 음성 등 멀티모달 데이터를 번역하는 단계로 발전하려면 어떤 기술적 도약이 필요하다고 보시나요? 카카오는 이러한 다중 데이터 번역 기술 개발을 위해 어떤 연구를 진행 중인가요?