개인회원 메뉴

개인회원 정보

이력서 사진
이력서 사진 없음
로그인 링크
로그인
회원가입 링크
아직 회원이 아니세요?

개인회원 서비스

JOBKOREA

직무인터뷰

직무인터뷰 상세

IT/SW/인터넷

AI 영어회화 앱을 론칭해 앱 교육분야 1위를 달성했어요

소속
머니브레인 딥러닝팀 권용재 연구원
등록일자
2020.07.13
조회수
781

바야흐로 딥러닝의 시대다. 머니브레인은 딥러닝을 이용해 실제 사람과 자연스러운 대화가 가능한 인공지능 서비스를 제공하고 있다. 최근 딥러닝 기술을 기반으로 한 ‘스픽나우’ 영어회화 앱을 론칭해 업계 1위를 달성하기도 했다. 안드로이트 앱 교육분야의 상위권을 차지할 수 있었던 비결은 자연스러운 음성 및 영상 합성 기술과 기술력의 확장에 있다. 딥러닝팀 권용재 연구원을 만나 자세한 이야기를 들었다.

MONEY BRAIN

딥러닝팀
권용재 연구원

 

반갑습니다. 간단한 자기 소개 부탁드립니다.

안녕하세요. 머니브레인 딥러닝팀에서 연구원으로 일하고 있는 권용재입니다. 현재 딥러닝 기반의 영상합성 및 음성합성 연구를 진행하고 있습니다.

 

딥러닝팀에서 주요 업무는 무엇인가요?

최신 논문들의 방법론을 연구하여 필요에 따라 개발하고 있습니다. 연구 위주의 일들을 담당한다고 보시면 될 것 같습니다. 음성 및 영상 합성 기술과 관련 있는 딥러닝 기술들을 구현시키기 위해 여러 논문들 보고 있는데요. 보다 상세히 설명하자면 생성적 적대 신경망 (Generative Adversarial Network), End-to-End 음성 합성 모델들 위주로 인공지능 합성에 필요한 기술들을 연구 및 개발하고 있습니다.

Interview 01

최신 논문에서

필요 기술을 찾아내는 연구원

 

입사하면 논문에 대한 지식을 우선 쌓아야 하나요?

맞아요. 먼저 음성, 영상 합성 딥러닝 기술들의 근간이 되는 논문들을 읽고, 해당 기술들과 관련 있는 몇몇 논문들을 구현하기도 하면서 실무에 필요한 지식들을 우선 쌓습니다. 그 다음, 머니브레인에서 촬영한 모델들을 대상으로 직접 대화형 인공지능을 개발해보기도 합니다.

 

매번 새로운 논술을 보는 일이 쉽지는 않을 것 같아요.

그렇죠. 최근 딥러닝 기술, 그중에서도 생성적 적대 모델에 대한 학계의 관심이 높아지면서 하루가 다르게 새로운 논문들과 기술들이 쏟아져 나오고 있습니다. 새로운 기술을 연구하고 구현시키는 건 즐거운 경험이지만 한편으론 매일같이 새로운 기술들을 연구하는 것이 부담이 될 때도 있습니다.

 

딥러닝 연구에서 가장 주의해야할 부분은 무엇인가요?

딥러닝 연구는 굉장히 빠른 속도로 신기술들이 추가되는 분야입니다. 기존의 기술들이 뒤쳐지거나 비효율적으로 여겨지는 분야이기 때문에, 항상 학계의 최신 동향에 귀를 기울이면서도 특정 기술에 편견을 가지지 말고 열린 마음으로 도전해보는 게 중요하다고 생각합니다.

Interview 02

음성과 영상을

자연스럽게 합성하는 기술력

 

최근 페이스북에서 개최한 ‘딥페이크 탐지 경영대회’에 참여했다고 들었어요.

맞아요. 최근 이슈인 딥페이크 영상 합성 기술을 사용하여 영상물을 탐지하는 기술 개발에 참여한 것인데요. 대회가 끝난 이후, 페이스북 측은 대회에서 사용한 딥페이크 영상 데이터 생성 방법들과 그 장단점들을 기술한 논문을 발표했습니다. 경연대회를 통해 기술들에 대해 연구하면서 보다 자연스러운 영상 합성에 사용할 수 있는 부분들을 분석해 볼 수 있었는데요. 새로운 기술들을 배우면서 한편으론 딥페이크 기술이 악용될 경우 생길 수 있는 문제들에 대한 경각심을 일깨울 수 있어서 여러모로 인상적인 시간이었습니다.

 

인공지능 음성과 영상을 합성하는 매커니즘은 무엇인가요?

음성합성의 경우, 연속적인 Sequence-to-Sqeuence 모델을 기반으로 하여, Location Sensitive Attention 레이어와 함께 텍스트를 입력된 음성으로 출력하는 모델을 개발합니다. 이때 입력된 텍스트는 한글 자모 단위(또는 알파벳 단위)로 쪼개어 특정 모델의 목소리를 사용해 훈련에 들어가는데요. 초반에는 3D 캐릭터가 모델이었지만 최근에는 연예인과 같은 특정인의 목소리를 재현하는 것이 가능해졌습니다.

영상합성의 경우, 차세대 딥러닝 알고리즘으로 주목받고 있는 생성적 적대 신경망(Generative Adversarial Network) 기술을 이용합니다. 영상과 음성을 동기화, 음성을 입력 값으로 받아 자연스럽게 얼굴이 움직이는 영상을 출력하는 모델을 개발합니다. 복잡한 음성 및 영상 데이터의 확률분표를 추정하고, 인공 신경망이 그 분포를 학습 및 생성하는데요. 모델을 통해서 자연스러운 영상을 합성할 수 있습니다.

Interview 03

헤드헌터 추천으로

머니브레인에 입사

 

근무 부위기와 복리후생에 대해서도 소개해주세요.

업무 분위기는 굉장히 자율적이며, 당장에 급한 업무가 없을 시, 각 팀원의 관심사에 따라 연구 진행을 장려하고 있습니다. 위에서 강제하는 방식의 업무가 아닌, 각자에 맞는 방식으로 업무와 연구를 진행하기 때문에 편안한 분위기에서 효과적으로 업무를 보는 게 가능합니다. 복리후생 중에서는 매달 3만원씩 자기개발 목적으로 취미생활을 지원해 주는 점이 좋습니다. 복지를 이용해 평소 읽고 싶었던 책을 주로 구매하고 있습니다.

 

머니브레인에 입사하게 된 경로는 무엇인가요?

학사 시절에 통계학과 컴퓨터공학을 복수 전공했고, 석사로는 Data Science Institute에서 데이터 공학을 전공했습니다. 이후 링크드인에 경력사항을 올려 놨는데 이를 헤드헌터가 확인하여 먼저 머니브레인을 추천해줬습니다. 과거 데이터분석가로 일하던 경력과 석사시절 여러 딥러닝 프로젝트들을 진행한 점을 위주로 어필한 결과, 연구원으로 취직하게 되었습니다.

 

마지막으로 딥러닝 분야로 취업을 원하는 후배들에게 조언 한마디 부탁 드립니다.

딥러닝 분야는 매우 빠르게 발전하고 있으며 그만큼 하루가 다르게 배워야할 것이 쏟아집니다. 급변하는 환경에 적응이 힘들 수도 있지만 시간이 지날수록 성취감도 느낄 수 있으니, 꾸준히 공부를 즐기는 마음가짐을 가질 것을 말씀드리고 싶습니다.

저작권은 잡코리아(유)에 있으며, 무단전재 및 재배포를 금지 합니다.

‘IT/SW/인터넷’ 다른 직무인터뷰