──────────

네오위즈 세이클럽, 라인 B612 등 선도적인 서비스 런칭의 경험을 바탕으로 ‘보이저엑스'를 창업한 남세동 대표

데이터마이닝 - 빅데이터 - 데이터사이언스 를 거쳐 현재 우버에서 머신러닝 기술 활용 엔지니어로 활동중인 김형진 엔지니어

──────────

 


2018-1월 디톡스, 그 생생했던 현장


● 머신러닝의 시작

 

대다수의 대중에게 머신러닝의 시작은 “알파고” 였죠. 그렇다면 현업에서 가장 밀접하게 일해 온 두 분에게 머신러닝의 시작은 언제였을까요?


김형진 엔지니어는__ 스탠포드 대학 시절 컴퓨터 과학계에서 딥러닝으로 유명한 앤드류 응(Andrew Ng) 교수의 수업을 들으면서 이 분야를 처음 접해보았다고 합니다. 학생들이 우르르 몰려가 들을만큼 선호하는 과목이었다는데요. 특히, 수업에 참여한 학생들의 기술 활용 프로젝트는 지금 생각해도 놀라울 만한 퀄리티였다고 합니다.

*앤드류 응(Andrew Ng) 교수 개인 홈페이지 : http://www.andrewng.org/


남세동 대표는__ 이미 20년 전 쯤에 체스게임에서 사람을 이긴 ‘딥블루’ 사례가 있었기 때문에 알파고 이슈가 크게 놀라움을 주지는 못했다고 해요. 그 동안 컴퓨터의 속도, 정교함이 점차 발전해왔기 때문에 비교적 간단한 체스에서 다소 복잡한 바둑으로 그 종목이 변경된 것이라고 여겼습니다. 오히려 알파고를 만든 딥마인드 팀이 구글에 인수된 계기였던 ‘벽돌깨기 게임 인공지능 플레이’는 정말 충격적이었다고 하는데요. 이 콘텐츠를 접한 이후 딥러닝에 지대한 관심을 가지게 되었고 보이저엑스를 창업했습니다.


딥마인드팀의 벽돌깨기 게임 인공지능 플레이

 

● 머신러닝의 현재

 

머신러닝의 다양한 활용사례에 대해 이야기 해보기 전에, 머신러닝 기술에 대한 기본 개념에 대해 한번 짚고 넘어가볼까요?


김형진 엔지니어의

리얼밸리 머신러닝, 딥러닝 초간단 설명! 인터뷰

 

남세동 대표의 딥러닝 사랑을 엿볼 수 있는 ‘헬로 딥러닝’

 

그렇다면 두 분에게 인상적이었던 머신러닝 활용사례는 무엇이었을까요?

김형진 엔지니어는__ 본인이 근무 했었던 링크드인의 친구추천기능과 광고 타켓팅 시스템을,

남세동 대표는__ 딥마인드의 구글 데이터센터 전기 절약 사례를 인상적이라고 말했습니다.

이 뿐만 아니라 참가자 분들도 서른개에 가까운 다양한 사례를 리스트업해주셨는데요. 그 중 가장 많은 관심을 받았던 4가지 사례를 한번 볼까요? (클릭시 관련 서비스 및 기사로 이동)


  • 이제는 진짜와의 구별이 무의미해진 음성인식기술 - 구글 tacotron

  • 서비스를 사용할 수록 더 정교한 큐레이션을 직접 느낄 수 있는 - Pinterest

  • 온오프라인의 장벽을 깨고 사용자의 일상과 더 가까이 - Prisma

  • 자율주행 뿐 아니라 사고처리까지 가능한 완벽한 머신러닝 - 구글 웨이모


머신러닝은 어찌보면 다양한 활용을 통해서 그 개념을 정립해 나가는 “현재진행중” 인 기술이라는 생각을 했습니다.


● 머신러닝의 미래

 

머신러닝 기술을 산업계에서 활용하는 사례가 늘어나면서 업계에서 일하고 있는, 특히 개발자들이 이 기술에 대한 기대뿐만 아니라 본인의 포지션에 대한 우려를 하게 되었습니다.

 

두 패널 분들도 이 기술 자체에 대한 연구도 중요하지만 수많은 활용 사례를 분석하고 다양한 분야에 접목해보는 노력도 못지않게 중요하다는 의견을 주었는데요. 기술의 발전은 업무 프로세스를 180도 변화시키지만 기술이 인간에게 영향력을 끼친 사례는 머신러닝에만! 국한된 일은 아니었죠? 지난 수백년 간 전기, 증기기관 등 다양한 기술이 나오면서 기계가 인간의 일을 대체하는 일은 부지기수로 일어났고 지금 이 순간에도 쉼없이 일어나고 있습니다. 번역의 경우, 영어, 불어와 같이 상용화된 언어는 5년, 상담 챗봇은 1-2년, 자동차 자율주행은 3-4년 이내에 머신러닝을 통해 정교화된 서비스가 가능하다는 의견도 업계에서 나오고 있는데요.

그럼에도 불구하고 컴퓨터 산업은 앞으로 2, 3배, 그 이상으로 커질 것이기 때문에 기계가 인간의 일을 대체하는 일만큼이나 보다 높은 가치를 가진 새로운 일이 더 많이 늘어날 것이라고 해요. 걱정과 우려보다는 이 기술을 얼마나 효과적으로 이용하여 새로운 영역을 확보해 나갈 것인지를 고민하는 노력이 더 필요할 것 같습니다.


***


● 어느 때 보다 활발했던 Q&A

 

Q. 자연어 처리과정에서 중복된 문구나 오탈자는 머신러닝으로 처리하나요? 그 프로세스가 궁금해요.

A. 지금까지의 딥러닝은 사람과 기계가 함께 수행해왔는데요. 중복되는 정보나 오탈자가 있는지는 머신러닝이 1차로 검수하고 그 후 사람이 후처리 한 결과물을 다시 머신러닝을 돌려 완성도를 높여간다고 보면 될 것 같습니다.


Q. 머신러닝의 알고리즘은 수학자들의 고민을 컴퓨터에 접목시킨 것으로 알고있습니다. 머신러닝이라는 것이 수학적 알고리즘을 더 좋게 발전시키는 건지(원천기술), 알고리즘을 비즈니스에 더 적합하도록 발전시키는건지(활용기술)? 그 방향성이 궁금합니다.

A. (남) 아직도 원천 기술은 수준이 낮다고 생각해요. 그 뜻은 아직도 원천 기술에서 할 일은 매우 많다는 것입니다. 컴퓨터 산업이 양과 질, 모든 측면에서 발전하면서 앞으로 원천기술을 발전시킬 가능성은 더 많아지리라 생각합니다. (김) 사람마다 일하는 스타일과 생각이 다르기 때문에 그 방향성은 개개인 마다 모두 다를 것 같습니다. 저 같은 경우는 원천 기술 자체보다는 이를 활용하는 쪽에 더 가깝죠. 결국은 어느 쪽이 더 중요한 게 아니라 둘 다 중요하지만 맡은 직무에 따라 중요도를 달리 둘 수 있다고 말하고 싶네요.


Q. 머신러닝을 하려면 구글, 페이스북 등이 다루는빅데이터가 필요한데, 스타트업이 어떻게 효과적으로 양질의 데이터를 확보할 수 있을까요?

A. (김) 일단 굉장히 어렵습니다. 그래도 방법은 있어요. 적은 데이터로 기본적인 모델을 만든 후 Positive한 선순환 구조를 만드는 것이 중요한데요. 링크드인에서는 유저들의 데이터를 점차 확보하면서 Postive한 선순환 구조를 통해 빅데이터를 만들어 왔습니다. (남) 디지털화 된 데이터는 구글, 페이스북이 상당수를 가지고 있습니다. 하지만 디지털화 되지 않은 데이터도 이 세상에는 정말 많습니다. 구글과 페이스북 등이 그 데이터를 디지털화하지 않는 이유는 현재로서는 비즈니스적 가치가 없기 때문인데요. 우리 삶 모든 곳에 데이터는 정말 많습니다. 예를 들면 의료 데이터 등이 있죠. 제가 보기에는 세상의 전체 데이터를 100으로 봤을 때 99는 아직 미개척 되었다고 생각해요. 이 외에도 요즘에는 알파고와 같은 기술을 통해 데이터를 생성할 수도 있기 때문에 데이터를 모으는 최적화된 방법은 정말 다양한 것이라고 봅니다.


마지막으로 참가자 분들과 두 패널이 함께 “머신러닝” 을 정의해보았습니다. 절대적인 답은 아니지만 머신러닝을 보는 다양한 시선이 있다는 걸 알수 있죠!


  • 증강된 인간 능력의 시작

  • 인간 진화의 첫발

  • 수고로움을 덜어주는 심부름꾼

  • 시간을 절약해주는 기술

  • 범위가 좁고 복잡한 일을 간편하게 처리해주는 비서

  • 뻔한 일을 빨리, 제대로 해줘! 머신러닝

  • 미래의 먹거리

  • 데이터로 미래를 엿보는 기술

  • 빅데이터가 꽃을 피우는 활동

  • 고급 패턴인식

  • 스스로 학습해서 판단하는 기계

  • 컴퓨팅의 새로운 패러다임

  • 데이터 이면에 있는 패턴, 법칙성을 밝히는 것

  • 지금 알지 않으면 늦을 수 있는 기술

  • 현재를 바꿔가는 미래

  • 인간 의사결정 모방 기술 등


새로운 기술과 그 활용범위, 앞으로의 전망까지 두루두루 이야기해볼 수 있는 소중한 시간이었어요. 무엇보다 재미있었다는 점!!!! 앞으로도 업계에서 머신러닝 관련된 다양한 사례를 논의하는 자리가 많아졌으면 합니다. 세기말 분위기였던 미세먼지를 뚫고! 함께 해준 모든 참가자 분들 그우-우-우-우뤠잇! 다음 디톡스도 많은 기대 바랍니다 ^_^


●●●●● 이번 디톡스와 함께한 패널은?


남세동 대표

  • 2017 ~ 보이저엑스 대표

  • 2009 ~ 2015 라인 본사 서비스 실장

  • 2006 ~ 2009 네이버 개발 팀장

  • 2005 ~ 2006 검색서비스 첫눈 기획/개발 팀장

  • 1998 ~ 2005 게임사 네오위즈 개발 팀장

  • 카이스트 컴퓨터 사이언스 졸업


김형진 엔지니어

  • 2017. 5 ~ 우버 시니어 소프트웨어 엔지니어 (머신러닝)

  • 2015. 2 ~ 2017. 2 Mattermark 리드 소프트웨어 엔지니어 (머신러닝)

  • 2011. 7 ~ 2015. 2 LinkedIn 소프트웨어 엔지니어 / 데이터 사이언티스트

  • 스탠포드대 컴퓨터 사이언스 졸업

  • 카이스트 컴퓨터 사이언스 졸업

 

 

 

크리에이티브 커먼즈 라이선스
디캠프에 의해 작성된 [D.TALKS] 2018-1월 디톡스 ‘머신러닝 A to Z’ 현장스케치은(는) 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 4.0 국제 라이선스에 따라 이용할 수 있습니다.
http://dcamp.kr의 저작물에 기반이 라이선스의 범위 이외의 이용허락을 얻기 위해서는 http://dcamp.kr/support/qna을 참조하십시오.