우리는 이미 인공지능과 빅데이터 없이는 살지 못하게 되었다

 자기 전 잠깐 유튜브에서 동영상을 보려다가 정신을 차려보니 한 시간째 영상을 보고 있던 경험을 한 적이 있다. 이대로 자기는 아쉬워서 잠깐만 동영상을 잠깐만 본다는 것이 동영상 아래의 추천 동영상까지 보게 되고, 또다시 다른 추천 동영상을 보고 그렇게 “하나만 더”를 외치다 보면 시간이 훌쩍 지나가있다.

유튜브는 어떻게 내가 볼 법한 영상만 골라서 추천을 해주는걸까.

 답은 빅데이터와 인공지능에 있다. 요즘 이 분야가 유망하다는 이야기는 누구나 들어봤을 것이다. 정치인들도, 기업인들도, 언론들도 너도 나도 빅데이터와 인공지능이 중요하다는 이야기를 한다. 이쯤 되면 이게 무엇인지 몰라도 “아무튼 똑똑하신 분들이 중요하다고 하니 앞으로 발전할 산업이겠구나.” 정도로 생각할 수는 있다.

그러나 빅데이터와 인공지능은 생각보다 우리 삶에 너무나도 가까이 쥐도 새도 모르게 다가와있다. 이미 우리 삶은 이전으로 돌아갈 수 없게 되었다.

 

요즘 유튜브에서는 "어떤 이유에서인지 몰라도 추천 영상으로 제안하길래 시청해봤는데 생각보다 재밌었다." 라는 요지의 댓글을 심심찮게 찾아볼 수 있다
요즘 유튜브에서는 "어떤 이유에서인지 몰라도 추천 영상으로 제안하길래 시청해봤는데 생각보다 재밌었다" 라는 요지의 댓글을 심심찮게 찾아볼 수 있다.

 유튜브는 사용자가 더 오랜 시간 유튜브라는 플랫폼에 머무를 수 있도록 동영상 추천 알고리즘을 설계했다.

원리는 간단하다. 민수와 광석이라는 사람이 있다고 해보자. 민수는 다큐멘터리 영상을 즐겨본다. 광석이도 다큐멘터리 영상을 즐겨본다. 한편 광석이는 1박 2일 같은 옛날 예능 영상도 자주 찾아본다.

이때 유튜브는 “민수와 광석이는 다큐멘터리 영상을 좋아하네. 그런데 광석이는 옛날 예능 영상도 좋아하는구나. 그렇다면 민수도 옛날 예능 영상을 좋아하지 않을까?” 라는 추론을 통해 민수에게도 옛날 예능 영상을 추천해준다. 이것이 유튜브 동영상 추천 원리의 기본 뼈대가 된다.

 이러한 시청 데이터가 전 세계 수억 명의 유튜브 사용자들에게서 모인다. 이 모든 데이터는 허투루 쓰이지 않는다.

기본적으로 앞서 설명한 역할도 하지만 인공지능의 알고리즘을 통해 추천해준 영상을 실제로 시청하는지, 즉 추천이 효과가 있었는지에 대한 데이터도 수집할 것이다.

그렇게 추천해준 영상을 몇 분이나 보았을지도 기록할 것이다. 이러한 추가 데이터들로 기존의 추천 알고리즘을 평가하고 더욱 추천이 정교해지도록 알고리즘을 수정할 것이다.

수억 명의 사용자에게서 데이터를 받기 때문에 인공지능의 알고리즘은 신선의 경지에 이를 만큼 정교하게 수정된다. 이것이 빅데이터를 통해 인공지능을 개선하는 방법이다.

유튜브는 나와 같은 영상을 시청한 다른 사용자의 시청 내역을 기반으로 나에게 영상을 추천해준다
유튜브는 나와 같은 영상을 시청한 다른 사용자의 시청 내역을 기반으로 나에게 영상을 추천해준다.

 애플은 이러한 원리를 사용자의 얼굴을 인식하여 스마트폰의 잠금을 해제하는 Face ID(이하 페이스 아이디)에 활용했다.

사용자는 처음 페이스 아이디를 사용할 때 본인의 얼굴을 등록한다. 시키는대로 고개를 좌로 돌리고 우로 돌려가며 얼굴을 등록시키면 제법 정교한 얼굴 형태가 스마트폰에 저장된다.

이제 스마트폰은 사용자가 잠금을 풀기 위해 얼굴을 비출 때마다 저장된 얼굴 형태와 사용자 얼굴 형태를 비교하여 사용자 본인이 맞는지 확인하는 작업을 거친다.

 여기서부터 인공지능이 일을 시작한다. 매번 잠금을 풀 때마다 사용자의 얼굴을 확인하고 학습 데이터로 사용한다. 처음 얼굴을 등록할 때 수염이 없던 사용자가 다음날 조금 자란 수염을 깎지 않고 얼굴 인식을 시도했다. 수염 부분이 조금 달라졌지만 얼굴의 대부분이 일치하기 때문에 잠금은 풀릴 것이다.

이때 수염이 자랐다면 수염이 자란 것까지 사용자의 얼굴 변화로 인식하고 학습한다. 이제 사용자가 한 달 동안 수염을 깎지 않아 모습이 크게 바뀌더라도 한 달 동안 사용자의 수염이 자라는 모습을 학습했기 때문에 정상적으로 잠금이 풀릴 것이다.

페이스 아이디는 사용자의 얼굴 3만개의 점을 사용해 투사하여 인식한다사진 출처 = 애플
페이스 아이디는 사용자의 얼굴 3만개의 점을 사용해 투사하여 인식한다. 사진 출처 = 애플

 한편 콘텍트 렌즈를 끼는 사용자가 있다. 이 사용자는 처음 페이스 아이디에 자신의 얼굴을 등록할 때 콘텍트 렌즈를 끼지 않았다.

다음날 사용자가 콘텍트 렌즈를 끼고 잠금 해제를 시도했을 때 스마트폰은 처음 등록한 사람의 눈과 다르게 생긴 눈을 인식하고 다른 사람이라고 판단할 것이다. 이어 사용자는 페이스 아이디를 사용하는 대신 직접 비밀번호를 입력해서 잠금을 풀었다. 이 과정에서 스마트폰은 “방금 얼굴 인식을 시도한 사람이 다른 사람인줄 알았지만 비밀번호를 해제한 것을 보아 같은 사람이군.” 이라는 식으로 학습을 하게 된다.

이 데이터가 점차 쌓이게 되면 콘텍트 렌즈를 착용한 채로 얼굴 인식을 통해 잠금을 풀 수 있게 된다.

인공지능이 진짜 사람처럼 정교해지기 위해서는 수 많은 학습 데이터가 반드시 필요하다. 구글은 자율주행 자동차의 인공지능을 개발하기 위해 도로 사진에서 무엇이 도로이고, 자전거이고, 사람이고, 자동차이고, 신호등인지 분류하여 학습시킬 필요가 있었다.

그러나 현실 세계에는 매우 복잡해서 인공지능을 사람 수준으로 정교하게 학습시키기 위해서는 상상도 못할 만큼 방대한 학습용 자료가 필요하다. 놀랍게도 구글은 여기서 전 세계 사람을 대상으로 학습 데이터를 제작시킨다는 발상을 해냈다.

사용자가 사람인지 로봇인지 구분하기 위해 만들어진 CAPTCHA 시스템. 이제는 인공지능 학습 데이터 수집을 위해 도로 사진을 주로 보여준다.
사용자가 사람인지 로봇인지 구분하기 위해 만들어진 CAPTCHA 시스템. 이제는 인공지능 학습 데이터 수집을 위해 도로 사진을 주로 보여준다.

 사용자가 사람인지 로봇인지 구분하기 위해 만들어진 CAPTCHA 시스템은 이제는 자율주행 자동차 인공지능 개발을 위한 데이터 수집용으로도 쓰이고 있다.

사용자에게 이미지를 제공하고 해당 이미지에서 어디까지가 자동차에 해당하는지 선택하게 만든다.

이때 사용자가 자동차에 해당하는 영역을 선택하여 제출하면 이 데이터는 도로 위 사물을 구분하는 인공지능 학습에 사용된다. 이렇게 우리는 일상적인 순간에도 인공지능 학습 데이터를 생산하고 있었던 것이다.

이토록 인공지능과 빅데이터는 우리 삶에 우리 스스로도 모르는 사이 성큼 다가왔다. 더욱 놀라운 것은 지금까지의 발걸음은 단지 시작에 불과하다는 것이다.

많은 기업들이 분야를 가리지 않고 인공지능 성능 향상을 위해 본격적으로 데이터를 수집하기 시작했다.

데이터 수집 뿐만 아니라 인공지능 기술 영역에서도 많은 진보가 이루어지고 있다. 이러한 추세라면 인공지능과 빅데이터 분야는 향후 정보기술 분야에서 지금보다 더욱 중요한 기술로 자리잡을 전망이다.

저작권자 © 자투리경제 무단전재 및 재배포 금지