긱 경제(Gig Economy). 그 때 그 때 필요에 따라 임시직을 고용해 일을 맡기는 경제 형태다. 긱(Gig)이라는 단어는 1920년대 미국 재즈 공연장에서 필요할 때마다 임시로 연주자를 섭외해 공연하던 방식을 의미한다.

긱경제 노동자 또는 온라인 플랫폼 노동자들은 '개인 사업자'와 같은 개념이다. 매일 만원버스나 지옥철로 직장까지 출퇴근할 필요도 없이 일하고 싶을 때 일을 골라서 할 수 있다면 얼마나 좋을까. 자투리경제에서는 긱경제 사례들을 하나 하나 살펴보기로 한다. <편집자 주> 

사진 = 구글딥마인드
사진 = 구글딥마인드

 

구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'와 경쟁하기 위해 자체 모델 '제미나이(Gemini) 1.0'을 지난 6일 공개했다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지키고 있는 상황에서 구글 제미나이가 생성형 인공지능(AI) 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

 

■ 3가지 버전의 AI 모델

 

사진 = 구글딥마인드
사진 = 구글딥마인드

 

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다.

▲  제미나이 울트라(Gemini Ultra): 가장 크고 뛰어난 모델로, 복잡한 작업에 적합

▲ 제미나이 프로(Gemini Pro): 중간 크기와 성능의 모델로, 다양한 작업에 걸쳐 확장하기 용이

▲ 제미나이 나노(Gemini Nano): 가장 작은 모델로, 온-디바이스(On-Device)에 최적화된 모델

 

■ 제미나이 성능

 

사진 = 구글딥마인드
사진 = 구글딥마인드

 

구글은 제미나이가 '선천적(natively)'으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

 

■ 32개 벤치마크 테스트 중 30개, 최고 성적

순다르 피차이 구글 최고경영자(CEO)는 “업계에 보급된 32개 성능 평가 지표 중 30개에서 앞섰다”며 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다고 강조했다. 구글은 제미나이와 GPT-4 간 비교표도 공개했다.

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

 

■ 강화된 코딩

제미나이 1.0은 파이썬, 자바, C++, Go 등 세계에서 가장 인기 있는 프로그래밍 언어로 작성된 고품질 코드를 이해하고, 설명하고, 생성할 수 있다. 다양한 언어를 다루고 복잡한 정보를 추론할 수 있는 능력으로 제미나이는 세계 최고 수준의 코딩 기반 모델 중 하나인 셈이다.

제미나이 울트라는 코딩 작업을 위한 업계 표준 벤치마크인 HumanEval와 구글의 자체 데이터셋 코딩 벤치마크인 네추럴투코드(Natural2Code)를 비롯한 여러 코딩 벤치마크에서 우수한 성적을 거두고 있다.

구글은 특화된 버전의 제미나이를 활용해 단순한 코딩을 넘어 복잡한 수학과 이론적 컴퓨터 과학을 포함하는 경쟁 프로그래밍 문제 해결에 뛰어난 알파코드 2(AlphaCode 2)를 개발했다.

 

■ 구글 제미나이 소개 영상

 

 

향후 챗GPT와 구글 제미나이의 경쟁을 통해 생성형 인공지능은 더욱 빠른 속도로 발전할 것으로 보인다. 여러 비즈니스에서 사무보조가 필요 없어지고 긱워커들이 인공지능과 함께 일하는 모습이 자연스러워질지도 모르겠다.

 

저작권자 © 자투리경제 무단전재 및 재배포 금지