×
뎁스노트
인공지능
GPT-4o, 영화 'her'가 현실이 되다

 

 

GPT-4o, 영화 'her'가 현실이 되다

 
 

오픈AI가 또 한번 세상을 떠들썩 하게 만들었습니다. 새로운 멀티모달 AI 모델인 GPT-4o를 발표한 건데요. (o는 Omni의 약자를 의미하고, ‘모든’, '전부’를 의미하는 단어입니다)  발표가 있은지 이틀이 지났지만 여전히 관련된 기사와 글, 영상으로 온통 뜨겁네요. 이번 수요레터에서는 GPT-4o의 핵심적인 특징들을 살펴보겠습니다.

 
 

AI와 진짜 대화한다

 

영화 의 인공지능 사만다가 현실이 되었습니다. 예전 GPT 모델들이 음성 지원에 3초에서 5초 사이의 시간이 걸렸던 것에 비해서 0.23초 안에 대답이 가능해 졌습니다. 보통 사람의 응답시간이 대략 0.3초 내외라고 했을 때 응답속도 측면에서는 사람과 대화하는 것과 차이를 느낄 수 없다는 거죠. 텍스트, 시각정보, 오디오 등 모든 데이터를 end to end 학습을 통해서 한번에 처리가 되기 때문에 이런 빠른 응답이 가능하다고 오픈AI는 설명하고 있네요. 무엇보다 GPT-4o의 목소리에는 마치 감정이 들어가 있는 것처럼 보입니다. 사람과 농담을 주고 받고, 웃고, 위로합니다. 데모 영상을 통해서는 AI라고 느끼지 못하겠더라구요. SF영화가 이렇게나 빨리 현실이 될 지는 상상도 못했습니다. 영화 의 주인공 테오도르가 사만다에게 느꼈던 사랑의 감정, 가능할 수도 있을까요?

 
 

아이폰에 ChatGPT

 

애플은 AI의 개발에 뒤쳐져 있습니다. 최근에 AI에 최적화된 M4 칩이 적용된 아이패드 프로를 발표하기도 했고, 애플카를 접으면서 관련된 자원을 AI에 쏟아부으며 최선을 다하지만 솔직히 AI는 후발입니다. 하지만 이번에 오픈AI의 발표를 통해 애플과 오픈AI의 협력이 의미심장한 시너지 효과를 낼 수 있게 되었습니다. ChatGPT의 데스크탑 앱을 출시했는데, 맥 버젼만 선보였습니다. 윈도우 버젼은 연말에나 가능다하고 얘기합니다. MS와 오픈AI의 그간의 관계를 생각해 보면 참 의아한 일이 아닐 수 없네요. 이번 데모 영상에서 보여준 기기들은 온통 애플 것들이었습니다. 그리고 최근 블롬버그의 소식에 의하면 6월에 발표할 애플의 WWDC에서 얘기될 iOS18에서 ChatGPT가 시리2.0에 통합될 수도 있다고 합니다. 전세게 약 22억대의 활성기기를 보유한 애플의 생태계에 올라탄다면 오픈AI가 정말로 게임체인저가 될 수도 있겠다는 생각이 듭니다. AI에 뒤늦은 애플의 입장에서도 나쁘지 않죠.

 
 

무료 버젼에서도 가능

 

ChatGPT-4가 유료 버젼에서만 가능했던 것에 비해서 GPT-4o는 무료버젼에서도 가능해질 전망입니다. 다만 제약이 좀 있죠. 플러스 유료 사용자들에겐 5배 더 많은 사용이 가능하다고 하네요. 일단 사용해 보면 유료를 쓰지 않을 수 없다고 판단하는 모양인데, 이틀동안 GPT-4o를 사용해보니 정말 많은 사람들이 지갑을 열지 않을까 생각해 봅니다. 아직은 한국어가 약간은 어색하지만 그래도 충분히 대화를 나눌 수 있는 수준입니다. 운전하면서 이젠 절대 심심하지 않을 겁니다.

 
 

API 사용성 확대

 

GPT-4o는 생태계 확대를 위한 API 사용성을 대폭적으로 확대했습니다. 기존 GPT-4 Turbo 대비 2배 빠르고 5배나 제한 없이 사용 가능한데, 가격은 절반입니다. 이 정도면 팀킬 아닌가 싶기도 한데, 문자와 영상 정보에 대한 AI 모델 개발에 대한 생태계를 선점하겠다는 포석이겠죠. 최근 메타의 LLaMA3가 오픈 LLM 모델로 좋은 성능과 개방성을 보여주고 있는 점을 경계하는 것 같네요.

 
 

그래서 무엇이 가능할까?

이번 GPT-4o는 다양한 응용 방법들을 보여주는 영상들을 여러 편 공개했습니다. 꼭 한번 보시길 추천합니다. 그 중에서 특히 인상 깊었던 몇 가지 데모를 소개합니다.

 

실시간 번역 

이젠 GPT-4o만 있으면 실시간 번역이 가능해 집니다. 굉장히 자연스럽고 또 빠릅니다. 당연히 한국어도 가능하죠. 언어 장벽은 정말로 무너져 내렸습니다.
https://youtu.be/WzUnEfiIqP4?si=-u_Xrvcg_drrEcbI

 

노래를 불러줘 

감자(Potatoes)에 대한 노래를 불러달라고 GPT-4o에게 요청하는데, GPT-4o는 노래를 만들어 부릅니다. (세상에 AI가 노래를 부르다니요. 그런데 꽤나 자연스럽네요) 노래의 톤과 분위기를 바꿀 수도 있습니다. 좀 더 부드럽게, 좀 더 속삭이 듯이 불러줘라고 추가적으로 요청하면 변화된 느낌과 감정으로 노래를 바꿔 부릅니다. 

https://youtu.be/2Djt1WWch20?si=gfbRFm2SPbUFXCkJ

 

수학문제 교사 

아이패드만 있으면 대화를 통해서 삼각함수를 GPT-4o에게 배울 수 있습니다. 실수에 대한 피드백과 문제를 맞췄을 때 적절한 응원까지. 정말 이런 교사가 없네요. 교육산업에 종사하는 분들은 이 영상을 보며 어떤 생각을 가지게 될 지 궁금해 졌습니다.

https://youtu.be/_nSmkyDNulk?si=UR5_gGffT4m-q2tW

 
 

할 얘기는 넘쳐나는 이번 오픈AI의 발표였습니다. 하지만 이게 다가 아닙니다. 비디오 AI 생성 서비스인 소라(SORA)도 곧 출시될 예정이고, GPT-5도 준비 중입니다. 검색엔진도 발표가 있을 것이고, 샘 알트만이 얘기한 새로운 모델인 큐스타도 기다리고 있습니다. 오픈AI가 도데체 세상을 얼마나 또 놀래킬 건지 모르겠네요.

 

 

구글도 새로운 AI 전략을 이번 구글 I/O에서 발표했습니다. 자신들이 가진 거대한 플랫폼 생태계에 AI를 녹여내어 패권을 이어가려는 전략을 보여줍니다. 조만간 구글의 AI 발표에 관련되어서도 정리해서 소개해 드리겠습니다.

 

 

 

AI 소식에 정신없는

촌장 드림

 

댓글 0