"사람처럼 듣고 말한다"…오픈AI, 신규 AI모델 'GPT-4o' 출시

13일 신제품 발표행사…"GPT-4o, 실시간 음성 대화 통해 질문·답변 요청 가능"
황성완 기자 2024-05-14 16:22:07
오픈AI는 13일(현지시간) 온라인 신제품 발표행사를 통해 최신 거대언어모델(LLM) 'GPT-4o'를 공개했다.

새 모델의 'o'는 모든 것이라는 '옴니(omni)'를 의미하며, 주로 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있다. 음성의 ‘말투’도 다양하다. 즉, 사람처럼 듣고 말하는 것이 가능하단 소리다.

GPT-4o의 응답 시간은 최소 232밀리초, 평균 320밀리초로, 인간의 응답시간과 비슷하다고 오픈AI는 설명했다. 이전 모델인 GPT-3.5의 응답 시간은 평균 2.8초, GPT-4는 5.4초였다.

미라 무라티 오픈AI 최고기술책임자(CTO)가 GPT-4o를 설명하고 있다. /사진=연합뉴스

이전 모델인 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸다. GPT-4o는 사람처럼 대화가 가능하고, 답 제공 중에 끼어들어도 대화는 계속 이어진다.

이날 시연에서 휴대전화로 '내가 좀 긴장한 상태인데 어떻게 진정할 수 있을까'라고 묻자, '숨을 깊이 들이마시라'는 음성 답이 돌아왔다.

또다른 시연에서는 종이에 적힌 수학 문제(3x+1=4)를 보여주고 답을 말하지 말고 풀어달라고 하자, 시각 기능을 이용해 단계별 과정을 제공했다.

오픈AI는 수학·물리학·법학·윤리학 등 57개 과목을 테스트하는 다중언어작업이해(MMLU)에서 GPT-4o가 88.7%를 기록했다고 밝혔다. GPT-4 터보의 86.5%와 구글 제미나이 울트라의 83.7%를 넘어서는 수준이다.

GPT-4o는 AI비서와 남성이 사랑에 빠지는 영화 '헐(HER)'도 떠올리게 했다. 샘 올트먼 최고경영자(CEO)는 지난 10일 자신의 엑스(구 트위터)에 이날 발표를 예고하며 her라고 적기도 했다. GPT-4o가 영화를 현실로 만들어주고 있다는 것을 의미하는 것으로 보인다.

오픈AI의 이날 발표로 인해 구글과의 AI 경쟁에도 관심이 쏠린다. 이번 신규 모델이 구글의 연례 개발자 회의(I·O)를 하루 앞두고 나왔기 때문이다.

구글이 어떤 내용을 발표할 것인지는 알려지지 않았지만, 업계에서는 AI 모델인 제미나이의 업그레이드 관련 내용이 담겨 있을 것으로 예상하고 있다.

황성완 기자 skwsb@smartfn.co.kr

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300