GPT-4o의 등장과 AI 기술 경쟁
작성자 뉴닉
데일리 뉴스
GPT-4o의 등장과 AI 기술 경쟁
뉴니커, 2013년에 나온 영화 ‘HER’ 본 적 있나요? 사람처럼 대화하는 AI(인공지능) 비서와 인간이 사랑에 빠지는 내용을 다룬 영화인데요. 영화 속 장면이 조만간 현실이 될지도 몰라요. 얼마 전 오픈AI가 새롭게 선보인 ‘GPT-4o’가 보여준 놀라운 성능 때문 😮.
지피티 포... 오?
‘챗GPT’로 잘 알려진 기업 오픈AI의 최신 AI 모델이에요. ‘o’는 ‘모든 것’을 뜻하는 단어 ‘omni(옴니)’에서 따왔는데요. 좀 더 자세히 살펴보면:
-
소리·영상도 인식하고 👀👂: 기존 모델은 주로 텍스트로 이용자와 대화할 수 있었는데요. GPT-4o는 시각·청각 정보도 인식하고 처리할 수 있는 능력이 크게 업그레이드됐어요. 사용자가 종이에 적힌 수학 문제를 보여주자 풀이 과정을 설명해 주는가 하면, 카메라로 사용자의 모습을 보여주며 “오늘 면접에 이렇게 입고 가도 될까?” 묻자 농담을 섞어가며 답하기도 했다고..
-
감정도 알아차리고 🧐: 시각·청각 정보를 단순히 인식하는 것뿐 아니라 해석할 수도 있어요. 사람의 표정이나 목소리, 억양 등을 분석해 지금 어떤 감정 상태인지 파악하는 것. 다양한 목소리와 톤으로 감정을 표현할 줄도 알고요. 예를 들어 동화를 만들어 읽어주는 GPT-4o에게 “더 극적인 말투로 읽어줘!” 했더니 바로 성우 같은 목소리로 바꿔 말하기도 했다고(영상).
-
사람처럼 빨라 💨: 반응 속도도 훨씬 빨라졌어요. 이전 모델들이 음성 응답에 평균 2.8~5.4초나 걸리던 것에 비해 GPT-4o는 평균 약 0.3초로, 사람과 거의 비슷한 반응속도라고. 실제 사람과 대화하듯 말을 주고받을 수 있는 거예요. 한국어 등 50개 언어를 실시간으로 통역할 수도 있고요(영상).
GPT-4o의 등장을 두고 이제 실제 인간과 가까운 ‘범용 AI’의 시대가 열렸다는 말도 나와요..
그건 무슨 얘기야?
범용 AI(AGI)는 모든 상황에서 스스로 학습하고 판단할 수 있는 AI를 말해요. 언어뿐 아니라 이미지·음성·영상 등의 데이터를 스스로 인간처럼 처리하는 수준이라, AI의 끝판왕으로 불리고요. 일부 과학자들 사이에서는 GPT-4o가 본격적인 범용 AI 시대를 열었다는 평가가 나와요. 그만큼 이전까지의 AI를 훌쩍 뛰어넘는 기술을 갖췄다는 거예요. 이에 AI 업계의 기술 경쟁은 더욱 뜨거워지는 중이라고 🔥.
AI, 또 뭐가 있더라?
-
이런 검색은 없었다 📢: 구글도 자사의 AI 모델 ‘제미나이’의 업그레이드 버전과 AI 비서 ‘프로젝트 아스트라’를 선보였어요. 구글은 검색부터 지메일·워크스페이스·포토·안드로이드 등 모든 제품에 AI 기술을 적용하겠다고 했는데요. 특히 구글 검색이 혁신적으로 바뀔 거라고. 지금처럼 사용자가 키워드를 입력해서 정보를 직접 찾는 게 아니라, 원하는 정보와 조건을 구체적으로 입력하면(예: “혼자 속초 2박 3일 여행 갈 건데 교통편, 추천 채식 식당 넣어서 일정 짜줘!”) AI가 알아서 ‘구글링’을 한 다음 결과를 정리해서 보여주는 거예요.
-
보여줄게, 달라진 시리 🤖: 애플도 음성 비서 ‘시리’를 확 업그레이드할 거라는 전망이 나와요. 그동안 시리는 매우 단순한 음성 명령만 처리할 수 있었는데요. 생성형 AI를 탑재해 더 똑똑하게 만들 거라고. 오픈AI와 손잡고 GPT-4o를 애플 운영체제에 넣을 수 있다는 얘기도 나오고요.