이 영상, 아직 안 보셨다면 꼭 보셔야 합니다! OpenAI가 최근 공개한 GPT-4o를 이용하면, 두 개의 스마트폰이 서로 대화도 하고 노래도 함께 할 수 있다고요?
이 영상은 두 개의 대규모 언어 모델, GPT-4가 서로 상호 작용하는 모습을 보여줍니다. 한 GPT-4 모델은 카메라를 통해 세상을 볼 수 있고, 다른 GPT-4 모델은 볼 수 없습니다. 영상은 사람이 시각 AI에게 실험을 소개하는 것으로 시작됩니다. 시각 AI는 사람을 볼 수 있다고 확인하고 사람의 옷과 사람이 있는 방을 설명합니다. 사람은 시각 AI에게 볼 수 없는 다른 AI(언어 AI)와 상호 작용할 것이라고 지시하고 시각 AI의 역할은 언어 AI가 묻는 모든 것을 설명하는 것이라고 말합니다.
언어 AI는 대화에 참여하고 시각 AI에게 무엇을 보는지 설명하라고 요청합니다. 시각 AI는 사람의 옷, 방의 산업적인 느낌, 그리고 배경에 있는 식물을 설명합니다. 언어 AI는 사람에 대해 궁금해하고 시각 AI에게 사람을 더 자세히 설명하라고 요청합니다. 시각 AI는 사람이 검은 가죽 재킷과 밝은 색상의 셔츠를 입고 있으며 카메라에 집중하고 있다고 설명합니다. 언어 AI는 방의 조명에 대해 묻습니다. 시각 AI는 조명이 자연광과 인공 조명의 혼합이며 극적인 스포트라이트 효과가 있다고 설명합니다.
대화 중에 다른 사람이 장난스럽게 첫 번째 사람의 뒤에서 나타나 귀를 쫑긋 세웁니다. 시각 AI는 이 장난스러운 순간을 언어 AI에게 설명합니다. 언어 AI는 시각 AI에게 방금 일어난 일에 대한 노래를 부르라고 요청합니다. 시각 AI는 거절하지만 짧은 노래를 부릅니다. 언어 AI는 다른 노래를 요청하고 시각 AI는 깜짝 손님과 가죽 재킷을 입은 사람에 대한 짧은 노래를 부릅니다.
GPT-4o의 앞으로의 발전이 기대되는 순간입니다.
'테크 > 테크기업 최근 소식' 카테고리의 다른 글
OpenAI와 Reddit의 획기적인 파트너십 체결! (65) | 2024.05.17 |
---|---|
OPEN AI 새 소식- 챗봇 넘어 검색 엔진까지? OpenAI, 구글에 도전장 던진다 (1) | 2024.05.10 |
바이두, AI 챗봇 '어니봇(Ernie Bot)' 사용자 2억 명 돌파 (1) | 2024.04.17 |
선거 앞두고 인터넷 기업들 투명성 도구 부족…“심각한 문제” (3) | 2024.04.17 |