드디어 등장한 챗GPT-4, 이미지 답변도 가능한 업그레이드 탑재

테크니컬 리포트, 개별 사진에 대한 설명까지 출력한 사례 언급

2023-03-16     최규현 기자
오픈AI가 챗GPT-4를 소개하고 있다.

지난 314일 오픈AI(Open AI)는 인공지능 언어모델인 GPT(ChatGPT)’4버전이 공개했다.

GPT-4는 이미지 입력에 대한 답변도 가능한 점에서 가장 큰 차별점을 나타냈다.

오픈AI의 예시는 밀가루계란이 포함된 사진으로 무엇을 만들 수 있을지 질문을 던졌고, GPT는 요리가 굉장히 많으며 그 예시로 팬케이크 와플 크레페 프렌치토스트 오믈렛 프리타타 커스타드 푸딩 머핀 케이크 등 무궁무진 하다는 답을 했다.

GPT-4 테크니컬 리포트에서 제시된 사례는 더 독특하다.

컴퓨터 모니터에 사용하는 VGA 커넥터를 스마트폰에 꼽는 사진의 유머 코드를 한 장씩 설명해달라는 요청을 받은 챗GPTVGA 커넥트를 작은 최신 스마트폰 충전 포트에 꽂은 부조리를 유머 코드다.”라고 답했다.

이어서 라이트닝 커넥트를 VGA 커넥트로 덮은 개별 사진에 대한 설명까지 출력했다.

GPT-425,000개 단어 분량의 텍스트를 처리할 수 있고, GPT-3.5버전보다 사실을 기반으로 대답하는 응답 비율도 40% 정도 높아졌다고 설명했다.

기존에 사실과 허구를 구별하지 못해 생기던 문제들이 개선되어 유명한 세종대왕 아이패드 던짐 사건 등을 사실이 아니라고 구별할 수 있게 됐으나 일부 사례에 대해선 여전히 답을 제대로 하지 못한 문제점이 산재되어 있는 것으로 알려졌다.

오픈AI는 문제점에 대해 챗GPT-4 역시 사회적 편견, 허구, 적대적 표현이 있을 수 있고, 이런 한계를 해결하기 위해 노력 중이라고 설명했다.

오픈AI많은 실제 시나리오에선 인간보다 능력이 떨어지지만, 다양한 전문 학술 벤치마크에서 인간 수준의 성능을 보인다.”시험 응시자의 상위 10% 정도의 점수로 미국 모의 변호사 시험을 통과했다. GPT-3.5가 하위 10% 점수를 보인 것과 대조적이다.”고 밝혔다.

생물 올림피아드에서는 GPT-3.5가 하위 31% 성적을 보였던 반면, GPT-4는 상위 1%의 성적을 기록했다.

이는 이미지 처리가 추가된 것도 성적 향상에 큰 기여를 한 것으로 해석된다.

이어서 “GPT-4의 트레이닝 런은 안정적이었으며 성능을 미리 정확하게 예측할 수 있는 최초의 대형 모델이 됐다.”신뢰할 수 있는 확장에 초점을 둬 미래의 기능을 더 미리 예측하고 준비하는 데 도움이 되는 방법론을 연마하는 것이 목표다.”고 덧붙였다.