매우 전문적인 금융 데이터 세트를 기반으로 해

8일 프랑스 일간 르몽드닷컴에 따르면 금융권에는 조만간 자체 챗GPT(인공지능 챗봇)가 찾아올 것으로 보인다.
경제·금융정보 서비스 기업 블룸버그가 수십 년간 수집한 데이터를 기반으로 한 인공지능(AI) 생성 시스템을 개발하고 있다.
1981년부터 금융시장 전문직 종사자들에게 서비스를 제공해 온 블룸버그는 지난주 블룸버그 GPT라는 프로젝트에 주력하고 있다고 발표했다.
블룸버그통신과 존스홉킨스대 연구진은 프로젝트를 소개하면서 이 알고리즘에 "500억 개의 파라미터가 있으며 광범위한 금융 데이터에서 정리한 것"이라고 썼다.
하지만 첫 번째 버전의 이 시스템은 아직 대중에게 공개되지 않았다.
블룸버그는 금융업계에 혁명을 일으켜 시장 참여자들이 방대한 양의 경제와 금융 정보에 접근할 수 있게 하고 글로벌 투자자들에게 참고가 될 수 있도록 했다.
이 회사는 "미증유의 분야에 대한 가장 포괄적인 전문 데이터 컬렉션을 구축했다"고 선언했다.
AI 생성 시스템이 "금융권에 현존하는 모든 모델을 능가한다"고 명시했다.
블룸버그의 새로운 모델은 공통 언어로 제기된 질문에 대한 답을 생성할 수 있는 대규모 언어 모델(LLM)을 기반으로 챗GPT에 매우 가깝게 작동한다.
이 AI 모델은 블룸버그의 '감정 속성 분석'에 도움이 될 수 있으며, 예를 들어 메시지가 시장에 나와 있는 기업에 긍정적인지 부정적인지를 결정할 수 있다.
모델은 또한 단말기에서 데이터를 쉽게 찾거나 정보 내용에 따라 기사 제목을 자동으로 생성할 수 있다.
블룸버그 GPT'의 주요 카드는 매우 전문적인 금융 데이터 세트를 기반으로 한다.
다른 AI 시스템은 범위가 훨씬 넓을 수 있지만 항상 고품질 콘텐츠에 접근할 수 있는 것은 아니므로 답변 측면에서 정확하지 않을 수 있다.
블룸버그 GPT의 훈련은 7000억 개의 마커를 포함한 대형 훈련 코퍼스를 기반으로 한다.
이 7000억 개 중 3630억 개는 블룸버그 자체 금융 데이터에서 나오거나 회사가 전문적으로 선별한다.
"뉴스·공지·인터넷에서 캡처한 자료, 블룸버그 파일에서 추출한 소셜네트워크서비스(SNS) 정보 등"이라는 방대한 금융자료 모음이다.
다른 표시는 공개 데이터에서 나온다. 이에 비해 2020년에 출시되는 챗GPT-3 버전은 훈련 코퍼스 마커가 5000억 개에 달한다.
최규현 기자 kh.choi@nvp.co.kr
