오픈AI, 전문 업무·과학 연구 특화 모델 ‘GPT-5.2’ 출시

읽기모드

글자크기

기사듣기

인쇄하기

URL 복사

https://stgauto.asiatoday.co.kr/kn/view.php?key=20251212010006763

글자크기

김영진 기자

승인 : 2025. 12. 12. 09:40

다양한 지식 업무 전반 성능 향상
경제적 효용 확대 기대
GDPval서 70.9% 기록…최고 성능

	참고사진 1_GDPval_Knowledge work tasks	0
오픈AI가 GPT-5.2를 출시했다./오픈AI

오픈AI(OpenAI)는 전문적인 지식 노동과 복잡한 다단계 프로젝트 수행을 지원하는 차세대 모델 'GPT-5.2'를 12일 공개했다.

GPT-5.2는 스프레드시트·프레젠테이션 제작, 코드 작성, 이미지 분석, 긴 문서 이해 등 다양한 지식 업무 전반에서 성능이 향상됐으며 기업용 사용자들이 이미 40~60분의 일상 업무 시간을 줄이고 있다는 분석 결과를 기반으로 경제적 효용이 더욱 확대될 것이 기대된다. GPT-5.2 씽킹(Thinking) 버전은 GDP 기여도가 높은 44개 지식노동 영역을 평가하는 GDPval에서 70.9%를 기록하며 최고 성능을 달성했다. 전문가 대비 11배 빠른 속도와 1% 미만의 비용으로 결과물을 생성해 실제 업무 지원 가능성을 보여줬으며, SWE-Bench Pro에서도 55.6%로 SOTA를 기록해 디버깅, 기능 구현, 대규모 코드 리팩터링 등 소프트웨어 엔지니어링 전반의 실무 역량이 한층 강화됐다.

	참고사진 2_SWE-Bench Pro (공개)_소프트웨어 및 엔지니어링	0
GDPval_Knowledge work tasks./오픈AI

환각(hallucination) 비율은 GPT-5.1 대비 30% 감소했고, 긴 문서 분석과 정보 통합 능력이 크게 향상돼 보고서, 논문, 계약서 등 수십만 토큰 단위의 문서에서도 일관성과 정확성을 유지할 수 있게 됐다. 이미지·차트·UI 등 시각적 정보 기반 업무에서도 오류율이 절반 수준으로 줄며 비전 모델 성능이 대폭 강화됐다. 과학 연구 분야에서도 성과가 보고됐다. GPT-5.2 프로는 통계적 학습 이론의 미해결 문제에 대한 하나의 증명을 제안했고 연구진과 외부 전문가 검증을 모두 통과해 최신 AI 모델이 인간의 감독 아래 학술 연구를 실제로 돕는 사례를 만들었다. OpenAI는 GPT-5.2가 수학·과학 연구 가속을 위한 최고 수준의 모델이 될 것이라고 설명했다.

안전성 역시 개선됐다. GPT-5.2는 민감한 대화 상황에서 응답 품질을 강화했으며 18세 미만 사용자의 민감 콘텐츠 접근을 제한하기 위해 새 연령 예측 모델 적용도 시작했다. GPT-5.2는 이날부터 ChatGPT 유료 사용자에게 순차 제공되며, API에서는 즉시 사용 가능하다. Notion, Box, Shopify, Harvey, Zoom 등 주요 글로벌 기업들은 장기 추론과 도구 호출, 코드 리뷰, 데이터 분석 등에서 GPT-5.2가 기존 모델을 크게 뛰어넘는 성능을 보였다고 평가했다.

김영진 기자yjjjj22@gmail.com