경제적 효용 확대 기대
GDPval서 70.9% 기록…최고 성능
|
GPT-5.2는 스프레드시트·프레젠테이션 제작, 코드 작성, 이미지 분석, 긴 문서 이해 등 다양한 지식 업무 전반에서 성능이 향상됐으며 기업용 사용자들이 이미 40~60분의 일상 업무 시간을 줄이고 있다는 분석 결과를 기반으로 경제적 효용이 더욱 확대될 것이 기대된다. GPT-5.2 씽킹(Thinking) 버전은 GDP 기여도가 높은 44개 지식노동 영역을 평가하는 GDPval에서 70.9%를 기록하며 최고 성능을 달성했다. 전문가 대비 11배 빠른 속도와 1% 미만의 비용으로 결과물을 생성해 실제 업무 지원 가능성을 보여줬으며, SWE-Bench Pro에서도 55.6%로 SOTA를 기록해 디버깅, 기능 구현, 대규모 코드 리팩터링 등 소프트웨어 엔지니어링 전반의 실무 역량이 한층 강화됐다.
|
안전성 역시 개선됐다. GPT-5.2는 민감한 대화 상황에서 응답 품질을 강화했으며 18세 미만 사용자의 민감 콘텐츠 접근을 제한하기 위해 새 연령 예측 모델 적용도 시작했다. GPT-5.2는 이날부터 ChatGPT 유료 사용자에게 순차 제공되며, API에서는 즉시 사용 가능하다. Notion, Box, Shopify, Harvey, Zoom 등 주요 글로벌 기업들은 장기 추론과 도구 호출, 코드 리뷰, 데이터 분석 등에서 GPT-5.2가 기존 모델을 크게 뛰어넘는 성능을 보였다고 평가했다.
















