목차
챗GPT가 풀어본 2025학년도 수능 국어, 딱 1개 틀렸다!
오픈AI 최신 모델 'o1-프리뷰'가 1등급 기록
AI의 수능 도전, 이번엔 1등급?
인공지능(AI)이 인간의 사고 능력을 평가하는 다양한 시험에서 고득점을 기록하며 주목받고 있습니다. 특히 2025학년도 대학수학능력시험(수능) 국어영역에서 오픈AI의 최신 AI 모델이 만점에 가까운 성적을 기록해 화제를 모으고 있습니다. 이는 AI의 복잡한 추론 능력이 비약적으로 발전했음을 보여주는 사례로 주목받고 있습니다.
o1 프리뷰, 단 1개 틀리며 1등급 달성
19일 공개된 자료에 따르면, 오픈AI의 최신 모델 'o1 프리뷰'는 2025학년도 수능 국어영역에서 원점수 97점을 기록하며 1등급 추정 등급컷을 충족했습니다. 이는 올해 시험에서 단 한 문제만 틀린 결과로, AI가 기존 수능에서 보여준 성적보다 크게 향상된 점수를 기록한 것입니다.
o1 프리뷰 외에도 GPT4o와 GPT3.5 터보 등 다양한 모델이 시험에 도전했지만, 성적은 4~8등급으로 비교적 낮은 점수를 기록했습니다. 특히, GPT3.5 터보는 16점으로 8등급에 그쳐 모델 간 성능 차이가 크게 나타났습니다.
Markr AI의 분석: "AI의 언어 능력, 인간 뛰어넘는다"
AI 연구팀 Markr AI의 진민성 연구원은 블로그를 통해 AI의 성능을 분석하며 "o1 프리뷰의 97점 기록은 AI의 한국어 언어 능력이 인간을 뛰어넘을 가능성을 보여준다"고 평가했습니다. 이전까지 AI는 수능 국어에서 평균적으로 3~9등급을 기록했지만, 이번 결과는 AI의 추론 능력과 학습 속도가 얼마나 빠르게 발전했는지 입증하는 사례로 볼 수 있습니다.
새로운 패러다임, AI의 가능성과 한계
오픈AI가 지난 9월 공개한 'O1(오원)' 모델은 복잡한 문제를 단계적으로 해결하는 추론 능력을 강화한 것이 특징입니다. 이는 국제수학올림피아드(IMO) 예선에서 기존 모델이 13%의 정답률을 기록했던 반면, O1은 83%의 정답률을 기록하며 성능의 차이를 입증했습니다.
오픈AI CEO 샘 올트먼은 O1 모델에 대해 "범용적인 복잡한 문제를 해결할 수 있는 새로운 패러다임"이라고 언급했으나, "여전히 기술적 한계와 결함이 있다"고 덧붙였습니다.
참조링크
주식회사 마커: http://markr.co.kr/
Markr.AI: https://github.com/Marker-Inc-Korea