챗GPT가 수능 보면…"영어는 2등급·수학은 낙제"

김동훈 기자 99re@bizwatch.co.kr
2023.02.06(월) 16:45

"의미추론, 요지파악 '우수'…두자리 곱셈부터 오답"

미국 오픈AI가 선보인 인공지능(AI) 챗봇 '챗GPT'가 한국에서 대학수학능력시험을 보면 당장 원하는 대학에는 가기 힘들 것으로 보인다.

시험평가 및 기술검증 기관 '애나'와 연세대 인공지능대학 김시호 교수 연구팀은 실제 수능 문제를 통해 챗GPT의 실력을 가늠해본 결과 영어는 2등급, 수학은 낙제 수준이었다고 6일 밝혔다.

이번 실험은 2023학년도 대학수학능력시험 문제에서 그림이 포함돼 문항 입력이 불가능한 경우를 제외한 문제 전체를 입력하고 답을 확인하는 방식으로 진행했다.

영어 수능 시험에서 듣기 평가의 경우 16문제 중 14문제, 독해 평가는 17문제 중 13문제에 정답을 맞혔다. 합산 점수는 82점으로, 수능 2등급 수준이다.

연구팀은 "문단에 함축된 의미 추론과 요지 파악, 글의 목적과 주제 파악 등 난도가 높은 문제에서는 모두 정답을 맞혔다"고 설명했다.

수학 시험에서는 부진한 결과가 나왔다.

공통 과목 분야에서는 20문제 중 6문제에 정답을 맞혔으나, 확률과 통계, 미적분학, 기하 분야의 문제는 전부 오답을 출력했다.

연구팀은 "기계학습 방법으로 수학을 배우는 챗GPT의 연산 능력은 한자리 숫자의 곱셈 정도는 풀지만, 두 자리 숫자의 곱셈에서 오답을 낼 정도로 정확도가 떨어진다"고 지적했다.

다만 연구팀은 챗GPT와 같은 인공지능의 기술을 응용한 새로운 서비스에 대한 가능성을 기대하면서, 한편으론 AI의 능력 수준이 점차 발전하고 있어 대학 교육의 목적과 방법도 바뀌게 될 것이란 예상을 내놨다.

애나의 이상호 CTO(최고기술책임자)는 "문장에 대한 요약, 추론 등에 대해서는 매우 뛰어난 능력을 보이고 있는 챗GPT의 기술을 응용할 수 있는 서비스가 무궁무진할 것"이라며 "산업계에서는 인재 채용에 대한 요구사항이 머지않아 바뀌게 될 것"이라고 말했다.

한경희 연세대 교수도 "머지 않은 미래에 AI의 능력이 대학 신입생의 학습 능력을 넘어서게 될 것"이라며 "AI와 동행하게 될 앞으로의 교육에서 새로운 교육 목적과 방법을 고민하지 않는다면, 미래사회에서 대학 교육은 존립의 근거를 잃게 될지도 모른다"고 우려했다.