인공지능(AI)이 영어 이해, 이미지 분류, 시각적 추론 등 여러 주요 작업에서 인간의 능력을 뛰어넘는 수준에 도달했다는 연구 결과가 발표됐다.
스탠퍼드대학교 인간중심 인공지능 연구소(HAI)는 최근 ‘2024 인공지능 지수(AI Index 2024)’ 보고서를 통해 이러한 평가를 내놨다. 보고서는 기존의 평가 기준이 빠르게 무의미해지고 있으며, 더 복잡한 작업인 추상적 사고와 논리적 추론을 평가할 새로운 기준이 필요하다고 강조했다.
기존 기준의 한계와 변화하는 평가 방식
보고서를 주도한 네스토어 마슬레이(Nestor Maslej) 편집장은 “10년 전만 해도 평가 기준이 5~10년 동안 유효했지만, 이제는 몇 년 만에 시대에 뒤떨어지는 경우가 많다”고 설명했다. 보고서는 복잡한 수학적 문제나 시각적 상식 추론 등 특정 분야에서는 여전히 인공지능이 인간을 완전히 따라잡지 못했다고 밝혔다.
산업계 주도, 학계의 변화된 역할
인공지능 기술의 선두는 산업계가 주도하고 있다. 보고서에 따르면 2023년 산업계는 51개의 주목할 만한 머신러닝 시스템을 개발한 반면, 학계에서는 15개만 발표됐다. 오스틴 텍사스대학교 레이몬드 무니 소장은 “학계는 이제 기업이 개발한 모델을 분석하고 취약점을 찾는 방향으로 전환하고 있다”고 말했다.
예를 들어, 뉴욕대학교 연구진은 대학원 수준의 거대언어모델(LLM) 평가 도구 ‘GPQA1’을 개발했다. 객관식 문항 400개로 구성된 이 도구는 박사급 연구자들도 65% 정답률을 기록할 정도로 어렵다. 인공지능 챗봇인 앤스로픽의 ‘클로드3’는 60%의 정답률을 기록하며 인간 수준에 근접했다.
급증하는 개발 비용과 자원 소모
인공지능 개발에는 막대한 비용이 소요된다. 2023년 3월 출시된 오픈AI의 GPT-4 훈련 비용은 7800만 달러(약 1080억 원), 같은 해 12월 구글의 제미나이 울트라(Gemini Ultra)는 1억9100만 달러(약 2600억 원)가 들었다. 네이처(Nature)는 “시스템이 발전할수록 더 큰 데이터센터와 더 많은 에너지가 필요하다”며 이에 따른 환경적 부담을 우려했다.
또한, 인공지능의 성능 향상을 위해서는 더 많은 학습 데이터가 필요하다. 미국 비영리 연구기관 에포크(Epoch)는 2024년부터 고품질 언어 데이터가 고갈될 수 있다고 경고했으나, 최근 보고서에서는 이를 2028년으로 수정했다.
윤리적 문제와 사회적 우려
인공지능의 급속한 발전은 윤리적 문제와 사회적 우려도 불러일으키고 있다. 미국에서는 2016년 인공지능 관련 법안이 단 한 건이었으나, 2022년에는 25건으로 급증했다. 마슬레이 편집장은 “법적 규제가 빠르게 증가하고 있다”고 강조했다.
세계 31개국 2만2816명을 대상으로 한 설문 조사에서는 응답자의 52%가 인공지능에 대한 불안감을 나타냈으며, 이는 전년도의 39%에서 크게 증가한 수치다. 반면, 인공지능이 긍정적인 변화를 가져올 것이라고 믿는 사람들은 52%에서 54%로 소폭 증가했다.
응답자의 66%는 인공지능이 향후 3~5년 이내에 자신의 삶을 크게 변화시킬 것으로 예상했다. 인공지능의 지속적인 발전이 인류에게 미치는 영향은 앞으로도 중요한 논의 주제가 될 전망이다.