
AI가 인간 지능에 근접하고 있습니다. 구글이 최근 공개한 제미나이 3 프로가 IQ 130을 기록하며 상위 2% 수준의 '천재' 등급에 진입했거든요. 2년 전만 해도 AI의 IQ는 85점에 불과했습니다. 도대체 무슨 일이 일어나고 있는 걸까요? AI 지능 측정의 신뢰성부터 실제 영향력까지, 2025년 AI 진화의 핵심을 정리했습니다.
AI IQ 테스트, 정말 믿을 만한가?
IQ 테스트는 인간의 인지 능력을 수치화하는 표준 도구입니다.
평균 100점, 130점 이상이면 상위 2%에 해당하죠. 그렇다면 AI에게도 똑같이 적용할 수 있을까요?
트래킹 AI(Tracking AI)는 2024년 2월부터 주요 생성형 AI 모델의 IQ를 정기적으로 측정해왔습니다. 이들이 사용하는 테스트는 멘사 회원들이 직접 제작한 오프라인 전용 문제입니다. 인터넷에 공개되지 않았기 때문에 AI가 학습 데이터로 접할 수 없다는 점이 핵심입니다. 즉, 암기가 아닌 진짜 추론 능력을 측정한다는 뜻이죠.
온라인 테스트(멘사 노르웨이)에서는 AI가 더 높은 점수를 기록하는 경향이 있습니다. 학습 데이터에 유사한 문제가 포함됐을 가능성 때문입니다. 제미나이 2.5 프로가 온라인에서 128점을 기록한 반면, 오프라인에서는 더 보수적인 점수를 받은 이유가 여기에 있습니다.
2025년 12월 기준 AI IQ 순위
| 순위 | 모델명 | 오프라인 IQ | 개발사 | 특징 |
| 1위 | 제미나이 3 프로 | 130점 | 구글 | 추론 능력 73% 향상 |
| 2위 | GPT-5.2 프로 | 127점 | 오픈AI | 코딩 정확도 80% |
| 3위 | GPT-5.2 싱킹 | 127점 | 오픈AI | 복잡한 추론 특화 |
| 4위 | 그록-4 전문가 | 125점 | xAI | 추론 성능 개선 |
| 5위 | 클로드 오퍼스 4.5 | 120점 | 앤트로픽 | 균형잡힌 범용성 |
제미나이 3가 선두를 차지했지만, GPT-5.2는 코딩과 전문 업무에서 더 뛰어난 성능을 보입니다.
AI 지능이 단일 지표로 평가될 수 없다는 증거입니다.
2년간 45점 상승, 선형적 성장의 비밀
트래킹 AI 운영자 맥심 로트(Maxim Lott)의 분석에 따르면 AI IQ는 놀라울 정도로 일정한 속도로 증가하고 있습니다.
- 2024년 2월: 최고 점수 85점
- 2025년 12월: 최고 점수 130점
- 증가폭: 45점 (약 20개월)
- 월평균 증가율: 2.5점
더 흥미로운 점은 이 성장이 '선형적'이라는 것입니다. 그래프로 그리면 거의 일직선에 가까운 상승 곡선을 보입니다.
로트는 이를 "AI를 위한 새로운 무어의 법칙"이라고 표현했습니다. 반도체 성능이 18개월마다 2배씩 증가하듯, AI 지능도 예측 가능한 속도로 향상되고 있다는 뜻입니다.
이 추세가 계속된다면 2027년 말 AI IQ는 160점을 넘어설 것으로 예상됩니다. 이는 인간 최상위 0.1% 수준입니다.
시각 지능의 폭발적 성장
IQ 테스트에는 시각 정보를 분석하는 문제가 포함됩니다. 그래프 해석, 도형 패턴 인식 등이죠. AI의 '비전 IQ' 발전은 그야말로 극적입니다.
- 2024년 2월: 60점 (무작위 선택 수준)
- 2025년 10월: 105점 (인간 평균 104점 수준)
- 증가폭: 45점 (20개월)
- 월평균 증가율: 약 3점
제미나이 3와 GPT-5 같은 멀티모달 모델이 등장하면서 AI는 이제 '보고 이해하는' 능력을 갖추게 됐습니다.
GPT-5의 경우 시각 분석에서 기존 o3 모델 대비 15점가량 향상됐습니다.
단순히 텍스트만 처리하던 AI가 이미지, 그래프, 도표까지 종합적으로 해석할 수 있게 된 것입니다.
제미나이 3 vs GPT-5.2, 진짜 승자는?
IQ 점수만으로는 전체 그림을 볼 수 없습니다. 각 모델이 빛나는 분야가 다르기 때문입니다.
제미나이 3 프로의 강점
- 종합 지능: IQ 130으로 현재 최고
- 멀티모달 능력: 텍스트와 이미지 통합 처리
- 추론 능력: 전작 대비 73% 향상
GPT-5.2의 강점
- 코딩 정확도: SWE-벤치 80% (제미나이 76.2%)
- 전문가 수준 업무: GDPval 74.1% (인간 전문가 대등)
- 환각 현상 30% 감소
결론적으로 제미나이 3는 '범용 지능'에서, GPT-5.2는 '전문 분야 정확도'에서 우위를 보입니다.
마치 모든 과목을 잘하는 학생과 특정 과목에서 압도적인 학생의 차이라고 할 수 있습니다.
스케일링 법칙이 무어의 법칙을 대체하다
AI 성능 향상의 핵심은 '스케일링 법칙'입니다. 크게 세 가지로 나뉩니다.
- 사전 학습 스케일링: 데이터 양을 늘리면 성능이 비약적으로 향상
- 사후 학습 스케일링: 추가 학습으로 특정 분야 강화
- 테스트-시간 스케일링: 추론 시 연산량 증가로 더 깊은 사고 가능
무어의 법칙은 이미 물리적 한계에 도달했지만, AI는 여전히 선형적으로 성장 중입니다.
단순한 하드웨어 개선이 아닌, 아키텍처 자체의 혁신이 일어나고 있기 때문입니다.
AI IQ 130, 정말 '천재'인가?
IQ 130이라는 숫자가 실제 문제 해결 능력을 의미할까요? 전문가들의 견해는 긍정적입니다.
로트는 "IQ 테스트가 실제 문제 해결 능력과 강한 상관관계를 보인다"고 분석합니다.
특히 패턴 인식, 논리 추론, 정보 처리 속도 면에서 높은 예측력을 가집니다.
다만 주의할 점도 있습니다. IQ가 높다고 해서 창의성, 윤리적 판단, 장기적 계획 수립 능력까지 뛰어난 것은 아닙니다.
AI는 여전히 주어진 패턴을 빠르게 인식하고 처리하는 데 특화돼 있을 뿐, 인간의 종합적 판단력을 대체하지는 못합니다.
2025년 AI 경쟁의 전환점
제미나이 3 출시는 AI 업계에 충격을 줬습니다. 11월 18일 공개 직후, 샘 올트먼 오픈AI CEO는 사내에 '코드 레드'(최고 경보)를 발령했습니다. 불과 23일 뒤인 12월 11일, GPT-5.2가 긴급 공개됐죠.
이제 'AI 1위'라는 타이틀은 특정 회사가 독점할 수 없게 됐습니다. 제미나이는 범용 지능에서, GPT는 전문성에서, 클로드는 안정성에서 각자의 영역을 구축하고 있습니다. 사용자 입장에서는 목적에 따라 최적의 AI를 선택하는 시대가 온 것입니다.
일상 생활에 미칠 영향
IQ 130 수준의 AI는 우리 삶을 어떻게 바꿀까요?
- 업무: 문서 작성, 데이터 분석, 코딩 작업 자동화
- 학습: 맞춤형 교육, 복잡한 개념을 쉽게 설명
- 창작: 아이디어 생성, 이미지 분석 및 제안
- 의사결정: 트렌드 예측, 투자 분석 보조
중요한 것은 AI를 '경쟁자'가 아닌 '도구'로 바라보는 시각입니다. AI를 잘 활용하는 사람과 그렇지 못한 사람의 격차가 점점 벌어질 것입니다. 지금 당장 제미나이든 GPT든 하나를 선택해 실제 업무에 적용해보는 연습이 필요합니다.
앞으로의 과제
AI IQ가 높아진다고 모든 문제가 해결되는 것은 아닙니다. 여전히 남은 과제들이 있습니다.
- 신뢰성과 일관성 개선
- 환각 현상 완전 제거
- 개인정보 보호 강화
- AI 윤리 기준 정립
- 일자리 변화 대응
로트는 명확히 말합니다. "AI가 인간을 대체하기보다는, 인류가 준비할 시간을 주는 것"이라고요.
IQ 160 수준의 AI가 2027년에 등장하더라도, 실제 세상에서 독립적으로 작동하는 것은 전혀 다른 문제입니다.
AI 시대, 두려워할 필요는 없습니다. 다만 준비는 해야 합니다.
지능이 높은 AI와 어떻게 협력할 것인지, 어떤 역량을 키워야 하는지 고민하는 것이 2025년을 사는 우리의 과제입니다.
'TECH' 카테고리의 다른 글
| 한국형 AI 독립선언! 국산 파운데이션 모델 5종 완벽 분석 (1) | 2026.01.02 |
|---|---|
| AI 학습 플랫폼 5곳 추천 가이드 (0) | 2026.01.02 |
| 왜 1시간은 60분일까? 시간의 신기한 역사 이야기 (0) | 2026.01.02 |
| AI가 키운 토마토 Sol, 클로드 3.5 스마트팜 실험 (0) | 2026.01.02 |
| 영하 40도도 끄떡없다! 전기차 겨울 혁명, CATL 나트륨배터리 (1) | 2026.01.02 |
댓글