Table of Contents

GPT-5, Erdös 문제 해답? 과장된 기대와 허위 과학 논란

최근 수개월간 AI 업계와 수학계 모두를 뜨겁게 달군 논란이 있었습니다. 바로 GPT-5가 미해결 난제인 Erdös 문제를 해결했다는 주장과 함께, 이에 따른 과장된 기대와 허위 과학 주장에 대한 비판이 급속히 퍼졌던 사건입니다. 이 사건은 “과장된 기대는 신뢰성을 훼손할 뿐만 아니라 과학적 검증의 중요성을 일깨우는 계기”로 떠오르고 있으며, Gary Marcus의 대표적 경고인 **”Extraordinary claims require extraordinary evidence”**의 의미를 다시 한 번 되새기게 합니다.

이번 글에서는 세바스티앙 부베크(Sebastien Bubeck)의 주장을 시작으로, 이 사건의 실체와 과학계·AI 커뮤니티의 반응, 그리고 과학적 검증이 얼마나 중요한지를 상세히 살펴보겠습니다.

1. 서론: 무슨 일이 일어났나? GPT-5와 Erdös 문제를 둘러싼 논란

1.1. Sebastien Bubeck, GPT-5/AGI 추측 부정하며 “Web crawler 기반 재발견” 주장

2025년 10월 11일, OpenAI와 협력하는 연구원 세바스티앙 부베크는 트위터 계정을 통해 “GPT-5가 Erdös 문제를 해결했다”고 전격 주장했습니다. 그는 “20년 전 이미 해결된 문제를, GPT-5가 크롤링과 검색을 통해 재발견했다”고 의혹 섞인 주장을 내놓았으며, 이는 급속히 논란으로 번졌습니다.

1.2. Gary Marcus 믿을 수 없는 과장, “증거 없이 큰 주장” 비판

이 주장을 접한 AI·수학 커뮤니티는 강한 반발을 표했으며, Gary Marcus는 “이건 과장이자 허위주장”이라고 공식 입장을 내놓았습니다. Marcus는 “심지어 과학적 증거나 원천이 명확하지 않으며, 검색 기술로 이미 해결된 문제를 ‘새롭게 해결했다’고 주장하는 것 자체가 과장”이라고 지적했습니다. 이는 AI 업계의 hype문화와 과학적 엄격성의 문제를 피력하는 대표적 사례입니다.

1.3. 이 사건의 배경: Erdös 문제와 수학계·AI 커뮤니티의 기대

Erdös 문제는 수학계의 가장 오래되고 미해결된 추측 중 하나로, 수십 년 동안 수학자들의 숙원으로 남아있습니다. GPT-5 같은 최신 AI 모델들이 ‘이 수수께끼의 난제’를 해결했다고 주장하는 것은 기대심리와 과대광고의 교차지점에 위치하며, 과학적 검증이 얼마나 중요한지 다시 한 번 보여줍니다.

2. 진위 여부: GPT-5가 Erdös 난제의 ‘해답’을 찾았나?

2.1. 실제 사건 전개: Bubeck, 트윗서 “해결했다”고 주장 → 즉시 비판받음

부베크는 트위터 상에서 “GPT-5가 Erdös 문제를 해결했다”고 주장했고, 최초 조회수는 10만을 돌파하며 일시적인 흥분을 유발했습니다. 하지만 이내 수학·AI 커뮤니티는 즉각 반발하며, “검색과 재발견 수준이지, 해결이 아니다”라는 목소리가 높아졌습니다. 유명 수학자와 AI 과학자들은 “이것은 발견이라기보다는 이미 있는 내용을 다시 찾은 것(재검색)”으로 해석했으며, 해당 내용의 실체와 차별성을 따져야 한다는 입장이 지배적이었습니다.

2.2. 커뮤니티 반응: 수학·AI 전문가, “이것은 발견이 아니라 재검색” 반응

Demis Hassabis(DL의 대표주자)는 “이건 ‘당황스럽다’, 과장이 심하다”는 식으로 부정적 평가를 내놨으며, 일부는 “이 사건이 Locher’s theorem에 대한 ‘새로운 증명’이라 주장하는 것과 유사하다”고 비꼬았습니다. 트위터 내에서는 “구글링으로 본 문제를 다시 찾았다고 ‘해결했다’고 주장하는 것”이라는 농담이 돌기도 했습니다.

2.3. 유명 인사들, Demis Hassabis 등 “이건 ‘embarrassing(당황스럽다)’” 비판

이 사건에 대한 내부 반응은 “과대 광고와 허위 주장”에 대한 경계심을 자극하며, AI와 수학계 간의 신뢰 저하로 연결됐습니다. 오히려 AI 모델의 성능은 검색과 재사용의 수준이 아니며, 증명과 해결은 엄밀한 수학적 검증을 필요로 한다는 목소리도 높아지고 있습니다.

3. 핵심 논점: 과장된 기대와 허위 주장, 신뢰도 손상

3.1. 진짜 성과? 웹 크롤러가 이미 검색한 ‘해결책’ 재발견

이번 사건의 핵심은 GPT-5가 수학적 난제를 해결하는 것이 아니며, 기존의 데이터베이스를 검색하고 재발견하는 수준임에도 기대심리와 과장된 발표가 번져 사실과 다른 기대를 형성했다는 점입니다.

3.2. 왜 기대를 끌었나? 과학계·투자자, 언론도 기대감 부풀림

이 주장에 기대를 품은 과학자와 투자자들이 많았던 이유는, AI의 잠재력을 과대평가하는 허풍과 함께 ‘혁신성’에 대한 과도한 기대가 맞물린 결과입니다. 언론도 이 사건을 선제적으로 보도하며 AI 버블을 부추겼다는 비판이 stubborn하게 이어지고 있습니다.

3.3. 부끄러운 사례 반복: 2019 AI 로봇이 ‘루빅스 큐브 해결’ 허위 주장 등

과거에도 유사한 사례는 반복됐습니다. 2019년 OpenAI의 로봇이 “원래 알고리즘이 아니라 새롭게 해결했다”고 주장했으나, 사실은 기존 해결책의 재활용에 불과했고, 이후 신뢰저하로 이어졌습니다.

4. “Extraordinary claims require extraordinary evidence” — 기대의 문제

4.1. 과장·허위 기대: “AI가 새 문제 해결?” 환상과 허상

이 사례는 “AI가 지금 당장 미해결 난제들을 풀어냈다”는 기대가 얼마나 무책임하며, 과학적 엄격성에 기반하지 않으면 허상에 불과하다는 경고입니다. 특히 과학계는 검증되지 않는 주장에 휩쓸리지 않기 위해 신뢰성 있는 증거를 요구해야 합니다.

4.2. 커뮤니티 내 신뢰 무너짐: “믿을만한 증거 없는데 기대는 높아져”

이 사건은 신뢰성을 근본부터 무너뜨릴 위험이 있으며, 특히 AI의 비용·시간 대비 기대 효과가 과대광고로 인해 저하될 가능성을 보여줍니다. 기대와 실제 실력 간의 차이가 크면, 결국 신뢰 회복이 어려워질 수 있습니다.

4.3. 실체적 진실: 수학·AI, “검색으로 이미 해결된 것” 재발견

실질적으로 GPT-5의 이 ‘해결’은 새로운 발견이 아니며, 온라인 rich한 데이터 기반의 검색과정에 불과하다고 볼 수 있습니다. 이는 AI와 수학 연구에 있어서 증명과 검증의 엄격성을 잃지 않아야 한다는 교훈입니다.

5. 교훈: 기대와 과학적 증거, 신뢰의 균형 잡기

5.1. 과학적 엄격성 강조: 허위 주장 막기 위해 증거 요구

이 사건은 “과학적 엄격성”의 필요성을 새삼 일깨우며, 과장된 주장에는 반드시 엄밀한 증거와 원천이 수반돼야 함을 보여줍니다.

5.2. AI 연구와 기대: “증거 없이 과대광고는 위험” 경고

AI 개발자와 투자자는 ‘과장이 동반된 기대’에 휘둘리지 않도록, 그리고 허위와 과장 광고에 따른 신뢰 저하를 방지하기 위해 더 신중한 태도를 가져야 합니다.

5.3. 미래 전망: 과장된 기대 방지, 과학적 검증 강화 방안

앞으로는 “과장된 기대와 과학적 검증의 균형”을 유지하는 체계적 기준 마련이 필요하며, AI의 잠재력과 한계를 투명하게 공개하는 문화 확산이 중요합니다.

결론: 기대와 과학적 증거의 균형 잡기, 앞으로의 길

이번 사건은 AI와 수학계 모두에게 중요한 교훈입니다. “Extraordinary claims require extraordinary evidence”라는 격언이 왜 변함없이 중요한지를 실감케 하는 사례입니다. 기대를 갖는 것은 자연스럽지만, 과학적 검증과 엄격한 증거 없이 과장된 주장은 신뢰를 무너뜨리고, 결국 AI와 과학 발전에 도움되지 않습니다.

무엇보다도, 지속적인 검증과 신뢰 확보를 통해 AI의 진정한 잠재력을 실현할 수 있다는 사실을 잊지 말아야 합니다. 오늘의 과장된 기대를 경계하며, 책임감 있는 연구 문화와 투명성을 새롭게 다짐하는 계기가 되었으면 합니다.

과장된 AI주장 부글부글? GPT-5 Erdös문제 해답 논란을 경계하세요