안녕하세요 :) Cross Planning 본부 이현정입니다.
2025년 7월 3주차 뉴스레터 발송드립니다.📮
<GIANTSTEP News> 빠른 제보는 슬랙 메시지 💌 @XP 사업기획팀 이현정
(📢 매주 목요일 오전까지 접수, 이후 제보는 차주 발행) |
|
|
🧠 Illusion of Thinking: LLM의 사고 능력은 착각일까?
(플랫폼실 AI팀 기고) |
|
|
애플 vs 클로드, 'Illusion of Thinking' 논문 전쟁으로 번지다
최근 AI 연구 분야에서 주목할 만한 흥미로운 논문 경쟁이 벌어졌습니다. 바로 Apple의 "Illusion of Thinking" 논문과 이에 대한 Anthropic(Claude 개발사)의 "Illusion of Illusion of Thinking" 반박 논문입니다. 기업들은 단순한 성능 비교를 넘어, 대형 언어 모델(LLM)의 "사고력(reasoning)"에 대한 근본적 질문까지 던지고 있어, 학문적으로 큰 파장을 일으키고 있습니다.
🔍 애플의 주장: "사고력이 무너진다"
Apple은 자사의 논문 Illusion of Thinking에서 LLM, 특히 추론 능력을 강화한 모델(LRM: Language Reasoning Model) 이 특정 문제 난이도를 넘어서면 complete accuracy collapse (정확도 붕괴) 를 겪는다는 점을 실험을 통해 입증합니다.
왜 이런 주장이 나왔을까?
기존 수학/코딩 기반 벤치마크는 다음과 같은 한계가 있었습니다:
- 이미 학습에 사용된 문제가 포함되어 있는 data contamination
- 문제 난이도를 정량적으로 조절하기 어려움
- 추론 과정 자체에 대한 분석이 어려움
이를 극복하기 위해 Apple은 직접 난이도를 조절할 수 있는 퍼즐 기반 평가 환경을 설계하였고, 여기서 추론 모델들이 복잡도가 높아질수록 생각을 "덜" 하게 되는 현상을 포착했습니다.
🎯 즉, 문제를 더 어려워졌음에도 reasoning effort가 감소하며, 모델이 생각 자체를 포기하게 되는 지점이 존재한다는 것입니다.
🤔 Claude의 반격: "그건 착각의 착각이다"
Anthropic은 곧바로 Illusion of Illusion of Thinking이라는 반박 논문을 게재하며 Apple의 실험 설계를 강하게 비판합니다:
- 하노이의 탑 문제는 모델이 사용 가능한 토큰 한계를 초과해 평가 자체가 불공정
- River Crossing 퍼즐 중 일부는 수학적으로 불가능한 문제를 포함
- 실험 평가에서 “답변을 일찍 멈춤”과 “틀린 답”을 구분하지 않음
- 같은 퍼즐도 압축된 형식(compressed form)으로 답변을 요청하면 정확히 해결함
즉, Claude 팀은 Apple의 실험 방식 자체가 모델의 reasoning collapse를 유도한 구조적 오류였다고 주장합니다.
💡 왜 이 논쟁이 중요한가?
이번 논문 경쟁은 단순한 모델 비교를 넘어서, "언어 모델이 정말 사고를 할 수 있는가?" 라는 근본적인 질문에 도전장을 던집니다.
- 기업 입장에서는 신뢰할 수 있는 추론 능력의 확보가 필수적이며,
- 연구자 입장에서는 reasoning capability의 한계와 측정 방식을 고민하게 합니다.
Apple과 Claude는 모두 자사 모델의 reasoning 능력을 과시하면서, AI의 미래 방향에 대한 철학적, 기술적 논쟁을 본격적으로 시작한 셈입니다.
🗣️ 여러분의 생각은 어떠신가요?
AI가 진짜 "생각"을 한다고 믿으시나요, 아니면 그저 "잘 설계된 착각"일까요?
이번 논문 경쟁은 아직 끝나지 않았으며, 향후 ChatGPT, Gemini, Claude 등 주요 LLM들도 이 논쟁에 참전할 가능성이 높습니다. |
|
|
📢 AI 기술에 대해 궁금한 점이 있으신 분들은 플랫폼실 AI팀으로 문의주시면
언제든 상담이 가능합니다. 💡 |
|
|
🧠 오픈AI, ‘챗GPT 에이전트’ 전격 출시… "AI가 직접 사고하고 행동하는 시대 가속"
오픈AI가 챗GPT에 ‘에이전트(Agentic)’ 기능을 정식 도입한 ChatGPT Agent를 출시했습니다. 기존 챗GPT가 단순 대화형 AI였다면, 이번 업데이트로 챗GPT는 사용자의 지시를 직접 실행하는 디지털 비서로 진화했습니다.
주요 기능 요약
-
웹 브라우징 및 자동 작업 수행: 웹사이트 탐색, 양식 입력, 로그인 처리 등 브라우저 내 실제 행동 가능
-
문서·슬라이드·스프레드시트 등 결과물 생성: 사용자의 지시를 분석해 직접 자료 제작
-
3종 웹 도구 통합: 시각 기반 브라우저, 텍스트 기반 브라우저, API 호출 기능을 적절히 조합
-
사용자 제어 강화: 실시간 확인·승인 기능 내장, 프롬프트 인젝션·오남용 방지 기능도 탑재
-
성능 향상 입증: 웹 브라우징, 데이터 분석, 재무 모델링 등 벤치마크에서 기존 모델 대비 압도적 성능 향상
-
적응형 워크플로우 설계: 작업 중 도구를 유연하게 전환하며 목표에 가장 효과적인 방법 선택
활용 예시
-
업무용: 경쟁사 분석, 회의 정리, 자료 제작, 일정 조율, 엑셀 업데이트
-
개인용: 여행/행사 계획, 예약, 전문가 상담 연결 등 반복 업무 대행
ChatGPT Agent는 처음으로 사용자가 AI에게 직접 웹 작업을 맡길 수 있는 기능을 정식 통합한 사례이며, 향후 반복적인 업무나 리서치, 콘텐츠 생성 전반에 걸쳐 AI 활용의 실질적 확장을 이끌 전망입니다. [더보기]
|
|
|
🎮 AI 게임 급증…2025년 출시작 20%가 생성형 AI 활용한다
게임 산업 전반에 생성형 인공지능(AI) 기술의 도입이 가속화되고 있습니다. Tom’s Hardware에 따르면 2025년 출시 예정 게임 중 최소 20%가 AI를 활용할 것으로 예측되며, 실제로 Steam에 등록된 AI 활용 게임 수는 7,800여 개에 달하는 것으로 나타났습니다.
AI 활용은 다음과 같은 영역에서 활발하게 이루어지고 있습니다:
특히 2025년 출시 예정인 '나이릭(Nyric)', '빗매직(Bitmagic)' 등은 텍스트 프롬프트만으로 게임 세계를 자동 생성하는 시스템을 채택했으며, ‘AI 로그라이트(AI Roguelite)’ 같은 전면 AI 기반 텍스트 RPG 게임도 새로운 장르로 주목받고 있습니다. 전문가들은 AI가 초기 콘텐츠 생성의 초안을 작성하고 인간 개발자가 이를 보완하는 방식이 점점 일반화되고 있으며, AI와 인간의 협업이 게임 제작의 새로운 표준으로 자리잡을 것으로 전망합니다. [더보기]
|
|
|
🕶 네이버, 연내 XR 콘텐츠 플랫폼 출시
네이버가 연내 XR 콘텐츠 플랫폼을 선보입니다 이 플랫폼은 삼성전자가 올해 선보이는 XR헤드셋 ‘무한’에서 처음으로 사용하게 되며, 향후 다양한 안드로이드XR 기반 디바이스에서 사용될 예정입니다. 네이버는 기존 콘텐츠 역량을 활용해 XR 환경에서도 K-POP, 버추얼 아티스트, 게임 콘텐츠(치지직) 등을 중심으로 몰입형 미디어 경험을 확장할 계획입니다. 특히 1:1 아바타 인터랙션과 이머시브 오디오 기술을 통해 실감형 콘텐츠 구현에 집중하고 있다고 합니다.
한편, 네이버는 AI 기반 미디어 기술도 적극 개발 중입니다.
-
MUAi 플랫폼: 영상 내 챕터 구분, 태그 분석, 감정 인식, 유해·저품질 콘텐츠 감지, 저작권 관리 등 기능 제공
-
AutoClipAi: 블로그 글을 자동 요약·해석해 숏폼 영상으로 변환하는 멀티모달 생성형 AI 기술
또한 버추얼 콘텐츠 제작을 위한 내부 스튜디오 ‘비전스테이지’와 ‘모션스테이지’를 운영하며, 3D 콘텐츠 제작, 가상 배경 방송, 쇼핑라이브 연계 등에도 AI와 XR 기술을 적극 도입하고 있습니다. [더보기]
|
|
|
경기도 성남시 네이버 1784에 위치한 버추얼 콘텐츠 특화 스튜디오 ‘모션스테이지’에서 3D 콘텐츠를 제작하는 모습 [사진: 네이버]
|
|
|
🎡 디스트릭트, 산리오캐릭터즈를 만나다! 빛나는 순간들이 몽글몽글 ‘호텔 플로리아’
디지털 디자인&아트 기업 디스트릭트(d’strict)가 산리오캐릭터즈(헬로키티, 마이멜로디, 시나모롤 등)와 손잡고 체험형 전시 《호텔 플로리아》를 11월 15일까지 여의도 IFC몰에서 선보입니다. 이 전시는 호텔을 콘셉트로 한 300평 규모의 미디어아트 공간에서 진행되며, 관람객은 랜덤 호텔키로 ‘체크인’한 뒤 산리오 캐릭터들이 꾸민 객실과 호텔 공간을 탐험하는 방식입니다.
전시는 총 11개 테마 공간으로 구성됩니다. 마이멜로디, 헬로키티, 시나모롤, 쿠로미 등 대표 캐릭터들의 개성을 살린 룸뿐 아니라, 물속을 누비는 수영장, 연회장, 가든파티가 열리는 정원, 핑크빛 해변 등 다채로운 연출이 특징입니다. 디스트릭트는 ‘호텔’이라는 공간이 주는 따뜻한 기억과 ‘플로리아(Floria)’라는 이름이 가진 꽃이 피어나는 이미지를 통해 관람객에게 작지만 반짝이는 행복을 전달하겠다는 의도를 밝혔습니다.
《호텔 플로리아》는 아르떼뮤지엄 등으로 글로벌 1000만 관객 돌파를 눈앞에 둔 디스트릭트가 뉴욕 9번째 지점 개관을 앞두고 선보이는 프로젝트로, 향후 유명 IP와의 협업을 통해 순회형 전시로 확장할 계획입니다. [더보기]
|
|
|
체험형 전시 ‘호텔 플로리아’ 중 ‘마이멜로디룸’(사진:디스트릭트) |
|
|
체험형 전시 ‘호텔 플로리아’ 중 ‘해변’(사진:디스트릭트) |
|
|
|