이번 주 AI 뉴스 — OpenAI는 왜 갑자기 '은행'이 되려 하는가

이번 주 핵심 요약
- OpenAI 슈퍼앱·개인금융 — ChatGPT가 미국 은행 계좌를 들여다본다는 보도. Codex·Atlas까지 한 팀으로 묶은 락인 전략.
- Anthropic 기업 시장 추월 — 한 시장조사 기준 1년 만에 엔터프라이즈 점유율 약 4배, 1위 자리를 가져갔다.
- 한국 독자 파운데이션 모델 — 정부 사업의 첫 결과물 공개, SK텔레콤은 5000억 파라미터급 신규 모델을 예고한 것으로 보도.
- 자가개선 AI 자본화 — Recursive Superintelligence가 6.5억 달러 라운드를 유치한 것으로 보도. '모델이 모델을 만든다'가 IR 자료로 옮겨갔다.
이번 주의 숫자
약 4배 Anthropic이 1년 만에 키운 엔터프라이즈 점유율 배수(한 시장조사 기준, 원조사 기관·측정 정의는 인용 매체에 명시되지 않음). OpenAI는 같은 기간 ChatGPT 컨슈머 가입자를 늘렸지만, 정작 돈을 쓰는 기업 고객을 놓쳤다.
1. OpenAI는 왜 '은행'이 되려 하는가
사람들은 OpenAI의 슈퍼앱 전략을 '강해지는 신호'로 읽지만, 그 반대일 수 있습니다. ChatGPT·Codex·개발자 API·Atlas 브라우저를 단일 제품팀으로 묶은 며칠 뒤, ChatGPT Pro에 미국 은행 계좌 연동 기반 개인금융 도구를 프리뷰로 붙인 것으로 전해졌습니다. 핵심은 통합이 아니라 '확장이 더 안 되니 쪼개진 영토를 묶어 깊이로 가자'는 결정에 가깝습니다.
지표가 그 해석을 뒷받침합니다. 같은 사이클에 공개된 한 엔터프라이즈 LLM 사용 조사에서 OpenAI는 처음으로 Anthropic에 1위 자리를 내준 것으로 보도됐습니다. 컨슈머에서 이긴 회사가 기업에서 밀리면, 다음 카드가 '컨슈머 잠금'으로 바뀌는 건 자연스러운 수순입니다. 은행 계좌, 브라우저, 폰 위의 Codex는 그래서 묶입니다.
슈퍼앱은 OpenAI에 어울리는 옷인가
슈퍼앱은 WeChat이 통제력 강한 단일 OS·결제 환경에서 만든 결과물입니다. 미국은 그런 토양이 아닙니다.
Codex가 폰으로 내려오고, Atlas 브라우저가 ChatGPT의 '눈'이 되며, 개인금융 도구가 '지갑'을 쥡니다. 한 사람의 검색·코딩·돈 흐름을 한 계정에 모은다는 비전은 매끈해 보입니다. 그러나 미국 빅테크 3사는 이미 같은 영토 위에 구체적인 진입 장벽을 쳐 놓았습니다. 애플은 App Store 인앱 결제 30% 수수료로 ChatGPT 구독·결제 흐름을 OS 단에서 묶을 수 있고, 구글은 안드로이드 기본 검색·어시스턴트 자리를 자사 Gemini에 우선 배정하며, 메타는 WhatsApp·Messenger·인스타그램 DM으로 일상 대화의 진입점을 이미 점유했습니다. OpenAI 입장에서 보면, 엔터프라이즈 1위를 내준 같은 사이클에 컨슈머 락인으로 우회 경로를 잡았다는 것이 이 전략의 본질입니다. 모델 한 가지로 정면 돌파하는 그림에서, 결제·검색·메시징의 측면 우회로 갈아탄 것입니다.
한국 직장인에게 의미
미국 프리뷰지만 챙겨야 할 신호는 분명합니다. 첫째, 'AI에게 내 금융 데이터를 얼마나 줄 것인가'가 1~2년 안에 한국에서도 실제 의사결정으로 들어옵니다. 특히 마이데이터 2단계 확대(비금융·의료 데이터 결합)와 신용정보법 개정 논의가 같은 시점에 걸려 있어, ChatGPT 같은 외산 AI가 국내 금융 데이터에 접근하는 게 가능한지, 어떤 동의·재위탁 구조로 가능한지가 즉시 규제 이슈가 됩니다. 둘째, 코딩 에이전트가 폰까지 내려오면서 'IDE 앞이 아닐 때의 생산성'이 새 경쟁축이 됐습니다. 셋째, OpenAI가 모델 단일 우위를 잃은 상태에서 락인을 쌓고 있다는 점은, 역설적으로 한국 기업의 가격·계약 협상 카드가 늘어났다는 뜻입니다.
리스크는 직설적으로 말해야 합니다. 미국 규제 당국이 이미 빅테크 금융 진출에 까칠한 상태에서 챗봇 회사가 은행 데이터를 들고 들어가는 그림은, 청문회 한 번이면 1년이 날아갈 수 있는 종류의 베팅입니다. 슈퍼앱 비전이 청문회 뉴스 한 줄에 무너지는 시나리오를 OpenAI는 분명 계산했을 텐데, 그럼에도 밀어붙인다는 점이 더 위험한 신호입니다.
출처: TechCrunch 2026-05-15 OpenAI 슈퍼앱·제품팀 통합 보도 · TechCrunch 2026-05-14 ChatGPT Pro 개인금융 프리뷰 보도 · MarketingProfs AI Update 2026-05-15 엔터프라이즈 LLM 사용 조사 인용
2. Anthropic이 마침내 기업을 가져갔다
약 4배. 한 시장조사가 집계한 Anthropic의 엔터프라이즈 점유율 증가폭입니다. 같은 기간 OpenAI는 컨슈머 가입자에서 앞섰지만, 기업 시장 1위 자리를 내준 것으로 보도됐습니다.
같은 사이클에 출시된 'Claude for Small Business'가 그 흐름을 굳혔습니다. QuickBooks·HubSpot·Google Workspace와 직접 통합되는 SMB 번들로, '모델 API를 쓰세요'가 아니라 '여러분의 회계·CRM·문서 안에서 Claude가 일합니다'라는 메시지입니다. 엔터프라이즈 영업이 모델 성능 경쟁이 아니라 워크플로우 점유율 싸움임을 정확히 짚은 제품 설계입니다.
| 항목 | Anthropic | OpenAI |
|---|---|---|
| 엔터프라이즈 점유율(전년 대비) | 약 4배 증가(보도 인용) | 정체 |
| SMB 통합 전략 | QuickBooks·HubSpot·Workspace에 박힘 | 슈퍼앱·개인금융으로 컨슈머 락인 |
모델 벤치마크 1등이 시장 1등은 아니다. 이번 사이클의 가장 비싼 교훈입니다.
순위 데이터도 같은 이야기를 합니다. Artificial Analysis 종합지수 기준으로 GPT-5.5(xhigh)가 100점으로 선두를 지키지만, Claude Opus 4.7이 95점으로 Gemini 3.1 Pro와 어깨를 나란히 하면서 '종합 1위'와 '기업 1위'가 다른 회사인 시대가 굳어졌습니다. 한국 SaaS 기업이 'OpenAI 한 군데'를 표준으로 잡던 시기는 끝났다고 봐야 합니다. 다음 갱신 협상에서 멀티 벤더 카드를 꺼내지 않는 IT 책임자는 비용을 흘리는 사람입니다.
검증 노트: 인용된 '약 4배' 수치는 보도 매체가 출처를 두루뭉술하게 표기해 원조사 기관(예: Menlo Ventures Enterprise LLM Report 등)과 측정 단위(API 사용량 vs 매출 vs 계약 수)가 본문상 확인되지 않습니다. 사내 인용 시 1차 보고서 교차 확인 권장.
출처: TechCrunch 2026-05-13 Claude for Small Business 출시 및 점유율 인용 · MarketingProfs AI Update 2026-05-15 엔터프라이즈 LLM 사용 조사 인용 · /rankings (Artificial Analysis 종합지수)
3. 한국 LLM 판이 진짜로 바뀌고 있다
토종 LLM이 '연구 시연'에서 '상용 경쟁' 단계로 넘어갔다는 사실은 의외로 조용히 도착했습니다. 과기정통부 '독자 AI 파운데이션 모델' 사업으로 추정되는 정부 주도 프로그램의 첫 결과물이 공개됐고(주관 부처·정확한 사업명·참여 컨소시엄은 인용 매체에 단정적으로 적혀 있지 않음), 거의 동시에 SK텔레콤이 5000억 파라미터급 신규 모델을 예고한 것으로 보도됐습니다. 두 흐름이 한 시점에 동시 가시화된 건 처음입니다.
핵심은 파라미터 수가 아닙니다. 두 흐름 모두 '한국어 특화'를 전면에 내세우면서, GPT-5.5·Claude Opus 4.7의 한국어 성능과 정면으로 비교당할 자리에 올랐다는 점입니다. 그동안 토종 모델은 '국산이라 의미 있다'는 정성적 평가로 보호받았지만, 이제는 같은 벤치마크 위에서 점수로 평가됩니다.
정부 예산이 들어간 모델이 글로벌 최상위와 비교당하는 첫 사이클. 결과가 나쁘면 과기정통부 'AI 반도체·국산 AI 파운데이션 모델' 예산 라인과 IITP(정보통신기획평가원)가 집행하는 후속 R&D 라운드가 바로 흔들립니다. 익명의 '예산'이 아니라, 내년도 예산안 심사 때 국회 과방위 테이블에 올라갈 구체적 항목입니다.
비판적으로 볼 지점도 명확합니다. 5000억 파라미터는 글로벌 프런티어와 비교하면 중상위권이며, '한국어 1등'이 자동으로 '한국 시장 1등'을 의미하지 않습니다. 기업 고객은 모델 한국어 점수보다 SaaS 통합·관리·과금·보안을 봅니다. Anthropic이 이번 사이클에 입증한 바로 그 지점입니다.
검증 노트: SKT 5000억 파라미터 모델 예고와 정부 독자 파운데이션 모델 첫 결과물 모두 큐레이션 매체(BetaAI Substack, 한국AI융합교육협회 데일리)를 통해 전해진 것으로, SKT 공식 보도자료·연합뉴스·전자신문 등 1차 출처 교차 확인 후 인용 권장.
출처: BetaAI Substack 2026-05 SKT 신규 LLM 예고 큐레이션 · 한국AI융합교육협회 데일리 AI 뉴스 2026-05-10 정부 파운데이션 모델 첫 결과물 소개
4. '자가개선 AI'는 더 이상 연구실 단어가 아니다
자가개선 AI를 '먼 미래의 안전 논의'로 미뤄둔 사람이라면 시간표를 당겨야 합니다. 스텔스에서 나온 Recursive Superintelligence가 6억 5천만 달러 규모 라운드를 유치한 것으로 보도됐고, Adaption이라는 회사가 모델이 스스로를 학습시키는 'AutoScientist'를 공개했다는 보도가 같은 며칠에 함께 나왔습니다. 자본과 제품이 동시에 움직였다는 점이 결정적입니다.
'AI가 AI를 만든다'는 명제가 안전 콘퍼런스 패널에서 IR 자료로 옮겨갔습니다.
순위표가 일부 뒷받침합니다. 최근 사이클에서 가장 큰 폭으로 오른 DeepSeek V4 Flash(+3점)와 신규 진입한 Grok 4.3은 모두 '학습 파이프라인 자동화'를 핵심에 둔 것으로 알려진 모델입니다. 다만 +3점 상승의 원인이 실제로 자가개선·자동화 기법이라는 점을 직접 입증하는 DeepSeek 공식 기술 보고서는 아직 공개되지 않았고, 학습 비용 절감률·평가 자동화 비율 같은 추가 정량 신호도 본문상 확인되지 않습니다. 현재 시점의 정량 신호는 사실상 점수 1개뿐입니다. 자가개선이 IR 슬라이드를 넘어 벤치마크 곡선에 본격 반영된다고 단정하기엔 이르고, 다음 분기 학습비용·평가 자동화 수치가 나올 때까지는 '신호 하나 잡힌 단계'로 두는 게 정확합니다.
업계 통념은 '자가개선은 위험하니 연구는 천천히'였습니다. 그러나 실제 자본의 답은 정반대였습니다. 위험하니까 먼저 깃발을 꽂자는 쪽입니다. 한국 기업·정책에 던지는 함의는 단순합니다. 자가개선 모델이 표준이 되면 1년 단위 모델 교체 주기가 분기 단위로 짧아지고, 그 속도에 맞춘 거버넌스를 가진 조직만 살아남습니다.
검증 노트: Adaption / AutoScientist는 일반에 거의 알려지지 않은 명칭으로, 공식 사이트·보도자료 1차 확인 전까지는 회사명·제품명 오기 가능성 존재. Recursive Superintelligence 6.5억 달러 건도 정확한 기사 URL과 SEC 파일링 교차 확인 후 사내 자료 인용 권장.
출처: TechCrunch 2026-05-14 Recursive Superintelligence 투자 라운드 보도 · TechCrunch 2026-05-13 Adaption AutoScientist 공개 보도
에디터 한마디
이번 사이클의 네 뉴스를 묶으면 'AI 1등 자리가 영토별로 쪼개졌다'는 한 줄이 됩니다. 컨슈머는 OpenAI가 결제·브라우저·금융 데이터로 락인 우회 중, 엔터프라이즈는 Anthropic이 워크플로우 통합으로 가져갔고, 한국어는 토종 모델이 첫 비교 무대에 올랐으며, 연구 프런티어는 자가개선 스타트업으로 자본이 옮겨갔습니다. 그래서 던질 질문은 두 가지입니다. 하나, 당신 조직이 'AI 표준 벤더'를 한 곳으로 묶어두고 있다면, 다음 갱신 협상에서 무엇을 잃고 있는지 숫자로 적어 보세요. 둘, 자가개선 모델이 분기 단위로 교체되는 시대가 정말 오면, 지금의 1년짜리 보안·법무 리뷰 사이클은 그대로 작동하나요? 이 두 질문이 다음 분기 IT 예산서와 컴플라이언스 검토표에 들어가야 할 항목입니다.
자주 묻는 질문 (FAQ)
ChatGPT 개인금융 도구는 한국에서도 바로 쓸 수 있나요?
현재 미국 ChatGPT Pro 사용자 대상 프리뷰로 보도됐습니다. 미국 은행 계좌 연동이 전제라서 국내 즉시 사용은 불가능하며, 한국 출시 일정은 공개되지 않았습니다. 다만 1~2년 안에 마이데이터 2단계 확대·신용정보법 개정 논의와 맞물려 한국에서도 'AI에게 금융 데이터를 어디까지 줄 것인가'가 실제 의사결정으로 들어옵니다.
Anthropic이 엔터프라이즈에서 OpenAI를 추월했다면 우리 회사도 갈아타야 하나요?
모델 점수가 아니라 워크플로우 적합도로 봐야 합니다. QuickBooks·HubSpot·Google Workspace를 쓰는 SMB라면 Claude for Small Business가 즉시 효과를 줍니다. 반면 ChatGPT 기반 사내 도구를 이미 깐 조직은 단순 교체보다 멀티 벤더 구성으로 가는 게 비용·협상력 모두에 유리합니다.
한국 독자 파운데이션 모델이 GPT-5.5나 Claude Opus 4.7을 따라잡을 수 있나요?
종합 성능에서 따라잡기는 어렵지만, 한국어 특화 영역에서는 충분히 경쟁 가능합니다. 보도된 5000억 파라미터급 모델이 사실이라면 글로벌 중상위권이며, 정부·공공·금융처럼 데이터 주권이 중요한 영역에서 우위가 있습니다. 다만 SaaS 통합·관리·보안 수준이 글로벌 수준에 못 미치면 시장 점유로 이어지지 않습니다.
David Lee
Moket Editor
