[AI 최신 트렌드] / AI 트렌드 | 4월 24일 : GPT-5.5, Claude 개인 앱 커넥터, 오피스 Agent Mode, 고객지원 M&A, DiLoCo.md

AI 트렌드 | 4월 24일 : GPT-5.5, Claude 개인 앱 커넥터, 오피스 Agent Mode, 고객지원 M&A, DiLoCo

조회

2026년 4월 24일 | AI 최신 트렌드


GPT-5.5 공개, Claude의 개인 앱 연결, Microsoft 오피스 안의 Agent Mode, 고객지원 에이전트 시장의 인수전, 그리고 Decoupled DiLoCo까지 이어서 보면, 모델 성능표보다 AI가 실제 소프트웨어와 업무 표면에 어떻게 붙는가가 더 크게 보인 날이었다.

내가 이번 묶음에서 특히 눈여겨본 건 다섯 가지다. 모델은 더 많은 일을 끝까지 맡기려는 방향으로 가고 있고, 앱 연결은 업무용에서 개인용으로 넓어지고, 문서 도구는 채팅창이 아니라 편집기 자체가 에이전트 표면이 되고 있다. 거기에 시장 쪽에서는 워크플로 통합 역량을 사들이는 움직임이 붙고, 인프라 쪽에서는 멀리 떨어진 데이터센터를 한 학습장처럼 묶으려는 시도가 나온다. 각각 따로 보면 뉴스인데, 같이 놓으면 AI 산업의 무게중심이 꽤 선명하다.

1. GPT-5.5: 더 높은 점수보다 "끝까지 맡길 수 있는 모델"을 전면에 내세우기

GPT-5.5 관련 기사 대표 이미지

Figure 1: GPT-5.5 공개를 다룬 커버 이미지

OpenAI 공개 글을 읽어보면, GPT-5.5의 포인트는 단순히 "더 똑똑하다"에서 끝나지 않는다. OpenAI는 이 모델을 코드 작성과 디버깅, 온라인 리서치, 데이터 분석, 문서와 스프레드시트 작성, 소프트웨어 조작처럼 도구를 넘나들며 작업을 마무리하는 모델로 설명했다. 내 눈에는 이 표현이 중요했다. 이제 모델 소개 문구가 채팅 품질보다 업무 완결성 쪽으로 이동하고 있기 때문이다.

수치도 그 방향을 뒷받침한다. 공개 문서 기준으로 GPT-5.5는 Terminal-Bench 2.0에서 82.7%를 기록했고, GPT-5.4의 75.1%를 넘어섰다. SWE-Bench Pro는 58.6%까지 올라왔고, 같은 Codex 작업을 더 적은 토큰으로 끝내면서도 실서비스에서는 GPT-5.4와 비슷한 per-token latency를 유지한다고 밝혔다. 외부 보도까지 같이 보면, 이번 업데이트의 핵심은 최고 점수 자랑이라기보다 에이전트형 코딩과 지식노동에서 품질과 비용을 동시에 맞추려는 시도에 가깝다. Plus·Pro·Business·Enterprise에 먼저 풀고 API는 보호장치 조건을 더 본 뒤 내놓겠다는 일정도, 이제는 모델 하나를 바로 범용 API로 뿌리기보다 운영 리스크까지 같이 묶어 보는 흐름으로 읽힌다.

2. Claude 개인 앱 커넥터: 업무 도구를 넘어서 생활 앱까지 들어오는 에이전트

Claude 개인 앱 커넥터 관련 이미지

Figure 2: Claude가 개인용 앱 커넥터를 넓히는 흐름

The Verge 보도에 따르면 Anthropic은 Claude의 앱 연결 범위를 Spotify, Uber, AllTrails, TripAdvisor, Instacart, TurboTax 같은 개인 생활 앱까지 넓혔다. 기존에 Microsoft 365 같은 업무 앱 연결이 먼저 붙었다면, 이번에는 추천·이동·세금·식료품 같은 일상 쪽으로 확장된 셈이다. 모든 Claude 요금제에서 쓸 수 있고 모바일은 베타라고 하니, 실험 단계이긴 해도 방향은 분명하다.

여기서 내가 중요하게 본 건 단순 연결 개수보다 행동 구조다. 기사에 따르면 Claude는 연결된 앱 가운데 상황에 맞는 후보를 제안하고, 구매나 예약처럼 실제 행동이 필요한 경우에는 사용자의 재확인을 받는다. 이건 결국 에이전트가 검색창 바깥으로 나와 생활 OS의 얇은 조정층이 되려는 움직임이다. 어제 트렌드에서 워크스페이스 에이전트가 보였다면, 하루 만에 그 반대편에서는 개인 앱 에이전트가 붙는다. 일과 생활 양쪽에서 같은 경쟁이 벌어지고 있다는 뜻이다.

3. Microsoft Agent Mode: 오피스 안에서 채팅보다 편집기가 먼저 에이전트 표면이 되기

Microsoft Office Agent Mode 관련 이미지

Figure 3: Word·Excel·PowerPoint 안으로 들어온 Agent Mode

The Verge 기사를 보면 Microsoft는 Word, Excel, PowerPoint에서 쓰는 Copilot의 Agent Mode를 더 전면으로 밀고 있다. Microsoft 365 Copilot과 Premium 구독자에게는 이제 이 모드가 기본값처럼 들어가고, 회사 표현대로는 예전 채팅형 Copilot보다 더 강한 실행형 편집기에 가깝다. 나는 이런 변화가 꽤 현실적이라고 본다. 많은 사용자는 새 AI 앱을 배우기보다 원래 쓰던 편집기 안에서 일이 줄어드는 쪽에 더 빨리 반응하기 때문이다.

구현 방식도 흥미롭다. 사이드바에서 Copilot이 어떤 단계를 밟는지 실시간으로 보여 주고, Excel에서는 수식과 표를 직접 바꾸고, PowerPoint에서는 회사 템플릿 스타일을 유지한 채 기존 덱을 업데이트한다. 이건 더 이상 "문서에 대해 대화하는 AI"가 아니라 문서를 손대는 AI다. 생산성 툴 경쟁이 챗 UI 경쟁으로 보일 때도 많았는데, 실제로는 이렇게 기존 업무 표면 안에서 수정 권한을 어디까지 줄 수 있느냐가 더 중요한 싸움이 되고 있다.

4. Sierra의 Fragment 인수: 고객지원 에이전트 시장이 워크플로 통합력 쪽으로 좁혀지기

Sierra 인수 관련 기사 대표 이미지

Figure 4: Sierra의 Fragment 인수 소식이 보여 주는 고객지원 에이전트 시장 재편

TechCrunch 보도에 따르면 Bret Taylor의 Sierra는 YC 출신 프랑스 스타트업 Fragment를 인수했다. Fragment는 기업이 AI를 기존 워크플로에 붙이는 일을 돕는 팀이고, 이번 인수는 Sierra의 세 번째 공개 인수다. 앞서 Opera Tech, Receptive AI를 사들였고 이번에 Fragment까지 더했다. 에이전트 회사가 모델 성능만으로 경쟁하지 않고 통합, 음성, 지역 솔루션, 실행 레이어를 사 모으는 그림이 점점 더 노골적으로 보인다.

고객지원 시장은 특히 이런 흐름이 빨리 드러나는 곳이다. 이유가 단순하다. 실제 배포에서 중요한 건 답변 한 줄의 품질만이 아니라, CRM과 연결되느냐, 업무 단계를 얼마나 안전하게 자동화하느냐, 콜과 채팅과 후처리를 한 플랫폼에서 묶을 수 있느냐이기 때문이다. 그래서 Sierra의 행보는 작은 M&A 뉴스라기보다, 고객지원 에이전트 시장이 모델 전쟁에서 워크플로 전쟁으로 옮겨간다는 신호에 가깝다.

5. Decoupled DiLoCo: 멀리 떨어진 데이터센터를 한 학습장처럼 쓰려는 인프라 감각

Decoupled DiLoCo 관련 이미지

Figure 5: Google DeepMind가 소개한 Decoupled DiLoCo 개념 이미지

Google DeepMind 블로그는 4월 23일 Decoupled DiLoCo를 소개했다. 핵심은 frontier 모델 학습을 하나의 초밀착 동기화 클러스터에만 묶지 않고, 여러 계산 섬을 비동기 데이터 흐름으로 연결해 낮은 대역폭에서도 견디는 분산 학습 구조를 만들겠다는 것이다. 설명대로라면 로컬 장애가 나도 다른 구역이 계속 학습을 이어 갈 수 있고, 멀리 떨어진 데이터센터까지 학습 자원으로 엮는 쪽에 더 가까워진다.

이런 글은 숫자보다 방향이 더 중요하다. 추론 쪽은 이미 전 세계 서비스 표면과 가까운 곳으로 퍼지고 있는데, 학습 쪽도 결국 같은 압력을 받는다. 동기화 비용이 너무 큰 구조만 고집하면 거리와 전력과 장애 복원력이 발목을 잡기 쉽다. Decoupled DiLoCo가 흥미로운 이유는 칩 하나의 속도보다, 멀리 떨어진 인프라를 어떻게 한 시스템처럼 다룰 것인가를 정면에서 건드렸기 때문이다. 모델이 앱과 문서와 서비스 안으로 더 깊게 들어갈수록, 뒤쪽의 학습 인프라도 이런 식으로 더 유연해질 가능성이 커 보인다.

6. 한 줄로 묶어 보면: AI는 모델 경쟁에서 작동 표면 경쟁으로 이동 중

이번 다섯 가지를 같이 놓고 보면 공통분모가 꽤 명확하다. GPT-5.5는 더 오래 맡길 수 있는 모델을 내세웠고, Claude는 개인 앱에 붙는 에이전트로 넓어졌고, Microsoft는 문서 편집기 자체를 에이전트 표면으로 밀고 있다. Sierra는 실행 워크플로를 사들이는 쪽으로 가고, DeepMind는 멀리 떨어진 인프라를 묶는 학습 구조를 꺼냈다. 결국 앞단의 제품 표면과 뒷단의 시스템 구조가 동시에 바뀌고 있다.

나는 당분간 AI 뉴스를 볼 때 새 모델 이름보다도 어디에 붙는가, 무엇을 직접 수정하는가, 어떤 워크플로를 흡수하는가, 그걸 받치는 인프라가 어떤 모양으로 재편되는가를 먼저 보게 될 것 같다. 점수표는 여전히 중요하지만, 시장이 실제로 돈을 쓰는 지점은 점점 더 그 바깥에서 결정되고 있다.

7. 다음 며칠 체크포인트

내가 여기서 바로 이어서 볼 포인트도 분명하다. GPT-5.5는 API 공개 시점과 가격이 붙는 순간 평가가 더 현실적으로 바뀔 가능성이 크고, Claude 개인 앱 커넥터는 추천에서 실제 구매·예약 실행까지 어디까지 허용할지가 관건이다. Microsoft Agent Mode는 대기업 문서 워크플로 안에서 감사 로그와 권한 통제를 얼마나 잘 보여 주느냐가 중요해질 거고, Sierra 같은 회사는 결국 도입 속도보다 기존 시스템 접착력에서 승부가 날 가능성이 높다. DiLoCo 쪽은 논문과 후속 실험에서 글로벌 분산 학습의 실제 비용 절감 폭이 얼마나 검증되는지를 봐야 한다.

이 다섯 가지를 한 문장으로 줄이면, AI 업계는 지금 더 좋은 답변을 넘어 더 깊게 붙는 실행더 멀리 퍼지는 인프라를 동시에 만들고 있다. 당장 사용자에게 보이는 건 챗봇 한 줄 같아도, 뒤에서는 앱 연결, 편집 권한, 워크플로 통합, 학습 토폴로지까지 한꺼번에 다시 설계되는 중이다. 그래서 이런 날의 트렌드는 모델 출시 기사 하나만 읽는 것보다, 어느 표면에서 어떤 권한이 생겼는지를 같이 보는 편이 훨씬 덜 놓친다.

특히 4월 셋째 주까지는 새 기능이 어디에 붙는지가 주로 화두였다면, 4월 24일 묶음에서는 한 단계 더 나아가 그 기능이 실제로 일을 대신 끝내도록 만드는 조건이 같이 드러났다. 모델은 토큰 효율과 장기 작업 능력을 강조하고, 앱 커넥터는 행동 직전 검증을 붙이고, 오피스는 수정 과정을 가시화하고, 고객지원 스타트업은 통합 역량을 인수하고, 인프라는 장애를 흡수하는 학습 구조를 고민한다. 이제 경쟁 포인트가 성능 그 자체보다 신뢰 가능한 실행 체인으로 이동하는 느낌이 강하다.

출처

댓글

홈으로 돌아가기

검색 결과

"" 검색 결과입니다.