[AI 최신 트렌드] / AI 트렌드 | 4월 21일 : Gemini 크롬 확장, Fortnite AI 캐릭터, AI 동료 복제, Spark 2.0, 출력 다양성 붕괴.md

AI 트렌드 | 4월 21일 : Gemini 크롬 확장, Fortnite AI 캐릭터, AI 동료 복제, Spark 2.0, 출력 다양성 붕괴

조회

2026년 4월 21일 | AI 최신 트렌드


2026년 4월 21일 메모 | 모델 점수표보다 브라우저·게임·회사·웹 3D·후학습처럼 AI가 실제 표면과 부딪히는 장면들만 골랐다.

4월 21일 후보군을 다시 훑어보니 공통축이 꽤 또렷했다. GoogleGemini를 크롬 안으로 더 넓게 밀어 넣고 있었고, Epic Games는 게임 안 캐릭터를 대화형 AI로 바꾸는 실험을 본격화하고 있었다. 회사 안쪽으로 들어가면 더 날카롭다. 중국 테크 업계에서는 동료의 업무 스타일을 AI 스킬로 증류하려는 분위기가 기사로 올라왔고, 웹 그래픽 쪽에서는 World Labs의 Spark 2.0이 브라우저에서 초대형 3D 장면을 스트리밍하는 길을 열고 있었다.

연구 쪽에서 눈에 들어온 건 후학습 이후 출력 다양성 붕괴를 추적한 새 논문이었다. 요즘은 모델을 더 잘 정렬하고 더 말 잘 듣게 만드는 일이 거의 기본값처럼 여겨지는데, 그 과정이 오히려 샘플 다양성테스트타임 탐색 여지를 깎아 먹을 수 있다는 이야기다. 오늘 다섯 건을 한 줄로 묶으면 이렇다. AI는 더 이상 챗봇 창 안에서만 경쟁하지 않고, 브라우저와 게임과 회사와 시각 인터페이스로 퍼져 나가면서 동시에 모델 내부의 성질까지 다시 문제 삼기 시작했다.

1. 먼저 잡히는 장면: 오늘 다섯 건을 한 표로 묶어 보면

주제 무슨 변화인가 왜 눈여겨볼 만한가
Gemini in Chrome 브라우저 안 AI 도우미가 한국 포함 7개국으로 더 넓게 배포됐다. AI가 별도 앱을 넘어 기본 브라우저 경험으로 스며드는 속도를 보여 준다.
Fortnite AI 캐릭터 개발자가 플레이어와 대화하는 AI NPC를 직접 만들 수 있는 실험 도구가 열렸다. 게임 속 캐릭터가 고정 대사 중심 구조에서 실시간 상호작용 표면으로 바뀌기 시작한다.
AI 동료 복제 직원의 업무 방식과 말투를 AI 스킬처럼 증류하려는 압박이 기사화됐다. AI 도입이 해고 공포를 넘어 조직 내부의 역할 정의 자체를 흔드는 단계로 간다.
Spark 2.0 초대형 3D Gaussian Splatting 장면을 웹에서 스트리밍하는 오픈소스 엔진이 공개됐다. 공간지능과 생성형 3D가 데모를 넘어 브라우저 배포 층으로 내려온다.
출력 다양성 붕괴 후학습 단계에 따라 모델의 답변 다양성이 어디서 줄어드는지 분해해 봤다. 정렬과 성능 향상만 보던 시선에 샘플 다양성과 탐색 여지라는 비용 항목을 다시 붙인다.

이 표만 봐도 오늘의 핵심은 분명하다. 하나는 AI가 실제 인터페이스 표면으로 얼마나 빨리 내려오고 있는가이고, 다른 하나는 그렇게 배포가 빨라질수록 사람의 역할과 모델의 내부 성질을 어떤 방식으로 다시 읽어야 하는가다. 아래 다섯 건은 그 압력을 서로 다른 층에서 보여 준다.

2. Gemini in Chrome: 브라우저 기본 경험으로 들어오는 AI

Gemini in Chrome 관련 TechCrunch 이미지

TechCrunch 이미지: Gemini는 별도 탭의 챗봇을 넘어 크롬 브라우저 안의 기본 보조 계층으로 더 넓게 배포되고 있다.

TechCrunch에 따르면 Gemini in Chrome은 한국을 포함한 7개국으로 배포 범위를 넓혔다. 데스크톱과 iOS에 모두 확장되지만 일본은 예외적으로 데스크톱만 먼저 열렸고, 이미 미국에서 열려 있던 기능이 호주·인도네시아·일본·필리핀·싱가포르·한국·베트남으로 내려왔다. 단순한 지역 확대처럼 보여도, 실제로는 "AI를 어디에 둘 것인가"에 대한 Google의 답이 더 선명해진 셈이다.

기사에서 흥미로운 부분은 이 기능이 그냥 옆에 떠 있는 요약창이 아니라는 점이다. 탭을 넘나들며 질문에 답하는 사이드바형 보조자 역할을 하고, Gmail·Google Photos·Calendar·Maps와 연결되는 개인화 답변까지 크롬 안으로 끌어온다. 일정 잡기, 위치 확인, 메일 초안 작성처럼 원래는 서비스별 앱을 오가야 하던 일을 브라우저 레벨에서 묶겠다는 방향이다. 그리고 브라우저를 대신 조작해 작업을 끝내는 agentic feature는 아직 미국 유료 플랜에서만 시험 중이라, 지역 확장과 자동화 권한 확장을 분리해서 가져가는 점도 보인다.

나는 이 소식이 모델 성능 뉴스보다 더 실질적으로 느껴졌다. 대부분의 사람은 AI를 논문 이름보다 기본 브라우저, 기본 검색, 기본 메일 흐름에서 먼저 만난다. 그래서 Gemini in Chrome 확대는 "Google도 AI가 중요하다"는 선언보다, AI가 점점 더 설치돼 있는 인터페이스의 기본값으로 들어가고 있다는 신호에 가깝다. 이 층에서 자리를 잡으면 사용자는 별도로 앱을 열었다는 감각 없이 AI를 쓰게 된다.

3. Fortnite AI 캐릭터: NPC가 고정 대사에서 실시간 상호작용으로 넘어갈 때

Fortnite AI 캐릭터 관련 The Verge 이미지

The Verge 이미지: Fortnite 개발자는 이제 대화형 AI 캐릭터를 실험할 수 있지만, 캐릭터 역할과 관계 범위는 꽤 강하게 제한된다.

The VergeEpic Games가 Fortnite 창작자에게 "conversations" 도구를 열어 주면서, 플레이어가 말 걸고 상호작용할 수 있는 AI 캐릭터를 시험할 수 있게 됐다고 전했다. 기사 서두가 굳이 지난해의 "욕설하던 AI Darth Vader" 사건을 다시 꺼낸 이유도 분명하다. 이제 게임 안 대화형 캐릭터는 기술 데모가 아니라, 실제 사용자 접점으로 밀어 넣는 단계에 들어가고 있기 때문이다.

동시에 안전 규칙도 굉장히 구체적이다. Epic은 개발자가 의료나 정신건강 조언을 하는 캐릭터를 만들지 못하게 했고, 더 직접적으로는 데이트 상대나 로맨틱 파트너, 친밀한 동반자 역할을 흉내 내는 캐릭터도 금지했다. 우회적으로 안전장치를 뚫도록 설계하는 것 역시 규정 위반으로 못 박았다. 즉 Epic은 "AI NPC를 열겠다"고 말하면서도, 어디까지를 허용 가능한 상호작용으로 볼 것인지를 먼저 그어 두고 있다.

이게 중요한 이유는 게임이 AI와 가장 잘 맞는 표면 중 하나이기 때문이다. 캐릭터는 원래부터 대화와 역할극과 세계관을 품고 있었고, 플레이어는 이미 그 안에서 반응하고 몰입한다. 다만 실제 배포 단계로 내려오면 곧바로 관계 시뮬레이션, 미성년자 안전, 콘텐츠 통제 문제가 붙는다. 그래서 Fortnite의 이번 실험은 단순한 게임 AI 뉴스보다, 대화형 캐릭터가 어디까지 상품화될 수 있는가를 플랫폼 규칙 안에서 시험하는 장면으로 읽혔다.

4. AI 동료 복제: 자동화 압박이 조직 안쪽 역할 정의를 흔드는 방식

중국 테크 업계 AI 동료 복제 관련 MIT Technology Review 이미지

MIT Technology Review 이미지: 동료의 말투와 업무 방식을 AI 스킬로 만들려는 상상은 웃긴 밈처럼 보이지만, 실제 조직에서는 꽤 불편한 현실과 닿아 있다.

MIT Technology Review는 중국 테크 업계에서 화제가 된 Colleague Skill 프로젝트를 통해, 직원들이 자기 자신이나 동료의 업무 방식을 재사용 가능한 AI 스킬처럼 정리하도록 압박받고 있다고 전했다. 원래는 풍자에 가까운 GitHub 프로젝트였지만, 반응은 웃고 끝나는 쪽이 아니었다. 기사에 따르면 일부 관리자는 실제로 직원들에게 작업 흐름을 문서화해 자동화 가능한 단위로 쪼개라고 요구하고 있고, 그 배경에는 OpenClawClaude Code 같은 에이전트 도구의 빠른 확산이 있다.

프로젝트의 발상이 묘하게 섬뜩한 건 단지 생산성 때문만은 아니다. 이름, 기본 프로필, 채팅 기록, 파일 같은 재료를 모아 두면 어떤 사람이 코드를 어떻게 디버깅하고, 어떤 말투를 쓰고, 어떤 습관으로 반응하는지까지 AI 에이전트가 흉내 내게 만들 수 있다는 상상 때문이다. 기사 속 인터뷰에서는 실제로 이 도구가 동료의 말버릇과 구두점 습관까지 꽤 잘 따라 한다는 반응이 나온다. 업무 자동화가 이제는 단순 반복 작업이 아니라 개인의 일 스타일 자체를 추출 가능한 자산처럼 다루기 시작한 셈이다.

나는 이 기사가 꽤 오래 남았다. AI 도입 뉴스가 보통은 감원, 생산성, 비용 절감 같은 숫자로 정리되는데, 이 기사에서는 더 불편한 층이 올라온다. 사람은 그냥 업무 절차만 수행하는 기계가 아니라 맥락을 읽고, 모호함을 견디고, 사소한 뉘앙스를 축적하는 존재인데, 조직은 그것조차 템플릿과 스킬로 뽑아내고 싶어 한다. AI가 조직 안으로 깊게 들어갈수록 앞으로 더 자주 부딪힐 질문은 성능보다도 무엇이 자동화 가능한 업무이고 무엇이 사람의 고유한 역할인가일 가능성이 크다.

5. Spark 2.0: 공간지능이 웹 브라우저 배포 층으로 내려오는 방식

Spark 2.0 관련 AI타임스 이미지

AI타임스 이미지 프록시: Spark 2.0은 초대형 3D Gaussian Splatting 장면을 웹과 모바일, VR에서 스트리밍하는 오픈소스 엔진으로 소개됐다.

AI타임스와 연결된 GitHub 저장소를 보면, World Labs가 공개한 Spark 2.0의 핵심은 "초대형 3D Gaussian Splatting 장면을 웹에서 다루는 법"에 있다. 기사에 따르면 이 엔진은 모바일 기기와 VR 헤드셋까지 포함한 환경에서 수천만~수억 단위의 3D 데이터를 실시간으로 스트리밍하는 데 초점을 맞췄다. 공간지능이나 생성형 3D 얘기는 많이 들었지만, 정작 그 결과물을 어디서 보여 주고 어떻게 배포할지는 늘 뒤로 밀렸는데, Spark 2.0은 그 문제를 정면에서 건드린다.

설계 포인트도 꽤 구체적이다. 기사 기준으로는 LoD 트리로 사용자의 시점과 거리, 움직임에 맞게 데이터양을 조절하고, .RAD 기반 점진적 스트리밍으로 장면 전체를 다 받기 전에 대략적인 모습부터 보여 준다. 여기에 GPU 가상 메모리 구조를 더해 메모리가 부족한 환경에서도 필요한 데이터만 교체하며 불러온다. 결과적으로 1억개 이상 스플랫을 웹 환경에서 스트리밍할 수 있고, 실제 데모에서는 4000만개 이상 스플랫으로 구성된 장면도 원활하게 돌아갔다고 한다.

이 소식이 반가운 이유는, 생성형 AI의 시각 결과물이 이제 2D 이미지나 짧은 비디오를 넘어 조작 가능한 공간으로 이동하고 있기 때문이다. 그런 순간에는 모델 성능보다 렌더링 엔진, 전송 형식, 브라우저 호환성이 훨씬 중요해진다. Spark 2.0은 바로 그 배포층을 노리는 뉴스였다. 공간지능이 정말 보편적 인터페이스가 되려면, 연구실 데모가 아니라 웹에서 바로 열리고, 모바일에서 버티고, VR에서도 돌아가는 표면이 필요하다. 이 프로젝트는 그쪽으로 한 단계 더 내려온 느낌이 강했다.

6. 출력 다양성 붕괴 논문: 후학습은 어디서 모델의 답변 폭을 줄이는가

출력 다양성 붕괴 논문의 단계별 다양성 비교 그림

논문 Figure 2: Think 계열은 SFT에서, Instruct 계열은 DPO에서 다양성 하락이 크게 나타난다는 결과를 요약한다.

arXiv에 올라온 "Where does output diversity collapse in post-training?"는 요즘 후학습 논의에서 잘 안 보이던 질문을 정면으로 던진다. 모델을 더 유용하고 더 안전하고 더 말 잘 듣게 만들수록, 실제로는 답변의 폭이 얼마나 줄어드는가를 단계별로 따라가 본 것이다. 저자들은 Olmo 3 계열의 병렬 체크포인트를 활용해 Think, Instruct, RL-Zero 세 계열을 비교했고, 15개 과제와 여러 다양성 지표로 후학습의 어느 단계에서 폭이 줄어드는지 추적했다.

재미있는 지점은 결과가 "후학습은 원래 다양성을 죽인다" 수준으로 뭉뚱그려지지 않는다는 데 있다. Figure 2 설명대로 Think 계열은 SFT 단계에서, Instruct 계열은 DPO 단계에서 다양성 하락이 더 크게 나타났다. 즉 붕괴가 한 가지 알고리즘 때문이 아니라, 어떤 데이터 조합으로 어떤 후학습 경로를 밟았는가에 따라 위치가 달라진다는 이야기다. 게다가 Think 모델에서 추론 시 CoT를 숨겨도 다양성이 회복되지 않았고 정확도만 떨어졌다는 결과는, 문제의 일부가 출력 형식이 아니라 이미 모델 가중치 안에 박혀 있다는 해석으로 이어진다.

이 논문이 실무적으로 중요한 이유는 요즘 다들 self-consistency, pass@k, test-time compute scaling 같은 탐색형 기법을 더 자주 이야기하기 때문이다. 그런 기법은 결국 여러 개의 충분히 다른 후보가 나와야 힘을 받는데, 후학습이 그 후보 공간을 미리 좁혀 버리면 점수표 뒤에서 잃는 것도 생긴다. 모델을 더 정렬하고 더 예측 가능하게 만드는 일은 분명 필요하지만, 동시에 정답률 향상과 출력 폭 축소를 어떤 비율로 교환하고 있는지도 이제는 같이 봐야 한다는 메시지로 읽혔다.

7. 같이 보면: AI가 현실 표면으로 내려올수록 더 중요해지는 질문들

오늘 다섯 건을 같이 놓고 보면, AI 경쟁의 중심이 더 분명하게 바깥으로 이동하고 있다. Gemini in Chrome은 브라우저를 통해 기본 경험을 먹으려 하고, Fortnite는 캐릭터를 실시간 대화 표면으로 바꾸려 하며, Colleague Skill 류의 이야기는 회사 안에서 사람의 역할을 다시 정의하게 만든다. Spark 2.0은 공간지능의 결과물을 웹 배포층으로 끌어내리고, 마지막으로 출력 다양성 붕괴 논문은 그런 모든 변화의 엔진이 되는 모델 내부 성질을 다시 점검하라고 말한다.

예전에는 AI 트렌드 정리를 할 때 새 모델 이름과 벤치마크 숫자를 중심에 놓아도 하루치 그림이 그려졌다. 그런데 지금은 그 바깥층이 더 빨리 움직인다. 어디에 배포되는가, 누가 상호작용을 통제하는가, 어떤 업무가 템플릿으로 환원되는가, 결과물이 어떤 표면에서 재생되는가, 후학습의 비용이 무엇인가. 오늘 뉴스는 이 질문들이 이제 부가 항목이 아니라 AI를 읽는 기본 질문이 되어 가고 있다는 걸 꽤 선명하게 보여 줬다.

당분간은 모델 성능 자체보다도 어떤 인터페이스가 기본값이 되는지, 그 과정에서 사람의 역할이 어떻게 재편되는지, 그리고 정렬된 모델이 무엇을 잃는지를 같이 봐야 할 것 같다. 4월 21일 뉴스는 그 세 층이 한꺼번에 움직이는 날에 가까웠다.

출처

댓글

홈으로 돌아가기

검색 결과

"" 검색 결과입니다.