2026년 5월 19일 열린 구글 I/O 2026의 발표 전체를 9가지로 정리합니다. 모델 라인업, 24시간 일하는 개인 에이전트, 검색·워크스페이스의 변화, 가격 인하까지 어떤 등급에서 언제부터 쓸 수 있는지를 함께 짚습니다.
Sundar Pichai는 기조연설에서 "이제 사람들은 매일 쓰는 제품에서 AI의 가치를 직접 보고 싶어하는 단계에 들어왔다"라고 말했습니다. 그 단계를 채우기 위해 구글이 어떤 카드를 꺼냈는지 살펴보겠습니다.
1. 토큰 처리량 1년 만에 약 67배 — 거대해진 사용 규모
구글이 이번 I/O에서 가장 먼저 강조한 것은 모델이 아니라 사용량입니다.
월간 토큰 처리량: 2024년 9.7조 → 2025년 480조 → 2026년 3.2경 (전년 대비 약 67배)
분당 처리 능력: 190억 토큰
월 850만 명의 개발자가 구글 모델로 새 앱을 개발 중
연간 1조 토큰 이상을 처리하는 Google Cloud 고객사: 375개사
Gemini 앱 MAU는 1년 사이 4억 명에서 9억 명으로 두 배 이상이 되었고, 검색의 AI Overviews는 25억 MAU, AI Mode는 출시 1년 만에 10억 MAU에 도달했습니다. 이번 발표는 "AI 도입 곡선이 평탄해지는 게 아니라 더 가팔라지고 있다"라는 메시지를 깔고 시작합니다.
2. Gemini 3.5 Flash — 4배 빠르고 절반 가격, 즉시 출시
Gemini 3.5 Flash는 이번 I/O의 핵심 발표 모델입니다.
이전 세대 플래그십이었던 3.1 Pro를 거의 모든 벤치마크에서 초과
다른 프론티어 모델 대비 출력 속도 약 4배
가격은 동급 모델의 절반 이하 (약 40% 저렴)
1M 토큰 컨텍스트, 65k 최대 출력, 4단계 thinking 모드 지원
GDPval 코딩 벤치마크에서 큰 폭의 점수 상승
구글은 "기업이 워크로드의 80%를 3.5 Flash로 이동하면 연간 약 10억 달러를 절감할 수 있다"라는 추산까지 함께 공개했습니다. 코딩·에이전트·자동화처럼 대량 호출이 필요한 워크로드부터 옮길 만한 명분이 생긴 셈입니다.
발표와 동시에 일반 출시되었으며, 한 단계 위인 Gemini 3.5 Pro는 다음 달 출시 예정입니다.