Grok 4는 박사 수준이라고 불리며 월 300달러 구독 서비스를 제공
머스크는 공식적으로, Grok 4가 2025년 7월 9일에 xAI의 공식 계정을 통해 태평양 시간 밤 8시 라이브 방송으로 출시된다고 발표했습니다.

Grok 4는 Grok 3의 후속으로 개발되었으며, "3.5" 버전을 출시하지 않고 바로 도약했습니다. 이 모델은 주로 두 가지 버전으로 전개됩니다: 일반 Grok 4와 Grok 4 Heavy. “Heavy” 버전은 멀티 에이전트(multi-agent) 버전으로 높은 성능을 약속합니다. Grok 4의 주목할 만한 능력 중 하나는 멀티모달로, 이미지를 분석하면서 텍스트도 처리할 수 있어 ChatGPT나 Gemini와 같은 경쟁자와 유사합니다.
프레젠테이션에서 xAI는 Grok 4가 다양한 AI 벤치마크에서 최첨단 성능을 보였다고 주장합니다. 예를 들어, Humanity’s Last Exam이라는 수학, 인문학, 과학 능력을 측정하는 어려운 시험에서, Grok 4는 "도구" 없이 25.4%의 점수를 획득해 Google Gemini 2.5 Pro(21.6%)와 OpenAI의 o3 모델(21%)을 능가했습니다.
추가 "도구"를 사용한 경우에도 Grok 4 Heavy는 44.4%의 점수를 달성해 도구를 사용한 Gemini의 26.9%를 크게 앞섰습니다. 시각적 패턴 해결 능력을 평가하는 ARC-AGI-2 테스트에서도 Grok 4는 16.2%의 점수로 상업용 모델 중 신챔피언이 되었으며, 2위 모델(Claude Opus 4)의 거의 두 배 성적을 기록했습니다.
이 진보를 일론 머스크는 출시 행사에서 솔직히 요약했습니다. "학술 문제에 관해서는, Grok 4는 모든 과목에서 박사 수준 이상의 성능을 보입니다, 예외는 없습니다"라고 말했습니다.
머스크는 여전히 존재하는 약점도 인정했습니다. 예를 들어 때때로 Grok는 상식적 판단이 부족하거나 스스로 새로운 기술을 창출하지 못하는 점 등이지만, 이는 시간 문제라고 확신하고 있습니다. 지능 향상 외에도, xAI의 향후 제품 로드맵에는 8월 출시 예정인 코딩 특화 모델, 9월의 멀티모달 에이전트, 10월의 생성 영상 모델이 포함되어 있어, 머스크의 Grok의 다양한 분야 능력 확장 비전을 보여줍니다.
Grok 4 발표와 동시에, xAI는 SuperGrok Heavy라는 새로운 구독 패키지를 월 300달러에 도입했습니다. 이것은 xAI가 제공하는 지금까지 가장 고가의 패키지로, 다른 주요 AI 제공업체(OpenAI, Google, Anthropic)의 최고급 플랜보다 비쌉니다. SuperGrok Heavy 가입자는 Grok 4 Heavy와 미공개 실험 기능에 조기 접근할 수 있으며, 미래의 xAI AI 제품에 대한 미리보기 또한 포함됩니다. 예를 들어 코딩 모델, 고급 에이전트 또는 곧 출시될 영상 모델에 대한 최초 접근 권한을 얻을 수 있다고 회사는 말했습니다.
7월 9일 Grok 4 출시 라이브 방송에서는 일론 머스크와 xAI 리더가 새 모델의 성능과 능력에 초점을 맞춰 프레젠테이션을 진행했습니다. 머스크는 이전 버전에 비해 Grok 4의 진보 정도를 보여주며, 특히 Grok 4 Heavy가 고급 벤치마크를 돌파한 성공을 강조했습니다. 이전에 Grok는 정치적 편향이 있는 답변으로 주목받았고, 머스크는 이를 "중대한 실패"라고 불렀지만, 그는 팀이 최신 버전에서 그 문제를 수정했다고 확약했습니다.