Grok 4
그록
AI 모델 분야에서 미국 xAI가 공개한 Grok 시리즈 4세대 LLM(Large Language Model, 거대 언어 모델)으로, X(구 Twitter) 실시간 데이터를 학습·참조해 시사·검색 강점을 가진 추론 모델 라인입니다.
Grok 4는 일론 머스크가 만든 회사 xAI의 4세대 대형 언어 모델이에요. 다른 챗봇이 미리 학습해 둔 책 내용 위주로 답한다면, Grok 4는 X(예전 트위터)에 지금 올라오는 글까지 같이 읽고 답을 만듭니다. 조별 과제를 할 때 도서관 자료만 보는 친구와, 도서관 책과 학교 단톡방·SNS 반응을 같이 보는 친구의 차이라고 보면 비슷해요. 시사 이슈·실시간 여론·갓 나온 뉴스를 묻기 좋은 도구라서 PR·리서치·시장조사 쪽에서 이름이 자주 거론됩니다.
X 타임라인을 실시간으로 보며 답을 쓰는 사내 리서치 담당.
xAI 공식 — Humanity's Last Exam 정답률 25.4%
xAI 공식 발표문은 Grok 4가 도구 없이 푼 Humanity's Last Exam(2,500문항 학제 추론 시험)에서 정답률 25.4%를 받아 Gemini 2.5 Pro·OpenAI o3 같은 직전 세대 프런티어 모델을 한 자릿수 %p 차이로 앞섰다고 공개했습니다 [1][2]. 도구 사용을 허용하면 Grok 4 Heavy가 같은 시험 텍스트 서브셋에서 50.7%를 받아 같은 평가를 50% 이상으로 넘긴 첫 모델로 기록됐고, AIME 2025 91.7%·GPQA Diamond 87.5%·LiveCodeBench(2025년 1~5월) 79.0%도 함께 보고됐습니다 [1][2]. 사내 PoC에서 "어느 모델이 더 똑똑한가"를 한 줄 근거로 인용해야 하는 보고 사용처에 들어갑니다.
한국 사용자 — grok.com·X 앱 한국어 사용 가능
xAI 공식 가이드와 한국어 정리 자료에 따르면 한국 사용자는 grok.com 또는 X 모바일 앱의 Grok 메뉴에서 같은 모델을 호출할 수 있고, 구글·애플·이메일 인증으로 1분 안에 시작할 수 있습니다 [5][6]. 2025년 9월에는 후속작 Grok 4 Fast가 컨텍스트 2M 토큰·X 실시간 검색을 묶어 무료 사용자까지 풀려, 별도 구독 없이도 영문 뉴스·X 여론을 한국어로 받아 볼 수 있게 됐습니다 [4]. 사내 도구 결제 전에 영문 SNS·뉴스 흐름을 빠르게 한국어로 받아 보고 싶은 1인 기획자·리서치 보조 업무에 자리를 잡고 있습니다.
엔터프라이즈 API — 256K 컨텍스트·라이브 검색
xAI 공식 발표문은 Grok 4 API가 256,000 토큰 컨텍스트와 멀티모달 입력을 지원하고, X·웹·뉴스 소스를 묶은 라이브 검색 API와 함께 호출되도록 설계됐다고 명시했습니다 [1]. 보안 측면에서는 SOC 2 Type 2·GDPR·CCPA 인증을 안내했고, 가격은 입력 100만 토큰당 $3·출력 $15로 책정됐습니다 [1][7]. 사내 RFP 작성, 외부 뉴스·SNS 기반 모니터링 보고서 자동화에 같은 API로 붙이는 엔터프라이즈 사용처에 들어갑니다.
코딩·에이전트 — LiveCodeBench·ARC-AGI V2
xAI 발표문은 Grok 4가 LiveCodeBench(2025년 1~5월) 해결률 79.0%, ARC-AGI V2(추상 추론 벤치마크) 정답률 15.9%를 기록했다고 공개했고, ARC-AGI V2 수치는 Claude Opus 4의 약 8.6%를 거의 두 배 앞선 값으로 보고됐습니다 [1][3]. Vending-Bench 같은 에이전트 평가에서는 5회 평균 매출 $4,694.15·판매 4,569개로 Claude Opus 4($2,077.41)와 사람 평균($844.05)을 모두 앞섰습니다 [1]. 단순 한 줄 코드 생성보다, 코드 실행·웹 브라우징·반복 수정까지 묶어야 하는 자동화 PoC 사용처에 인용할 수 있는 수치입니다.
- grok.com 또는 X 앱의 Grok 메뉴에서 한국어로 "지난 24시간 X에서 우리 회사·제품 언급 톤을 표로 정리해 줘"를 입력해 X 기반 실시간 검색 품질을 확인합니다.
- 같은 질문을 ChatGPT·Gemini에 동시에 던지고 인용 출처·실시간성 차이를 한 장표에 정리합니다.
- SuperGrok 구독 검토 시, 기본 Grok 4(256K 컨텍스트)와 Grok 4 Fast(2M, 무료)를 표로 비교해 어떤 워크로드가 어디에 맞는지 분류합니다.
- xAI API를 쓴다면 라이브 검색 API와 함께 입력 $3·출력 $15(100만 토큰) 단가를 월 사용량에 대입해 예상 비용을 추산합니다.
- 회사 데이터 정책에 SOC 2·GDPR·CCPA 항목이 들어가 있는지 점검하고, X 게시물 인용이 포함된 응답을 외부 보고서에 그대로 쓸 수 있는지 사내 컴플라이언스에 사전 확인합니다.
공식 발표문과 외부 매체 모두 Grok 4의 X 의존성을 주된 한계로 다룹니다. X에 떠도는 잘못된 정보가 응답에 그대로 섞일 위험이 있고, Scientific American과 AIwire는 출시 직후 일부 답변이 일론 머스크 본인의 X 게시물을 가중치 있게 인용한 사례를 보도했습니다 [2][3]. 학습 데이터 안에서 한국어는 영어·코드에 비해 비중이 낮고, 초기 버전은 한국어 입력을 다른 언어로 이해한 뒤 다시 옮기는 경향이 있다고 한국어 정리 자료가 지적합니다 [6]. 컨텍스트도 기본 Grok 4는 256K 토큰으로 묶여 있어, 200만 토큰을 쓰려면 Grok 4 Fast 계열을 골라야 하고, 발표 직후에는 일부 안전성 사고가 함께 보도돼 도입 전 자체 점검이 필요한 모델로 평가됩니다 [3][4].
진화 방향은 세 갈래입니다.
- xAI는 2023년 11월 Grok 1, 2024년 8월 Grok 2, 2025년 2월 Grok 3을 거쳐 7월 Grok 4까지 평균 6~8개월 간격으로 세대 교체를 이어왔고, 9월 Grok 4 Fast로 추론·비추론을 한 모델 안에 합치고 컨텍스트를 2M으로 늘리면서 같은 벤치에서 비용을 약 98% 떨어뜨렸다고 밝혔습니다 [1][4].
- Colossus는 2025년 5월 시점 200,000 GPU 규모로 보도됐고, xAI는 100만 GPU 확장을 목표로 한다는 외부 보도가 이어지고 있어 다음 세대 모델은 더 큰 강화학습 위에서 만들어질 가능성이 큽니다 [8][9].
- 발표문은 Grok 4 음성 모드와 카메라 기반 실시간 영상 인식을 함께 공개해, X 텍스트 데이터에 음성·영상까지 묶는 멀티모달 방향이 분명해지고 있습니다 [1].
- 유사 개념Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- Grok 4 — 회사 공식 발표 · xAI · 2025-07-09
- Grok 4 Fast: Pushing the Frontier of Cost-Efficient Intelligence — 회사 공식 발표 · xAI · 2025-09-19
- Elon Musk's New Grok 4 Takes on 'Humanity's Last Exam' as the AI Race Heats Up — 권위 매체 · Scientific American · 2025-07
- About Grok on X — 회사 공식 가이드 · X(구 Twitter)
- Grok 4 — 한국말 할 줄 알아? — 한국어 정리 · WikiDocs · 2025
- xAI Grok Pricing Index — 가격 정리 · Metronome · 2025
- Grok 4 Scores High on Benchmarks but Controversy Clouds the Launch — 권위 매체 · AIwire · 2025-07-15
- Colossus AI Hits 200,000 GPUs as Musk Ramps Up AI Ambitions — 권위 매체 · HPCwire · 2025-05-13
- Elon Musk's xAI targets one million GPUs for Colossus supercomputer in Memphis — 권위 매체 · Data Center Dynamics
- Colossus: The World's Largest AI Supercomputer — 회사 공식 페이지 · xAI
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.