로컬 LLM, 회사에 들여놓으면 정말 ROI가 나오나

1편을 쓰고 며칠이 지났을 때, 회사 GPU 워크스테이션 한 대에 같은 Qwen3.5 122B를 깔아봤다.

1편에서 내 M4 노트북이 한 자릿수로 떨어진 자리를 본 뒤, 자연스럽게 다음 질문이 따라왔다. 그러면 회사 차원은 어떨까. 노트북이 외롭다고 끝낸 그 자리가, GPU가 박힌 워크스테이션에서는 어떻게 보일까. 마침 사내에 시범으로 띄울 수 있는 NVIDIA RTX Pro 6000 Blackwell 96GB 한 대가 있었다. 같은 모델을 거기에 올려봤다.

속도는 5배에서 7배 빨라졌다. M4에서 6~8 토큰/초로 떨어졌던 게 워크스테이션에서는 35~50 토큰/초가 나왔다. 챗 답변이 한 글자씩 깜빡이며 떨어지는 그림이 사라지고, 문장이 통째로 흘러나오는 그림이 됐다. 1편에서 본 한 자릿수 두 개의 어긋남에서 한쪽(속도)이 풀린 것이다.

그리고 팀 5명을 거기 붙였다. 잠시 후 평균 응답이 다시 한 자릿수로 돌아왔다.

같은 단어가 다른 차원에서 또 등장했다. 1편에서는 내 노트북 한 대의 속도가 한 자릿수였고, 이번에는 회사 GPU 한 대를 다섯이 동시에 쓰는 큐가 한 자릿수를 만들었다. 큐가 쌓이는 자리에서 토큰/초가 다시 떨어졌다. 거기서 멈췄으면 "GPU 더 깔자"가 답이었을 텐데, 그 주에 회계팀에 보고서를 들고 갔다가 다른 한 자릿수를 마주쳤다. 시트당 단가를 분해해봤더니, 우리가 쓰던 클라우드 ZDR보다 비싸게 나왔다. 그리고 보안팀에서 "누가 어떤 코드를 어떤 모델에 넣었는지 로그가 있느냐"고 물어왔는데, Ollama에는 그런 로그가 기본으로 안 붙어 있었다.

회사 도입은 한 가지 답이 아니었다.

1편이 "외로움"이라 부른 자리가 회사로 가면

1편을 한 줄로 요약하면 이렇다. 로컬 LLM이 벤치는 따라잡았는데 노트북 위에서는 외롭다. 토큰/초가 한 자릿수다. 그리고 OS 통합도, NPU 활용도, 에이전트 통합도, 배터리도, 발열도 어느 것 하나 제대로 풀리지 않는다.

그 다섯 가지 중 회사 GPU에서 풀리는 게 일부 있다. 속도는 풀린다. 배터리와 발열은 데스크탑 클래스라 애초에 문제가 아니다. NPU도 데이터센터 GPU에서는 Tensor Core가 다 동원되니까 노트북 NPU가 노는 그림과는 다르다. 1편에서 외롭다고 했던 자리의 일부는 회사 차원에서 풀린다.

대신 회사 차원에서 새로운 자리가 생긴다.

동시 사용자 큐가 새 변수다. 5명이 한 워크스테이션을 같이 쓰면 35 토큰/초가 다시 한 자릿수로 떨어진다. 거버넌스 로그가 또 다른 변수다. 누가 무슨 코드를 어떤 모델에 넣었는지 회사가 추적할 수 있어야 하는데, 로컬 추론 서버는 그 로그를 기본으로 만들어주지 않는다. 회계가 세 번째 변수다. "API 호출 0"이라는 단일 KPI가 회사 회계로 가면 네 가지 라인으로 쪼개진다. 시트당 단가, 안정성, 자율성, 모델 deprecation. 이걸 다 합쳐야 비로소 진짜 비용이 보인다.

1편의 "외롭다"가 회사 차원에서는 한 가지 답이 아니라는 발견이 여기서 나왔다. 회사 도입 의사결정은 세 축의 매트릭스로 풀어야 한다. 보안·규제(F1), 비용 회계(F2), 직군 워크플로우(F3). 이 세 축이 만나는 자리에서만 로컬 LLM ROI가 나오고, 그 자리는 회사마다 다르다.

"다 깔자"도 틀렸고 "다 클라우드 쓰자"도 틀렸다. 회사가 어느 칸에 들어가는지 본인이 찾아야 답이 나온다.

F1 — 보안·규제 축: 어떤 코드는 절대 클라우드로 안 보낸다

가장 먼저 풀어야 하는 축이 보안이다. 이 축에서 답이 정해지면 나머지 두 축은 따라온다.

회사가 진짜 두려워하는 것

먼저 한 가지 오해를 풀자. 회사 보안팀이 두려워하는 건 "모델 학습 데이터 유출"이 아니다. 클라우드 LLM에 우리 코드를 넣었더니 그게 모델 학습에 들어가서 다른 회사 사용자에게 노출되는 그림. 이건 ZDR(Zero Data Retention) 옵션으로 거의 해결됐다.

진짜 두려운 건 인퍼런스 컨텍스트 그 자체다. 우리 회사 핵심 코드 한 파일이 클라우드로 한 번 전송되는 순간, 그게 학습에 쓰이지 않더라도 누군가의 서버 메모리를 거쳐갔다는 사실이 남는다. 정책 위반 의심으로 분류되면 최대 2년간 보관되기도 한다. Anthropic ZDR 문서도 이걸 명시한다. "법적 의무 또는 정책 위반 대응을 위해 필요한 경우는 예외"라고.

ZDR이 만능이 아니라는 뜻이다. 정상 흐름에서는 보관되지 않지만, 예외 경로가 있다.

ZDR이 답이 아니게 되는 자리

이 예외 경로 때문에 금융권, 의료기관, 법무 펌, 게임사 핵심 코드 같은 1등급 자산은 ZDR로도 안심이 안 된다. 미국 OCC의 클라우드 가이드라인이나 한국 금융감독원의 클라우드 이용 가이드는 "데이터 거버넌스가 외부 사업자 정책으로 종속되는 구조"를 별도 검토하라고 요구한다. ZDR 계약을 맺어도, 그 계약이 외부 사업자 정책에 의존한다는 사실 자체가 별도 리스크다.

EU AI Act가 이 압력을 더 키운다. 2026년 8월 2일 부속서 III의 고위험 AI 시스템 의무가 전면 활성화된다. 데이터 거버넌스, 기술 문서, 인간 감독 설계, 라이프사이클 모니터링이 의무가 된다.

다만 한 가지 정밀하게 짚을 게 있다. 일주일 전인 2026년 5월 7일에 EU 입법자들이 일부 조항을 2027년 12월로 연기하기로 합의했다. 생체 인식, 핵심 인프라, 교육, 고용, 이민·망명·국경관리 영역의 일부 조항이 연기 대상이다. 즉, 8월 시행이 완전히 풀리는 건 아니지만 그렇다고 모든 고위험 영역이 8월에 묶이는 것도 아니다.

회사 법무팀이 자기 회사가 어느 영역에 들어가는지를 먼저 확인해야 한다. 그 다음에야 "클라우드 ZDR로 갈지, 로컬로 가져올지"가 정해진다.

그런데 보안 등급 3등급, 5등급짜리 작업도 회사엔 많다

여기서 흔히 빠지는 함정이 있다. 1등급 자산이 무서워서 회사 전체를 로컬로 옮기려는 그림.

회사 안에서 LLM이 닿는 작업의 80% 이상은 1등급이 아니다. 사내 문서 요약, 회의록 정리, 메일 초안, 단순 코드 리팩토링, README 보강. 이런 작업까지 로컬 GPU에 묶으면 다른 축(F2, F3)이 깨진다. 클라우드 ZDR이 더 합리적인 자리를 굳이 로컬로 끌어오는 셈이다.

보안 축의 결론은 단순하다. 1등급 자산은 로컬, 3등급 이하는 클라우드 ZDR이 합리적이다. 이 분리를 못 하면 회사 전체 LLM 운영이 한 방향으로 쏠려서 비효율이 쌓인다.

F2 — 비용 회계 축: "API 호출 0"이 회사 회계로 가면

두 번째 축이 비용이다. 여기서 개인과 회사가 가장 크게 갈린다.

개인이 보는 비용은 한 줄짜리다. API 청구서. 월말에 카드로 빠져나가는 금액 한 줄. "로컬에 깔면 이 줄이 0이 되네"라는 단순한 산수가 성립한다.

회사 회계로 가면 그 한 줄이 네 줄로 쪼개진다.

회사가 보는 비용 = 네 라인이 다 들어간다

첫째, 하드웨어 감가상각. NVIDIA RTX Pro 6000 Blackwell 96GB는 2026년 5월 현재 시장가가 $8,000~$9,200이다. MSRP는 2025년 3월 출시 당시 $8,565였고, NVIDIA Marketplace 표시가는 $8,900. 본문 계산은 $9,000을 기준으로 한다. 워크스테이션 본체(CPU, RAM, SSD, 케이스, 전원)까지 합치면 $12,500 안팎이다. 36개월 감가상각으로 풀면 월 $347.

이게 끝이 아니다. 회사 도입 의사결정에서 더 흥미로운 사실 하나. Mac Studio M3 Ultra 512GB는 2026년 3월에 단종됐다. 글로벌 DRAM 부족 때문에 Apple이 512GB 옵션을 카탈로그에서 빼버렸다. 단가는 $9,499였는데, 지금은 살 수가 없다. NVIDIA DGX Spark도 2026년 2월에 $3,999에서 $4,699로 18% 인상됐다. 같은 이유다. 메모리 공급 부족.

회사 도입의 첫 번째 변수가 "원하는 하드웨어를 살 수 있느냐"가 되어버렸다. 자체 GPU 인프라 계획이 공급망에 직접 노출되는 그림이다.

둘째, 전기료. RTX Pro 6000은 TDP가 600W다. 평균 가동률 35%로 잡고 하루 24시간, 한 달 30일을 돌리면 월 전력 소비가 약 151kWh. 미국 평균 산업용 전기료 $0.15/kWh를 적용하면 월 $23. 한국은 더 싸고, EU는 더 비싸다. 어느 쪽이든 다른 라인 대비 작은 숫자다.

셋째, 운영 인건비. 이게 함정이다. MLOps나 DevOps 엔지니어가 워크스테이션 한 대를 관리한다고 가정하자. 한 달 인건비를 $12,000으로 잡고, GPU 운영에 0.1 FTE(전체 근무 시간의 10%)를 쓴다고 하면 월 $1,200. 0.05 FTE면 $600, 0.2 FTE면 $2,400.

여기가 시트당 단가가 흔들리는 자리다. 회계가 인건비를 어떻게 잡느냐에 따라 결과가 3배에서 5배로 변한다.

넷째, 모델 업데이트·검증 비용. 분기마다 새 모델이 나오면 사내 코드 베이스로 평가를 다시 돌려야 한다. 이게 한 분기에 $2,000 정도 든다고 보면 월 $667. 이걸 빼면 단가는 더 내려가지만, 회사 정책상 모델 검증을 빼먹을 수는 없다.

실제 시트당 단가 비교

이 네 라인을 합쳐서 5명 팀이 한 GPU 워크스테이션을 공유한다고 잡고 시트당으로 풀면 이렇게 나온다.

항목 월 비용 시트당 (5명 공유)
하드웨어 감가상각 (워크스테이션 풀세트 $12,500 / 36개월) $347 $69
전기료 (600W × 35% 가동률) $23 $5
운영 인건비 (0.1 FTE × $12,000) $1,200 $240
모델 업데이트·검증 $667 $133
합계 $2,237 $447

인건비 가정을 0.05 FTE로 낮추면 시트당 $327, 0.2 FTE로 올리면 시트당 $687. 회계가 인건비를 어떻게 잡느냐가 답을 좌우한다.

클라우드 묶음 가격은 어떤가. Cursor Business가 $40/시트/월, GitHub Copilot Enterprise는 $39에 GitHub Enterprise Cloud $21을 더해 $60. Cursor Enterprise는 공식 가격이 공개되지 않고 영업팀 협상이지만 50시트 이상 기준 추정 $50~80 선이다. 직접 API로 GPT-5.5 $1.25/M 인풋을 개발자 1인당 월 12M 토큰 기준으로 쓰면 $15. 단, API만 쓰는 그림은 회사 SSO, 감사 로그, 시트 관리, 온보딩 자동화를 별도로 만들어야 하니까 실제 비용은 더 든다.

단가만 보면 클라우드 묶음이 시트당 $40~80, 로컬은 시트당 $327~687. 클라우드가 5~10배 싸다.

그러면 왜 로컬을 고민하는가.

단가 외에 들어가는 두 가지 — 안정성과 자율성

단가 비교가 끝이 아니다. 회사 회계로 가면 두 가지가 추가로 들어간다.

안정성. 2026년 4월 20일, OpenAI가 90분 이상 장애를 냈다. ChatGPT, Codex, API Platform이 동시에 멈췄다. 영국에서만 8,700건이 넘는 리포트가 올라왔다. 회사 코딩 워크플로우가 클라우드 API 한 줄에 묶여 있으면 그 90분 동안 전체가 멈춘다. 회계로 환산하면 5명 팀이 시급 $80짜리 작업을 90분 멈춘 게 $600이다. 한 번 사건으로 한 달 단가 차이가 흔들린다.

자율성. 모델 deprecation이 다른 변수다. 회사가 1년간 Claude Sonnet 4.5 위에서 워크플로우를 다듬어 놨는데, Anthropic이 Sonnet 5를 풀면서 4.5 API를 점진 폐기한다고 발표하면 어떻게 되나. 워크플로우 일부를 다시 빌드해야 한다. 이게 사실 회사에서 가장 부담스러운 자리다. 로컬 모델은 회사가 가중치를 들고 있는 한 사라지지 않는다. 자율성을 사는 셈이다.

비용 축의 결론도 단순하다. 단가만 보면 클라우드, 안정성·자율성까지 합치면 하이브리드. 단일 답이 없다.

F3 — 직군 워크플로우 축: 누가 어떻게 쓰는지가 답을 바꾼다

세 번째 축이 워크플로우다. 같은 회사 안에서도 직군마다 답이 달라진다.

코딩 직군 — 7시간 자율 작업이 가능한 모델만 의미가 있다

1편에서 다뤘던 자리다. Anthropic이 Claude Code를 7시간 자율로 돌린 Rakuten 사례를 풀었고, OSWorld에서 78%를 찍었다. 사람이 중간에 개입 안 하고 모델이 도구를 수백 번 호출하면서 작업을 끌고 가는 그림이다.

로컬 Qwen3.5 122B가 같은 일을 할 수 있을까. 5분짜리 작업은 된다. 한 시간짜리는 도중에 길을 잃는다. 1편에서 다섯 가지 한계 중 하나로 꼽았던 "에이전트 통합"이 코딩 직군에서 가장 크게 걸린다. 컨텍스트가 길어지면 부패 속도가 클로즈드 모델보다 빠르다.

코딩 워크플로우는 사실상 클라우드 손을 못 놓는다. 회사 1등급 코드가 아닌 한, 로컬을 고집할 이유가 없다.

글쓰기·리서치 직군 — 짧고 자주, 컨텍스트 부패 영향 작음

여기가 로컬 LLM이 가장 합리적인 자리다.

회의록 정리, 문서 요약, 메일 초안, 보도자료 다듬기. 한 번 호출이 짧고, 컨텍스트가 길지 않고, 사용자가 결과를 바로 검수한다. 모델이 한 시간씩 자율로 돌 필요가 없다.

게다가 회의록은 회사 내부 정보가 많이 섞여 있다. 비전·전략 회의, HR 회의, 법무 검토 회의. 이런 내용을 클라우드로 보내는 것 자체가 보안 등급 정책에 걸린다. 로컬 GPU 워크스테이션 한 대로 글쓰기·리서치 직군 전체를 커버할 수 있다면 ROI가 가장 잘 나오는 자리다.

데이터·분석 직군 — 컨텍스트 길이가 결정한다

데이터·분석 직군은 또 다른 변수가 결정한다. 한 번에 처리해야 하는 데이터 양.

Meta Llama 4 Scout가 10M 컨텍스트를 오픈 웨이트로 풀었다. 이게 진짜 의미를 갖는 자리가 데이터 분석이다. 회사 내부 분기 데이터, 한 해 로그 더미, 전체 코드 베이스 인덱스. 이런 자료를 한 번에 모델에 넣고 분석하는 워크플로우는 클라우드 1M 컨텍스트로는 안 된다.

그리고 이런 자료는 외부 전송 자체가 안 되는 경우가 많다. 회사 거버넌스가 "분기 영업 데이터는 사내 사설망 밖으로 안 나간다"고 정해두는 식이다. 로컬 강제다. 직군 워크플로우와 보안 축이 같이 답을 내는 자리.

다만 Llama 4의 라이선스는 회사 도입 전에 법무 검토가 필요하다. DAU 7억 미만 회사는 무료지만, 그 이상은 별도 협상이다. 한국 IT 대기업은 대부분 무료 구간이지만, 영업 정의에 따라 다르게 해석될 여지가 있다.

디자인·기획 직군 — 멀티모달이 결정한다

마지막 직군이 멀티모달을 본격적으로 쓰는 영역이다. 디자인 리뷰, 와이어프레임 검토, 기획 자료 비주얼 다듬기.

여기서 1편에서 본 라인업 분화의 의미가 다시 등장한다. Gemini 3.2 Flash가 vision까지 묶인 자리가 OEM 진영에서 가장 빨리 진화하는 영역이다. 디자인 리뷰에서 PNG 한 장을 던지고 "이 화면의 위계 구조를 봐달라"고 하면 클라우드 모델이 답한다.

로컬 멀티모달은 아직 외롭다. Qwen3.5 VL이 있긴 한데 워크플로우 통합이 약하다. 디자인 도구에 플러그인으로 박혀 있는 모델은 거의 클라우드 기반이다. 디자인·기획 직군은 클라우드를 손에서 못 놓는다.

직군 축의 결론이 나온다. 코딩과 디자인은 클라우드, 글쓰기·리서치·분석은 로컬이 합리적. 같은 회사 안에서도 부서마다 다른 답이 나온다.

세 축이 만나는 자리 — 회사가 그릴 수 있는 네 가지 도입 그림

세 축을 다 봤다. 이제 이 세 축이 만나는 자리에서 실제로 회사가 그릴 수 있는 그림은 몇 가지 패턴으로 정리된다. 네 가지로 풀어보자. 회사 규모, 보안 등급, 직군 분포에 따라 어디에 들어가는지가 달라진다.

그림 A — 전면 클라우드(ZDR 묶음)

대상: 50명 미만 스타트업, 보안 1등급 자산이 적은 회사. SaaS 스타트업, 마케팅 에이전시, 일부 핀테크 초기 단계.

구성: Cursor Business + Claude Code, 또는 GitHub Copilot Enterprise. 직접 API는 호출 빈도 낮은 보조 작업에만.

시트당 비용: $80~100/월.

이 그림이 가장 단순하다. 회사가 직접 인프라를 들고 갈 이유가 없다. ZDR 옵션을 쓰고, 1등급 자산이 생기면 그때 가서 그림 B나 C로 옮겨가면 된다.

그림 B — 하이브리드(클라우드 메인 + 로컬 보조)

대상: 50~500명 중견 IT 회사. 일부 1등급 자산이 있지만 코딩·디자인 워크플로우가 메인.

구성: 코딩·디자인은 클라우드 ZDR. 사내 문서·회의록·분기 리포트 정리는 사내 GPU 워크스테이션 1~2대로 처리.

시트당 비용: 클라우드 $50~120 + 사내 인프라 분배 $50~150. 합치면 $100~250 안팎.

이 그림이 한국 IT 중견기업 다수가 들어갈 자리다. 클라우드 1등급 자산을 별도로 분리해두고, 나머지는 효율 위주로 클라우드에 맡기는 그림.

그림 C — 보안 우선 하이브리드(로컬 메인 + 클라우드 보조)

대상: 금융·의료·게임사 핵심 코드 보유 회사. 1등급 자산이 회사 매출의 큰 비중.

구성: 1등급 자산 코드, 분석은 로컬 GPU 클러스터(4~8대). 3등급 이하 일반 작업은 클라우드 ZDR. 사내 MLOps 팀 0.5~1.0 FTE.

시트당 비용: $200~400/월 (인프라 분배 포함). 사내 MLOps 인건비가 핵심 변수.

이 그림은 도입 결정 자체가 한두 달 검토로는 안 끝난다. 법무, 보안, 회계, 기술이 다 같이 들어가야 한다. ROI가 단기에 안 나오고 1~2년 시계로 봐야 의미가 잡힌다.

그림 D — 전면 로컬(온프레미스 + 사내 사설망)

대상: 정부, 국방, 일부 의료기관. 거의 모든 자산이 1등급으로 분류되는 조직.

구성: GPU 클러스터 16대 이상, 사내 IT 팀 풀로 운영, 외부 API 차단.

시트당 비용: $500+/월.

이 그림은 회사 규모 200명 이상에서만 ROI가 나온다. 그 이하면 사내 MLOps 인건비를 시트로 나눌 때 단가가 너무 커진다. 즉, 그림 D는 "ROI가 나와서 선택하는 자리"가 아니라 "규제로 강제된 자리"에 가깝다.

네 그림 사이에서 우리 회사는 어디인가

네 그림을 늘어놓고 보면 답이 명확해진다. 회사마다 들어가는 칸이 다르다. 그리고 같은 회사 안에서도 직군별로 다른 그림을 동시에 쓸 수 있다. 코딩 직군은 그림 B의 클라우드를, 회의록 직군은 그림 B의 로컬을 같이 쓰는 그림.

출발점은 "로컬이냐 클라우드냐" 이분법을 처음부터 버리는 자리다. 우리 회사가 어느 칸에 들어가는지, 같은 회사 안에서 직군별로 다른 칸을 동시에 쓸 수 있는지를 본인이 정리해야 한다. 이게 답이다.

I/O 사흘 뒤, 1편 예측이 회사 도입 계산에 어떻게 들어왔나

이 글이 발행되는 5월 21일은 Google I/O 키노트가 끝난 지 사흘째다. 1편에서 예측한 그림 일부가 검증되거나 빗나갔다. 회사 도입 계산에 어떤 영향을 줄까.

먼저 Gemini 3.2 Pro 공식 발표 가격이 회사 도입 계산에 직접 들어간다. 1편 발행 시점에 Gemini 3.2 Flash가 $0.25/M 인풋으로 사전 노출됐었고, I/O에서 Pro 라인 가격이 공식화됐다. 가격이 더 떨어지면 그림 A와 그림 B의 클라우드 단가가 다시 한 번 인하 압력을 받는다. 같은 시트당 단가에서 토큰 사용량을 더 키울 수 있다.

Android OS 통합 발표는 B2B 회사 도입에 직접 영향은 아직 없다. 1편에서 짚었듯이 Android는 일반 사용자 디바이스 측면이라 회사 LLM 운영(워크스테이션·서버 위주)과는 다른 갈래다. 다만 회사 직원이 노트북뿐 아니라 폰에서도 Gemini를 쓰는 환경이 자리잡으면, 회사 SSO·MDM에 연결되는 OEM 모델이 그림 B에서 보조 도구로 들어올 가능성이 열린다.

Apple WWDC가 6월 초에 남았다. 회사 직원 노트북에 Mac 비중이 큰 곳은 거기서 또 한 번 그림이 흔들린다. iOS 27에서 외부 모델 선택이 가능해지면, 회사가 모델 선택을 사용자에게 위임하는 옵션이 진짜로 열린다. 그게 회사 거버넌스에 어떻게 들어오는지는 다음 글에서 다뤄야 할 자리.

I/O가 직접 회사 도입 그림 자체를 뒤집지는 않았다. 다만 그림 A·B의 클라우드 단가에 추가 인하 압력을 줬다는 정도. 진짜 변수는 6월 WWDC와 하반기 OpenAI Sweetpea다.

마치며

세 축 매트릭스의 결론은 단순하다. 한 줄 답은 없다.

체크리스트로 풀면 이렇다.

첫째, 우리 회사에 보안 1등급 자산이 있나. 있으면 그림 C 또는 D 후보. 없으면 그림 A 또는 B.

둘째, 우리 회사 GPU 인프라를 운영할 수 있나. MLOps/DevOps 0.1 FTE 이상을 떼어줄 수 있나. 못 떼면 그림 A 외에는 답이 없다.

셋째, 우리 회사 직군 분포가 어떤가. 코딩·디자인이 메인이면 그림 A 또는 B 클라우드 비중 높게. 글쓰기·리서치·분석이 메인이면 그림 B의 로컬 비중 늘리는 게 합리적.

넷째, 우리 회사 규모. 50명 미만이면 그림 A에서 시작. 50~500명이면 그림 B. 500명 이상이고 1등급 자산이 매출 핵심이면 그림 C. 200명 이상이고 거의 모든 자산이 1등급이면 그림 D.

이 네 가지에 답하면 우리 회사가 어느 칸에 들어가는지 윤곽이 나온다. 정확한 시트당 단가는 그 칸 안에서 회계팀이 인건비 가정을 어떻게 잡느냐로 또 갈린다.

내가 회사 GPU 워크스테이션 한 대에 깔아봤을 때 본 한 자릿수는, 1편의 노트북 한 자릿수와 다른 차원의 변수였다. 1편이 "벤치는 따라잡았는데 실사용은 외롭다"였다면, 2편은 "회사 차원에서 외로운 자리와 합리적인 자리가 갈린다"였다.

3편은 I/O 키노트의 실제 발표가 1편 예측을 어디까지 검증했는지, 그리고 6~9월 다음 분기 전망을 다듬는 글이다. 5월 22일에서 25일 사이 발행 예정.

회사가 어느 칸에 들어가는지는 회사가 답해야 한다. 그 답을 같이 그려가는 자리가 이 시리즈의 다음이다.

댓글

이 블로그의 인기 게시물

개발자는 코드를 쓰는 사람이 아니다 — AI 시대에 남는 자리는 '책임'에 있다

Harness Engineering in Practice — How Anthropic Designs AI Agents

What Is Harness Engineering — Designing the Reins for AI Agents