EXECUTIVE SUMMARY
① AI는 단어가 아니라 4 변수를 고려하는게 투자 결정에 중요하다고 판단된다. = (Growth × Margin × Defensibility) ÷ Replicability.
Codeium 71x, Jasper 10x — 같은 GenAI 카테고리에서 7배 격차가 나는 이유는 분자가 아니라 분모인 R(Replicability)이 변수로 파악된다.1
② 3-Tier가 시장을 가른다.
AI-Native(VC에선 21.2x / M&A에선 11.5x) · AI-Enabled(8.5x / 7.0x) · Legacy SaaS(5.5x / 3.8x).
격차는 좁아지지 않고 2024-2026년 사이 더 벌어졌다. 특히 Aventis 데이터 기준 legacy SaaS 멀티플 2025년 3.8x → 2026년 3.1x로 감소세2
③ 매출 비중이 아니라 Defensibility가 멀티플을 결정한다.
PwC 데이터 기준 proprietary 모델 + 데이터 보유 시 9-12x ARR, 3rd-party API wrapper는 3-4x ARR. 똑같은 ARR에서 3배 격차를 보이고 있다. 한국 투자자들은 실사에서 “AI 매출 비중 %”를 보지만, 현재 글로벌 투자자들는 “data moat × workflow embeddedness”를 주로 보고 있다.3
④ 한국 투자자(PE) 50%가 GenAI 활용 중, 그러나 투자 대상으로서의 AI 평가는 글로벌 대비 6-12개월 뒤처져 있는 것으로 파악된다. MBK 홈플러스 9000억 손실(2024)이 그 단면 — retail은 AI agent에 가장 빠르게 disintermediate 되는 섹터인데, 2017 LBO 시점에 해당 가정을 고려하지 않은 것으로 판단된다.4
⑤ SEC가 AI washing을 enforcement priority로 지정했다.
2025년 1월 Presto Automation 첫 제소5, EU AI Act 최대 €35M 또는 글로벌 매출 7% 벌금 부과하였다. AI 라는 단어 자체가 disclosure risk가 됐다. 한국 자본시장법도 2026년 AI 공시 가이드라인 도입 예정6
1) 시장 데이터
▣ 21.2x vs 5.5x — 같은 SaaS 시장에서 4배 격차가 벌어진 이유
Finro Q1 2026 dataset (575개 AI 기업)과 SaasRise/Windsor Drake 보고서를 통합 분석한 결과, AI 멀티플 시장은 단일 시장이 아닌 3개의 분리된 시장으로 fragmenting 되었다.
VC 라운드 기준 AI-Native는 21.2x EV/Revenue, AI-Enabled는 8.5x, Legacy SaaS는 5.5x — 그 격차는 좁혀지지 않고 2024년 이래 매분기 확대됐다.
3-Tier 멀티플 데이터 (Q1 2026)
| Tier | (VC) EV/Rev | (M&A) EV/Rev | 대표 기업 | 핵심 특징 |
|---|---|---|---|---|
| AI-Native | 21.2x | 11.5x | OpenAI 81.1x · Cursor 50x · Harvey 100x · Codeium 71x | Proprietary 모델·데이터, NRR 135%+, 100%+ YoY 성장 |
| AI-Enabled | 8.5x | 7.0x | Palantir 20.3x · Salesforce(Agentforce $800M ARR) · Databricks 25x | 기존 워크플로우에 AI integration, 측정 가능한 ROI |
| Legacy SaaS | 5.5x | 3.8x | Per-seat 가격 모델 SaaS 대다수 (Aventis 2026 median 3.1x) | Per-seat 가격, 성장률 10-12% 미만, AI substitution 위험 |
| AI-Washed | (보고 거부) | 3-4x | Jasper 10x (API wrapper · LLM 의존) | SEC enforcement 대상, D&O; risk |
프리미엄 격차의 3대 동인
① Capital 집중 가속
2025년 글로벌 VC dollars의 약 50%가 AI 스타트업에 투입됐다 (2024년 34%에서 급증).
CB Insights 데이터 기준 Q1 2026 AI M&A deal 266건 (+90% YoY).
자본 집중은 multiple compression이 아니라 multiple expansion으로 이어졌다.7
② Legacy SaaS의 “SaaSpocalypse”8
Aventis 데이터 기준 legacy SaaS M&A median 멀티플 2025년 3.8x → 2026년 3.1x.
사유는 단순하다. per-seat 가격 모델이 AI agent에 의해 seat count 자체가 감소하기 때문.
매출이 줄어드는 게 아니라 매출 모델이 흔들린 것이다
③ Authenticity Discount9
Windsor Drake 데이터 기준 동일 카테고리 내에서도 “proprietary AI vs API wrapper” 격차 매우 큼.
Codeium($40M ARR, 71x)과 Jasper($100M ARR, 10x)의 7배 격차가 그 증거이며, ARR이 더 큰 Jasper가 더 낮은 멀티플을 받았다.
2) Tier Framework
▣ AI-Native vs. AI-Enabled vs. AI-Washed … 7가지 분류 기준
투자심사 과정에서 가장 흔한 실수는 “AI를 한다”는 IM 한 줄에 멀티플을 후하게 주는 것이다. 그러나 글로벌 PE의 valuation은 7가지를 축으로 tier를 먼저 분류한 뒤 가격을 매기는 작업에 들어간다. 한국 투자자도 아래 7가지 항목에 대해서 알고 들어가면 entry valuation을 측정하는데 도움이 될 것으로 판단된다.
| 7가지 분류 | AI-Native | AI-Enabled | AI-Washed |
|---|---|---|---|
| Product의 본질 | AI = product 자체 | AI = feature 강화 | AI = marketing slogan |
| 모델 ownership | Proprietary fine-tuned + own data | Hybrid (own + 3rd party) | 3rd party API wrapper |
| Pricing 모델 | Consumption / outcome-based | Hybrid (seat + consumption) | Per-seat 위주 |
| Gross Margin | 50-65% (GPU COGS 후) | 65-80% | 75-85% (API 마진은 OpenAI) |
| NRR | 135%+ | 110-130% | 95-110% |
| YoY 성장률 | 100%+ | 25-50% | 10-20% |
| Data Moat | Proprietary corpus, 사용자 telemetry | Customer 데이터 feedback loop | Public dataset 의존 |
[실전 코멘트]
한국 스타트업의 IM을 접하다보면, 10개 기업 중 약 9개 기업이 “AI-Enabled”라고 자칭한다. 그러나 7가지 분류 기준에서 절반 이상은 AI-Washed에 속한다. 최근 2년 동안 한국 SaaS 스타트업 30개 중 21개가 “3rd party API wrapper + per-seat pricing + 95-110% NRR” 조합이었다. 이 회사들은 IM에서 “AI revenue 30%”를 자랑하지만, Gross margin 분석에 들어가면 API 호출 비용을 COGS 처리하지 않는 경우도 많았다. 글로벌 valuation 기준으로 다시 매기면 entry EBITDA multiple 절반 이하로 떨어진다.
3) 관성적 가정들 … “AI는 프리미엄”으로 봐야하는가
▣ “AI는 무조건 프리미엄”이라는 거짓말
| # | 관성적 가정 | 물리적 사실 | 증거 |
|---|---|---|---|
| ① | AI는 무조건 프리미엄이다 | Replicable AI(API wrapper)는 디스카운트 | Jasper $100M ARR · 10x (legacy SaaS와 동급) |
| ② | AI 매출 비중 = 멀티플 | Margin trajectory × Defensibility가 결정 | PwC: 동일 ARR에서 3배 격차 (Data moat 유무) |
| ③ | GenAI = AI 프리미엄 | GenAI wrapper는 commodity화 가장 빠름 | Q1 2026 AI-native 멀티플 H2 2025 peak 대비 소폭 하락 |
| ④ | AI 인재 수 = Moat | Data 독점 + Workflow embeddedness가 진짜 | PwC: proprietary 9-12x ARR vs. API moat wrapper 3-4x |
| ⑤ | AI 매출은 SaaS처럼 valuation | AI gross margin 50-60% vs. SaaS 80-90% | Woozle: GPU COGS 차감 후 단위 경제 차이 |
| ⑥ | Public AI = Private AI 멀티플 | Private에서 dispersion 훨씬 큼 (10x-100x) | Harvey 100x · Cursor 50x outlier vs Palantir 20.3x |
[실전 코멘트]
단순히 “AI를 한다”는 명제는 멀티플과 무관하다. AI 관련 투자 심사에서 중요한 점은 “AI의 Growth(G) · Margin(M) · Defensibility(D)를 통제하고 Replicability(R)를 얼마나 낮추는가”이다.
투자 심사에서 자주 빠지는 함정은 IM 자료 상 “AI 매출 비중”을 1차 screening 기준으로 쓰는 것 — 그 비중이 50%여도 R=0.9(누구나 복제 가능)면 EV/Revenue가 5x 아래로 떨어진다. 반대로 AI 매출 비중 20%여도 D=0.8(proprietary data)이면 15x 이상도 가능하다.
4) 4가지 변수를 통해 멀티플 reverse-engineering
▣ AI 멀티플
Growth · Margin · Defensibility 이렇게 3가지를 분자 변수로 Replicability를 분모 변수로 접근하고 측정 및 검증해 보았다.
이러한 방정식이 만사 능통은 아니나, 4가지 시나리오에서 검증 가능하다는 점이다.
예를 들어 분자가 1에 가깝고 분모가 0.3으로 좁혀지면 EV/Rev 20x 이상, 분자가 0.5 미만으로 떨어지면 3-4x로 자동 추락한다.
| 변수 | 정의 | 측정 지표 | Ideal 값 |
|---|---|---|---|
| G (Growth Durability) | AI 추가로 지속 가능한 성장 여력 | YoY 성장률 × NRR 안정성 (2년 cohort) | 0.8-1.0 (100%+ 성장, NRR 130%+) |
| M (Margin Trajectory) | AI COGS(GPU) 차감 후 마진 도달 | Gross margin 60% 달성 시점 (월 단위) | 0.7-0.9 (60%+ GM, 12개월 가능성 안에 가능) |
| D (Defensibility) | 4-layer moat 종합 (Data/Workflow/Distribution/Compute) | Proprietary corpus + system of record + 채널 | 0.7-0.9 (3개 layer 이상 통과 |
| R (Replicability) | Well-funded competitor가 12개월 안에 복제 가능한 정도 | Model weight + 데이터 + 채널 동시 복제 난이도 | 0.2-0.4 (복제 어려움, 분모이므로 작을수록 좋음) |
▣ 4가지 시나리오 계산 검증 (예시적)
| Profile | G (Growth) | M (Margin) | D (Defensibility) | R (Replicability) | result | 실측 EV/Rev |
|---|---|---|---|---|---|---|
| AI-Native 이상형 (Codeium/Harvey) | 1.0 | 0.7 | 0.8 | 0.3 | 1.87 | 18-21x, 사례: Finro 21.2x |
| AI-Enabled 평균 (Palantir 유사) | 0.5 | 0.6 | 0.6 | 0.5 | 0.36 | 7-9x, 사례: SaasRise 8.5x |
| 획득한 MI 자료 기준, 한국 SaaS 20개사 + AI 평균 | 0.6 | 0.55 | 0.5 | 0.6 | 0.275 | 6-7x |
| AI-Washed 함정 (Jasper 유사) | 0.4 | 0.4 | 0.3 | 0.9 | 0.053 | 3-4x, 사례: Aventis 3.1x |
▣ Defensibility … 진짜 AI Moat의 해부
Defensibility 변수 D는 단일 차원이 아니라 4-layer stack 이다. 각 layer는 독립적으로 측정하고, 3개 이상 통과해야 D ≥ 0.7을 부여하였다. 가장 자주 누락되는 layer는 Data Moat (사용자 telemetry 독점)와 Compute Efficiency (own inference vs API) 이다.
| 4가지 Layer stack | 정의 | 측정 방법 | 대표 case |
|---|---|---|---|
| ① Data Moat | 사용자 생성 + curated proprietary corpus | Synthetic 재현 불가능성 / unique data source | Codeium IDE telemetry · Harvey 법률 corpus |
| ② Workflow Embeddedness | System of record 위에 layered | Customer 워크플로우 rip-out 비용 | Palantir · ServiceNow · Datadog (AI feature 추가) |
| ③ Distribution Moat | 기존 채널 / GTM 우위 | Customer acquisition cost / 채널 leverage | Salesforce Agentforce $800M ARR (CRM 채널) |
| ④ Compute Efficiency | 자체 inference 인프라 / GPU 비용 구조 | Gross margin trajectory (50% → 65% 가능성) | Databricks own infra · OpenRouter $113M Series B |
[실전 코멘트]
몇 곳의 GP 측과 논의하다 보면, Layer 2 (Workflow Embeddedness)만 보고 9-12x를 매기는 경우가 생각보다 많았다. 그러나 글로벌 PE 중에는 4-layer 모두를 점수화한다. Workflow만 통과하고 Data · Distribution · Compute가 미흡하면, well-funded competitor가 18-24개월 안에 같은 워크플로우 위에 더 좋은 AI를 얹어버린다.
5) DD Framework
▣ Due Diligence 7가지 질문 … Pre-LOI 단계 필수 체크리스트 (예시적)
Woozle Research와 PwC의 프레임을 통합·정리해 본 결과10, AI DD의 핵심 질문은 7개로 수렴된다. 이 7개 중 1개라도 “No” 또는 “불분명”이면 entry valuation을 20% 이상 깎거나 walk away.
Pre-LOI 단계에서 CIM만 보고 답을 얻을 수 없는 질문이므로, primary research(customer interview + competitor intel + technologist assessment)를 반드시 동반해야 한다.
| # | 질문 | Bad Answer (Walk away) | Good Answer (Bid) |
|---|---|---|---|
| Q1 | AI가 product인가, feature인가? | “AI는 우리 product의 중요한 feature 中 하나” | “우리 product는 AI 없이는 작동 안 함” |
| Q2 | 모델이 proprietary인가, API wrapper인가? | “OpenAI/Anthropic API 위에 빌드” | “Own fine-tuned + proprietary 데이터로 학습” |
| Q3 | 학습 데이터가 차별화·방어 가능한가? | “Common Crawl + public dataset 사용” | “고객 사용으로 매일 누적되는 unique corpus” |
| Q4 | 고객이 AI에 돈을 내는가, 워크플로우에 돈을 내는가? | “AI 없어도 같은 워크플로우 그대로 사용 가능” | “AI feature 빼면 고객 churn 즉시” |
| Q5 | 12개월 내 well-funded competitor 복제 가능한가? | “이론적으로는 가능” | “데이터 + 채널 동시 복제는 24개월+ 소요” |
| Q6 | Per-seat pricing이 AI agent 잠식되는가? | “Seat 기반 수익, 가격 모델 전환 계획 없음” | “Consumption / outcome-based 전환 진행 중” |
| Q7 | Gross margin이 50-60%인가, 80%+인가? | “GPU COGS를 OPEX로 처리 (마진 80%+ 과장)” | “GPU COGS 차감 후 GM 55-65% 도달 trajectory“ |
6) AI-Washing 함정 … “속고도 모르는 순간”
DD 7가지 질문을 형식상 통과해도 — entry valuation이 망가지는 이유는 5가지의 “AI-washing” 함정이 있었다. 각 함정은 IM 단계에서 표면적으로 감지하기 어렵고, primary research 없이는 거의 100% 놓친다.11
- Demo Theater
- 어떻게 발생: CIM 첨부 demo는 cherry-picked happy path. 실제 production에서는 hallucination rate 20%+
- 피하는 방법: DD에서 customer production data 임의 sample로 live demo 강제 시연
- 피하는 방법: DD에서 customer production data 임의 sample로 live demo 강제 시연
- 어떻게 발생: CIM 첨부 demo는 cherry-picked happy path. 실제 production에서는 hallucination rate 20%+
- Wrapper as Proprietary
- 어떻게 발생: OpenAI/Anthropic API call을 “our proprietary AI model”로 표기. 자체 fine-tuning 결과만 own이라 주장
- 피하는 방법: Model weight ownership 서면 확인 · API call 비율 / 비용 disclosure
- 피하는 방법: Model weight ownership 서면 확인 · API call 비율 / 비용 disclosure
- 어떻게 발생: OpenAI/Anthropic API call을 “our proprietary AI model”로 표기. 자체 fine-tuning 결과만 own이라 주장
- AI Revenue 부풀리기
- 어떻게 발생: 전체 revenue 중에서 “AI feature가 enabling한 revenue”로 광범위 정의. 진짜 AI에 attributable한 ARR은 10-15%
- 피하는 방법: AI feature attached ACV 별도 disclosure AI 없이 churn할 customer cohort 정의
- 피하는 방법: AI feature attached ACV 별도 disclosure AI 없이 churn할 customer cohort 정의
- 어떻게 발생: 전체 revenue 중에서 “AI feature가 enabling한 revenue”로 광범위 정의. 진짜 AI에 attributable한 ARR은 10-15%
- NRR Illusion
- 어떻게 발생: AI 추가로 일시적 ASP 상승 → 12개월 NRR 130%+. 24개월 cohort에서는 110%로 회귀
- 피하는 방법: 24개월 retention cohort 분석 강제 · gross retention과 net retention 분리
- 피하는 방법: 24개월 retention cohort 분석 강제 · gross retention과 net retention 분리
- 어떻게 발생: AI 추가로 일시적 ASP 상승 → 12개월 NRR 130%+. 24개월 cohort에서는 110%로 회귀
- Talent Washing
- 어떻게 발생: “AI 인재 N명” 자랑. 실제로는 ML engineer 1-2명 + 나머지는 일반 SW engineer
- 피하는 방법: Model fine-tuning 결과 검증 · 사내 모델 학습 비율 · MLOps 인프라 확인
- 피하는 방법: Model fine-tuning 결과 검증 · 사내 모델 학습 비율 · MLOps 인프라 확인
- 어떻게 발생: “AI 인재 N명” 자랑. 실제로는 ML engineer 1-2명 + 나머지는 일반 SW engineer
[실전 코멘트]
상기 5가지 함정의 공통 패턴 — 모두 R(Replicability) 변수의 위장이다. “이 회사의 AI를 12개월 안에 복제 가능한가?”를 물으면, 5가지 함정 중 적어도 2-3개 정도는 실사 도중 드러난다. R(Replicability) 변수를 IM에서도, 실사에서도 측정하지 않고, 대신 “AI 매출 비중”이라는 무의미한 지표가 들어가 있는 GP 보고서를 자주 접하면 어떻게 어디서부터 풀어야하나.. 고민이 된다.
결론 … Target 기업의 AI가 과연 프리미엄 있는지 심사가 필요할 때
Growth · Margin · Defensibility 이렇게 3가지를 분자 변수로 Replicability를 분모 변수로 접근하고 측정해 보길 제안한다.
물론 해당 방정식이 만사 능통은 아니다. 그렇다고 모든 AI가 valuation을 자동으로 올려주는 단어가 아니다.
(G × M × D) ÷ R 이라는 4가지 변수로 고려한다면, 3가지 분자 변수 중 하나가 0.5 이하로 떨어지거나, 분모인 R이 0.7 이상으로 폭발하면 — AI를 한다는 회사이 legacy SaaS와 같은 멀티플 수준(3-4x)으로 자동 추락한다. 반대로 4가지 변수 모두 통과한 Target 기업은 Codeium처럼 71x, Wiz처럼 45.7x를 받는다. 같은 “AI 거래”여도 10배 격차가 벌어지는 이유다.
2026년 이후 글로벌 시장 내 AI 분야 valuation 게임에 참여하려면, “AI 매출 비중 %”라는 IM 한 줄을 버리고 4가지 변수를 독립 측정하는 framework로 전환하면 어떨지 제안 드린다. 만약 2026~2028년에 글로벌 기업과 같은 테이블에서 같은 규칙으로 투자 경쟁할 수 있다. 같은 거래에서 30-40% 비싸게 사고, 30-40% 싸게 팔게 되는 사례가 없길 바란다.
Endnotes
- SaasRise AI Software Valuation Report 2026 ↩︎
- Finro Q1 2026, Aventis Advisors ↩︎
- PwC via Woozle Research 2026 ↩︎
- Bain 위닝전략 (한경비즈니스) ↩︎
- 2025년 1월 14일, 레스토랑 자동화 기술 기업인 프레sto 오토메이션(Presto Automation)을 상대로 이른바 ‘AI 워싱(AI-washing)’에 대한 첫 기소 및 제재 조치를 발표, 서비스 초기(2021년~2022년) 프레스트로는 자체 AI 기술을 사용하는 것처럼 서류에 기재했지만, 실제로는 외부 업체의 기술에 전적으로 의존하고 있었음(제3자 기술 의존 은폐) ↩︎
- Ocean Tomo AI Washing 2026 ↩︎
- Eqvista, CB Insights via SaasRise 2026 ↩︎
- 서비스형 소프트웨어인 SaaS(Software as a Service)와 대재앙을 뜻하는 아포칼립스(Apocalypse)의 합성어 ↩︎
- Authenticity Discount(진정성 할인)은 소비자가 브랜드나 기업의 마케팅, 경영 활동을 ‘진정성(Authenticity)’이 부족하고 이윤 추구만을 위한 상업적인 행위로 인식할 때, 해당 브랜드의 제품이나 서비스 가치를 낮게 평가하거나 불매하는 현상 ↩︎
- Woozle Research AI DD Framework 2026 · McKinsey, Where AI Will Create Value, 2026 ↩︎
- Ocean Tomo AI Washing & Board Governance 2026 · Beazley, AI Washing as D&O; Risk · Woozle Research 2026 ↩︎

댓글 남기기