이전 글에서 고위드 데이터팀이 의사결정 엔진을 만드는 이야기를 했습니다. 이번 글은 그 엔진의 출발점 — 스타트업의 리스크를 어떻게 평가하는지에 대한 이야기입니다.
기업의 신용을 평가할 때, 일반적으로 가장 먼저 확인하는 것은 재무제표입니다. 문제는 스타트업의 재무제표가 통상 분기/반기 재무제표 없이 연 1회, 보통 다음 해 3~4월에야 확정된다는 점입니다.
2026년 1월에 자금 지원이 필요한 스타트업이 있다면, 이 회사가 제출할 수 있는 가장 최신 재무제표는 2024년 기준입니다. 1년 넘게 지난 데이터로 지금의 신용을 판단해야 합니다.
재무제표가 아예 없는 경우도 많습니다. 설립 1년 차 법인은 재무제표가 한 벌뿐이고, 설립 직후라면 아예 없습니다. 한 달 만에 매출이 3배가 되기도 하고, 두 달 만에 런웨이가 바닥나기도 하는 게 스타트업인데, 1~2년 전 스냅샷으로는 이 속도를 따라잡을 수 없습니다.
고위드는 금융사와 스타트업을 연결하는 회사입니다. 스타트업에게 법인카드와 한도를 제공하려면 “이 법인이 법인카드 사용액을 갚을 능력이 있는가”를 판단해야 하는데, 법인의 실시간 현금흐름 데이터를 갖고 있는 고위드가 리스크 평가를 수행하고 이를 기반으로 금융사와 함께 한도를 결정합니다. 전통적인 방식으로는 답이 안 나왔습니다. 그래서 자체 리스크 스코어링 모델을 만들었습니다.
재무제표가 말해주지 않는 것
전통적인 기업 신용평가는 잘 만들어진 시스템입니다. 수십 년간 검증된 지표들 — 부채비율, 유동비율, 이자보상배율 같은 것들을 조합해서 등급을 매깁니다.
이 시스템이 잘 작동하는 조건:
- 매출이 안정적이고
- 분기/반기 보고서가 의무적으로 공시되고
- 신용 이력이 수년간 쌓여 있는 법인
대기업이나 중견기업은 대부분 이 조건을 충족합니다. 문제는 스타트업입니다.
설립 2년 차 SaaS 회사를 생각해보세요. 작년 매출 3억, 올해 상반기에 이미 5억을 찍었습니다. 그런데 가장 최근 확정 재무제표는 작년 말 기준입니다. 그 사이에 시리즈 A를 받았고, 팀이 두 배로 늘었고, 서버 비용이 세 배가 됐습니다. 재무제표만 보면 이 회사의 “지금”은 보이지 않습니다.
반대 경우도 있습니다. 재무제표는 괜찮은데, 최근 몇 달간 급여 지급이 불규칙하고 임차료가 밀리기 시작한 법인. 연말 재무제표에는 아직 반영되지 않은 신호들입니다.
결국 재무제표는 “과거의 결산”이지, “현재의 상태”가 아닙니다. 스타트업처럼 빠르게 변하는 법인을 평가하려면 더 자주, 더 실시간에 가까운 데이터를 봐야 했습니다.
현금흐름이라는 관점
고위드는 법인의 계좌와 거래 데이터를 연동하여 실시간 현금흐름을 수집합니다. 재무제표가 연 1회 찍히는 스냅샷이라면, 현금흐름은 매일 쌓이는 실시간 데이터입니다. 돈이 어디서 들어오고 어디로 나가는지, 그 패턴이 안정적인지 급변하는지.
비유하자면 이렇습니다.
ㅤ | 재무제표 | 현금흐름 |
비유 | 매년 찍는 건강검진 | 매일 차는 스마트워치 |
갱신 주기 | 연 1회 | 실시간 |
보여주는 것 | 과거 결산 시점의 상태 | 지금 이 순간의 흐름 |
놓치는 것 | 결산 이후의 변화 | 구조적 체력 |
건강검진에서는 정상이었어도, 요즘 스마트워치에서 보이는 심박수가 불규칙하면 뭔가 달라진 겁니다.
고위드는 재무제표를 토대로 한 스타트업 신용 평가의 한계를 인지하고, 고위드가 수집하는 일별 현금흐름 데이터를 토대로 “가까운 미래에 연체가 발생할 확률”을 예측하는 머신러닝 모델을 만들었습니다.
동적 데이터만으로는 부족했다 — 정적 데이터와의 결합

초기 버전의 모델은 현금흐름 시계열 데이터만 사용했습니다. 백테스팅을 했을 때 과거에 발생했던 연체를 조기에 식별할 수 있었고, 모델을 운용한 이후로는 손실율이 급격히 감소하는 등 사업적 성과 또한 확인할 수 있었습니다.
하지만 한계가 분명했습니다. 현금흐름 패턴이 비슷해도 재무 구조가 전혀 다른 법인들이 있었거든요. 예를 들면, 현금 보유량이 넉넉한 회사와 빠듯한 회사가 비슷한 규모의 현금 유출입 패턴을 보일 수 있습니다. 이 두 회사는 겉으로는 같아 보일 수 있지만, 사실 내구성은 다릅니다.
이 문제를 해결하기 위해서 고위드가 선택한 접근은 동적인 데이터와 정적인 데이터를 결합(Temporal-Static Fusion)하여 모델에 입력하는 구조입니다.
ㅤ | 동적 데이터 (현금흐름) | 정적 데이터 (재무제표) |
데이터 성격 | 매일 갱신되는 시계열 | 연 1회 확정되는 스냅샷 |
추출 가능한 것 | 추세, 변동성, 주기성 등 temporal feature | 부채비율, 유동비율, 자본 구조 등 cross-sectional feature |
알 수 있는 것 | “이 회사가 지금 어떤 방향으로 움직이고 있는가” — 궤적 | “이 회사의 구조적 체력이 어느 정도인가” — 기저 상태 |
위 두 데이터는 별도의 파이프라인으로 처리된 뒤 결합됩니다. 법인의 현금흐름 데이터에서 추출한 동적 데이터와 재무제표에서 추출한 정적 데이터는 서로 다른 스케일과 분포를 가지고 있기 때문에, 각각 별도의 정규화 과정을 거친 후 결합됩니다.
법인의 현금흐름 데이터는 다양한 전처리 과정을 거쳐서 고유한 의미를 갖는 동적 데이터로 변환되고, 이 동적 데이터를 모델에 전달하여 표상(Representation)을 추출합니다. 재무제표에서는 기업 가치 평가 등 도메인 지식을 기반으로 설계된 정적 파생 변수가 생성되며, 표상과 정적 파생 변수를 결합해 최종 모델에 입력하여 해당 법인의 연체 확률을 획득합니다.
이 구조를 도입한 뒤, 주요 판별 지표(정밀도, 재현율, 손실방어율 등)를 기준으로 유의미한 개선을 확인했습니다.
“위험하다”만으로는 부족하다 — 모델 결과를 의사결정으로 만들기
모델이 “이 법인은 위험합니다”라고 말해주면 그걸로 끝일까요? 아닙니다. 현장에서는 바로 다음 질문이 나옵니다.
“그래서 어떻게 해야 하는데?”
- 한도를 줄여야 하는지
- 모니터링만 강화하면 되는지
- 아니면 당장 조치가 필요한지
위험하다는 신호만으로는 이런 의사결정을 내릴 수 없습니다. 위험의 정도가 사람이 이해할 수 있도록 수치로 표현되어야 하고, 그 수치가 구체적인 액션과 연결되어야 합니다.
그래서 모델의 출력을 등급으로 가공합니다. 모델이 출력하는 연체 확률 또는 레이블을 등급으로 변환하는 겁니다.
모델 출력 | 의사결정 연결 |
“이 법인은 위험합니다” (0 또는 1의 레이블값,
혹은 0~1사이의 확률값) | → 그래서 뭘 해야 하지? ❌ |
“이 법인은 주의 등급입니다” | → 이 등급에 대한 프로세스를 따르자 ✅ |
고위드는 각 등급별로 한도 기준, 모니터링 주기, 대응 방식을 정해두었습니다. 등급이 나오는 순간 액션이 자동으로 따라옵니다. 리스크 스코어링 모델이 단독으로 끝나는 게 아니라, 의사결정 엔진의 핵심 입력이 됩니다.
설계 원칙: “경고가 있어도 추론은 한다”
데이터 품질이 완벽하지 않은 법인도 있습니다. 예를 들어,
- 설립 초기라 이력이 짧거나
- 데이터 수집에 일시적 문제가 있거나
이런 경우 모델 추론을 중단하는 대신, 경고를 기록하고 등급은 산출합니다. “이 등급은 데이터 품질 이슈가 있으니 참고하라”는 맥락을 함께 전달하는 겁니다. 의사결정 담당자는 모델의 등급 뿐만 아니라 경고 정보까지 종합해서 최종 의사결정을 내립니다.
커버리지를 최대한 넓게 유지하면서도, 불확실성을 숨기지 않는 방식입니다.
모델이 바뀌어도 등급은 흔들리지 않아야 한다

모델은 계속 개선됩니다. 새 피처가 추가되고, 학습 데이터가 늘어나고, 아키텍처가 바뀝니다. 모델이 바뀔 때마다 같은 등급의 의미가 달라지면 곤란합니다 — 등급별 의사결정 기준이 흔들리니까요.
그래서 등급 체계가 안정적인 의미를 가질 수 있도록 설계했습니다. 모델이 출력하는 확률값을 통계적 변환을 거쳐 일관된 스케일에 매핑합니다. 모델이 바뀌어도 동일한 위험 수준의 법인이 같은 등급을 받도록 만들며, 모델이 개선될 때마다 등급 체계의 안정성을 모니터링합니다. 완벽하지는 않지만, 의사결정 체계가 모델 버전에 무관하게 동작할 수 있는 기반이 됩니다.
아직 풀고 있는 문제들
완성된 이야기가 아닙니다. 지금도 고민하고 있는 것들이 있습니다.
- 데이터 부족: 설립 초기 법인은 현금흐름 이력 자체가 짧습니다. 모델이 요구하는 기간만큼 데이터가 쌓이지 않은 법인을 어떻게 평가할 것인가.
- 업종별 차이: 업종별로 현금흐름 패턴이 크게 다릅니다. 하나의 모델로 커버하는 게 맞는지, 업종별 모델을 따로 만들어야 하는지.
- 환경 변화: 거시경제 환경이 바뀌면 과거 데이터로 학습한 모델의 유효성이 어디까지인지. 실제로 특정 시점 전후로 모델 성능 변화를 관찰한 적이 있고, 이를 조기에 감지하는 모니터링 체계를 고도화하고 있습니다.
스타트업을 평가하는 일은, 어떤 면에서 스타트업을 만드는 일과 비슷합니다. 불확실성 속에서 제한된 정보로 최선의 판단을 내려야 하고, 그 판단을 계속 검증하고 개선해야 합니다.
고위드 데이터팀은 이 문제를 풀고 있습니다. 전통 금융이 커버하지 못하는 영역에서, 데이터로 신뢰를 만드는 일. 이 모델을 통해 리스크 수준에 맞는 적정 한도를 빠르게 제공하고, 위험 신호가 포착된 법인은 사전에 관리할 수 있게 됐습니다.
고위드 데이터팀은 DPM, DS, DAE, DA, PE로 구성되어 모델 개발부터 의사결정 엔진 운영까지 end-to-end로 담당합니다. 스타트업의 신용을 데이터로 읽는 일에 관심이 있다면, 지금 고위드 데이터팀 채용 정보를 확인해보세요.
Share article