golden_builder 조달청 ISP PoC · 골든셋 빌더

조달-민간 매칭 골든셋 빌더

방안 1·2 모델 평가의 ground truth 를 만든다. 자동만 쓰면 90%가 노이즈, 사람만 쓰면 규모가 안 나옴. 자동 발견 → 1차 검수 → 자동 캡처·추출 → 2차 라벨링 의 4단계로 1명 1일에 500건 골든셋이 가능하게 한다.

파이프라인 8단계

시드 → 후보 → GATE 1 → 캡처 → 추출 → GATE 2 → 골든셋 → 평가
01
시드
조달 식별번호
176
02
후보 발견
자동 검색
03
GATE 1
1차 검수
통과
04
캡처
Playwright
페이지
05
추출
L1 + L3
06
GATE 2
2차 라벨
대기
07
골든셋
ground truth
08
평가
방안 1·2
GATE 1

1차 검수 — "이 후보 수집할 가치 있나?"

자동 발견 후보의 매칭률이 ~10%. 캡처 들어가기 전에 사람이 5~10초만에 버릴까 말까 결정. 헛돈 90% 절감.

검수 시작 대기: 0
GATE 2

2차 라벨링 — "진짜 같은 상품인가?"

LLM이 옵션·리뷰까지 다 추출했어도 최종 판정은 사람. EXACT / SIMILAR_HIGH / SIMILAR_MEDIUM / DIFFERENT 4단계 + 불공정 신호.

라벨링 시작 대기: 0

시드 — PoC 15품목

기존 OpenAPI 인덱스 176건 재사용
등급 분류명 분류번호 활성 계약 목표 골든셋 현재 골든셋
노트북컴퓨터 43211503 176 200 0 / 200 검수 →
태블릿컴퓨터 43211509 0 0 검수 →
레이저프린터 43212105 0 100 0 / 100 검수 →
디지털카메라 45121504 0 0 검수 →
가정용전자레인지 52141502 0 0 검수 →
액정모니터 43211902 0 100 0 / 100 검수 →
냉난방기 40101787 0 0 검수 →
공기청정기 40161602 0 0 검수 →
김치냉장고 52141554 0 0 검수 →
자동전자혈압계 42181602 0 0 검수 →
멀티미디어학습장치 60109399 0 0 검수 →
도구보관캐비닛 24112401 0 0 검수 →
방역용소독기 46182401 0 0 검수 →
우산빗물제거기 47121697 0 0 검수 →
종이펀칭기/바인딩기 44101602 0 0 검수 →

왜 새 파이프라인인가

  • • NAVER Open API 는 14항목 중 6항목 미제공 — 옵션·카드가·배송비·리뷰·상세·판매량
  • • 조달 전용 SKU 매칭률 ~10% — 무차별 자동 수집은 헛돈
  • shop.g2b.go.kr 등 한국 외 IP 차단 → 한국 IP 캡처 필수
  • • selector 5사이트 유지보수 연 ₩5M+ vs LLM prompt 하나로 모든 사이트

4-Tier 추출 (싼 것부터)

Tier방법비용/페이지
L1JSON-LD 정규식$0
L2BeautifulSoup selector$0.0001
L3LLM (Claude→sLLM swap)$0.05~0.15
L4Web Agent (옵션 클릭)$0.30~1.00

운영 패턴: L1 시도 → 부족 필드만 L3 호출. 80% 트래픽 L1 로 종료. 사업화 단계엔 L3 를 자체 EXAONE / HCX SEED 로 swap.