조달-민간 매칭 골든셋 빌더
방안 1·2 모델 평가의 ground truth 를 만든다. 자동만 쓰면 90%가 노이즈, 사람만 쓰면 규모가 안 나옴. 자동 발견 → 1차 검수 → 자동 캡처·추출 → 2차 라벨링 의 4단계로 1명 1일에 500건 골든셋이 가능하게 한다.
파이프라인 8단계
시드 → 후보 → GATE 1 → 캡처 → 추출 → GATE 2 → 골든셋 → 평가01
시드
조달 식별번호
176
건
02
후보 발견
자동 검색
—
건
03
GATE 1
1차 검수
—
통과
04
캡처
Playwright
—
페이지
05
추출
L1 + L3
—
건
06
GATE 2
2차 라벨
—
대기
07
골든셋
ground truth
—
건
08
평가
방안 1·2
—
—
GATE 1
1차 검수 — "이 후보 수집할 가치 있나?"
자동 발견 후보의 매칭률이 ~10%. 캡처 들어가기 전에 사람이 5~10초만에 버릴까 말까 결정. 헛돈 90% 절감.
검수 시작
대기: 0건
GATE 2
2차 라벨링 — "진짜 같은 상품인가?"
LLM이 옵션·리뷰까지 다 추출했어도 최종 판정은 사람. EXACT / SIMILAR_HIGH / SIMILAR_MEDIUM / DIFFERENT 4단계 + 불공정 신호.
라벨링 시작
대기: 0건
시드 — PoC 15품목
기존 OpenAPI 인덱스 176건 재사용| 등급 | 분류명 | 분류번호 | 활성 계약 | 목표 골든셋 | 현재 골든셋 | |
|---|---|---|---|---|---|---|
| 상 | 노트북컴퓨터 | 43211503 | 176 | 200 | 0 / 200 | 검수 → |
| 상 | 태블릿컴퓨터 | 43211509 | 0 | — | 0 | 검수 → |
| 상 | 레이저프린터 | 43212105 | 0 | 100 | 0 / 100 | 검수 → |
| 상 | 디지털카메라 | 45121504 | 0 | — | 0 | 검수 → |
| 상 | 가정용전자레인지 | 52141502 | 0 | — | 0 | 검수 → |
| 중 | 액정모니터 | 43211902 | 0 | 100 | 0 / 100 | 검수 → |
| 중 | 냉난방기 | 40101787 | 0 | — | 0 | 검수 → |
| 중 | 공기청정기 | 40161602 | 0 | — | 0 | 검수 → |
| 중 | 김치냉장고 | 52141554 | 0 | — | 0 | 검수 → |
| 중 | 자동전자혈압계 | 42181602 | 0 | — | 0 | 검수 → |
| 하 | 멀티미디어학습장치 | 60109399 | 0 | — | 0 | 검수 → |
| 하 | 도구보관캐비닛 | 24112401 | 0 | — | 0 | 검수 → |
| 하 | 방역용소독기 | 46182401 | 0 | — | 0 | 검수 → |
| 하 | 우산빗물제거기 | 47121697 | 0 | — | 0 | 검수 → |
| 하 | 종이펀칭기/바인딩기 | 44101602 | 0 | — | 0 | 검수 → |
왜 새 파이프라인인가
- • NAVER Open API 는 14항목 중 6항목 미제공 — 옵션·카드가·배송비·리뷰·상세·판매량
- • 조달 전용 SKU 매칭률 ~10% — 무차별 자동 수집은 헛돈
- •
shop.g2b.go.kr등 한국 외 IP 차단 → 한국 IP 캡처 필수 - • selector 5사이트 유지보수 연 ₩5M+ vs LLM prompt 하나로 모든 사이트
4-Tier 추출 (싼 것부터)
| Tier | 방법 | 비용/페이지 |
|---|---|---|
| L1 | JSON-LD 정규식 | $0 |
| L2 | BeautifulSoup selector | $0.0001 |
| L3 | LLM (Claude→sLLM swap) | $0.05~0.15 |
| L4 | Web Agent (옵션 클릭) | $0.30~1.00 |
운영 패턴: L1 시도 → 부족 필드만 L3 호출. 80% 트래픽 L1 로 종료. 사업화 단계엔 L3 를 자체 EXAONE / HCX SEED 로 swap.