ENDPOINTS
검색의도분류기
검색 키워드의 구매 의도·마케팅 퍼널·신뢰등급을 실시간으로 분류합니다. 다중 한국어 언어모델 앙상블 기반, 1차 의도 85%+ · 종합 정확도 80%+.
POST
/api/v3/intent-classify인증 (Authentication)
모든 요청에 x-api-key 헤더가 필요합니다. 또는 Authorization: Bearer <key> 형식도 지원합니다.
vac-••••••••••••••••••••••••••••••••••••••••••••API 키 발급 및 문의 사항은 고퍼소프트 관계자에게 문의하세요.
요청 파라미터 (Request Body)
Content-Type: application/json
| 파라미터 | 타입 | 필수 | 설명 |
|---|---|---|---|
keyword | string | required | 분류할 검색 키워드 |
tokens | string[ ] | optional | 토큰 목록 (미입력 시 자동 분할) |
tags | string[ ] | optional | 태그 목록 (미입력 시 자동 추정) |
요청 예시
curl -X POST https://0-mac-studio-1.tailed52b5.ts.net/api/v3/intent-classify \
-H "x-api-key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"keyword": "삼성 에어컨 추천"}'응답 스펙 (Response)
| 필드 | 타입 | 설명 |
|---|---|---|
keyword | string | 입력 키워드 |
tokens | string[ ] | 토큰 분해 결과 |
tags | string[ ] | 태그 결과 (18종) |
primary_intent | "T" | "C" | "I" | "N" | 1차 의도 |
secondary_intent | string | null | 2차 의도 (없으면 null) |
is_mixed_intent | boolean | 혼재 의도 여부 |
confidence_grade | "A+" | "A" | "B+" | "B" | "C+" | "C" | 신뢰등급 |
funnel_marketing | "MF1"~"MF6" | 마케팅 퍼널 단계 |
funnel_sales | "SF1"~"SF6" | 세일즈 퍼널 단계 |
intent_probs | object | 의도 확률 분포 {T, C, I, N} |
latency_ms | number | 응답 시간 (ms) |
source | string | 응답 출처 식별자 |
fallback_used | boolean | 보정 모델 사용 여부 |
model_version | string | 모델 버전 |
의도 분류 기준
| 코드 | 이름 | 의미 | 예시 키워드 |
|---|---|---|---|
| T | 거래 (Transactional) | 구매·신청·예약 등 즉각 행위 | 삼성 에어컨 구매, 실손보험 가입 |
| C | 비교 (Commercial) | 구매 전 비교·추천·리뷰 탐색 | 공기청정기 추천, 종신보험 비교 |
| I | 정보 (Informational) | 지식·방법·원리 탐색 | 에어컨 원리, 실손보험이란 |
| N | 네비게이션 (Navigational) | 특정 사이트·브랜드로 이동 | 삼성생명, 카카오뱅크 로그인 |
마케팅 퍼널
| 코드 | 단계 | 의미 |
|---|---|---|
| MF1 | 초기 탐색 | 이런 게 있구나 |
| MF2 | 정보 탐색 | 구체적으로 뭐가 있지? |
| MF3 | 경험 탐색 | 다른 사람은 뭐 샀대? |
| MF4 | 구매 확정 | 이거 사자, 어디서 얼마에? |
| MF5 | 구매 후 | 어떻게 쓰지? |
| MF6 | 리텐션 | 다시 사야지 |
신뢰등급 (Confidence Grade)
| 등급 | 의미 | 처리 |
|---|---|---|
| A+ | 매우 확실 (95%+) | 즉시 서빙 |
| A | 확실 | 즉시 서빙 |
| B+ | 꽤 확신 | 서빙 + 로그 |
| B | 애매 | 서빙 + OOV 큐 저장 |
| C+ | 불확실 | 보정 모델 추가 처리 |
| C | 매우 불확실 | 보정 모델 추가 처리 |
C+/C 등급은 내부 보정 모델을 통해 추가 검증 후 결과를 반환합니다. 저신뢰 결과는 자동 수집되어 모델 개선에 활용됩니다.
모델 스펙
| 모델명 | 검색의도분류기V3 |
| 아키텍처 | 다중 한국어 사전학습 언어모델 앙상블 (Soft-Voting) |
| 학습 데이터 | 네이버 키워드 기반 40만 건 + Human 검수 Gold 데이터 |
| 분류 항목 | 1차 의도 · 2차 의도 · 혼재 여부 · 신뢰등급 · 마케팅 퍼널 · 세일즈 퍼널 (6종 동시 출력) |
| 정확도 | 1차 의도 85%+ · 종합 6항목 80%+ (Human 검수 기준) |
| 추론 속도 | 평균 500ms 이하 (서버 warm-up 후) |
| 하드웨어 | Apple Silicon MPS 가속 |