코사인/내적/L2 거리. 배치 upsert·압축으로 비용/성능 밸런스.
벡터 데이터베이스 (Vector DB)
RAG/시맨틱 검색을 위한 임베딩 벡터 저장·검색 서비스. 컬렉션/네임스페이스, HNSW/IVF 등 인덱스, 필터링·하이브리드 검색, 모니터링/보안까지. 요금은 별도문의로 안내합니다.
팀·프로젝트 단위 다중 네임스페이스와 메타데이터 필터.
HNSW, IVF-PQ, Disk 기반 인덱스(옵션) 중 워크로드별 선택.
데이터 암호화, IAM 정책, 감사로그·모니터링 연동.
스키마(예시)
| 필드 | 타입 | 설명 |
|---|---|---|
| id | string | 문서/청크 고유 ID |
| vector | float[] | d 차원 임베딩 (예: 768/1024/3072) |
| text | string | 원문 또는 청크 텍스트 |
| meta | object | 키워드, 태그, 권한, 날짜 등 필터용 |
| ns | string | 네임스페이스(팀/프로젝트 경계) |
* 차원(d)/거리함수는 컬렉션 생성 시 고정됩니다.
예시: 임베딩 파이프라인
# 1) 텍스트를 청크로 분할 (예: 800자, 100자 오버랩) # 2) 임베딩 모델 호출 → 벡터 리스트 생성 # 3) 메타데이터 생성(ns, 태그, 권한 등) # 4) upsert(batch)로 컬렉션에 적재
예시: upsert(JSON)
POST /v1/vector/upsert
{
"collection": "docs",
"namespace": "team-a",
"points": [
{"id":"a1","vector":[0.12, ...],"text":"청크1","meta":{"topic":"guide","lang":"ko"}},
{"id":"a2","vector":[-0.03, ...],"text":"청크2","meta":{"topic":"faq","lang":"ko"}}
]
}
인덱스/거리함수
| 유형 | 핵심 파라미터 | 특징/적합 |
|---|---|---|
| HNSW | M, efConstruction, efSearch | 고정밀·낮은 지연. 대부분의 온라인 검색에 적합 |
| IVF-PQ | nlist, nprobe, pq(m×nbits) | 대규모·저비용. 오프라인 배치/대용량 인덱스 |
| DiskANN(옵션) | 캐시 크기, I/O 병렬 | 메모리 제약 환경에서 대용량 처리 |
| 거리함수 | cosine / ip / l2 | 임베딩 학습 방식에 맞춰 선택 |
KNN + 필터 검색
POST /v1/vector/query
{
"collection": "docs",
"namespace": "team-a",
"vector": [0.02, ...],
"topK": 5,
"filter": {"meta.topic": {"$in": ["guide","faq"]}, "meta.lang":"ko"},
"include": ["text","meta"],
"rerank": {"strategy":"mmr", "lambda":0.5}
}
문자열 + 벡터(하이브리드)
# 1) BM25(키워드) 상위 k1 # 2) 벡터 유사도 상위 k2 # 3) 점수 정규화 후 가중 합산(α*BM25 + (1-α)*sim) # 4) 중복 제거 → 최종 TopK
하이브리드 검색 옵션
| 옵션 | 설명 | 비고 |
|---|---|---|
| Late Fusion | BM25·KNN 점수 결합 | 빠르고 간단 |
| Cross-Encoder | 상위 후보 재랭크 | 정확도↑, 지연↑ |
| MMR | 다양성 극대화(중복 억제) | QA·요약에 유리 |
운영/확장
샤딩/복제 — 컬렉션당 샤드 수, 복제 계수 선택.
일괄 적재 — 배치 upsert·비동기 빌드로 재색인 단축.
백업/스냅샷 — 스냅샷 + 내보내기(객체 스토리지 연동).
일관성 — 쓰기 확인 수준(단일/쿼럼) 선택.
TTL/보존 — 임시 임베딩 자동 만료 옵션.
버전 관리 — 임베딩 모델 교체 시 롤링 마이그레이션.
보안
IAM — 사용자/역할/정책 기반 접근제어, 네임스페이스 격리.
암호화 — 저장 시(At-Rest)·전송 중(In-Transit) 암호화.
네트워크 — VPC/서브넷, 보안그룹, 프라이빗 엔드포인트.
감사로그 — 쿼리/업데이트 이벤트 기록·보관.
쿼터/레이트 — API 키·쿼터·속도 제한으로 오남용 방지.
디도스보호(프록시) — 엣지 프록시 보호 연동(옵션).
모니터링/로그
| 항목 | 범위 | 설명 |
|---|---|---|
| 메트릭 | 컬렉션/샤드/노드 | QPS, 지연 p50/p95/p99, 인덱스 빌드, 리콜 샘플링 |
| 로그 | 요청/오류 | 슬로우 쿼리, 필터/스코어, 재시도 |
| 트레이싱 | 요청 체인 | 임베딩→검색→LLM 응답 경로 추적 |
요금 안내
요금: 별도문의
컬렉션 수/차원 수(d)/인덱스 유형/스토리지 용량/트래픽/보관기간에 따라 산정됩니다.
RAG·시맨틱 검색, 지금 시작하세요
문서 유형/임베딩 차원/예상 QPS를 알려주시면 최적 구성을 제안드립니다.
벡터 DB 상담
ℹ️
개인정보 처리 안내
문의 응대를 위해서만 사용되며 일정 기간 후 파기됩니다.