용어집

지원 분야의 지식 그래프 및 시맨틱 검색

지원 맥락에서 지식 그래프는 개념, 제품, 문제 및 해결책 간의 관계를 구조화하여 표현한 것입니다. 이는 키워드 매칭만으로는 불가능한, 의미와 관계 맥락에 기반하여 관련 지식 기반 콘텐츠를 찾는 시맨틱 검색을 가능하게 합니다. 시맨틱 검색은 셀프 서비스 해결률과 상담원의 지식 발견을 획기적으로 향상시킵니다.

?

지원 지식 기반에서 키워드 검색이 실패하는 이유는 무엇이며, 시맨틱 검색은 어떻게 결과를 개선하나요?

대부분의 고객 지원 센터 및 내부 지식 기반 검색 시스템의 기반인 키워드 검색은 검색자가 답변 문서에 나타나는 것과 정확히 동일한 단어를 사용해야 합니다. 예를 들어, 고객이 "내 계정에 두 번째 이메일을 추가할 수 없어요"라고 검색했을 때, "두 번째 이메일"이나 "추가할 수 없어요"라는 문구가 문서 텍스트에 없으면 "여러 사용자 주소 관리"라는 제목의 문서를 찾지 못할 것입니다. 그 결과는 높은 검색량에도 불구하고 낮은 클릭률, 고객이 원하는 답변을 찾지 못하고 이미 지식 기반에 답변이 있는 질문에 대해 지원 티켓을 여는 상황으로 이어집니다. 시맨틱 검색은 임베딩 모델(텍스트를 숫자 벡터 표현으로 변환하는 신경망)을 사용하여 문자 그대로의 단어 중복이 아닌 의미를 기반으로 쿼리와 문서를 일치시킵니다. "내 계정에 두 번째 이메일을 추가할 수 없어요"라는 쿼리는 공유 키워드가 없더라도 여러 사용자 주소 관리에 대한 문서와 의미론적으로 가깝습니다. 이는 둘의 벡터 표현이 임베딩 공간에서 유사하기 때문입니다. 시맨틱 검색 구현은 키워드 기반 검색과 비교하여 셀프 서비스 문서 클릭률에서 25~40%, 셀프 서비스 해결률에서 15~25%의 지속적인 개선을 보여줍니다. 지원 팀의 경우, 상담원용 지식 포털의 시맨틱 검색은 문서 검색 시간도 단축시켜 AHT(평균 처리 시간)의 가장 중요한 요인 중 하나를 줄여줍니다.
?

제품 및 지원 팀은 지원 지식 기반을 위한 시맨틱 검색을 어떻게 구현하나요?

시맨틱 검색 구현에는 세 가지 구성 요소가 필요합니다. 임베딩 모델: 지식 기반 문서(및 들어오는 쿼리)를 벡터 표현으로 변환하는 텍스트 임베딩 모델입니다. 옵션: OpenAI의 text-embedding-ada-002는 영어 지원 콘텐츠에 가장 널리 사용되는 상업용 임베딩 모델이며, sentence-transformers 모델과 같은 오픈 소스 대안은 데이터 민감 배포를 위해 온프레미스에서 실행됩니다. 벡터 데이터베이스: 수백만 개의 임베딩 벡터에 걸쳐 유사성 검색을 효율적으로 저장하고 가능하게 하는 데이터베이스입니다. 옵션: Pinecone(관리형, 설정이 가장 쉬움), Weaviate(오픈 소스, 더 많은 제어), 또는 pgvector(기존 Postgres 인스턴스 내에서 벡터 검색을 가능하게 하는 PostgreSQL 확장)가 있습니다. 검색 API: 쿼리 흐름 — 들어오는 검색 쿼리는 모델에 의해 임베딩되고, 벡터 데이터베이스는 문서 임베딩에 걸쳐 근접 이웃 검색을 수행하며, 상위 N개의 가장 유사한 문서가 반환되고 순위가 매겨집니다. 대부분의 SaaS 지원 팀에게 가장 빠른 구현 경로는 사용자 지정 파이프라인을 구축하는 대신 지식 관리 도구(Notion AI, Guru, Atlassian Intelligence가 포함된 Confluence) 또는 전용 지원 검색 플랫폼(Algolia NeuralSearch, Help Scout의 Beacon search)의 기본 제공 시맨틱 검색 기능을 사용하는 것입니다.
?

제품이 발전함에 따라 지식 그래프는 어떻게 최신 상태와 정확성을 유지하나요?

지식 그래프 및 시맨틱 검색 시스템은 기본 지식 기반이 오래되면 정확도가 떨어집니다. 이는 임베딩이 생성될 당시의 콘텐츠를 나타내기 때문입니다. 문서가 업데이트되면 해당 문서의 임베딩은 다시 계산되어 벡터 데이터베이스에서 교체되어야 합니다. 유지보수 요구 사항: 자동 재임베딩 파이프라인: 지식 기반 문서가 업데이트될 때마다(CMS 또는 지식 관리 도구의 웹훅으로 감지) 해당 문서는 자동으로 재임베딩되고 벡터 데이터베이스 레코드가 업데이트됩니다. 이는 문서 업데이트 후 몇 분 이내에 완료되는 백그라운드 작업이어야 합니다. 커버리지 모니터링: 높은 신뢰도 일치(유사성 임계값 이상)를 반환하는 상담원 검색 및 고객 지원 센터 검색의 비율과 낮은 신뢰도 또는 일치하지 않는 응답을 반환하는 비율을 추적합니다. 커버리지 비율이 감소하면 지식 기반이 제품에 뒤처지고 있음을 나타냅니다. 즉, 새로운 기능과 문제가 검색되고 있지만 아직 콘텐츠가 존재하지 않는다는 의미입니다. 콘텐츠 격차 알림: 특정 쿼리가 지속적으로 낮은 신뢰도 일치를 반환할 경우, 정확한 쿼리 텍스트와 함께 콘텐츠 팀에 알립니다. 이는 콘텐츠 생성 우선순위가 됩니다. 주기적 재조정: 제품 기능이 크게 발전함에 따라 임베딩 모델이 해당 도메인의 특정 언어에 대해 여전히 유용한 표현을 생성하는지 재평가합니다.

지식 챌린지

지원 분야의 지식 그래프 및 시맨틱 검색을(를) 마스터하셨나요? 이제 관련된 5글자 단어를 맞춰보세요!

입력하거나 키보드를 사용하세요