SubtractEmbeddings

v1에서 임베딩 벡터 v2를 빼고 정규화된 벡터로 결과를 반환합니다.

포맷 

SubtractEmbeddings ( v1 ; v2 )

매개 변수 

v1v2 - 동일한 차원의 임베딩 벡터를 포함하는 모든 텍스트 표현식, 텍스트 필드 또는 컨테이너 필드입니다.

반환되는 데이터 유형 

텍스트, 컨테이너

다음 버전에서 시작됨 

22.0

설명 

이 함수는 두 개의 임베딩 벡터에 대해 벡터 빼기(v1 - v2)를 수행하고 결과를 정규화된 벡터로 반환합니다. 정규화는 결과 벡터의 초점을 크기보다는 의미론적 방향에 맞추는데, 이는 임베딩을 비교하거나 조작하는 표준 사례입니다.

이 함수를 사용하여 한 벡터(v2)의 의미를 다른 벡터(v1)에서 제거하여 의미 개념을 분리하거나 수정합니다. 예를 들어, "겨울" 벡터에서 "추위" 벡터를 빼면 "추위와 무관한 겨울 측면"을 나타내는 벡터가 될 수 있으며, 잠재적으로 "온화한 겨울" 또는 단순히 "계절"과 같은 개념으로 기울어질 수 있습니다. 유명한 비유는 "왕"의 벡터에서 "남자"의 벡터를 빼고 "여자"의 벡터를 더한 값이 "여왕"에 매우 가까운 벡터 결과를 낳는 것입니다.

v1v2가 텍스트인 경우 JSON 배열의 형태여야 합니다. 하지만 일반적으로 임베딩 벡터를 이진 컨테이너 데이터로 사용하면 성능이 향상됩니다.

참고 

  • 임베딩 벡터는 동일한 모델에서 생성해야 호환성과 성능을 보장할 수 있으며, 서로 다른 모델의 임베딩 벡터를 혼합하는 것은 지원되지 않습니다.

  • 이 함수는 다음의 경우 "?"를 반환합니다.

    • v1v2의 차원이 다른 경우

    • 또는 함수가 0 벡터를 정규화할 수 없기 때문에 결과는 0 벡터임(v1과 v2가 동일한 경우 발생할 수 있음)

예제 1 

SubtractEmbeddings( "[1, 2, 3]" ; "[4, 5, 6]" )에서 [-0.57735026918962573106, -0.57735026918962573106, -0.57735026918962573106]을 반환합니다. 빼기는 [1-4, 2-5, 3-6] = [-3, -3, -3]입니다. 그런 다음 함수는 이 벡터를 정규화하고 두 입력이 모두 텍스트였기 때문에 JSON 배열로 반환합니다.

예제 2 

SubtractEmbeddings( Concepts::Winter_Embedding ; Concepts::Cold_Embedding )는 "추위"의 개념을 제거한 "겨울"의 개념을 나타내는 정규화된 벡터를 포함하는 컨테이너 객체를 반환합니다.

이 예에서는 Concepts::Winter_Embedding이 "겨울"에 대한 임베딩 벡터를 포함하고 Concepts::Cold_Embedding에 "추위"에 대한 임베딩 벡터가 포함되어 있다고 가정합니다. 결과 벡터는 의미론적 찾기 수행 스크립트 단계와 함께 사용하여 추위가 주요 초점이 아닌 상황에서 겨울을 논의하는 레코드를 찾을 수 있습니다(예: 겨울 패션, 겨울 휴가).

예제 3 

"왕 - 남자 + 여자 ≈ 여왕" 비유를 보여주기 위해, SubtractEmbeddings 및 AddEmbeddings의 사용을 결합할 수 있습니다. "왕", "남자", "여자" 및 "여왕"에 대한 임베딩이 포함된 ConceptName 및 ConceptVector 필드가 있는 Concepts(개념) 테이블이 있다고 가정합니다.

복사
변수 설정 [ $kingMinusMan ; 값: SubtractEmbeddings ( Concepts::King_Embedding ; Concepts::Man_Embedding ) ]
변수 설정 [ $queenAnalogyEmbedding ; 값: AddEmbeddings ( $kingMinusMan ; Concepts::Woman_Embedding ) ]

변수 $queenAnalogyEmbedding은 이제 비유 계산에서 나온 정규화된 벡터를 가진 컨테이너 객체를 보유합니다. 다음을 사용하여 비유를 테스트할 수 있습니다.

CosineSimilarity ( $queenAnalogyEmbedding ; Concepts::Vector_Queen )

1에 가까운 결과는 사용된 임베딩 모델에 대해 비유가 잘 유지됨을 나타냅니다.