SubtractEmbeddings
v1에서 임베딩 벡터 v2를 빼고 정규화된 벡터로 결과를 반환합니다.
포맷
SubtractEmbeddings ( v1 ; v2 )
매개 변수
v1
및 v2
- 동일한 차원의 임베딩 벡터를 포함하는 모든 텍스트 표현식, 텍스트 필드 또는 컨테이너 필드입니다.
반환되는 데이터 유형
텍스트, 컨테이너
다음 버전에서 시작됨
22.0
설명
이 함수는 두 개의 임베딩 벡터에 대해 벡터 빼기(v1
- v2
)를 수행하고 결과를 정규화된 벡터로 반환합니다. 정규화는 결과 벡터의 초점을 크기보다는 의미론적 방향에 맞추는데, 이는 임베딩을 비교하거나 조작하는 표준 사례입니다.
이 함수를 사용하여 한 벡터(v2
)의 의미를 다른 벡터(v1
)에서 제거하여 의미 개념을 분리하거나 수정합니다. 예를 들어, "겨울" 벡터에서 "추위" 벡터를 빼면 "추위와 무관한 겨울 측면"을 나타내는 벡터가 될 수 있으며, 잠재적으로 "온화한 겨울" 또는 단순히 "계절"과 같은 개념으로 기울어질 수 있습니다. 유명한 비유는 "왕"의 벡터에서 "남자"의 벡터를 빼고 "여자"의 벡터를 더한 값이 "여왕"에 매우 가까운 벡터 결과를 낳는 것입니다.
v1
및 v2
가 텍스트인 경우 JSON 배열의 형태여야 합니다. 하지만 일반적으로 임베딩 벡터를 이진 컨테이너 데이터로 사용하면 성능이 향상됩니다.
참고
-
임베딩 벡터는 동일한 모델에서 생성해야 호환성과 성능을 보장할 수 있으며, 서로 다른 모델의 임베딩 벡터를 혼합하는 것은 지원되지 않습니다.
-
이 함수는 다음의 경우 "?"를 반환합니다.
-
v1
및v2
의 차원이 다른 경우 -
또는 함수가 0 벡터를 정규화할 수 없기 때문에 결과는 0 벡터임(v1과 v2가 동일한 경우 발생할 수 있음)
-
예제 1
SubtractEmbeddings( "[1, 2, 3]" ; "[4, 5, 6]" )
에서 [-0.57735026918962573106, -0.57735026918962573106, -0.57735026918962573106]을 반환합니다. 빼기는 [1-4, 2-5, 3-6] = [-3, -3, -3]입니다. 그런 다음 함수는 이 벡터를 정규화하고 두 입력이 모두 텍스트였기 때문에 JSON 배열로 반환합니다.
예제 2
SubtractEmbeddings( Concepts::Winter_Embedding ; Concepts::Cold_Embedding )
는 "추위"의 개념을 제거한 "겨울"의 개념을 나타내는 정규화된 벡터를 포함하는 컨테이너 객체를 반환합니다.
이 예에서는 Concepts::Winter_Embedding이 "겨울"에 대한 임베딩 벡터를 포함하고 Concepts::Cold_Embedding에 "추위"에 대한 임베딩 벡터가 포함되어 있다고 가정합니다. 결과 벡터는 의미론적 찾기 수행 스크립트 단계와 함께 사용하여 추위가 주요 초점이 아닌 상황에서 겨울을 논의하는 레코드를 찾을 수 있습니다(예: 겨울 패션, 겨울 휴가).
예제 3
"왕 - 남자 + 여자 ≈ 여왕" 비유를 보여주기 위해, SubtractEmbeddings 및 AddEmbeddings의 사용을 결합할 수 있습니다. "왕", "남자", "여자" 및 "여왕"에 대한 임베딩이 포함된 ConceptName 및 ConceptVector 필드가 있는 Concepts(개념) 테이블이 있다고 가정합니다.
변수 설정 [ $kingMinusMan ; 값: SubtractEmbeddings ( Concepts::King_Embedding ; Concepts::Man_Embedding ) ]
변수 설정 [ $queenAnalogyEmbedding ; 값: AddEmbeddings ( $kingMinusMan ; Concepts::Woman_Embedding ) ]
변수 $queenAnalogyEmbedding은 이제 비유 계산에서 나온 정규화된 벡터를 가진 컨테이너 객체를 보유합니다. 다음을 사용하여 비유를 테스트할 수 있습니다.
CosineSimilarity ( $queenAnalogyEmbedding ; Concepts::Vector_Queen )
1에 가까운 결과는 사용된 임베딩 모델에 대해 비유가 잘 유지됨을 나타냅니다.