SubtractEmbeddings

v1에서 임베딩 벡터 v2를 빼고 정규화된 벡터로 결과를 반환합니다.

포맷

SubtractEmbeddings ( v1 ; v2 )

매개 변수

v1 및 v2 - 동일한 차원의 임베딩 벡터를 포함하는 모든 텍스트 표현식, 텍스트 필드 또는 컨테이너 필드입니다.

반환되는 데이터 유형

텍스트, 컨테이너

다음 버전에서 시작됨

22.0

설명

이 함수는 두 개의 임베딩 벡터에 대해 벡터 빼기(v1 - v2)를 수행하고 결과를 정규화된 벡터로 반환합니다. 정규화는 결과 벡터의 초점을 크기보다는 의미론적 방향에 맞추는데, 이는 임베딩을 비교하거나 조작하는 표준 사례입니다.

이 함수를 사용하여 한 벡터(v2)의 의미를 다른 벡터(v1)에서 제거하여 의미 개념을 분리하거나 수정합니다. 예를 들어, "겨울" 벡터에서 "추위" 벡터를 빼면 "추위와 무관한 겨울 측면"을 나타내는 벡터가 될 수 있으며, 잠재적으로 "온화한 겨울" 또는 단순히 "계절"과 같은 개념으로 기울어질 수 있습니다. 유명한 비유는 "왕"의 벡터에서 "남자"의 벡터를 빼고 "여자"의 벡터를 더한 값이 "여왕"에 매우 가까운 벡터 결과를 낳는 것입니다.

v1 및 v2가 텍스트인 경우 JSON 배열의 형태여야 합니다. 하지만 일반적으로 임베딩 벡터를 이진 컨테이너 데이터로 사용하면 성능이 향상됩니다.

참고

임베딩 벡터는 동일한 모델에서 생성해야 호환성과 성능을 보장할 수 있으며, 서로 다른 모델의 임베딩 벡터를 혼합하는 것은 지원되지 않습니다.
이 함수는 다음의 경우 "?"를 반환합니다.
- v1 및 v2의 차원이 다른 경우
- 또는 함수가 0 벡터를 정규화할 수 없기 때문에 결과는 0 벡터임(v1과 v2가 동일한 경우 발생할 수 있음)

예제 1

SubtractEmbeddings( "[1, 2, 3]" ; "[4, 5, 6]" )에서 [-0.57735026918962573106, -0.57735026918962573106, -0.57735026918962573106]을 반환합니다. 빼기는 [1-4, 2-5, 3-6] = [-3, -3, -3]입니다. 그런 다음 함수는 이 벡터를 정규화하고 두 입력이 모두 텍스트였기 때문에 JSON 배열로 반환합니다.

예제 2

SubtractEmbeddings( Concepts::Winter_Embedding ; Concepts::Cold_Embedding )는 "추위"의 개념을 제거한 "겨울"의 개념을 나타내는 정규화된 벡터를 포함하는 컨테이너 객체를 반환합니다.

이 예에서는 Concepts::Winter_Embedding이 "겨울"에 대한 임베딩 벡터를 포함하고 Concepts::Cold_Embedding에 "추위"에 대한 임베딩 벡터가 포함되어 있다고 가정합니다. 결과 벡터는 의미론적 찾기 수행 스크립트 단계와 함께 사용하여 추위가 주요 초점이 아닌 상황에서 겨울을 논의하는 레코드를 찾을 수 있습니다(예: 겨울 패션, 겨울 휴가).

예제 3

"왕 - 남자 + 여자 ≈ 여왕" 비유를 보여주기 위해, SubtractEmbeddings 및 AddEmbeddings의 사용을 결합할 수 있습니다. "왕", "남자", "여자" 및 "여왕"에 대한 임베딩이 포함된 ConceptName 및 ConceptVector 필드가 있는 Concepts(개념) 테이블이 있다고 가정합니다.

복사

변수 설정 [ $kingMinusMan ; 값: SubtractEmbeddings ( Concepts::King_Embedding ; Concepts::Man_Embedding ) ]
변수 설정 [ $queenAnalogyEmbedding ; 값: AddEmbeddings ( $kingMinusMan ; Concepts::Woman_Embedding ) ]

변수 $queenAnalogyEmbedding은 이제 비유 계산에서 나온 정규화된 벡터를 가진 컨테이너 객체를 보유합니다. 다음을 사용하여 비유를 테스트할 수 있습니다.

CosineSimilarity ( $queenAnalogyEmbedding ; Concepts::Vector_Queen )

1에 가까운 결과는 사용된 임베딩 모델에 대해 비유가 잘 유지됨을 나타냅니다.