AddEmbeddings
두 개의 임베딩 벡터를 추가하고 결과를 정규화된 벡터로 반환합니다.
포맷
AddEmbeddings ( v1 ; v2 )
매개 변수
v1
및 v2
- 동일한 차원의 임베딩 벡터를 포함하는 모든 텍스트 표현식, 텍스트 필드 또는 컨테이너 필드입니다.
반환되는 데이터 유형
텍스트, 컨테이너
다음 버전에서 시작됨
22.0
설명
이 함수는 두 개의 임베딩 벡터에 벡터 덧셈을 수행하고 결과를 정규화된 벡터로 반환합니다. 정규화는 결과 벡터의 크기보다는 의미론적 방향에 초점을 맞추는데, 이는 임베딩을 비교하거나 조작하는 표준 사례입니다.
이 함수를 사용하여 벡터로 표현되는 두 개념의 의미론적 의미를 결합합니다. 예를 들어 "I like dogs"에 대한 벡터와 "I like cats"에 대한 벡터를 추가하면 "I like pets" 또는 "I like both dogs and cats"에 더 가까운 개념을 나타내는 벡터가 나올 수 있습니다. 이는 개념을 넓히기 위한 의미 검색이나 집계된 의미를 찾기 위한 데이터 분석에 유용할 수 있습니다.
v1
및 v2
가 텍스트인 경우 JSON 배열의 형태여야 합니다. 하지만 일반적으로 임베딩 벡터를 이진 컨테이너 데이터로 사용하면 성능이 향상됩니다.
참고
-
임베딩 벡터는 동일한 모델에서 생성해야 호환성과 성능을 보장할 수 있으며, 서로 다른 모델의 임베딩 벡터를 혼합하는 것은 지원되지 않습니다.
-
이 함수는 다음의 경우 "?"를 반환합니다.
-
v1
및v2
의 차원이 다른 경우 -
또는 함수가 0 벡터를 정규화할 수 없기 때문에 결과는 0 벡터(v1과 v2가 동일하지만 반대 부호를 갖는 경우 발생할 수 있음)입니다.
-
예제 1
AddEmbeddings( "[1, 2, 3]" ; "[4, 5, 6]" )
는 [0.40160966445124940405, 0.56225353023174917677, 0.722897396012249005]를 반환합니다. 더하기는 [1+4, 2+5, 3+6] = [5, 7, 9]입니다. 그런 다음 함수는 이 벡터를 정규화하고 두 입력이 모두 텍스트였기 때문에 JSON 배열로 반환합니다.
예제 2
AddEmbeddings( Products::Smartphone_Embedding ; Products::Premium_Embedding )
는 "premium smartphone"의 결합된 개념을 나타내는 정규화된 벡터에 대한 컨테이너 데이터를 반환합니다.
이 예에서는 Products::Smartphone_Embedding 필드에 "smartphone" 텍스트에 대한 임베딩 벡터가 포함되어 있고 Products::Premium_Embedding에 "premium" 텍스트에 대한 임베딩 벡터가 포함되어 있다고 가정합니다. 결과 벡터는 의미론적 찾기 수행 스크립트 단계와 함께 사용되어 의미론적으로 이 결합된 개념에 가까운 제품 설명을 찾을 수 있습니다.