Embeddings
嵌入是一个由浮点数组成的向量(列表)。两个向量之间的距离衡量了它们之间的相关性。距离小表示相关性高,距离大表示相关性低。
嵌入可以用来创建文本数据的数值表示。这种数值表示很有用,因为它可以用来查找相似的文档。
它们通常用于:
搜索(搜索结果根据与查询字符串的相关性进行排序)
聚类(根据相似性将文本字符串分组)
推荐(推荐具有相关文本字符串的项目)
异常检测(识别出相关性极低的离群值)
多样性度量(分析相似性分布)
分类(根据文本字符串最相似的标签对其进行分类)
嵌入节点:
Last updated