Embeddings


嵌入是一个由浮点数组成的向量(列表)。两个向量之间的距离衡量了它们之间的相关性。距离小表示相关性高,距离大表示相关性低。

嵌入可以用来创建文本数据的数值表示。这种数值表示很有用,因为它可以用来查找相似的文档。

它们通常用于:

  • 搜索(搜索结果根据与查询字符串的相关性进行排序)

  • 聚类(根据相似性将文本字符串分组)

  • 推荐(推荐具有相关文本字符串的项目)

  • 异常检测(识别出相关性极低的离群值)

  • 多样性度量(分析相似性分布)

  • 分类(根据文本字符串最相似的标签对其进行分类)

嵌入节点:

Last updated