Embeddings
嵌入是一个由浮点数组成的向量(列表)。两个向量之间的距离衡量了它们之间的相关性。距离小表明相关性高,距离大表明相关性低。
嵌入可用于创建文本数据的数值表示。这种数值表示很有用,因为它可以用来查找相似的文档。
它们通常用于:
搜索(搜索结果根据与查询字符串的相关性进行排序)
聚类(根据相似性对文本字符串进行分组)
推荐(推荐具有相关文本字符串的项目)
异常检测(识别出相关性极低的离群值)
多样性度量(分析相似性分布)
分类(根据文本字符串最相似的标签对其进行分类)
嵌入节点:
Last updated