温馨提示×

spaCy中怎么进行文本距离计算

小亿
94
2024-05-11 19:14:52
栏目: 编程语言

在spaCy中,可以使用similarity方法来计算两个文本之间的相似度(文本距离)。以下是一个示例代码:

import spacy

# 加载预训练的模型
nlp = spacy.load("en_core_web_sm")

# 创建两个文本
text1 = "apple"
text2 = "banana"

# 处理文本
doc1 = nlp(text1)
doc2 = nlp(text2)

# 计算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)

在上面的示例中,我们加载了英文的预训练模型en_core_web_sm,然后创建了两个文本text1text2,并将它们分别处理为spaCy文档对象doc1doc2。最后,我们使用similarity方法计算了这两个文本之间的相似度,并打印输出结果。

请注意,文本相似度的值范围在0到1之间,值越接近1表示文本越相似。

0