温馨提示×

spaCy中怎么进行文本相似度计算

小亿
171
2024-05-11 19:13:50
栏目: 编程语言

在spaCy中,可以使用similarity方法来计算两个文本之间的相似度。首先,需要将文本转换成spaCy的Doc对象,然后使用similarity方法来计算相似度。示例如下:

import spacy

# 加载spaCy模型
nlp = spacy.load("en_core_web_lg")

# 将文本转换成Doc对象
doc1 = nlp("apple")
doc2 = nlp("banana")

# 计算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)

在上面的示例中,我们通过加载spaCy的en_core_web_lg模型创建了一个spaCy的Doc对象,并计算了两个文本"apple"和"banana"之间的相似度。similarity方法返回一个0到1之间的值,表示两个文本之间的相似程度,值越接近1表示相似度越高。

0