温馨提示×

spaCy怎么评估文本分类器的性能

小亿
85
2024-05-13 14:07:18
栏目: 编程语言

在spaCy中,可以使用evaluate()方法来评估文本分类器的性能。该方法需要传入一个可迭代的样本集,其中每个样本是一个元组,包含文本和标签。然后,该方法会返回一个包含性能指标的字典,包括准确率(accuracy)、精确率(precision)、召回率(recall)、F1值等。

下面是一个示例代码,演示如何使用evaluate()方法评估文本分类器的性能:

import spacy

# 加载spaCy模型
nlp = spacy.load("en_core_web_sm")

# 准备样本集
test_samples = [
    ("This is a great movie", "POSITIVE"),
    ("I did not like this book", "NEGATIVE"),
    ("The weather is nice today", "NEUTRAL")
]

# 加载分类器
textcat = nlp.get_pipe("textcat")

# 评估性能
evaluation_results = textcat.evaluate(test_samples)
print(evaluation_results)

运行该代码后,将会输出包含性能指标的字典,可以根据这些指标来评估文本分类器的性能。

0