温馨提示×

怎么使用NLTK库对齐文本

小亿
82
2024-05-11 19:02:56
栏目: 编程语言

NLTK库可以通过使用align_words函数对文本进行对齐。以下是一个示例代码:

from nltk.translate import AlignedSent
from nltk.translate import Alignment

src_words = ['I', 'saw', 'the', 'man']
tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']

alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])

aligned_sent = AlignedSent(src_words, tgt_words, alignment)

print(aligned_sent.words)
print(aligned_sent.mots)
print(aligned_sent.alignment)

在这个示例中,我们创建了一个包含源语言单词列表和目标语言单词列表的AlignedSent对象,然后打印出对齐后的结果。您也可以使用Alignment()函数来指定单词之间的对应关系,以生成自定义的对齐结果。

0