Tesseract支持的文件格式包括:
图像文件格式:Tesseract能够处理的图像文件格式包括JPEG、PNG、TIFF、GIF、BMP等常见格式。
PDF文件:Tesseract可以处理PDF格式的文件,但需要先将其转换成图像格式才能进行识别。
文本文件:Tesseract也支持直接处理文本文件,如txt、doc等格式的文件。
需要注意的是,Tesseract对于不同格式的文件支持程度可能会有所差异,一般来说,图像文件格式是Tesseract最常用的输入格式。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:Linux GIMP支持哪些文件格式