这篇“PaddleOCR怎么实现识别表情包文字功能”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“PaddleOCR怎么实现识别表情包文字功能”文章吧。
pip install paddlepaddle pip install paddleocr
我这边安装后的版本:
paddleocr==2.5.0.3
paddlepaddle==2.3.1
在 macOS 安装后,项目运行报错报错,忘了截图,应该是与 setuptools 版本有关,解决方式:
pip install --upgrade setuptools==59.8.0
完成这些配置后,我们就可以愉快的玩耍了。
import hashlib
import io
from PIL import Image
from paddleocr import PaddleOCR
def get_gif_pic_path(url):
'''下载图片,返回图片第一帧路径'''
response = requests.get(url)
filename = hashlib.md5(url.encode(encoding='utf-8')).hexdigest()
img = Image.open(io.BytesIO(response.content))
current = img.tell()
img_path = f'bqb/{filename}_{current}.png'
img.save(img_path)
return img_path
def ocr_get_gif_text_sec(url) -> str:
'''识别gif第一帧图片的文字'''
img_path = get_gif_pic_path(url)
ocr = PaddleOCR(use_angle_cls=True, lang='ch')
result = ocr.ocr(img_path, cls=True)
data = []
for item in result:
data.append(item[1][0])
return ",".join(data)
ocr_get_gif_text_sec('https://xxxxxx')
由于 gif 是个动图,所以我们需要取出图片的第一帧进行识别,get_gif_pic_path
实现了这个功能。ocr_get_gif_text_sec
从 gif 第一帧的图进行文字提取,返回的 result
是个数组,我们通过遍历进行提取出来。
提取 gif 图片的内容我们就完成了,两个函数的功能也比较简单。本文没做 gif 全部文字的提取,有兴趣可以挑战下。
当我们想在上传图片的时候,进行对图片文字的处理怎么办?难道要将上传的图保存到路径再去识别么?这也是我在开发中遇到的一个问题,经过拆坑,答案是:不,你不需要。
思路:我们可以从表单中获取上传的图片的二进制,然后将这个二进制传给ocr.ocr()
,那么ocr.ocr()
支持这个类型么?经过查看此函数源码,我们可以让它支持。
将图片二进制转化为 nparray 类型即可。下面是这个过程的具体代码
from paddleocr import PaddleOCR
import numpy as np
import cv2
@app.route('/v1/upload_img', methods=['POST'])
def api_v1_upload_img():
if 'file' not in request.files:
return "no file part"
file = request.files['file']
if file.filename == '':
return "no selected file"
if file:
file_name = file.filename
# 获取图片的二进制
res = upload_image(bytes=file.read(), filename=file_name)
return res
else:
return "no file"
def upload_image(bytes, filename = None, mime_type = None):
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
## 核心步骤
np_arr = np.frombuffer(bytes, dtype=np.uint8)
img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
# 进行识别
result = ocr.ocr(img=img, cls=True)
ocr_result = []
for line in result:
ocr_result.append(line[1][0].strip())
img_content = ' '.join(ocr_result)
return img_content
在api_v1_upload_img
我们获取到图片二进制以及图片名,将这些作为参数传到upload_image
,在upload_image
中:
np_arr = np.frombuffer(bytes, dtype=np.uint8)
img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
上面两行代码是这个需求的核心突破点。
还有一点就是建议不要将此识别功能部署到性能差的机器上,并发一下,完全扛不住,默默的留下两行眼泪。
以上就是关于“PaddleOCR怎么实现识别表情包文字功能”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注亿速云行业资讯频道。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。