当前位置: 首页 > news >正文

软件网站建设方案微投票网站

软件网站建设方案,微投票网站,十大网站,职校计算机专业主要学什么文章目录 前言一、下载并安装Tesseract OCR二、配置环境变量三、Python中安装使用pytesseract总结 前言 Tesseract OCR是一个开源OCR(Optical Character Recognition)引擎,用于从图像中提取文本。Pytesseract是Tesseract OCR的Python封装&am…

文章目录

  • 前言
  • 一、下载并安装Tesseract OCR
  • 二、配置环境变量
  • 三、Python中安装使用pytesseract
  • 总结

前言

Tesseract OCR是一个开源OCR(Optical Character Recognition)引擎,用于从图像中提取文本。Pytesseract是Tesseract OCR的Python封装,它使得在Python中使用Tesseract OCR引擎变得容易。Pytesseract提供了简单的API,帮助开发者轻松地使用Tesseract OCR引擎来实现图像中文本的识别。本文主要介绍了Windows下安装Tesseract OCR、并在Python中使用pytesseract进行本地文字识别的流程。

一、下载并安装Tesseract OCR

在Tesseract OCR下载地址https://digi.bib.uni-mannheim.de/tesseract/下载合适的版本安装包,如下:
下载地址
点击安装包进行安装:

语言选择英文:

select language
自定义安装路径:
install path
然后一直选择默认选项进行安装即可。

二、配置环境变量

为了方便使用Tesseract,需要将软件安装目录添加到系统环境变量中,这样不必每次执行命令时都切换到Tesseract的安装路径,如下:
environment variable
设置确定后之后,可以进行验证,打开CMD,输入tesseract --version,示意如下:

C:\Users\LENOVO>tesseract --version
tesseract v5.3.0.20221214leptonica-1.78.0libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0Found AVX2Found AVXFound FMAFound SSE4.1Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0

如果输出版本等信息,说明安装成功。

三、Python中安装使用pytesseract

Python通过API接入Tesseract OCR,就可以在Python中方便进行文字识别。在使用前需要进行安装,如下:

# 使用conda进行安装
conda install pytesseract -y
# 使用pip安装
pip install pytesseract

安装成功即可使用,OCR示例如下:

In [1]: import pytesseractIn [2]: import reIn [3]: import requestsIn [4]: from PIL import ImageIn [5]: url = 'http://42.194.197.95:8001/static/imgs/phone_imgs/phone0.png'In [6]: image = Image.open(requests.get(url, stream=True).raw)In [7]: image
Out[7]: <PIL.PngImagePlugin.PngImageFile image mode=RGBA size=94x20>In [8]: res = pytesseract.image_to_string(image)In [9]: res
Out[9]: '14770126139\n'In [10]: re.search('\d+', res).group()
Out[10]: '14770126139'

总结

Tesseract OCR是一个本地的图片识别开源引擎,不需要额外的深度学习OCR模型即可实现简单、快速的识别,同时可以通过接口来与多种编程语言对接而集成,可以作为轻量OCR的最佳选择。

http://www.yayakq.cn/news/43582/

相关文章:

  • 网站建设开发实训的目的外贸网上营销的途径有哪些
  • 重庆网站建设沛宣wordpress linux 重装
  • 鄂州网站设计效果叫人做网站多少钱
  • 站内推广有哪些方式创业初期要建立公司的网站吗
  • 代理商加盟网站网址域名注册多少钱
  • 网站分析怎么做的沈阳双兴建设集团有限公司网站
  • 铁岭市网站建设隐秘入口 黑料正能量
  • 做网站电信运营许可证免费开源商城系统源码
  • 免费的ai写作网站网页设计汽车网站建设
  • seo站长查询济南网站建设搜q.479185700
  • 学校网站构建wordpress淘宝客api
  • 西安seo网站推广优化游戏推广话术技巧
  • 潍坊市建设监理协会网站wordpress主题升级
  • php视频网站开发拍卖网站咋做
  • 广州市外贸网站建设品牌企业名词解释
  • 载网站源码 怎么下载不了商务网站推广目标有哪些
  • 建设银行网站用户名是什么意思免费建站平台官网
  • 塑胶托盘东莞网站建设品牌网站制作网站公司
  • 0基础多久学会网站架构京东网站建设目的
  • iis的默认网站没有自动启动专业制作网站 上海
  • 做网站租服务器吗php是做网站还是网页
  • 兼职网站建设收费十大经典口碑营销案例
  • 嘉兴网站制作方案个人网站开发总结文档
  • 网站推广页面设计网站建设工资 优帮云
  • 网站安全建设必要性ios风格网站模板
  • 遵义网站建设制作高德地图能不能看国外
  • 西宁建站惠州网站设计
  • 网页设计就是网站开发吗工作细胞樱花动漫
  • 教育投资网站建设方案南通企业做网站
  • 惠城营销网站制作河南省建设厅网站中州杯