Ubuntu/Linux 上的额外依赖
在 Ubuntu 或 Linux 上运行 Tess4J,你需要手动安装以下依赖:
Tesseract OCR 引擎
sudo apt update sudo apt install tesseract-ocrLeptonica(图像处理库,通常随 Tesseract 一起安装)
sudo apt install libleptonica-dev语言包(如 tesseract-ocr-eng 用于英文识别)
sudo apt install tesseract-ocr-eng # 英文 sudo apt install tesseract-ocr-chi-sim # 简体中文- Java JNA 支持(Tess4J 依赖)
Tess4J 使用 JNA 调用本地库,确保你的 Java 环境支持它(通常 Maven/Gradle 会自动下载)。
Windows 上的情况
在 Windows 上,Tess4J 的发行版(如从 Maven 引入的 tess4j)通常已经包含了:
- tesseract.dll(Tesseract 的动态链接库)
- lept.dll(Leptonica 的动态链接库)
所以,你只需要:
- 确保 Tesseract 的语言数据(.traineddata)放在正确的位置(如 tessdata 目录)。
通过 Maven/Gradle 引入 Tess4J:
<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>5.8.0</version> </dependency>
总结
| 系统 | 是否需要额外安装依赖? | 主要依赖 |
|---|---|---|
| Windows | ❌ 不需要(已内置) | 自带 .dll 文件 |
| Ubuntu/Linux | ✅ 需要 | tesseract-ocr, libleptonica-dev, 语言包 |
如果遇到问题,可以检查:
- TESSDATA_PREFIX 环境变量是否指向 tessdata 目录。
- 确保 Java 能正确加载本地库(如 System.loadLibrary("tesseract") 不报错)。
希望这能帮到你! 😊
https://www.syntaxspace.com/article/2508011113259950.html
评论