使用 ocr 技术扫描识别是获取图片上文字的主要方式。spire.ocr for java 能够帮助开发者在 java 项目中快速批量识别并提取图片上的文字,实现高效的文字提取功能。本文将介绍如何使用 spire.ocr for java 在 java 项目中识别并提取图片上的文本。
获取 spire.ocr for java
使用 spire.ocr for java 扫描识别图片上的文字需要先在 java 项目中引入 spire.ocr.jar 以及相关的其他依赖文件。
spire.ocr.jar 文件可从 spire.ocr for java 下载页获取。如果您使用 maven,可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 jar 文件。
com.e-iceblue
e-iceblue
https://repo.e-iceblue.cn/repository/maven-public/
e-iceblue
spire.ocr
1.9.0
其他依赖文件请根据您所使用的操作系统选择下载:
安装依赖项
步骤 1、在 intellij idea 中创建 java 项目。
步骤 2、在菜单中的:文件 > 项目结构 > 模块 > 依赖中,添加 spire.ocr.jar 作为项目依赖。
步骤 3、下载并解压其他依赖文件,将解压出的 dependencies 文件夹中的所有文件复制到项目目录中。
扫描识别本地图像中的文字
- java
import com.spire.ocr.ocrscanner;
import java.io.*;
public class scanlocalimage {
public static void main(string[] args) throws exception {
// 指定依赖文件的路径
string dependencies = "dependencies/";
// 指定要扫描的图像文件的路径
string imagefile = "data/sample.png";
// 指定输出文件的路径
string outputfile = "scanlocalimage_out.txt";
// 创建一个 ocrscanner 对象
ocrscanner scanner = new ocrscanner();
// 设置 ocrscanner 对象的依赖文件路径
scanner.setdependencies(dependencies);
// 使用 ocrscanner 对象扫描指定的图像文件
scanner.scan(imagefile);
// 获取扫描的文本内容
string scannedtext = scanner.gettext().tostring();
// 创建一个输出文件对象
file output = new file(outputfile);
// 如果输出文件已经存在,则删除它
if (output.exists()) {
output.delete();
}
// 创建一个 bufferedwriter 对象用于向输出文件写入内容
bufferedwriter writer = new bufferedwriter(new filewriter(outputfile));
// 将扫描的文本内容写入输出文件中
writer.write(scannedtext);
// 关闭 bufferedwriter 对象以释放资源
writer.close();
}
}
指定语言文件扫描识别图像中的文字
- java
import com.spire.ocr.ocrscanner;
import java.io.*;
public class scanimagewithlanguageselection {
public static void main(string[] args) throws exception {
// 指定依赖文件的路径
string dependencies = "dependencies/";
// 指定语言文件的路径
string languagefile = "data/japandata";
// 指定要扫描的图像文件的路径
string imagefile = "data/japanesesample.png";
// 指定输出文件的路径
string outputfile = "scanimagewithlanguageselection_out.txt";
// 创建一个 ocrscanner 对象
ocrscanner scanner = new ocrscanner();
// 设置 ocrscanner 对象的依赖文件路径
scanner.setdependencies(dependencies);
// 加载指定的语言文件
scanner.loadlanguagefile(languagefile);
// 使用 ocrscanner 对象扫描指定的图像文件
scanner.scan(imagefile);
// 获取扫描的文本内容
string scannedtext = scanner.gettext().tostring();
// 创建一个输出文件对象
file output = new file(outputfile);
// 如果输出文件已经存在,则删除它
if (output.exists()) {
output.delete();
}
// 创建一个 bufferedwriter 对象用于向输出文件写入内容
bufferedwriter writer = new bufferedwriter(new filewriter(outputfile));
// 将扫描的文本内容写入输出文件中
writer.write(scannedtext);
// 关闭 bufferedwriter 对象以释放资源
writer.close();
}
}
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。