.NET / C#用のOCRライブラリ
.NET(C#)アプリケーションに高精度の光学式文字認識(OCR)を追加します。
ImageGear OCR SDKは、Windows上のC#やその他の.NET言語を含む、複数のプラットフォームと言語で利用できます。
ImageGearは、中国語、日本語、韓国語などの西洋言語とアジア言語の両方に全ページの光学式文字認識(OCR)を提供します。 ImageGearの自動言語検出機能により、OCRの完了が可能になります。
OCRは、アプリケーション開発用の完全なドキュメントイメージングライブラリを提供するアドオンとして購入できます。C#OCRライブラリ:
- 中国語、韓国語、日本語を検出して読み取ります
- 1つの画像内で複数の言語の文字を認識します
- C#OCR、VB.NETOCRのサンプルが提供されています
フルページOCR
自動ゾーニングとセグメンテーションにより、ユーザーは次のことができるようになります。
- 処理のためにページを個々のゾーンに自動的に分割します
- 画像全体またはページの個々の領域を処理します
- ユーザーがゾーンを定義するか、ファイルからロードするか、エンジンによって自動的に検出されます
最大精度のための画像前処理
OCRの前に何が起こりますか? OCRの前処理手順を見てください。
- OCRの精度を向上させるために、高度な画像処理方法を利用できます
- 自動反転機能は、最高の精度を得るために画像を反転する必要があるかどうかを検出します
- 自動画像方向付けは、画像が適切に方向付けられるように画像を検出して調整します
- Deskewメソッドは、画像のずれを検出して自動的に修正し、セグメンテーションと認識の精度を向上させます
- スペックル除去法は、画像キャプチャプロセスの小さな点や欠陥を取り除きます
優れた結果処理
OCR認識の詳細を取得すると、正確さを示すために各文字が信頼水準で返されます。
個別の単語信頼値は、追加の正確さの指標を提供します。高度なフォントと場所の情報により、OCRライブラリは同様のレイアウトで元のファイルのテキスト表現を作成できます。
ImageGear OCRエンジンは、すべてのデータをUnicode形式で処理します。データ出力は、次のような複数の出力オプションを使用して、特定のコードページ用にフォーマットできます。
- PDF上の画像
- テキストベースのPDF
- XML