認識結果を確認してエクスポートする
バッチ処理が完了すると、抽出されたテキストを確認したり、外部システムで利用するためにエクスポートできます。ここでは結果レビューと出力手順を説明します。
結果を確認する
- 対象プロジェクト内で処理済みバッチを開きます。
結果タブを選択すると、ページ単位で抽出テキストが表示されます。- 必要に応じてハイライト表示された原稿画像と照らし合わせ、誤認識箇所を修正します。
- 修正内容は自動的に保存され、エクスポート時にも反映されます。
エクスポートする
- 結果画面右上の
エクスポートボタンをクリックします。 - 出力形式(CSV、JSON、Markdown など)を選択します。
- エクスポート対象(全ページ / 選択ページ)を指定し、
ダウンロードを実行します。 - 指定した形式のファイルが生成され、ブラウザからダウンロードできます。
ワンポイント
- 誤認識が多い場合は、バッチ設定で前処理オプション(回転補正、ノイズ除去)を有効にして再実行することで精度が向上する場合があります。
- エクスポートテンプレートはプロジェクト設定でカスタマイズでき、カスタムヘッダーの追加やフィールド順序の変更が可能です。
- 外部システム連携が必要な場合は、API キーを取得して Webhook 連携を利用すると自動化できます。
これで基本的な OCR ワークフローの一連の流れは完了です。次は応用編として、精度チューニングや自動化を検討してみましょう。