ユーザーマニュアル

PDF透明テキスト付加アプリ(OCR)

このアプリは、PDFの見た目(画像)を実質的に変えずに、OCR等により「検索可能な透明テキスト(テキストレイヤ)」を付与します。

1. 画面構成

  • ドラッグ&ドロップ領域/一覧(リスト)
    PDFファイル、またはフォルダを投入できます。フォルダを投入した場合、そのフォルダ直下のPDFを列挙して一括登録します。同一ファイルの重複登録は抑止します。
  • OCR言語の選択(ラジオボタン)
    英語/ドイツ語/フランス語/スペイン語 から選択します。
  • 開始/一覧クリア/閉じる
    開始で処理実行、一覧クリアで登録済みPDFを消去します。
  • ステータス表示
    「確認中」「処理中」「スキップ」など進行状況を表示します。

2. 既存テキスト判定とスキップ

  • 処理開始後、各PDFについて「すでに十分なテキストレイヤが付与済みか」を所定基準で判定します。
  • 付与済みと判定された場合は、「さらにOCRを実行するか」を確認し、否定した場合はそのPDFをスキップします。

3. 出力と注意点(重要)

  • 処理結果で元PDFを上書きします。必要に応じて、事前にPDFをコピーしてから実行してください。
  • PDOでは、日本語の透明テキスト付加は文字間に半角スペースが含まれてしまうため、日本語PDFの透明テキスト付加機能を搭載していません。PDOエクスプローラの右クリックメニューに「テキスト抽出してhtml表示」がありますので、こちらをご利用ください。