ユーザーマニュアル
PDF透明テキスト付加アプリ(OCR)
このアプリは、PDFの見た目(画像)を実質的に変えずに、OCR等により「検索可能な透明テキスト(テキストレイヤ)」を付与します。
1. 画面構成
- ドラッグ&ドロップ領域/一覧(リスト)
PDFファイル、またはフォルダを投入できます。フォルダを投入した場合、そのフォルダ直下のPDFを列挙して一括登録します。同一ファイルの重複登録は抑止します。 - OCR言語の選択(ラジオボタン)
英語/ドイツ語/フランス語/スペイン語 から選択します。 - 開始/一覧クリア/閉じる
開始で処理実行、一覧クリアで登録済みPDFを消去します。 - ステータス表示
「確認中」「処理中」「スキップ」など進行状況を表示します。
2. 既存テキスト判定とスキップ
- 処理開始後、各PDFについて「すでに十分なテキストレイヤが付与済みか」を所定基準で判定します。
- 付与済みと判定された場合は、「さらにOCRを実行するか」を確認し、否定した場合はそのPDFをスキップします。
3. 出力と注意点(重要)
- 処理結果で元PDFを上書きします。必要に応じて、事前にPDFをコピーしてから実行してください。
- PDOでは、日本語の透明テキスト付加は文字間に半角スペースが含まれてしまうため、日本語PDFの透明テキスト付加機能を搭載していません。PDOエクスプローラの右クリックメニューに「テキスト抽出してhtml表示」がありますので、こちらをご利用ください。