• 公開日:

PDFのOCR(テキスト変換)に高精度なフリーソフト3選

PDFのテキスト変換、すなわちOCR(光学文字認識)機能を持つフリーソフトは、文書作業の効率を大幅に向上させることができます。

そこで今回は、高精度なOCR機能があるおすすめの無料ソフトを3つ紹介します。

ご紹介するソフトを活用すれば、手軽に文書のデジタル化が進められ、作業の幅が広がることでしょう。

PDF24 Creatorの基本情報

PDF24 Creator

PDF24 Creator

評価: 3.7 (17)
評価をする:

☆を押した後にレビューができます

レビュー: (2)

  • 2024/8/20
    余白の削除が簡単にできました。タブレットで読むことが出来そうです。
レビューの続きを見る

日本語: 〇
オンライン(インストール不要): 〇
オフライン(インストール型): 〇

PDF24 CreatorでPDFのOCR(テキスト変換)処理を行う方法

PDF24 Creatorには「PDF OCR」という機能があり、PDFをアップロードするだけでOCRによるテキスト変換ができます。

完全無料かつ無制限で使用できるため、気軽に使用できます。オンライン版とデスクトップ版がありますが、どちらでもOCR機能は使えます、

詳しい使い方は以下の通りです。PDF24 Creatorのデスクトップ版を使用しています。

OCRを選択する

PDF24 Creatorを開き、「PDF OCR」を選択します。

ファイルを追加ボタンを押す

「ファイル追加」ボタンを押します。

ファイルを開く

「文書選択」ダイアログボックスが表示されます。

OCR処理したいPDF(例:データ1.pdf)を選択し、②「開く」ボタンを押します。

OCR処理を開始する

読み取る言語(例:Japanese)を選択します。

②保存をスムーズにするため、「同じフォルダに保存する」にチェックを入れます。

③各設定を調整できたら、「開始」ボタンを押します。

OCR完了

「時間」の項目にチェックマークが表示されたら、OCR処理完了です。

保存できているか確認してみましょう。

保存されている

エクスプローラーを起動し、アップロードしたPDFと同じフォルダを開きます。

すると、PDF24 CreatorでOCR処理をしたデータが保存されていることが分かります。

テキストとして認識できている

PDF24 Creatorでは、OCR後のデータはPDFとして出力されます。

PDFを開いてテキストをドラッグしてみると、テキスト部分が認識されて範囲選択できるようになっています。

Sejdaの基本情報

Sejda

Sejda

評価: 3.7 (3)
評価をする:

☆を押した後にレビューができます

レビュー: (0)

    日本語: 〇
    オンライン(インストール不要): 〇
    オフライン(インストール型): 〇

    SejdaでPDFのOCR(テキスト変換)処理を行う方法

    Sejdaのデスクトップ版では、PDFをアップロードするだけでテキストデータを簡単に抽出できます。

    無料では「1日に3回まで」使用可能です。出力する形式をPDF/テキストファイル(.txt)の2つから選べるためおすすめです。

    詳しい使い方は以下の通りです。Sejdaのデスクトップ版を使用しています。

    OCRを選択する

    Sejdaを開き、「OCR」を選択します。

    ファイルを選択ボタンを押す

    「Choose PDF files」ボタンを押します。

    ファイルを選択する

    「開く」ダイアログボックスが表示されます。

    OCR処理したいPDF(例:データ1.pdf)を選択し、②「開く」ボタンを押します。

    読み取る言語や出力形式を選択する

    読み取る言語(例:Japanese)を選択し、②出力するファイル形式(例:Text)を選択します。

    ③設定できたら、「Recognize text on all pages」ボタンを押します。

    保存場所を選択する

    「Select output folder」ダイアログボックスが表示されます。

    ①任意の保存先(例:ダウンロード)を選択し、②「Select output folder」ボタンを押します。

    OCR完了

    「Task completed」という画面が表示されたら、OCR処理は完了です。

    出力されたファイルを確認するため、「1 file produced」を選択します。

    保存されている

    出力されたファイルが保存されていることを確認できます。

    今回は出力形式をTextに指定したため、テキストファイル(.txt)として出力されました。

    テキスト抽出できた

    試しにテキストファイルを開いてみました。

    データは比較的見やすくまとまっています。間違いもなく、正確に抽出されています。

    CamScannerの基本情報

    CamScanner

    CamScanner

    評価: 1.0 (1)
    評価をする:

    ☆を押した後にレビューができます

    レビュー: (1)

    • 2024/1/28
      無料のお試しを押したら12000円決済になってしまった。

    日本語: ×
    オンライン(インストール不要): 〇
    オフライン(インストール型): 〇

    CamScannerでPDFのOCR(テキスト変換)処理を行う方法

    CamScannerでは、アップロードしたPDFのテキストデータのみを抽出してテキストファイル(txt)として保存できます。

    無料版だと「3回まで」OCR機能を使用できます。4回目以降の使用は有料版に加入する必要があります。

    詳しい使い方は以下の通りです。CamScannerのスマホアプリ版(iOS)を使用しています。

    ドキュメント入力を選択する

    CamScannerを開き、①「ファイル」、②「ドキュメント入力」の順に選択します。

    ファイルを選択する

    OCR処理したいPDF(例:データ1.pdf)、②「開く」の順に選択します。

    テキスト抽出を選択する

    「テキストの抽出」を選択します。

    エクスポートを選択する

    テキストデータが抽出されていることが分かります。

    テキストデータを保存するため、「エクスポート」を選択します。

    エクスポートの形式を選択する

    「Txtファイルとしてエクスポート」を選択します。

    ファイルに保存を選択する

    「"ファイル"に保存」を選択します。

    保存を選択する

    「保存」を選択します。

    保存できている

    スマホのファイルアプリを開くと、CamScannerで抽出したテキストデータのファイルが保存されていることを確認できます。

    テキスト抽出できた

    試しにテキストファイルを開いてみました。

    表の形は保っていませんが、正確に文字を読み取って抽出されています。