【Mac標準アプリ】Automatorを使ってPDFからテキストを抽出する方法

Not image

今回は、Mac標準アプリであるAutomatorの便利な使い方を一つ紹介しようと思います。

ズバリやることとしては、PDFからテキストを抽出するという操作です。

PDF形式のファイルは、会社や学校で配布される資料の一般的なテキスト形式なので、見たことがある方が大多数ではないでしょうか?

しかし、PDF形式という形式で配布された資料を編集したり、カスタマイズしたりすることは結構めんどくさいのです。

「あれ、ここの文字間違ってるから編集しよう!」「・・・・あれ、うまくいかない。」なんてことが結構おきます。

そんな時に使えるのが、Mac標準搭載のアプリケーションである「Automator」です。

標準搭載だと、「使い勝手が悪いんじゃないか?」と思っている方もいるかもしれませんが、ご安心ください。

めちゃくちゃ使えるし、めちゃくちゃ便利です。

今回は、PDFからテキストを抽出するという操作だけですが、他にも便利機能がありますのでチェックしてみてください。

さて前置きはこれくらいにして、PDFからテキストを抽出する方法をまとめていきます。

Automatorを使ってPDFからテキストを抽出する方法

手順1:Automatorを起動する

まず起動するところですが、Finderを起動します。

起動しましたら、アプリケーションの項目にある「Automator.app」を起動してください。

手順2に進みます。

手順2:ワークフローを設定する

Automatorが起動しましたら、「新規書類」をクリックし、「ワークフロー」を選択してください。

Not image

ワークフローを「選択」をクリックすると、ワークフローを設定する段階になります。

「ファイルをドラッグしてください」という画面が立ち上がりますので、そこに今回テキスト抽出したいPDFファイルをドラッグ&ドロップしてください。

ドラッグ&ドロップしましたら、下画像のようになると思います。

Not image

次に「アクション」から「PDFテキストを取り出す」という項目を選択してください。上画像のように「名前検索フォーム」に「PDF」などと入力すると、簡単に見つかります。

見つけたらダブルクリックすると、ワークフローの設定は終了です。

手順3:実行し確認する

先ほどのほぼ続きですが、実行し実行できたか確認していきましょう。

下画像のような画面構成になると思うので、「PDFテキストを取り出す」の取り出しオプションなどを確認しつつ、OKなら「実行」をクリックしてください。

Not image

実行が無事終了されたようでしたら、テキストを確認していきましょう。

今回私は出力先をデフォルトの「デスクトップ」に設定したので、デスクトップに出力されていました。みなさんも「出力保存先」で指定したディレクトリに出力されているか確認してください。

まとめ

今回はPDFからテキストを抽出するために、Mac標準アプリのAutomatorの使い方をまとめてきました。

思ったより簡単に作業ができると感じられたかもしれません。

「Automator」は思ったより使いやすくて、他にも色々便利機能がありますので、これを機に調べてみるのもいいと思います。

普段やっているルーティンワークを効率化できる機能を発見できるかもしれません!

また今回はAutomatorを使いGUIで操作していきましたが、コマンドラインでやりたいというエンジニア気質のある方は、以下の記事を参考にしてみてください。

【コマンド自作】popplerを使ってPDFからテキストを抽出する方法!【あると意外と便利かも】

2018.11.29

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です