今回は、Mac標準アプリであるAutomatorの便利な使い方を一つ紹介しようと思います。
ズバリやることとしては、PDFからテキストを抽出するという操作です。
PDF形式のファイルは、会社や学校で配布される資料の一般的なテキスト形式なので、見たことがある方が大多数ではないでしょうか?
しかし、PDF形式という形式で配布された資料を編集したり、カスタマイズしたりすることは結構めんどくさいのです。
「あれ、ここの文字間違ってるから編集しよう!」「・・・・あれ、うまくいかない。」なんてことが結構おきます。
そんな時に使えるのが、Mac標準搭載のアプリケーションである「Automator」です。
標準搭載だと、「使い勝手が悪いんじゃないか?」と思っている方もいるかもしれませんが、ご安心ください。
めちゃくちゃ使えるし、めちゃくちゃ便利です。
今回は、PDFからテキストを抽出するという操作だけですが、他にも便利機能がありますのでチェックしてみてください。
さて前置きはこれくらいにして、PDFからテキストを抽出する方法をまとめていきます。
Automatorを使ってPDFからテキストを抽出する方法
手順1:Automatorを起動する
まず起動するところですが、Finderを起動します。
起動しましたら、アプリケーションの項目にある「Automator.app」を起動してください。
手順2に進みます。
手順2:ワークフローを設定する
Automatorが起動しましたら、「新規書類」をクリックし、「ワークフロー」を選択してください。

ワークフローを「選択」をクリックすると、ワークフローを設定する段階になります。
「ファイルをドラッグしてください」という画面が立ち上がりますので、そこに今回テキスト抽出したいPDFファイルをドラッグ&ドロップしてください。
ドラッグ&ドロップしましたら、下画像のようになると思います。

次に「アクション」から「PDFテキストを取り出す」という項目を選択してください。上画像のように「名前検索フォーム」に「PDF」などと入力すると、簡単に見つかります。
見つけたらダブルクリックすると、ワークフローの設定は終了です。
手順3:実行し確認する
先ほどのほぼ続きですが、実行し実行できたか確認していきましょう。
下画像のような画面構成になると思うので、「PDFテキストを取り出す」の取り出しオプションなどを確認しつつ、OKなら「実行」をクリックしてください。

実行が無事終了されたようでしたら、テキストを確認していきましょう。
今回私は出力先をデフォルトの「デスクトップ」に設定したので、デスクトップに出力されていました。みなさんも「出力保存先」で指定したディレクトリに出力されているか確認してください。
まとめ
今回はPDFからテキストを抽出するために、Mac標準アプリのAutomatorの使い方をまとめてきました。
思ったより簡単に作業ができると感じられたかもしれません。
「Automator」は思ったより使いやすくて、他にも色々便利機能がありますので、これを機に調べてみるのもいいと思います。
普段やっているルーティンワークを効率化できる機能を発見できるかもしれません!
また今回はAutomatorを使いGUIで操作していきましたが、コマンドラインでやりたいというエンジニア気質のある方は、以下の記事を参考にしてみてください。
コメントを残す