好きな画像を好きなだけ集めたい? icrawlerに任せよう!

engineering

どうも。マサです。

最近機械学習でまとまった画像を取得する必要がありました。

その際にpythonのライブラリであるicrawlerを使って超絶簡単に画像を収集することができたので紹介したいと思います。

機械学習以外でも自分の好きな芸能人や風景の写真を簡単に収集することができるのでオススメです!

今回はプログラマー以外の方でも使えるように手順紹介していきます。

なお、手順はMacですのでWindowsの場合は手順が異なる可能性があります。

python インストール

pythonはプログラミング言語の1つです。主に機械学習に用いられる言語で、他の言語よりも少ないコード量で書くことができます。個人的には読みやすいし書きやすいのでpython好きです。将来機械学習エンジニアになっていきたい方はpythonの学習をオススメします。他の言語よりも年収高めらしいです。

さて、インストール方法ですがMacには何もしなくてもpythonがインストールされています。ただ、古いバージョンであとあと困ることもあることを考慮して最新バージョンのpythonをインストールします。

こちらの記事がわかりやすいので参考にしてみてください。

pythonインストール方法

 

pip インストール

icrawlerを使うためにはpipをインストールする必要があるのでインストールします。

pipはPythonのパッケージのインストールを簡単にするためのパッケージ管理ツールです。

ターミナルでこちらのコードを打ち込んでインストールしましょう。

$sudo easy_install pip

画像を収集!

getImageという名前でフォルダを作成して、その配下にicrawler.pyファイルとImageフォルダを作成しましょう。今回はこのicrawler.pyに取得コードを書いていきますので、テキストエディタで編集してきましょう。

 

pythonでicrawlerを使えば簡単に画像を取得することができます。Your passにはあなたが作成したicrawlerフォルダまでのパスを書いてください。ターミナルでImageフォルダまで移動してpwdコマンドを使えば現在の階層を表示してくれるのでそれを貼り付けるのが一番簡単かもしれません。取得したい画像のキーワードには検索するキーワードを入れましょう。「猫」とか「犬」とかです。max_numは取得したい画像枚数です。今回は10枚を設定していますので適宜変更してください。

あとは作成したこのicrawler.pyをターミナルから実行すればImageフォルダに画像が保存されているでしょう。

 

コメント

%d人のブロガーが「いいね」をつけました。