Python学習【365日チャレンジ!】334日目のマスターU(@Udemy11)です。
昨日まで、ほぼ1年間継続して学習してきた酒井さんの講座の振り返りをしました。
ほぼ1年なので、かなり長い期間になりますが、振り返るとあっという間なんですよね。
といっても復習がしっかりできていなかったことと、それぞれのレクチャーを順番に学習していったので、最初の頃に学習したことがすでに頭の中から抜けてしまっているので、実践を始めつつ、うる覚えなところは復習をする必要があります。
自分の作業で必要な部分も不必要な部分もすべて学習したので、これから実践しつつ、必要な部分を重点的に見に付けていこうと思います。
酒井さんの講座の振り返りはこちらの記事から御覧ください。。
Webスクレイピングとは
今日から、Webスクレイピングを実践していきますが、Webスクレイピングは、酒井さんの講座でも学習しました。
このWebスクレイピングは、アフィリエイトなどに必要なWebサイト分析に欠かせないスキルなので、具体的に実践していこうと思います。
といきたいところですが、ウォーミングアップとして、アフィリエイトには欠かせないGoogle検索のサジェストキーワードを抜き出す方法を実行してみたいと思います。
Googleサジェスト
「Googleサジェストって何?」という方のためにお知らせしてくと、Googleで検索した時に検索窓に候補として表示されるキーワードで、検索したキーワードと合わせて検索されているワードが、Googleサジェストになります。
つまり、これらのGoogleサジェストがよく検索されているキーワードなので、このキーワードで検索上位になれば、アクセスをたくさん集められるということです。
アクセスを集めるためには、上位に表示されないと意味がないので、そのためのテクニックが必要になってきますが、アフィリエイトで成果を上げるためには、まずこのGoogleサジェストを集める必要があるということです。
とはいえ、いちいち検索窓にキーワードを入力して、Googleサジェストを取得していては時間がいくらあっても足りないので、今回紹介するテクニックが有効になってきます。
関数IMPORTXML
GoogleスプレッドシートはGoogleが提供しているサービスなだけに、エクセルにはない便利な関数があって、それが【IMPORTXML】です。
スプレッドシートの任意のセルにキーワードを入力するだけで、関数IMPORTXMLを使ったセルの列にサジェストキーワードを取り出すことができます。
B2
に次の関数を入力します。
=IMPORTXML("http://www.google.com/complete/search?hl=ja&output=toolbar&q="&A2,"//suggestion/@data")
セルA2
にキーワードを入力すると、B2:B11
にサジェストが表示されます。
まとめ
スプレッドシートでのサジェストキーワードの抜き出しは、PythonのWebスクレイピングではありませんが、アフィリエイトに取り組む人にとっては結構役立つので、覚えておいて損はないと思います。
この関数IMPORTXMLは、Webページの検索で、キーワードを入れた結果を取得しているので、ある意味スクレイピングといえます。
すでに学習しましたが、Webページには規則性があり、その規則を活用して必要な情報を抜き出すことができるので、必要な情報を抜き出してビジネスに活用しましょう。
それでは、明日もGood Python!