ピックワールド(PIC World)

インフォメーション

この記事は 2021年10月07日 に以下のカテゴリに投稿されました Web.

この記事のタグ

, , , , , , , ,


PythonでWebサイトをスクレイピングするまでの実践編! 『PythonとScrapyを使ったWebスクレイピング』発行! 技術の泉シリーズ、10月の新刊

いろいろなところから公開されている Web サイトには、様々な情報で溢れていますよね。

そのデータを取り込んで、自在に活用することを、スクレイピングと呼ぶ。

個人的には、最初にこれを行ったのは Perl によるスクリプトだった。

それから時代は変わり、VB から IE を操作して Excel の表にデータを取り込み加工して使っていた。

まぁ、様々な使用条件とかもあるだろうから、それには一考を要すとは思うが、これが出来ると、非常に強力な武器となることは確かなことだ。

それを Python のスクリプトで行う方法について書かれた書籍が、インプレスから販売開始となったそうです。

PythonでWebサイトをスクレイピングするまでの実践編! 『PythonとScrapyを使ったWebスクレイピング』発行! 技術の泉シリーズ、10月の新刊
株式会社インプレスホールディングス

インプレスグループで電子出版事業を手がける株式会社インプレスR&Dは、『PythonとScrapyを使ったWebスクレイピング』(著者:川原 英明)を発行いたします。
最新の知見を発信する『技術の泉シリーズ』は、「技術書典」や「技術書同人誌博覧会」をはじめとした各種即売会や、勉強会・LT会などで頒布された技術同人誌を底本とした商業書籍を刊行し、技術同人誌の普及と発展に貢献することを目指します。

『PythonとScrapyを使ったWebスクレイピング』
https://nextpublishing.jp/isbn/9784844379812

PythonとScrapyを使ったWebスクレイピング

PythonとScrapyを使ったWebスクレイピング

著者:川原 英明
小売希望価格:電子書籍版 1,600円(税別)/印刷書籍版 2,000円(税別)
電子書籍版フォーマット:EPUB3
印刷書籍版仕様:B5判/カラー/本文102ページ
ISBN:978-4-8443-7981-2
発行:インプレスR&D

<<発行主旨・内容紹介>>
本書ではWebスクレイピングを、PythonとScrapyフレームワークを利用して行うことをソースコードとともに解説します。Webサイトには多くの情報があり、ブラウザの利用だけでも取得できます。しかし、Webサイトを閲覧するという行為が能動的であり手間と時間を使うことになります。本書はPythonを使って普通のサイトからWebスクレイピングをはじめ、少しづつ難易度を高めていく実践的な内容です。
(本書は、次世代出版メソッド「NextPublishing」を使用し、出版されています。)

<<目次>>
第1章 環境構築
第2章 最初のスクレイピング
第3章 POSTメソッドがあるサイトでスクレイピング
第4章 データベースを使用する
第5章 動的画面のスクレイピング
第6章 Lazy loading画面のスクレイピング
第7章 Dropboxと連携する
第8章 Cloudサービスを使ってスクレイピング
第9章 cloudサービスで定期的実行をする

<<著者紹介>>
川原 英明
ファミコンゲームの開発時代からのエンジニア。iモード登場時にはIT企業を経て、SESで大手IT企業で常駐を経験。その後はスタートアップ企業に転職。多くの案件を経験しており、対応できる開発言語は10を超える。得意言語はPerl、Python、PHP、Shell script。2021年秋からは採用関連も担当。

<<販売ストア>>
電子書籍:
Amazon Kindleストア、楽天koboイーブックストア、Apple Books、紀伊國屋書店 Kinoppy、
Google Play Store、honto電子書籍ストア、Sony Reader Store、BookLive!、BOOK☆WALKER、
BOOK TECH
印刷書籍:
Amazon.co.jp、三省堂書店オンデマンド、hontoネットストア、楽天ブックス
※各ストアでの販売は準備が整いしだい開始されます。
※全国の一般書店からもご注文いただけます。

<<技術の泉シリーズについて>>
『技術の泉シリーズ』は、技術者の知見のアウトプットである技術同人誌を底本とした、2017年創刊の技術書シリーズです。NextPublishingによるスピーディーな編集制作とプリントオンデマンドによる1冊からの印刷製本により、技術の変化に追従しつつ返品や品切れのないサスティナブルな出版モデルを特徴としています。本シリーズを通じて、エンジニアの“知の結晶”である技術同人誌の世界に、より多くの方が触れていただくきっかけとなることを目指しています。

技術の泉シリーズ

技術の泉シリーズ

【インプレスR&D】 https://nextpublishing.jp/
株式会社インプレスR&D(本社:東京都千代田区、代表取締役社長:福浦一広)は、デジタルファーストの次世代型電子出版プラットフォーム「NextPublishing」を運営する企業です。また自らも、NextPublishingを使った「インターネット白書」の出版などIT関連メディア事業を展開しています。
※NextPublishingは、インプレスR&Dが開発した電子出版プラットフォーム(またはメソッド)の名称です。電子書籍と印刷書籍の同時制作、プリント・オンデマンド(POD)による品切れ解消などの伝統的出版の課題を解決しています。これにより、伝統的出版では経済的に困難な多品種少部数の出版を可能にし、優秀な個人や組織が持つ多様な知の流通を目指しています。

【インプレスグループ】 https://www.impressholdings.com/
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:松本大輔、証券コード:東証1部9479)を持株会社とするメディアグループ。「IT」「音楽」「デザイン」「山岳・自然」「モバイルサービス」「学術・理工学」「旅・鉄道」を主要テーマに専門性の高いメディア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。

【お問い合わせ先】
株式会社インプレスR&D NextPublishingセンター
TEL 03-6837-4820
電子メール: np-info@impress.co.jp

以上

内容的には、技術書となるのだろうけれど、この表紙は、本屋さんでおっさんがカウンターに出すのが恥ずかしいような表紙なのがちょっと気になる。

まぁ、最近はこんなのでないとダメなのかと言うのは解るような気もするが、若い人たちは、この表紙に惹かれて購入したりもするのかな?

そうか、アマゾンで買えば恥ずかしくないってことなのか?

その当時、試行を重ねたのは、会員制のページの認証をどうやってくぐり抜けるかとかだったけれど、そのあたりのことが書いてあると、助かるのですけどね。

今度本屋で確認してみよう(恥ずかしいけど)。

 


コメントを残す

最近の投稿

最近のコメント

アーカイブ