ピックワールド(PIC World)

インフォメーション

この記事は 2023年03月27日 に以下のカテゴリに投稿されました Others (その他).

この記事のタグ

, , , , , ,


画像認識の基礎から実装までを解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ画像認識』を3月22日(水)に発売

中級者(以上)向けの Python で画像認識(等)を行う手引書。

これくらいになってくると、内容も本格的だし、少し難しくなってくるかも。

画像認識の基礎から実装までを解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ画像認識』を3月22日(水)に発売
株式会社インプレスホールディングス

インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、画像認識技術の基礎から実装までを解説した書籍『Pythonで学ぶ画像認識 機械学習実践シリーズ』を2023年3月22日(水)に発売いたします。

Pythonで学ぶ画像認識

Pythonで学ぶ画像認識

■画像認識の基礎から実践までを一冊に凝縮
近年の技術の発展により、画像認識技術はますます身近になっています。スマートフォンの顔認証によるロック解除や、オンライン会議での人物と背景を認識して背景をぼかす技術など、さまざまな場面において画像認識技術は人々の生活をサポートしています。本書では発展著しい画像認識について基礎から実践までを具体的に学ぶことを目的とし、Pythonでの実装を示しながらその手法を丁寧に解説しています。また、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。

■基本から深層学習を用いた最新技術までカバー
本書は6章構成です。第1章では、画像認識の概要やアプリケーション、本書の前提となる開発環境について解説します。第2章では、画像読み込みやフィルタ処理などの基本的な操作から始め、畳み込み演算やアテンションといった深層学習における特徴抽出の基礎についても解説します。第3章では、単純な画像分類モデルを使って画像認識の学習から評価までの流れを確認します。また、深層学習の基礎を解説し、深層学習を本格的に使い始める前の準備を行います。第4章では、画像認識の最も基本的なタスクである画像分類について解説します。順伝播型ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、Transformerという異なる構造を持つ3種類のネットワークを使った手法を解説し、それぞれのネットワークの特徴を理解できるようにします。第5章では、画像認識アプリケーションで広く用いられている物体検出について解説します。この章ではCNNを使った手法とTransformerを使った手法を1つずつ紹介し、それぞれの構造が物体検出でどのような利点を持つのかを解説します。第6章では、画像認識と自然言語処理の融合技術である画像キャプショニングを解説します。CNNとLong Short-Term Memory(LSTM)の組み合わせによる代表的な手法、アテンション機構を利用した手法、Transformerを応用した手法を解説します。

■本書は以下のような方におすすめです画像処理のエンジニア・研究者
理系の大学生
Pythonで画像処理を実装したい人

■紙面イメージ

画像認識の基礎から丁寧に解説しています。

画像認識の基礎から丁寧に解説しています。

最新の画像認識技術を実装レベルで学ぶことができます。

最新の画像認識技術を実装レベルで学ぶことができます。

■本書の構成
第1章 画像認識とは?
第2章 画像処理の基礎知識
第3章 深層学習を使う準備
第4章 画像分類
第5章 物体検出
第6章 画像キャプショニング

■書誌情報
書名:Pythonで学ぶ画像認識 機械学習実践シリーズ
著者:田村雅人・中村克行
発売日:2023年3月22日(水)
ページ数:352ページ
サイズ:B5変形判
定価:3,850円(本体3,500円+税10%)
電子版価格:3,850円(本体3,500円+税10%)※インプレス直販価格
ISBN:978-4-295-01599-4

◇Amazonの書籍情報ページ:

◇インプレスの書籍情報ページ:https://book.impress.co.jp/books/1122101074/

■著者プロフィール
田村雅人(たむら・まさと)
2016年に東京大学大学院工学系研究科修士課程を修了し、(株)日立製作所に入社。パブリックセーフティ向け映像認識技術の研究開発に従事し、人物検出や追跡、人と物体の関係性検出など、映像監視に使われるAI技術を開発。2021年よりアメリカ・シリコンバレーにオフィスをおくHitachi America, Ltd.に出向し、世界トップレベルの研究者たちと映像認識技術の開発に従事。

中村克行(なかむら・かつゆき)
2007年 東京大学大学院 新領域創成科学研究科 博士課程修了。同年、(株)日立製作所 中央研究所入社。物体追跡、一人称視点映像解析、マルチモーダル認識などの研究開発に従事し、2022年より同社研究開発グループ 先端AIイノベーションセンタ 知能ビジョン研究部長。2015-2016年 スタンフォード大学コンピュータサイエンス学科 客員研究員。2005年 FIT ヤングリサーチャー賞、2011年 IEEE Consumer Electronics Society Best Paper Award in Television Technologyなど受賞。

■機械学習実践シリーズについて
中級者以上に向けた、特定の技術分野のアルゴリズムの紹介と、そのアルゴリズムを実装したコードを解説する、より技術的・実践的なシリーズです。

以上

この書籍を始め、シリーズになっているようで。Python で・・って形で、。音声認識とか、音声合成、音源分離とかが出ているのね。

なかなか面白そうですね。

でも、これらは奥が深いから、一つ一つやるにしても、結構じっくりと取り組む必要がありそうです。

 


コメントを残す

最近の投稿

最近のコメント

アーカイブ