お知らせ・ニュースリリース

シェア このエントリーをはてなブックマークに追加 Check
  • ニュースリリース
  • 出版/電子出版

「音声認識」の最新手法を解説した、中級者以上向けの実践的な技術書 『Pythonで学ぶ音声認識』を5月20日(木)に発売

インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』を2021年5月20日(木)に発売いたします。

Pythonで学ぶ音声認識

■音声認識の基礎から深層学習を用いた最新手法までを解説

音声認識とは、音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的とし、その手法をソースコード付きで丁寧に解説しています。

本書は「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのソースコードを豊富に紹介する「機械学習実践シリーズ」の2冊目です。2020年8月24日刊行の同シリーズ『Pythonで学ぶ音源分離』(戸上真人著)に続く音声処理技術として、「音声認識」をテーマにしています。

■ベースとなる技術からPythonを用いた音声処理までカバー

1・2章では音声認識の基礎知識を紹介しています。3章からPythonのソースコードを交えて解説しています。まず3章ではPythonを用いた音声処理の基礎と、音声認識に使うための特徴抽出方法を解説しています。4章では音声認識の初歩ともいうべき「DPマッチング」という手法を紹介し、5章のDPマッチングをより実用的な方法に進化させた、混合正規分布と隠れマルコフモデルによる音響モデルを解説しています。6・7章は2010年以降、発展してきた深層学習を用いたディープニューラルネットワークと隠れマルコフモデルによる音響モデル、そして近年、研究のトレンドとなっているEnd-to-Endモデルという最新手法を紹介しています。全章を通して、最新の音声認識技術を実装レベルで学ぶことができます。

〈本書はこんな人におすすめです〉

〈紙面イメージ〉

Pythonで学ぶ音声認識

音声認識の概念やしくみといった基礎から解説しています

Pythonで学ぶ音声認識

End-to-Endモデルによる連続音声認識についても詳しく解説しています

■書籍の詳細

Pythonで学ぶ音声認識書名:Pythonで学ぶ音声認識 機械学習実践シリーズ
著者:高島遼一
発売日:2021年5月20日
ページ数:352ページ
サイズ:B5変型版
定価:3,850円(本体3,500円+税10%)
電子版価格:3,850円(本体3,500円+税10%) ※インプレス直販価格
ISBN:978-4-295-01138-5
◇Amazonの書籍情報ページ:https://www.amazon.co.jp/dp/429501138X/
◇インプレスの書籍情報ページ:https://book.impress.co.jp/books/1120101083/

■著者プロフィール

高島遼一(たかしま・りょういち)
2013年神戸大学大学院システム情報学研究科博士後期課程修了(博士(工学))。2011年4月~2013年3月日本学術振興会特別研究員(DC2)。2013年4月に(株)日立製作所研究開発グループに入社し、装置の異常検知や音声認識のための雑音除去など、音声・音響信号処理に関する研究開発に従事。2016年10月~2018年9月に国立研究開発法人情報通信研究機構へ出向し、音声認識に関する研究開発に従事。2019年4月より神戸大学都市安全研究センター兼同大学院システム情報学研究科准教授に着任。現在、音声認識を始めとした音声処理・機械学習技術とその福祉分野への応用に関する研究に従事。

■「機械学習実践シリーズ」とは

本書を通して「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのコードを豊富に紹介するシリーズです。機械学習の基本から実装までを学ぶことができます。

以上

本件に関するお問合せ先

株式会社インプレス 広報担当:丸山

※在宅勤務中につき、お問合わせはメールにてお願いいたします。

このリリースのダウンロード[PDF]: 20210520-01.pdf