PRESSプレスリリース

2024.04.03

エーピーコミュニケーションズ翻訳の技術書「Apache Spark徹底入門」4月12日に発売

株式会社エーピーコミュニケーションズは、当社エンジニアの市村 幸一郎、永里 洋が翻訳に携わった「Apache Spark徹底入門」が、2024年4月12日に翔泳社より出版されることをお知らせいたします。本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。

■書籍情報

書名:Apache Spark徹底入門
翻訳:長谷川 亮、弥生 隆明、北村 匡彦、竹下 俊一郎、小谷 尚太郎、北岡 早紀、市村 幸一郎、永里 洋、野上 将嗣
定価:4,400円(本体4,000円+税10%)
発売日:2024年04月12日
※ 書店への入荷日は店舗によって異なる場合があります。入荷日については各書店へお問い合わせください。

書籍URL:https://www.shoeisha.co.jp/book/detail/9784798182285

■詳細

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、MLflow、Delta Lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびDelta Lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実行
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas DataFrame、SparkDataFrameに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。

■翻訳者による書籍紹介イベントを4/18に開催

インフラエンジニア向けの書籍を取り上げ、その著者・翻訳者を招くライブトークイベント“インフラエンジニアBooks”にて、本書籍を取り上げます。
4/18に開催する回では、翻訳者の弥生 隆明氏(データブリックス・ジャパン株式会社)と当社エンジニアの永里 洋が本書をご紹介します。

イベント名:インフラエンジニアBooks 30分でわかる「Apache Spark徹底入門」
開催日時:2024年4月18日(木)20:00~20:45
開催場所:オンライン
参加申込:https://infra-eng-books.connpass.com/event/314425/

本件に関するお問い合わせ先

株式会社エーピーコミュニケーションズ 広報担当
お問い合わせフォーム

*記載されている会社名及び商品名/サービス名は、各社の商標または登録商標です。