2024.04.03

エーピーコミュニケーションズ翻訳の技術書「Apache Spark徹底入門」4月12日に発売

株式会社エーピーコミュニケーションズは、当社エンジニアの市村幸一郎、永里洋が翻訳に携わった「Apache Spark徹底入門」が、2024年4月12日に翔泳社より出版されることをお知らせいたします。本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。

■書籍情報

書名：Apache Spark徹底入門
翻訳：長谷川亮、弥生隆明、北村匡彦、竹下俊一郎、小谷尚太郎、北岡早紀、市村幸一郎、永里洋、野上将嗣
定価：4,400円（本体4,000円＋税10%）
発売日：2024年04月12日
※ 書店への入荷日は店舗によって異なる場合があります。入荷日については各書店へお問い合わせください。

書籍URL：https://www.shoeisha.co.jp/book/detail/9784798182285

■詳細

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、MLflow、Delta Lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびDelta Lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチデータとストリーミングデータの分析を実行
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータパイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas DataFrame、SparkDataFrameに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。

■翻訳者による書籍紹介イベントを4/18に開催

インフラエンジニア向けの書籍を取り上げ、その著者・翻訳者を招くライブトークイベント“インフラエンジニアBooks”にて、本書籍を取り上げます。
4/18に開催する回では、翻訳者の弥生隆明氏（データブリックス・ジャパン株式会社）と当社エンジニアの永里洋が本書をご紹介します。

イベント名：インフラエンジニアBooks 30分でわかる「Apache Spark徹底入門」
開催日時：2024年4月18日（木）20:00～20:45
開催場所：オンライン
参加申込：https://infra-eng-books.connpass.com/event/314425/

本件に関するお問い合わせ先

株式会社エーピーコミュニケーションズ　広報担当
お問い合わせフォーム

＊記載されている会社名及び商品名／サービス名は、各社の商標または登録商標です。

PRESS プレスリリース

エーピーコミュニケーションズ翻訳の技術書「Apache Spark徹底入門」4月12日に発売

■書籍情報

■詳細

■翻訳者による書籍紹介イベントを4/18に開催