ABOUT THIS SITE

あなたにエーピーコミュニケーションズを知ってもらうためのSiteです

2025/04/23

【開催レポ】Databricks活用Data&AIスキル習得の無料トレーニング×採用選考「Data & AI BootCamp」の内容を紹介!

このエントリーをはてなブックマークに追加

エンジニア採用企画として実施した無料トレーニング×採用選考「Data & AI BootCamp」を開催しました!

本企画は、急速な成長を続けるデータ・AI分野において、次世代を担う高度な専門知識と実践力を持つ人材の育成と、Lakehouse部(※1)における事業拡大に向けた優秀な人材の獲得を目的として開催されました。

◆通常の採用とは異なる、スキルアップと相互理解を深めるBootCamp

『Data & AI BootCamp』は、通常の採用のように今までの実績・経験だけで選考を行うのではなく、オリジナルのトレーニングを受講いただき、受講者にスキルを身につけてもらいつつ、応募者とAPCエンジニア双方の理解を深めたうえで選考に進んでいただく、独自の採用企画です。

ー『Data & AI BootCamp』特設サイト:https://www.ap-com.co.jp/recruit/bootcamp/

<トレーニング概要>

Data & AI領域での転職を考えているエンジニア向けに、業界で注目されているDatabricks Lakehouse Platformを活用したData & AI業務のためのベーススキル修得ができる短期間の研修を実施しました。

<身につくスキル>

これまでのご経験をもとに、Databricksを基盤としたData & AIエンジニアリングのベーススキルを習得しました。

◆全4回にわたるDatabricks集中ワークショップ

全4回にわたるBootCampでは、Databricks Lakehouse Platformを中心に、データエンジニアリングのベースとなる、データ整形・データパイプライン・ワークフローの構築、そして機械学習(Machine Learning;ML)と人工知能(Artificial Intelligence;AI)に関する幅広い知識とスキルを習得するための集中的なプログラムが提供されました。各回のテーマ及び内容は下記の通り:

Day 1 – Introduction to Databricks(Databricksの紹介)

Databricksプラットフォームの基本的な理解から始まり、ワークスペースの操作、データの取り込み及び整形、ノートブックの活用方法など、Databricks環境の基礎をハンズオン形式で学びました。

Day 2 – Data Pipeline & Workflow(データパイプライン・ワークフロー)

データソースから価値ある情報を引き出すためのデータパイプラインの構築、効率的なデータ処理を実現するワークフローの設計と実行について、Streaming TableやDelta Live TableといったDatabricksの主要な機能を用いた実践的なトレーニングが行われました。 特に、メダリオンアーキテクチャに基づいたデータの整理・加工プロセスについても深く掘り下げました。

Day 3 – ML/AI @ Databricks(DatabricksにおけるMLとAI)

機械学習と人工知能の基礎概念に加え、Databricks Machine Learning環境を活用したモデル構築のプロセス、そして近年注目を集める生成AIのDatabricksにおける可能性について学びました。

Day 4 – Final Wrap-up(プロジェクト発表及び振り返り)

全体を通しての学びの振り返り、参加者によるプロジェクト発表、そして活発な自由討論が行われ、知識の定着と参加者間の交流を深めました。

参加者は、Lakehouseというデータウェアハウスとデータレイクの利点を統合した新しいアーキテクチャや、Delta Lakeが提供するACIDトランザクション、スキーマの進化、タイムトラベルといった強力な機能についても理解を深めました。 また、効率的なデータ処理のためのクラスタ構成や、コスト最適化の考え方についても学びました。

◆約1ヶ月間のオンライン集中トレーニングでData & AIエンジニアリングのベーススキルを習得

本プログラムは、Databricksを活用したData & AIエンジニアリング業務に必要なスキルを身につける無料のトレーニングで、期間は約1ヶ月、全てオンライン(休日1回4h + 平日3回2h)で実施しました。現職を続けながら、お住まいの地域に関わらず参加いただけることが特徴です。
これまでの経験をもとに、Databricksを基盤としたData & AIエンジニアリングのベーススキルを習得できます。

◆実践的なプロジェクトを通じて応用力を育成

BootCampのハイライトの一つとして、実際のデータを用いたプロジェクトワークが挙げられます。

テーマ1:NYC TAXI(ニューヨーク・シティ・タクシー)データ(※2)を用いたMLモデル構築

参加者は、公開されているNYC TAXIのデータセットを用いて、データクレンジング、特徴量エンジニアリング、そして機械学習モデルの構築から評価までのEnd-to-Endのプロセスに取り組みました。 この過程で、Databricksのノートブック環境やMLflowといったツールを活用し、実践的なスキルを磨きました。

テーマ2:Talk To The City(※3)手法を用いたコメント分析

もう一つのテーマでは、テキストデータを対象とした自然言語処理の手法を学び、ソーシャルメディアなどのコメントデータを分析し、インサイトを抽出することに挑戦しました。

これらのプロジェクトを通じて、参加者は座学で得た知識を実際のデータ分析に応用する力を養いました。

◆多様な経験と高い意欲を持つ参加者

本プログラムには、社会人経験豊富なエンジニアから、データサイエンスやAI分野に強い関心を持つ若手まで、多様なバックグラウンドを持つ候補者が参加しました。事前知識やスキルも様々でしたが、共通してデータとAIに対する高い学習意欲を持ち、積極的にワークショップやプロジェクトに取り組む姿勢が非常に印象的でした。

◆事業好調に伴い、Lakehouse事業部では積極的な人員拡大を計画しています!

Lakehouse事業部は、業界で注目されているDatabricks Lakehouse Platformを活用したData & AI業務へのニーズの高まりを受け、事業が急速に拡大しています。この成長をさらに加速させるため、Lakehouseアーキテクチャを基盤としたDatabricks Lakehouse Platformの構築・運用を担う新たな仲間を積極的に募集しております。

本プログラムを通じて、即戦力となりうる高いスキルと、データ・AI分野に対する情熱を持った優秀な候補者と出会うことができました。これらの新たな力が加わることで、お客様へのより高品質なソリューション提供、そしてデータドリブンな社会の実現に大きく貢献できるものと確信しています。

「Data & AI BootCamp」は今後も継続して開催予定で、本企画を通じて積極的な人員拡大を目指していきます。

Lakehouse事業部は、今後も最先端のデータ・AI技術に関する知識の普及と人材育成に積極的に取り組み、お客様のビジネス成長に貢献してまいります。


※1:Lakehouse部について
ITインフラの設計・構築における豊富な知見と経験を強みに、エンタープライズ企業向けにカスタマイズされた生成AIやデータ分析基盤の導入支援を行っています。単なる生成AI製品や分析ツールの導入に留まらない、企業の事業ニーズに適した最先端のソリューションの提供が可能です。また、Databricks、dbt、Fivetranといった最新技術を活用し、多様なバックグラウンドを持つグローバルなデータエンジニアが多数在籍しており、お客様のデータや生成AIの活用を協力にサポートしています。
※2:NYC taxi dataとは、ニューヨーク市タクシー&リムジン委員会 (TLC)[https://www.nyc.gov/site/tlc/about/tlc-trip-record-data.page]が提供する、ニューヨーク市のタクシー運行情報を収集したデータセットで、乗車開始・終了地点、時間、料金などの詳細が含まれています。【参考:https://zenn.dev/yyteam/articles/medallion-lakehouse-nyc
※3:膨大な意見やアンケート結果の回答をまとめて、AI(人工知能)を使って分析・レポート化することができるオープンソースのアプリケーション

<当社が提供する生成AI関連のサービス>
データ&AI分析基盤の支援サービス with Databricks:https://www.ap-com.co.jp/service/data_ai/
生成AI 自社導入・活用支援サービス:https://www.ap-com.co.jp/service/llm/

* * * *

エーピーコミュニケーションズでは中途も新卒も積極的に採用中です。お気軽にご連絡ください!

採用サイト

▼エンジニアによる技術情報発信
tech blog APC
Qiita

このエントリーをはてなブックマークに追加