【教育プラットフォーム/Classi】データエンジニア
会社概要 Classi株式会社は、2014年にベネッセホールディングスとソフトバンクが共同で立ち上げた、累計導入2,300校、累計利用生徒210万人以上が利用する教育プラットフォームである「Classi(クラッシー)」、学校のICT化を支援する保護者連絡ツール「tetoru(テトル)」の開発・運営をする会社です。学校(School)× テクノロジー(Technology)を組み合わせた「SchoolTech」を推進しています。 SchoolTechとは、EdTechの中でも、特に公教育である「学校」で活用されることを目的としたテクノロジーを指している用語で、現在私たちのサービスは多くの小学校・中学校・高等学校の生徒/児童・先生・保護者に利用していただいています。 今日の児童・生徒たちは、既にデジタルネイティブ世代であることはもちろん、自分の人生を切り拓いていくための学びの場である学校では、ますますICT教育が果たす役割の重要性が増してきています。このような時代での我々の役割と責任について理解し、当社のミッション・ビジョン・バリューに共感していただける方からのご応募をお待ちしています。 求人紹介 Classiには日々、先生・生徒・保護者の利用データが集まってきます。 そういったデータを用いて、社内でのデータドリブンな意思決定支援や、プロダクトとしての提供、そして機械学習などを活用したサービス開発に活かすため、Google Cloudを中心とした基盤を構築しています。 直近では、データソースの増加やデータパイプラインの複雑化、利用者の増加に伴うガバナンスの負荷の向上、プロダクションとして提供するための基盤の安定性など、データ基盤自体のレベルアップが必要になってきました。 また、Classiのデータ基盤には次のような難しさや面白さもあります。 セキュリティ・個人情報の取り扱いで求められる水準の高さ 子どもたちの大切な情報を預かっているので、データ利活用のトレードオフの面で一般的なWebサービスよりも一段上の対策が求められます。 具体的には、安心・安全にデータ利活用するためのデータマスキングやデータ管理のための知見と実行などが必要です。 非構造化データの活用 試験問題などのテキストデータや講義などの動画データとその回答データをより良くプロダクトに活かすためのエンジニアリングが求められます。 生徒・先生の学校生活における継続した利用のデータの分析 学校に導入して利用いただくので、入学から卒業までのデータが蓄積されており、長いサイクルでのデータを扱えます。 こういった環境で、教育に対してデータから貢献したい方を募集しています。 また、今回の募集はデータエンジニア経験者だけでなく、ソフトウェアエンジニアからデータエンジニアへのキャリアチャレンジを考えている方も対象としています。 業務内容 社内およびプロダクトのためのデータ基盤の設計・開発・運用 データ連携・データマート構築のためのパイプラインの開発 ジョブの実行状況及びデータ品質の監視 データ基盤を活用したプロトタイプ開発環境の提供 組織におけるデータ活用のためのデータマネジメント セキュリティと利便性のバランスを考慮したデータガバナンスの推進 BIツール(Tableau / Redash)やデータへのアクセス権限の管理と利用状況のモニタリング 利便性向上を目的としたメタデータの管理 データからの価値創出 データサイエンティストのためのデータ分析環境の整備 プロダクトKPIなど重要指標の探索と計測のサポート 採用している技術スタック 言語: Python, Go, SQL, HCL(Terraform) データ基盤: AWS: AWS Batch Google Cloud: Cloud Composer, BigQuery dbt, Docker BIツール: Tableau, Redash CI/CD: GitHub Actions 取り組み内容などの詳細についてはこちらもご参照ください。 開発者ブログでのデータエンジニアリング関連の記事 Data Engineering Study #9「企業規模別に見る、データエンジニア組織の作り方」での登壇 Engineers in CARTA vol.3 #データエンジニアリングでの登壇 必須スキル・経験 Python・SQL(DML)・Dockerを用いた開発経験(3年以上) AWSもしくはGoogle Cloudを用いたインフラの開発・運用経験(3年以上) データ分析基盤の設計・開発、もしくはWebアプリケーションのバックエンド開発経験(2年以上) 歓迎スキル・経験 データ基盤構築 BigQuery,RedShiftなどのデータウェアハウス構築・運用の経験 DigdagやAirflowなどのワークフローエンジンの導入・運用 アプリケーションなどのログ収集基盤の構築経験 データマネジメント 個人情報の取り扱いや権限管理などを意識したセキュアなデータ基盤の構築経験 TableauやLookerなどのBIツールの導入・運用 データマネジメントの課題に対してdbtなどによるシステム的な改善策を導入した経験 機械学習 機械学習モデルを開発した経験 機械学習基盤の開発やMLOpsなどの経験 そのほか開発スキル Go言語を用いたアプリケーションの開発・運用経験 TerraformなどのIaCを用いたインフラ構築経験 CI/CDの構築・運用 こんな方、お待ちしてます! 当社のミッション・ビジョン・バリューに共感いただける方 基盤構築が好きなだけでなく、サービスを良くするために自らの考えを持って、データパイプラインを設計・開発する、という意思を持った方 異なるバックグラウンドを持つメンバーと学びあえ、チームとしての成果を最大化しようとする方 続きを見る