【教育プラットフォーム/Classi】データエンジニア(リーダー候補)
会社概要 Classi株式会社は、2014年にベネッセホールディングスとソフトバンクが共同で立ち上げた、累計導入2,300校、累計利用生徒210万人以上が利用する教育プラットフォームである「Classi(クラッシー)」、学校のICT化を支援する保護者連絡ツール「tetoru(テトル)」の開発・運営をする会社です。学校(School)× テクノロジー(Technology)を組み合わせた「SchoolTech」を推進しています。 SchoolTechとは、EdTechの中でも、特に公教育である「学校」で活用されることを目的としたテクノロジーを指している用語で、現在私たちのサービスは多くの小学校・中学校・高等学校の生徒/児童・先生・保護者に利用していただいています。 今日の児童・生徒たちは、既にデジタルネイティブ世代であることはもちろん、自分の人生を切り拓いていくための学びの場である学校では、ますますICT教育が果たす役割の重要性が増してきています。このような時代での我々の役割と責任について理解し、当社のミッション・ビジョン・バリューに共感していただける方からのご応募をお待ちしています。 求人紹介 Classiには日々、先生・生徒・保護者の利用データが集まってきます。 そういったデータを、社内でのデータドリブンな意思決定支援はもちろんのこと、プロダクトとして提供を行ったり、機械学習などを活用したサービス開発をしたりするためのデータ基盤を構築しております。直近では、データソースの増加やデータパイプラインの複雑化、利用者の増加に伴うガバナンスの負荷の向上、プロダクションとして提供するための基盤の安定性など、データ基盤自体のレベルアップが必要になってきただけでなく、機械学習などを活用したサービス開発のために基盤を利用するなど、ユースケースも多様になってきました。 また、Classiのデータ基盤には次のような難しさや面白さもあります。 セキュリティ・個人情報の取り扱いで求められる水準の高さ 子どもたちの大切な情報を預かっているので、データ利活用のトレードオフの面で一般的なWebサービスよりも一段上の対策が求められます 具体的には、安心・安全にデータ利活用するためのデータマスキングやデータ管理のための知見と実行などが必要です 非構造化データの連携 試験問題などのテキストデータや講義などの動画データとその回答データ 生徒・先生の学校生活における継続した利用のデータの分析 学校に導入して利用いただくので、入学から卒業までのデータが蓄積されており、長いサイクルでのデータが利用できる こういった環境で、教育に対してデータから貢献したい方を募集しています! 募集背景 Classiは2020年にセキュリティインシデントと大規模障害を引き起こしてしまいました。そこから、全社的にこの課題に向き合いサービスの信頼性を保てるように、開発組織はもちろん、全社的な組織体制やビジネスの方針など、大きく変化を行いました。お客様に安心してお使いいただけるようサービスの信頼性を第一に置き、成果を出すことができたと感じています。 https://tech.classi.jp/entry/2020/11/13/120000 これからは、信頼性に重きを置くことを継続しつつ、更に多くのお客様へ価値提供をしていくために、プロダクト開発を加速させたいと考えています。信頼性に重きを置くことを継続しつつ、更に多くのお客様へ価値提供をしていくために、プロダクト開発を加速させたいと考えています。 業務内容 社内およびプロダクトのためのデータ基盤の設計・開発・運用 データ連携・データマート構築のためのパイプラインの開発 ジョブの実行状況及びデータ品質の監視 組織におけるデータ活用のためのデータマネジメント セキュリティと利便性のバランスがとれたデータ利用ポリシーの設計 BIツール(Tableau / Redash / Google Data Portal)やデータへのアクセス権限の管理と利用状況のモニタリング メタデータ管理ツールの開発・運用 データ・機械学習系サービスの開発とデリバリーのための基盤構築 データサイエンティストのためのデータ分析環境の整備 データ基盤を活用したプロトタイプの開発環境の提供 ※取り組み内容や技術スタックの詳細についてはこちらもご参照ください 開発者ブログでのデータエンジニアリング関連の記事 Data Engineering Study #9「企業規模別に見る、データエンジニア組織の作り方」での登壇 Engineers in CARTA vol.3 #データエンジニアリングでの登壇 必須スキル・経験 Python・SQL(DML)・Dockerの使っての開発経験が3年以上 AWSもしくはGCPによるインフラの開発・運用の3年以上の経験 データ分析基盤の設計・開発、もしくはWebアプリケーションのバックエンド開発の経験が2年以上あること 歓迎スキル・経験 データ基盤構築 BigQuery,RedShiftなどのデータウェアハウス構築・運用の経験 DigdagやAirflowなどのワークフローエンジンの導入・運用 アプリケーションなどのログ収集基盤の構築経験 データマネジメント 個人情報の取り扱いや権限管理などを意識したセキュアなデータ基盤の構築経験 TableauやLookerなどのBIツールの導入・運用 データマネジメントの課題に対してdbtなどによるシステム的な改善策を導入した経験 機械学習 機械学習モデルを開発した経験 機械学習基盤の開発やMLOpsなどの経験 そのほか開発スキル TerraformなどのIaCを用いたインフラ構築経験 CI/CDの構築・運用 こんな方、お待ちしてます! 当社のミッション・ビジョン・バリューに共感いただける方 基盤構築が好きなだけでなく、サービスを良くするために自らの考えを持って、データパイプラインを設計・開発する、という意思を持った方 異なるバックグラウンドを持つメンバーと学びあえ、チームとしての成果を最大化しようとする方 続きを見る