1. 株式会社ミスミグループ本社
  2. 株式会社ミスミグループ本社 採用情報
  3. 株式会社ミスミグループ本社 の求人一覧
  4. SRE(リーダー候補~メンバー)/ AI検索プラットフォームの信頼性向上

SRE(リーダー候補~メンバー)/ AI検索プラットフォームの信頼性向上

  • TX-25-05-50-ML(2/4公開)
  • 正社員

株式会社ミスミグループ本社 の求人一覧

SRE(リーダー候補~メンバー)/ AI検索プラットフォームの信頼性向上 | 株式会社ミスミグループ本社

募集組織

デジタルサービスモデル開発・ハブ
AI検索開発室 AI検索開発チーム 全体基盤強化セクション

<AI検索開発チームの組織構成>
 全体11名(ディレクター2名、リーダー2名、メンバー7名)
<AI検索開発チームの年齢構成>
 ディレクター、リーダー:30代~40代
 メンバー:30代前半が中心。20代~30代まで在籍

①事業部/室ミッション  

 私たちはECサイトを運営する当社において「部品調達における顧客の 思考にかける時間 の短縮」に向けて活動しています。
IA産業(Industrial Automation産業)における部品調達のデファクトスタンダードとなるため、顧客・サプライヤーの「あらゆるムダの排除」を掲げる「デジタルサービスモデル開発・ハブ(TX)」の一員として、コア機能である「検索サービス」の内製開発を推進しています。

②チームミッション  

 本チームの使命は、データとAIモデルを武器に「ユーザーが欲しい商品を瞬時に見つけられる検索アプリケーション」を構築することです。
特にSREとしては、「AIの賢さ(精度)」と「検索エンジンの速さ(速度)」を両立させるための基盤を支え、グローバル規模でのアクセス増大(10→100のスケール)に耐えうる、堅牢かつ柔軟なインフラ・運用体制を構築することがミッションとなります。

③自組織の強み・事業責任者からのコメント等

 私たちの強みは、AIモデルの研究開発だけでなく、それを実際のECサイトで動くサービスとして実装・運用するまでを1チームで完結できる点です。開発と運用が分断されていないため、SREとしてアプリケーション内部やAIの挙動に深く踏み込んだ改善が可能です。
どれほど高精度なAIモデルができても、検索結果が返ってくるのに3秒かかってはユーザーは離脱します。「AIの賢さ(精度)」を損なわず、「検索エンジンの速さ(レイテンシ)」を極限まで追求し、最高の検索体験(Search UX)をインフラ・基盤の側面から支え抜くことがSREの最大のミッションです。
単にクラウドインフラを管理するだけでなく、バックエンドやAIモデルの特性を理解し、「サービス全体」の信頼性とパフォーマンスに責任を持つ視点で、チームを支え・牽引してくれる方を求めています。

仕事情報

①担当業務内容

AI検索機能(キーワード検索、ベクトル検索、AIレコメンド等)を提供するプラットフォームの信頼性向上、パフォーマンス改善、開発効率化をリードしていただきます。

1.信頼性向上・スケーラビリティ確保(Reliability & Infrastructure):40%
グローバル展開(10→100のスケール)に耐えうるインフラ基盤の設計・構築・運用をリードします。

  • コンテナ基盤の高度化: GKE (Kubernetes) / Cloud Run を活用した、高負荷に耐えうるオートスケーリング基盤の構築と運用。
  • SLI/SLOの導入・運用: サービスの信頼性を定義し、エラーバジェットに基づいた運用ルールの策定と、開発チームへの信頼性文化(Reliability Culture)の浸透。
  • グローバルインフラ設計: 各国のレイテンシ要件を満たすマルチリージョン構成やCDN戦略、ネットワーク設計の最適化。

2.パフォーマンス・エンジニアリング・可観測性(Performance & Observability):40%
「AIの賢さ」と「検索エンジンの速さ」を両立させるためのチューニングと監視環境を整備します。

  • 検索基盤の高速化: Elasticsearchやベクトル検索エンジンのインデックス設計、クエリパフォーマンスのボトルネック特定と解消。
  • 分散トレーシングの確立: マイクロサービスとAIモデルを横断するリクエストフローを可視化し、障害発生時の原因特定時間を短縮する。
  • コスト最適化 (FinOps): クラウドコストやAIリソース(GPU等)の使用状況を監視し、性能を維持しつつのコスト削減を提案・実行する。

3.DevEx向上・チームマネジメント(Developer Experience & Management):20%
開発チーム全体の生産性を最大化するための環境整備と、技術的なリードを行います

  • Toil(労苦)の削減: 手作業によるオペレーションを自動化し、エンジニアが創造的な作業に集中できる時間を創出する。
  • CI/CDパイプラインの進化: テスト自動化、カナリアリリース等のデプロイ戦略を実装し、安全かつ高速なリリースサイクルを実現する。
  • 技術共有・育成: SREプラクティスの勉強会実施やコードレビューを通じ、開発メンバーのインフラ・運用スキルの底上げを図る。

②仕事のやりがい(面白さ)

  • 「AI×検索」という高難易度領域への挑戦:
    単なるWebアプリとは異なり、重いAI処理とミリ秒単位のレスポンスが求められる検索エンジンが混在する環境です。この「精度 vs 速度」のトレードオフに対し、インフラやミドルウェアのチューニングで解決策を提示するエンジニアリングの醍醐味があります。
  • 大規模グローバルサービスへの成長フェーズ:
    月間数千万PV規模かつグローバル展開という、トラフィックが急増するフェーズに立ち会えます。スケーラビリティの課題が顕在化する前に手を打ち、システムが安定して成長していく様を支える達成感は格別です。
  • SRE文化の立ち上げ:
    専任のSREとしては初期メンバーに近い立ち位置となるため、監視体制の構築や障害対応フローの整備など、自らの手で「組織のSRE文化」をゼロから作り上げる経験が積めます。

③3~5年後の想定されるキャリアパス

  • 全社のインフラ戦略やクラウドアーキテクチャを統括する「プラットフォームエンジニアリングリード / CCoeリード」
  • AI/MLシステムの運用・パイプライン構築に特化した「MLOpsエンジニア / AIアーキテクト」
  • 特定技術(検索エンジン、K8s、DB等)を極め、技術的な最終意思決定を行う「スペシャリスト / プリンシパルエンジニア」
  • エンジニアリング組織の生産性やピープルマネジメントを担う「VPoE / エンジニアリングマネージャー」

④業務上の課題

基盤のマイクロサービス化やAI機能の融合は完了していますが、SRE視点では以下の課題が待ち受けています。これを共に解決してくれる方を求めています。

  1. 「10→100」のスケールに耐えうるアーキテクチャへの刷新
    現在の基盤は稼働していますが、今後予想されるグローバル規模の急激なトラフィック増大に対し、現行の構成では運用負荷やコストが指数関数的に増えるリスクがあります。先回りしてボトルネックを予測し、オートスケーリングの最適化やDBのシャーディング、キャッシュ戦略の再設計など、抜本的なスケーラビリティ対策が必要です。
  2. 複雑化するシステムの「可観測性」の確立
    AIモデル、検索エンジン、APIが複雑に連携しているため、障害発生時に「どこで遅延しているか」「なぜ検索結果が出ないか」の特定に時間がかかるケースがあります。単なる死活監視を超え、分散トレーシングやログ分析を高度化し、異常を予兆段階で検知できるレベルまでオブザーバビリティを高めることが急務です。
  3. 開発スピードと安定性のバランス(Error Budgetの運用)
    機能開発チームは「アジャイルな改善」を求めていますが、変更頻度の増加は障害リスクを高めます。「変更を止める」のではなく、「安全に失敗し、即座に復旧できる」ガードレールをシステム的に構築し、開発速度を落とさずに信頼性を担保する仕組み作りが必要です。

⑤使用ツール

  • クラウド・インフラ: GCP (Cloud Run, GKE, Vertex AI), AWS
  • 検索エンジン: Elasticsearch, Vertex AI Search
  • IaC・CI/CD: Terraform, GitHub Actions
  • モニタリング: Datadog, Cloud Operations (旧Stackdriver) 等
  • 言語: Python, Go (ツール作成やスクリプト等で使用)
  • DB/Cache: Redis, Firestore, Cloud SQL, BigQuery
  • コミュニケーション: MS Teams, GitHub Projects

⑥その他

リモートワークと出社のハイブリッド勤務、フリーアドレス制など、柔軟で働きやすい環境です。

募集条件

①必須要件

  • パブリッククラウド(GCPまたはAWS)におけるインフラ設計・構築・運用経験(目安:3年以上)
  • コンテナ技術(Docker, Kubernetes)を用いた本番環境の運用経験
  • Terraform 等のIaCツールを用いたインフラ構成管理の経験
  • Webアプリケーションの開発・運用プロセス(CI/CD、バージョン管理)への深い理解
  • スクリプト言語(Python, Go, Bash等)を用いた運用自動化の経験

②歓迎要件

  • Elasticsearch / Solr 等の検索エンジンの運用・チューニング経験(特に歓迎)
  • SLI/SLOの策定・運用や、トイル削減などのSREプラクティスの実践経験
  • 大規模トラフィック(高負荷)環境下でのパフォーマンスチューニング経験
  • マイクロサービスアーキテクチャにおける可観測性(Distributed Tracing等)の設計・導入経験
  • 機械学習パイプライン(MLOps)に関連するインフラ構築経験

③求める人物像

  • 「守り」だけでなく「攻め」のインフラ運用ができる方:
    安定稼働を守るだけでなく、アプリケーションのパフォーマンスを最大限引き出すための技術選定や改善提案ができる方。
  • 全体最適の視点を持てる方:
    「インフラ担当」という枠に閉じこもらず、アプリケーションエンジニアやデータサイエンティストと連携し、サービス全体の価値向上にコミットできる方。
  • 変化を楽しめる方:
    10→100への急拡大フェーズや、AI技術の進展に伴うアーキテクチャの変化を楽しみ、柔軟に対応できる方。

④学歴

大学院卒、大学卒、高専卒、専門卒以上

職種 / 募集ポジション TX-25-05-50-ML(2/4公開)
雇用形態 正社員
契約期間
期間の定め:無
試用期間:有(試用期間:原則3ヶ月) ※試用期間中の待遇変更はありません
給与
年収
※メンバー採用の場合:上記年収は月30時間の残業代が含まれています。月30時間を超える残業代は別途支給。
※管理職採用の場合、時間外勤務手当・休日勤務手当は支給無し。深夜勤務手当有り。
※賞与:年2回(12月と6月)
勤務地
  • 102-8583  東京都千代田区九段南1丁目-6-5 九段会館テラス
    地図で確認
<東京本社>
勤務時間
9:00~17:30(標準7時間30分)
※フレックスタイム制あり/コアタイム11:00~15:00
休日
年間休日124日
・完全週休2日制(土日)/祝日/年末年始(12/29~1/4)
※ただし、業務の都合で休日を他の日に振替えることがある
福利厚生
・有給(初年度:即日付与。日数は入社日によって変動。次年度以降:4月に付与。)
・慶弔休暇/特別休暇
・交通費※会社規定に基づき支給
・退職金制度(正社員のみ) ・確定拠出年金制度
・社会保険完備(健康保険・厚生年金保険・労災保険・雇用保険) 
・社内研修制度 ・社内英会話レッスン(本社ビルのみ)
・保養所(ラフォーレ倶楽部) ・テーマパークチケット優待
受動喫煙対策
屋内原則禁煙(喫煙専用室あり)
働き方
①勤務制度区分
 <フレックスタイム制>
②リモートワーク勤務
 <リモート可>
③出社頻度
 週3日
④土日祝出勤
 ・有無<無し>
⑤出張情報(有無/場所/頻度)
 ・有無<無し>
⑥兼業に関して
 ・原則不可
業務内容の変更範囲
会社の定める業務
勤務場所の変更範囲
会社の定める場所
会社情報
会社名 株式会社ミスミグループ本社
雇用主
株式会社ミスミ
所在地
東京都千代田区九段南1丁目6番5号九段会館テラス
売上高(連結)
401,987百万円(2025年3月期)
従業員数(連結)
11,064名(2025年3月31日時点)
上場証券取引所
プライム市場