全 6 件中 6 件 を表示しています
-
ソフトウェアエンジニア / マネージドサービス基盤の開発〜運用
部署紹介 CIU(CyberAgent group Infrastructure Unit)は、 サイバーエージェントグループ全体のインフラを支える組織です。 Cycloudというブランドでプライベートクラウドを展開しており、 IaaSとしてのOpenStackやKaaSであるAKEなど様々なサービスを提供しています。 仕事内容 独自のKubernetes as a Service基盤(AKE)を開発・運用しており、その基盤上で様々なサービスを稼働させています。 事業ドメイン特化なワークロードに対応するためのパフォーマンス・チューニングや、プライベートクラウド連携の作り込みなど、Kubernetes を理解した上で独自実装を行ったり、マネージドな環境にするためにクラスタ運用を自動化するような仕組み(Controller/Operator)や、GPUaaS on Kubernetes などの開発、Kubernetes関連プロダクトを用いた基盤(Prometheus、etc)の開発も行います。 入社後は、Kubernetes 関連技術のキャッチアップを行い、提案フェーズからAI 事業本部で利用する Kubernetes 関連基盤の開発・運用など幅広く携わる事が可能です。 業務フロー 価値あるものを開発するために、チームの力を最大化して開発しています。 要件定義・基本設計・プロダクトの企画(改善案)から携わり、 機能要求を満たすインフラの選定 / 設計に基づいた実装・検証・リリース・運用・保守改善・リリース後の機能改善 /スケールアウト、チューニングなどを一貫して行っております。 次に作るものはどうやって決められるか 事業戦略にもとづき、チームメンバー全体で次の戦略や改善案などを話し合います。 スケジュールや見積もり、今後の展開や取り組むことまで考えます。 また、コミュニティに積極的に関わりながら最新の情報をキャッチアップし、 新技術の検証・検討をチームメンバーが自ら考え行動しています。 タスクの見積もり、スケジュール管理 適宜、最適なツールを選定し進めています。 また、ミーティングやチャットツールなどで対話を行い、 タスクの量・大きさのコンセンサスを取りながら分担して実施しています。 開発フロー、デプロイフロー チームメンバーで合意した開発フロー、デプロイフローを利用しています。 都度、最適なものを検討し改善をしながら利用しています。 コードレビュー GitHub で Pull Request でコメントをもらいレビューを行っています。 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 Docker/Kubernetesの実務経験 Linuxの知識と3年以上の実務経験 Goによる開発経験 【歓迎する経験・知識】 OpenStackなどのPrivateCloudに関する知識や運用経験 OS、ミドルウェアの検証・運用監視経験 PublicCloudの利用経験 各種Kubernetes認定資格(CKA/CKAD/CKS) 求める人物像 インフラエンジニアの業務に興味と情熱のある方 新技術習得に向け、向上心の高い方 良好なコミュニケーション能力により、チーム内や他部署と調整可能な方 サービス、ユーザー中心で働く方 クラウドネイティブ技術に親和性のある方 OSS のアップストリームをウォッチする気持ちのある方 続きを見る
-
ソフトウェアエンジニア / 機械学習基盤の開発〜運用
部署紹介 CIU(CyberAgent group Infrastructure Unit)は、サイバーエージェントグループ全体のインフラを支える組織です。Cycloud というブランドでプライベートクラウドを展開しており、OpenStack (IaaS)、AKE (KaaS)、ML Platform (機械学習基盤) など様々なサービスを提供しています。 仕事内容 機械学習基盤 ML Platformの開発・運用を行い、社内のAI系技術者やプロダクトの開発効率化・速度向上・コスト削減を支援しています。 ML PlatformではGPUインスタンスの払い出し、機械学習ジョブの実行、機械学習モデルのデプロイといった機能を提供しています。今後はこれらの他にもMLOpsを推進するための機能を開発していく予定です。またこれらのサービスは基本的にKubernetes上のアプリケーションとして作られており、基礎的な機械学習の知識に加えてKubernetesに対する深い知識も必要になります。 サイバーエージェントは技術選定が自由であるため、ユーザーとなる社内プロダクトがパブリッククラウドを使うかCycloudを使うかは自由です。その中でCycloudのML Platformを選択してもらうために、ユーザーの求めるUXや機能を備えたサービスを作るのが我々のミッションです。 具体的な仕事内容は下記になります。 1. 大規模な GPU Kubernetes クラスタの開発、運用 物理 GPU ノードのセットアップ(OS インストールやパラメーターチューニング) Kubernetes クラスタの構築・運用 定期的な Kubernetes クラスタのバージョンアップデート Kubernetes の最新バージョンに対するキャッチアップ 大規模計算クラスタのための技術検証・導入(NVIDIA H100, RoCEv2/RDMA, NCCL など) 2. AI 系の開発を支援する機械学習サービスの開発、運用 GPU インスタンスや Jupyter Notebook を払い出すサービスの開発 各種機械学習フレームワークを用いたジョブシステムの開発(Pytorch/Tensorflow/etc.) 機械学習モデルのサーバーレスデプロイシステムの開発 機械学習のためのノード間分散ジョブシステムの開発(MPI) Kubernetes カスタムコントローラー(Go)の開発 Kubeflow などの機械学習系エコシステムの検証・導入・コントリビュート 3. ML Platform の規模拡大 新規・既存社内ユーザーとの積極的なコミュニケーションや折衝 ユーザーサポート(Python の学習スクリプトの調査など) AI 系技術や最新 GPU に対するキャッチアップ GPU リソースの需要調査や増設に向けた選定・導入 求める人物像 ソフトウェアからインフラまで幅広く興味があるエンジニアの方 向上心が高く、新しい技術の習得に対して抵抗がない方 良好なコミュニケーション能力により、チーム内や他部署と調整可能な方 サービス、ユーザー中心で物事を考えられる方 クラウドネイティブ技術に親和性のある方 OSS のアップストリームを追従・貢献する気持ちのある方 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 計算機科学に対する基本的な知識および理解 機械学習や GPU に対する基本的な知識および理解 Linux 環境における開発および運用経験 Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎する経験・知識】 以下の経験・知識を一つでもお持ちの方 Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow, Kueue, MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験 続きを見る
-
ソフトウェアエンジニア / 仮想サーバ基盤の開発〜運用
部署紹介 CIU(CyberAgent group Infrastructure Unit)は、 サイバーエージェントグループ全体のインフラを支える組織です。 Cycloudというブランドでプライベートクラウドを展開しており、 IaaSとしてのOpenStackやKaaSであるAKEなど様々なサービスを提供しています。 仕事内容 プライベートクラウドの提供を通じた、サービスの拡大・成長の支援をします。 1. プライベートクラウドに関わるツール/システムの開発及び運用 プライベートクラウドを運用する上で、必要となるツールやシステムの開発を担当 物理サーバのプロビジョニングシステム マネージドサービスの開発 x86サーバを用いたロードバランサ DBaaS PaaS CI/CD基盤 2. OpenStackの導入、運用及び改修 IaaS基盤としてOpenStackを導入しており、以下を担当 既に導入されているOpenStackの運用 新しいバージョンのOpenStackの検証、導入 OpenStackへの機能追加、変更、バグの修正 QEMU/KVM の調査・検証 3. Kubernetesの導入、運用及び改修 アプリケーションの実行基盤としてKubernetesの検証導入を進めており、以下を担当 Kubernetesの検証及び導入 コンテナランタイムの検証及び導入 利用者へ向けたKubernetes利用方法の指導 必要なプラグインやドライバ、コントローラの開発 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 計算機科学に対する基本的な知識および理解 Linux環境における開発および運用経験 2年以上のPython若しくはGoによる開発経験 Ansible、Terraform、Packer、Helm、Git、CI/CD、Prometheusの利用経験 【歓迎する経験・知識】 OpenStackの構築、本番運用経験 Kubernetesの構築、本番運用経験 Helm Charts、Kubebuilder、OperatorSDKを利用した開発の経験 QEMU/KVMに対する深い知識 MySQLの構築、本番運用経験 コンテナ関連技術(cgroups、namespace)への理解 選考のポイント 業務に対して責任感があり前向きかどうか 先々を想定しつつ自ら率先して行動に移せるかどうか 新しい技術やスキルの習得に対して積極的かどうか チームや他部署の人と一緒に業務ができるようなコミュニケーション能力があるかどうか 続きを見る
-
インフラエンジニア / サーバ・ストレージ
部署紹介 CIU(CyberAgent group Infrastructure Unit)は、 サイバーエージェントグループ全体のインフラを支える組織です。 Cycloudというブランドでプライベートクラウドを展開しており、 IaaSとしてのOpenStackやKaaSであるAKEなど様々なサービスを提供しています。 仕事内容 プライベートクラウドインフラの設計構築から運用 サーバやストレージの構築・保守・運用 AnsibleやJenkinsを用いた運用業務の自動化 要件に応じたサーバやストレージの設計、提案 ベンダーコントロール 次世代インフラに向けた技術検証 新しいメモリやCPUなどのパフォーマンス検証 GPUサーバの設計構築 入社後お任せする業務 プライベートクラウドインフラの運用から着手してもらう想定です。 具体的には、上記「仕事内容」の中の ・サーバやストレージの運用 ・AnsibleやJenkinsを用いた運用業務の自動化 を担当します。 なお中長期的には、上記「仕事内容」の全般業務に携わってもらうポジションとなります。 本ポジションの魅力 プライベートクラウドのインフラエンジニアとして、 大規模データセンターの設計~運用まで全てのフェーズに携わることができます。 サイバーエージェントの社内向けプライベートクラウド「Cycloud」には以下のような特徴があります。 プライベートクラウド向けに国内複数拠点のデータセンターを運用 1,000台以上の物理サーバーと85,000コア以上のCPU、2PB以上のストレージがある環境 AS(Autonomous System)を運用し多数の対外接続を持つ 自ら設計し自ら運用するため、一貫してシステムに携われる 参考情報(サイバーエージェントにおけるデータセンター運用とその課題) 参考情報(なぜディスクレスハイパーバイザに至ったのか) 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 ベアメタルサーバやストレージの保守運用経験(1年以上) Linuxやハイパーバイザに関する実務経験(1年以上) 【歓迎する経験・知識】 自宅でサーバーを運用している方 OpenStackやKubernetesに関する経験 CephやGlusterFSなどのSDSに関する経験 IaC(自動化)の知識および経験(シェルスクリプト、Jenkins、Ansibleなど) TCP/IPなどネットワークに関する知識 続きを見る
-
ネットワークエンジニア / 大規模データセンターの設計〜運用
部署紹介 CIU(CyberAgent group Infrastructure Unit)は、サイバーエージェントグループ全体のインフラを支える組織です。 Cycloudと呼ばれるプライベートクラウド(AS24284)を展開しており、OpenStackやKubernetesを用いてIaaS/KaaS/ML Platformなどの基盤を提供しています。 本ポジションの魅力 プライベートクラウドのインフラエンジニアとして、 大規模データセンターの設計~運用まで全てのフェーズに携わることができます。 サイバーエージェントの社内向けプライベートクラウド「Cycloud」には以下のような特徴があります。 プライベートクラウド向けに国内複数拠点のデータセンターを運用 1,000台以上の物理サーバーと85,000コア以上のCPU、2PB以上のストレージがある環境 AS(Autonomous System)を運用し多数の対外接続を持つ 自ら設計し自ら運用するため、一貫してシステムに携われる 参考情報(サイバーエージェントにおけるデータセンター運用とその課題) 参考情報(なぜディスクレスハイパーバイザに至ったのか) 仕事内容 1.既存ネットワークの運用 プライベートクラウドを支えるデータセンタネットワークの運用および障害対応 ASの運用およびバックボーンネットワークにおけるトラフィックエンジニアリング ネットワーク機器(Cisco、Huawei、Juniper、NVIDIA、A10など)の機能・性能検証 EoLなどに伴う機器のリプレイス手順書作成および実施 Ansible、Python・Goなどを利用した構築運用の自動化 ネットワーク機器の監視およびフロー情報の取得 ユーザからの問い合わせ対応 2.次世代ネットワークの設計と構築 AI/ML向けのGPUデータセンタ(400G RoCEv2 Lossless Ethernet/Infiniband)の設計・構築 ストレージネットワークの設計・構築 要件に応じた最適なプロトコルおよびアーキテクチャの選定 データセンタや回線の情報収集および選定 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 コンピュータサイエンスに関する基礎知識 データセンタネットワークやインターネットバックボーンの設計運用の経験(5年以上) 商用環境のネットワークにおける運用および障害対応の経験 データセンタにおけるケーブリングやラッキング等の物理作業の経験 【歓迎する経験・知識】 BGP、OSPF、EVPN/VXLANを用いたネットワークの知識および経験 ネットワーク機器(Cisco、Huawei、Juniper、NVIDIA、A10)の知識および経験 RoCEv2 Lossless Ethernet、InfinibandなどのGPU向けネットワーク設計・構築経験 専用線やインターネット回線の調査・選定 DDoS防御&緩和の知識および経験 Ansible、Jenkins、Gitの利用経験 TCP/UDP/HTTPプロトコルに関する深い知識 英語でのドキュメントやメール作成経験 選考のポイント ネットワーク業務に対して責任感があり前向きかどうか ネットワーク業務に対して主体的に発言・行動できるか 新しい技術やスキルの習得に対して積極的に行えるか(カンファレンス参加やRFCなどの読解) チームや他部署の人と調整するためのコミュニケーション能力を備えているか 続きを見る
-
ネットワークエンジニア(オフィスからスタジオ、データセンターまで幅広く担当)
部署紹介 Nic(ネットワークインテグレーションセンター)は、全国のサイバーエージェントグループのオフィスネットワークを支える新設組織です。現在3名が在籍し、多様な拠点の管理を通じて広範な経験を積むことができます。 オフィス系ネットワークだけでなく、スタジオやデータセンターとの連携を通じて最新技術に触れる機会が豊富にあり、ネットワークエンジニアとして成長できる環境です。 (↓)詳細はこちら https://it.cyberagent.group/team/nic/ 仕事内容 サイバーエージェントグループのオフィスネットワークの企画、設計、構築、運用まで一気通貫で支援します。 (具体的な業務) ・オフィスネットワークおよび関連システムの企画/設計/構築/運用 ・関連会社の新規設立や解散時などにおけるオフィスネットワークのサポート ・グループ会社の方からの問い合わせ・相談対応 ・プライベートクラウドのデータセンターネットワーク案件支援 ・CyberAgent Groupの動画事業(ABEMAなど) のネットワーク案件支援 入社後お任せする業務 既存社員サポートのもと、まずは現行の業務理解、環境理解してもらうために運用保守から着手していただく予定です。 業務理解が進んだら、なるべく早いタイミングで独り立ち(上記の業務内容全体を主体となってやっていく)していただくことを想定しております。 本ポジションの魅力 オフィスネットワークだけでなく、スタジオもデータセンターにも担当領域を広げることができます。 経験・スキル 【必須の経験・スキル】 以下全てを満たす経験をお持ちの方 Cisco製品(L2/L3スイッチ、無線LAN、ファイアウォール)を中心とした知識・経験 数十~数百人規模のネットワーク設計・構築を主体的に実施した経験 数百~数千人規模のオフィス系ネットワークの運用経験 【歓迎する経験・知識】 CCNP以上の資格を保持している方 広域イーサネット、キャリアサービスなど通信回線に関する知識 Fortigate、ASA/Firepowerを利用したリモートアクセスVPNの構築・運用経験 サーバ(Linux)の構築・運用経験 機器見積もり、発注、回線手配等の実務 続きを見る
全 6 件中 6 件 を表示しています