1. 株式会社Third Intelligence
  2. 株式会社Third Intelligence 採用情報
  3. 株式会社Third Intelligence の求人一覧
  4. Research Engineer - Post-training & Alignment / 事後学習

Research Engineer - Post-training & Alignment / 事後学習

  • 正社員

株式会社Third Intelligence の求人一覧

Research Engineer - Post-training & Alignment / 事後学習 | 株式会社Third Intelligence

Third Intelligenceは、日本発のAGIの確立に挑戦する、AI研究・プロダクト開発企業です。Third Intelligenceが独自に提唱する「遍在型AGI(汎用人工知能)」の確立と個人に寄り添ったその成長を通じて、社会の新たな基盤となるサービスの実現を目指します。

Third Intelligenceについて

仕事内容

ポジションの意義・背景

事前学習を終えた基盤モデルを、実際に人間が使える知能へと仕上げる役割です。具体的には、SFT(教師あり微調整)やRLHF(人間のフィードバックからの強化学習)などの手法を用いて、モデルの応答品質、推論能力、安全性を高めます。プロダクトとしてのAIの価値を直接左右する重要な工程を担っていただきます。

業務内容・期待成果

  • SFT, RLHF, DPO等の手法を用いた、モデルの応答性能と推論能力の高度化
  • 特定タスク(会話、プログラミング、数学、論理推論等)における思考プロセスの最適化と精度向上
  • ハルシネーションの抑制や安全性確保のための学習手法、および独自の評価メトリクスの設計
  • 高品質な合成データの生成・選別パイプラインの構築と、データ効率の最大化

応募資格(必須・歓迎)

【必須】

  • 大規模言語モデル(LLM)のFine-tuningや、アラインメント手法に関する実務・研究経験
  • Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
  • NLP領域の最新論文を自律的にキャッチアップし、その手法を迅速に再現・検証できる能力

【歓迎】

  • 基盤モデルの事前学習に関する知識や経験
  • フロンティアモデルの開発・運用実績
  • 英語による技術議論およびグローバルな開発体制における業務経験
  • 国際的な技術コミュニティでの活動や、英語による高度な技術交渉およびドキュメンテーション能力
  • BigTech水準のHPCインフラストラクチャを、最高のパフォーマンスで利用するための最適化能力
  • C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化、またはAIアクセラレータ(ASIC など)に関する専門的な知識
  • LLMの評価ベンチマークの設計、あるいはデータセットの構築に関する実績
職種 / 募集ポジション Research Engineer - Post-training & Alignment / 事後学習
雇用形態 正社員
契約期間
期間の定めなし(試用期間 3ヶ月)
給与
応相談
※ストック・オプション制度有‬‭
勤務地
  • 101-0052  東京都千代田区神田小川町1丁目4 WORK VILLA MYJ KANDA 11F
    地図で確認
地方からフルリモートOK。
ただし毎週、月曜日・金曜日は出社推奨日、かつ月1回のAllHands出社が必要(交通費支給)
勤務時間
専門型裁量労働制またはフルフレックス(所定労働時間 8時間‬)
休日
休日:土・日、祝日、年末年始 等。入社時に特別休暇を3日付与(有効期限半年)、その後6ヶ月勤務後から最低10日〜最大20日の年次有給休暇を付与。ほか特別休暇あり(慶弔休暇、アニバーサリー休暇など)
福利厚生
Company Deckよりご確認ください。
https://speakerdeck.com/thirdintelligence/third-intelligence-company-deck?slide=19
加入保険
雇用保険・労災保険・健康保険・厚生年金‬
受動喫煙対策
オフィス内禁煙
会社情報
会社名 株式会社Third Intelligence
代表者
代表取締役CEO 石橋 準也
設立
2025年3月27日
事業内容
AI研究、AIプロダクト開発