Third Intelligenceは、日本発のAGIの確立に挑戦する、AI研究・プロダクト開発企業です。Third Intelligenceが独自に提唱する「遍在型AGI(汎用人工知能)」の確立と個人に寄り添ったその成長を通じて、社会の新たな基盤となるサービスの実現を目指します。
仕事内容
ポジションの意義・背景
事前学習を終えた基盤モデルを、実際に人間が使える知能へと仕上げる役割です。具体的には、SFT(教師あり微調整)やRLHF(人間のフィードバックからの強化学習)などの手法を用いて、モデルの応答品質、推論能力、安全性を高めます。プロダクトとしてのAIの価値を直接左右する重要な工程を担っていただきます。
業務内容・期待成果
- SFT, RLHF, DPO等の手法を用いた、モデルの応答性能と推論能力の高度化
- 特定タスク(会話、プログラミング、数学、論理推論等)における思考プロセスの最適化と精度向上
- ハルシネーションの抑制や安全性確保のための学習手法、および独自の評価メトリクスの設計
- 高品質な合成データの生成・選別パイプラインの構築と、データ効率の最大化
応募資格(必須・歓迎)
【必須】
- 大規模言語モデル(LLM)のFine-tuningや、アラインメント手法に関する実務・研究経験
- Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
- NLP領域の最新論文を自律的にキャッチアップし、その手法を迅速に再現・検証できる能力
【歓迎】
- 基盤モデルの事前学習に関する知識や経験
- フロンティアモデルの開発・運用実績
- 英語による技術議論およびグローバルな開発体制における業務経験
- 国際的な技術コミュニティでの活動や、英語による高度な技術交渉およびドキュメンテーション能力
- BigTech水準のHPCインフラストラクチャを、最高のパフォーマンスで利用するための最適化能力
- C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化、またはAIアクセラレータ(ASIC など)に関する専門的な知識
- LLMの評価ベンチマークの設計、あるいはデータセットの構築に関する実績
| 職種 / 募集ポジション | Research Engineer - Post-training & Alignment / 事後学習 |
|---|---|
| 雇用形態 | 正社員 |
| 契約期間 | 期間の定めなし(試用期間 3ヶ月) |
| 給与 |
|
| 勤務地 | 地方からフルリモートOK。 ただし毎週、月曜日・金曜日は出社推奨日、かつ月1回のAllHands出社が必要(交通費支給) |
| 勤務時間 | 専門型裁量労働制またはフルフレックス(所定労働時間 8時間) |
| 休日 | 休日:土・日、祝日、年末年始 等。入社時に特別休暇を3日付与(有効期限半年)、その後6ヶ月勤務後から最低10日〜最大20日の年次有給休暇を付与。ほか特別休暇あり(慶弔休暇、アニバーサリー休暇など) |
| 福利厚生 | Company Deckよりご確認ください。 https://speakerdeck.com/thirdintelligence/third-intelligence-company-deck?slide=19 |
| 加入保険 | 雇用保険・労災保険・健康保険・厚生年金 |
| 受動喫煙対策 | オフィス内禁煙 |
| 会社名 | 株式会社Third Intelligence |
|---|---|
| 代表者 | 代表取締役CEO 石橋 準也 |
| 設立 | 2025年3月27日 |
| 事業内容 | AI研究、AIプロダクト開発 |