本ポジションについて
本ポジションのミッションは、「音声認識・話者認識・LLM領域における先端技術の研究開発を通じて、プロダクトの技術的優位性を確立すること」です。
最新の論文・手法の調査・検証から、新規アルゴリズムの開発・評価まで、研究開発を中心に担当していただきます。 加えて、受託したPoC案件での技術検証業務にも携わっていただきます。
募集背景
主力事業であるAI議事録ツール「SecureMemo/SecureMemoCloud」は昨年比200%成長を遂げており、政府系機関からエンタープライズ企業まで、幅広い組織にプロダクトを提供しています。
更なる成長のため、AI(音声認識・話者認識・LLM)の研究開発体制を強化する必要があります。 そこで、音声認識・話者認識・LLM領域における先端技術の研究開発を通じて、プロダクトの競争力を高めるリサーチエンジニアを募集します。
事業・ポジションの魅力
研究成果が実プロダクトで活用される環境
- 研究成果が数万ユーザーに届く実感
- 官公庁・大手企業の実データで研究開発
- プロダクトフィードバックを研究に活かせるサイクル
成長性と安定性を併せ持つ事業基盤
- 昨年比200%成長のスタートアップフェーズ
- 官公庁向け大規模案件を通じた安定した事業基盤
- 国のインフラを支える責任あるシステムで使用されるAIの研究開発
- NEDO「GENIAC」採択プロジェクトでの先端AI研究開発
知見共有が盛んで高いレベルで切磋琢磨できる環境
- AIエンジニア・リサーチエンジニアはKaggleでメダル獲得、上位入賞の実績のあるメンバーで構成
- 毎週水曜には「よもやま定例」という名の技術勉強会でR&Dやエンジニアリングのナレッジや意見交換を実施
- 最新の論文・技術トレンドをキャッチアップし、実務に活かす文化
具体的に期待する役割
- 音声認識・話者認識・LLMの最新論文を調査・検証し、プロダクトの技術的優位性を研究開発で切り拓くこと
- 仮説立案・実験設計・プロトタイプ実装を一気通貫で担い、研究成果を数万ユーザーが使うプロダクトへ直接つなげること
- 論文執筆・学会発表・特許出願を通じて、Nishikaの技術ブランドを対外的に発信していくこと
業務内容
以下の研究開発のタスクを推進していただきます。
- 文献調査・最新技術のキャッチアップ
- 最新論文(arXiv、主要国際会議等)のサーベイ
- 技術トレンドの分析・社内共有
- 仮説立案・実験設計
- 課題定義と解決アプローチの策定
- 評価指標の設定・実験計画の立案
- プロトタイプ実装・検証
- アルゴリズム実装・実験実施
- 結果分析・考察・技術レポート作成
- 研究成果の発信・技術移転
- プロダクトチームへの技術知見の共有・連携
- 論文執筆・学会発表
- 特許出願
研究開発テーマ(例)
- 音声認識
- 最新の音声認識モデル(Whisper、Conformer等)の調査・検証
- バッチ処理における精度向上手法の研究
- リアルタイム認識の精度・レイテンシ改善に向けた研究
- ドメイン適応・Few-shot学習手法の検討
- 日本語特有の課題(方言、専門用語等)への対応研究
- 話者認識
- 話者分離(Speaker Diarization)の精度向上
- 話者認証(Speaker Verification)の精度向上
- 声紋を含む話者とそうでない話者の話者認識の精度向上
- オーバーラップ音声への対応手法の研究
- ノイズ環境下での頑健性向上
- LLM
- 議事録生成に特化したプロンプトエンジニアリング手法の研究
- 文脈理解・専門用語処理の精度向上
- 誤認識修正(Post-Correction)手法の開発
- Fine-Tuning手法の研究(LoRA、QLoRA等)
- SLM(小規模言語モデル)の開発・最適化
- 推論効率化手法の研究(量子化、蒸留等)
技術スタック
- プログラミング言語: Python
- AI/MLフレームワーク: PyTorch, HuggingFace, Transformers
- LLMアプリケーションフレームワーク: LangChain
- 音声処理: librosa, torchaudio, pydub
- 実験管理・モニタリング: MLflow, Weights & Biases, Langfuse
- 開発ツール: Git, Docker
- クラウド: AWS, Azure, GCP
必須要件
以下いずれかの経験・実績
- 音声認識・音声処理・話者認識分野での研究経験(修士以上または同等の実務経験)
- LLM・自然言語処理分野での研究経験(修士以上または同等の実務経験)
- Kaggle等データ分析コンペでの賞金圏内入賞経験
かつ
- Python・PyTorchを用いた機械学習モデルの実装経験
- 英語論文の読解能力
歓迎要件
- トップカンファレンスでの複数論文採択経験
- 音声認識・話者認識の両分野での研究経験
- LLMのFine-Tuning・コンテキストエンジニアリング経験
- 博士号取得または博士課程在籍
- 特許出願・取得経験
こんな人と働きたい
- 最新の研究動向に強い関心を持ち、継続的に学習できる方
- 実験結果を論理的に分析し、次の打ち手を考えられる方
- 研究成果を論文・ブログ・社内勉強会等で積極的に発信できる方
- プロダクトチームと協働し、研究成果の技術移転に関心がある方
- 「研究のための研究」ではなく、「ユーザーに価値を届けるための研究」という意識を持てる
キャリアパス
入社直後〜中期
研究開発を通じて、以下のスキルを伸ばしていただきます。
- 音声認識・話者認識・LLM領域における最新技術の調査・検証スキル
- 実験設計・プロトタイプ実装・評価分析のスキル
- 研究成果を論文・技術レポート・社内勉強会等で発信するスキル
- プロダクトチームとの技術連携スキル(研究成果の技術移転、実データに基づく課題発見等)
将来
ご本人の志向性に応じて、以下のキャリアパスを想定しています
- リサーチエンジニアのリード
- リサーチエンジニアチームのマネジャー
選考プロセス
カジュアル面談
▼
書類選考
▼
技術面接(1回)
▼
最終面接(代表との面接)
▼
内定
| 職種 / 募集ポジション | リサーチエンジニア |
|---|---|
| 雇用形態 | 正社員 |
| 契約期間 | 期間の定め:無 試用期間:有(3ヶ月、期間中の条件変更なし) |
| 給与 |
|
| 勤務地 | 五反田駅(JR山手線、都営浅草線、東急池上線)徒歩6分 大崎駅(JR山手線、JR埼京線)徒歩9分 リモートワーク:週2回(火曜・木曜) |
| 勤務時間 | - フレックスタイム制
- 原則的な労働時間
- 午前10時~午後18時45分(実働7:45)
- コアタイム
- 午前10:00~午後3:00 |
| 休日 | - 完全週休2日制(土・日・祝) - 年末年始休暇 - 夏季特別休暇 - 年次有給休暇 - 年間休日120日以上 |
| 福利厚生 | - ストックオプション付与実績あり - リファラル補助制度 - 健康診断費用補助(毎年) - AIツール費用、書籍購入、自己研鑽費用補助 - インフルエンザワクチン接種費用補助 - 育児支援 |
| 加入保険 | 各種社会保険完備 |
| 受動喫煙対策 | 敷地外喫煙可能場所あり 屋内全面禁煙 |
| 諸手当 | 交通費一律支給(上限30,000円) |
| 会社名 | Nishika株式会社 |
|---|---|
| 代表者 | 代表取締役CEO 山下 達朗 代表取締役CTO 松田 裕之 |
| 設立 | 2019年5月7日 |
| 資本金 | 70,184千円 |
| 所在 | 東京都品川区東五反田1丁目25番11号 THE GATE GOTANDA EAST 4階 |
| 株主 | - サイバーエージェントキャピタル - リヴァンプ - グロービス |
| 事業内容 | - AIプロダクト事業 - AIソリューション事業 |