1. 株式会社オルツ
  2. 株式会社オルツ 採用情報
  3. 株式会社オルツ の求人一覧
  4. AIエンジニア(音声認識モデル生成)

AIエンジニア(音声認識モデル生成)

  • AIエンジニア(音声認識モデル生成)
  • 正社員

株式会社オルツ の求人一覧

AIエンジニア(音声認識モデル生成) | 株式会社オルツ

【About Alt / オルツについて】
Our company is dedicated to research and development with the aim of creating a world where everyone can have their own P.A.I. (Personal Artificial Intelligence), freeing people from labor (Lavoro) and allowing them to immerse themselves in creative and artistic pursuits (Opera).

弊社は、世界中の全ての人が自分自身のP.A.I. (パーソナル人工知能)を持つことによって、労働( Lavoro)から解放され、 創造的でアーティスティックな営み(Opera) に没頭することができる世界を実現するための研究開発を行ってい ます。

"P.A.I. (Personal Artificial Intelligence)" refers to an AI designed to digitize our own will and place it in the cloud, enabling this digital clone to handle various digital tasks. These digital clones, capable of making individual decisions, can operate 24/7 across the networked world, taking care of tasks such as work, shopping, and travel arrangements. By handling tasks that we don't need to do ourselves, they allow humans to focus on activities that only humans can truly accomplish.

『P.A.I.(パーソナル人工知能)』 とは私たち自身の意思をデジタル化し、 それをクラウド上に配置してあらゆるデジタル作業をそのクローン にさせることを目的としたAIです。
個人の意思・決断までも行えるデジタルクローンが、 24時間365日ネットワーク世界を飛び回り、仕事や買い物、 旅行の手配など自分が行わなくてもよい作業を代替することで、 人間が人間にしかできないことに集中することが可能になります。

Business Overview / 事業内容

Leveraging advanced AI technologies developed from P.A.I. research, we have introduced AI solutions to over 8,000 companies. Our flagship product is the automatic meeting transcription tool "AI GIJIROKU." Additionally, we utilize the domestically developed large-scale language processing model "LHTM-2" for products like "altBRAIN" and "clone.dev." Recently, we have expanded to include "Clone M&A," an M&A matching system using LLM, "Clone HR," a next-generation matching system, and "EMETH GPU POOL," a new service that makes GPU computing resources accessible to everyone. These AI solutions can be applied across various businesses, and we have grown to become one of the top AI companies in Japan, having raised a total of 10 billion yen in funding.

P.A.I.の研究から生まれた高度なAI要素技術群を活用し、 現在8000社以上の企業に導入が進んでいる会議自動文字起こし ツール『AI GIJIROKU(AI議事録)』を中心に、 国産の大規模言語処理モデル「LHTM-2」を活用した「 altBRAIN」「clone.dev」、直近3月には、 LLMを活用したM&Aマッチングシステム「CloneM&A」 やLLMを活用した新時代のマッチングシステム「 CloneHR」、 GPU計算リソースをあらゆる人に解放する新サービス「 EMETH GPU POOL」など、 あらゆるビジネスに活用可能なAIソリューションを展開し、 累計100億円の資金調達実績の国内トップクラスのAI企業まで 成長しました。

Our Service / サービス

Communication Intelligence「AI GIJIROKU

It is a Communication Intelligence tool equipped with AI learning capabilities. Designed to automate tasks such as meeting minute creation, this product digitizes and visualizes the outcomes and progress of each meeting. "AI GIJIROKU" is one of our products that utilizes speech recognition and LLM, with a unique feature of improving transcription accuracy with each use. It supports real-time simultaneous translation in 35 major languages and offers cutting-edge models with high speech recognition accuracy, specialized for industries such as finance, healthcare, pharmaceuticals, chemicals, and construction. The tool can personalize text by automatically learning from users' social media, emails, and dictionary data, as well as identify speakers through voiceprint recognition. By deploying AI that carries the unique "knowledge and expertise" of the client's company, it greatly contributes to the efficiency and productivity of meetings. In the pursuit of "P.A.I." (Personal Artificial Intelligence), it serves as a foundational data cloud for building business AI solutions.

AIの学習機能を搭載したCommunication Intelligenceツールであります。 会議議事録作成等の業務を代替し、 各会議結果及び経緯等をデータ化し可視化するプロダクトでありま す。 当社における音声認識及びLLMを活用したプロダクトであり、「 AI GIJIROKU」は、 利用する度に文字起こしの精度が向上するという特徴を持っていま す。主要35か国語のリアルタイム同時翻訳に対応し、金融、 医療、製薬、化学、建設などの業界・業種に特化した、 高い音声認識精度を有する最先端モデルを提供しています。 利用者のSNSやメール、 辞書データから自動学習した文章のパーソナライズ、 ユーザーの声紋判断による話者特定のパーソナライズが可能で、 クライアントの会社固有の“知識とノウハウ“ を持つAIが実稼働することで、 会議の効率化と生産性の向上に大きく貢献します。「P.A.I. 」(パーソナル人工知能)実現に向けては、 ビジネスシーンのAIを構築するための、 基盤データクラウドとしての役割を担っております。

"AI Call Center" - A next-generation voice bot that enables free-form conversation with AI / 「AIコールセンター」”AIとの自由会話”での対話が 可能な次世代ボイスボット      

"AI Call Center" is a voice interaction AI solution developed by ALTs to meet the call center needs of the new normal era. It leverages natural language processing technology, honed over years of research and development, to enable free-form conversation with AI. By implementing the "AI Call Center," companies can achieve over 50% cost savings compared to traditional labor costs. Additionally, the AI's analysis of conversations allows new operators to quickly learn from the best-performing operators, creating an environment for rapid skill acquisition.

「AIコールセンター」は、 ニューノーマル時代のコールセンターニーズに応える為、 オルツが長年の研究開発で培った自然言語処理技術による “AIとの自由対話“ が可能な音声対話AIソリューションです。「 AIコールセンター」を導入することで、 従来の人件費に対して50%以上のコスト削減を実現したり、 AIによるトークの解析によって優秀なオペレーターのトークを新 人オペレーターがすぐに学ぶ環境を創出することができます。

"CLONEdev" integrates users' life logs to generate digital clones / 「CLONEdev」利用者のライフログを連携し、 デジタルクローンを生成

"CLONEdev" is the world's first system that digitally replicates a user's personality. It combines life log data stored in OLTs' data storage system, "alt ID," with technologies such as language processing and image generation to capture individual human traits, enabling outputs that reflect the user's intentions for interactive dialogue. The clone generation platform of "CLONEdev" utilizes OLTs' proprietary large-scale language model, "LHTM-2." Given the extensive computational resources required for this model, the company plans to further integrate it with its distributed computing infrastructure, the "alt Emeth" project.

「CLONEdev(クローンデブ)」は、 利用者の人格をデジタル上に再現する世界初のシステムです。 オルツのデータ保管システム「alt ID(オルツID)」で保管されるライフログのデータと、 言語処理・画像生成などの技術を組み合わせ、 一人ひとりの人間の個性を導き出すことで、 その人の意思を汲んだ対話が可能なアウトプットを生成します。
「CLONEdev」のクローン生成プラットフォームは、 オルツ独自の大規模言語モデルである「LHTM-2」 を使用しており、 このモデルは膨大な計算リソースを必要とするため、 今後は当社の分散演算基盤「alt Emeth(オルツ・エメス)」 プロジェクトとの連携を進めて参ります。

"altBRAIN" no-code agent generation platform / 「altBRAIN」 ノーコードエージェント生成プラットフォーム

"altBRAIN" is a no-code platform that allows users to easily create a wide range of agents, such as character replicas of historical figures like Oda Nobunaga, game strategy agents, and diagnostic agents for fields like internal medicine and pediatrics. "altBRAIN" leverages OLTs' proprietary large-scale language model, "LHTM-2," and offers the flexibility to meet the rapidly growing demand for such models. This enables the swift development of agents for diverse purposes, ranging from entertainment to expert systems and FAQ solutions within enterprises.
*Agent: A software designed to perform tasks on behalf of a human.

「altBRAIN(オルツブレイン)」は、 織田信長や著名人のキャラクター生成、 ゲーム攻略エージェントや内科・ 小児科などの問診で使用可能な問診エージェント*など、 多岐にわたるエージェントの作成をノーコードで容易に行うことが できるプラットフォームです。
「altBRAIN」は、オルツが開発・ 提供する大規模言語モデル「LHTM-2」 の能力を活用しており、 急速に成長する大規模言語モデルのニーズに対応可能な柔軟性を有 しているため、エンターテインメント領域から、 企業内のエキスパートシステムやFAQシステムまで、 様々な用途に応じたエージェントをスピーディーに構築することが できます。
※エージェント: 人間の代行として処理を実行するソフトウェアの通称。

募集背景

2024年10月に上場後、海外投資家を含め世界的にも注目されている今、「ラボーロからオペラへ」をミッションに、国内外のマーケットで更なるシェアの拡大を目指しています。

そこで現在、アジアへの進出を見据えた組織、事業作りに取り組んでおり、AIエンジニアとして、さらなる基礎研究や応用研究の拡大・推進を通じて、弊社プロダクトに直接貢献してくださる方を募集します。既存の音声認識モデルの改造ではなく、自社モデル生成の研究開発を推進いただける方を募集しております。

業務内容

R&D部門のAIエンジニアとしてプロジェクトマネージャと連携しながら、実践的かつ最適な技術の選定・検討から、自社音声認識モデル生成に関する以下業務をお任せします。

<具体的な業務内容>

  • 音声認識モデル生成に関連する基礎/応用研究開発、及びソフトウェア開発
  • 開発サイド・ビジネスサイド関係者との議論を通じた技術・モデルの提案及び導入
  • 音声認識モデルに関連するアルゴリズム・ロジックの実装・レビュー・精度性能評価
  • 国際会議、論文などによる技術調査
  • モデリング設計やコーディングに関する他メンバへのメンタリング・育成 など

組織

現在R&D部門は約5名体制で開発に取り組んでおります。
今後R&D部門で約5名の採用予定です。

働き方

各個人が1番パフォーマンスを発揮できる場所・時間で働くことを正義としているため、リモートワークなど柔軟性をもって働くことが可能です。

応募資格 (MUST)

  • Python/SQL/機械学習の知識・経験
  • 雑音抑圧、話者適応など音声処理、音声解析に関するアカデミックなバックグラウンド、または実務経験
  • 読み書きレベルの英語
  • クラウド利用経験
  • (業務委託の方の場合)平日10:00~18:00の間で週24h以上稼働が可能な方

応募資格 (WANT)

  • 自然言語処理や音声言語処理に関する研究開発やプロダクト開発の経験
  • 音声認識モデル生成・カスタマイズの経験
  • フロントエンド開発、バックエンド開発の経験
    • TypeScript, Vue.js, Nuxt.js, Firebase等のご経験があれば尚可
  • 開発チームのリーダー・マネージャー経験
  • 国際会議や査読つき論文誌での研究発表経験
  • AWS/GCP/Azure の利用経験

技術環境

開発言語:Python
フレームワーク:PyTorch, HuggingFace, SpeechBrain, scikit-learn
データベース:Cloud Firestore
インフラ:AWS, GCP, Azure, Cloud Firebase, Cloud Functions
ソースコード管理:Bitbucket
開発管理:Notion, JIRA
コミュニケーションツール:Zoom, Slack, Google Workspace
※他の技術の社内導入も歓迎いたします

求める人物像

  • 労役をなくし創造的な仕事に集中できる世界を実現するという Mission に共感できる方
  • 1日でも早い Mission の実現に向け、スピード感とプロ意識を持って働ける方
  • 世界に広げるべき徹底した効率化を常に模索し続けられる方
  • やるべきと決めたことを即実行できる方
  • 「できない」を「できる」に変えられるアイデアを出し続け、実行できる方
  • 問題に対して手段にこだわらず柔軟に取り組める方
  • リモートワークでのコミュニケーションや業務遂行に支障がない方

ポジションの魅力

  • PoC プロジェクトに留まらない、自社プロダクトのグロースに直接的かつ継続的に貢献できます
  • 自社が保有する AI 技術を駆使したプロダクトが順調にグロースしており、PoC プロジェクトが上手くいかずにそのままプロジェクトが終わるということは起こりません
  • P.A.I. の実現に向けて遠大な研究計画ロードマップを有しており、AI エンジニア・リサーチャーにとって興味深いプロジェクトに参画できます
  • ストックオプション付与の可能性があります
  • リモートワークが可能です
  • 国内外問わず各分野のトップクラスのメンバーで構成された少数精鋭の組織のため、意思決定のスピードが早く、経営層と近い距離感で勤務いただけます
職種 / 募集ポジション AIエンジニア(音声認識モデル生成)
雇用形態 正社員
給与
年収
 
勤務地
  • 106-0032  東京都港区六本木7-15-7 新六本木ビル (SENQ六本木 402)
    地図で確認
リモートワーク可
※就業場所の変更の範囲:なし
所定労働時間
10:00~18:00(休憩1時間)
残業の有無
有(20~30時間/月程度)
業務内容
求人に記載の業務内容を想定しているが、適性に応じて会社の指示する業務への異動を命じることがある
その他
詳細は面談の時にお伝えします
会社情報
会社名 株式会社オルツ
代表取締役社長 / CEO
米倉 千貴 / Kazutaka Yonekura
本社所在地 / Location
東京都港区六本木7-15-7 新六本木ビル (SENQ六本木 402)
設立 / Establishment
2014年11月 / November 2014
役員 / Board members
代表取締役社長 CEO(Chief Executive Officer)/ 米倉 千貴 Kazutaka Yonekura
取締役CFO Board director CFO / 日置 友輔 Yusuke Hioki
取締役 Board director / 藤田 豪 Go Fujita
常勤監査役 Auditor / 中野 誠二 Seiji Nakano
監査役 Auditor / 福島 泰三 Taizo Fukushima
監査役 Auditor / 藤井 雅樹 Masaki Fujii