全 2 件中 2 件 を表示しています
-
【機械学習エンジニア】技術価値のデータ解析から解像度の高い未来の社会の姿を描く(フルリモート/GCP)
仕事内容 アスタミューゼには、未来を創るためのデータ情報源として、世界各国の産業における各技術領域ごとの基礎研究段階、応用開発段階、事業化・社会実装段階の技術情報、および研究投資情報など新たなイノベーションを生み出す源泉となるデータを保有しています。 【イノベーションデータリソース(世界193カ国、7億件超のデータベース】 ・イノベーター企業と投資額(VC・M&Aデータ) ・研究テーマと投資額(グラントデータ) ・商品アイディアと投資額(クラウドファンディングデータ・CtoCデータ) ・技術データ(特許・論文) ・3Dプリンターデータ(3Dデータ) 今回のポジションの方には、高度な分析から客観性・納得感の高いイノベーション創出のためのプロダクト、アルゴリズムを構築いただきます。 上記のデータは、テキストデータや画像データ、グラフ、表データなど複合的な内容のため、様々な分析手法を検討して実装いただきます。コンピュータサイエンス、統計学、数理科学などを駆使して分析・構造化し、コンサルティング提案や自社サービスに必要なデータ・示唆を導き出します。 そのため、エンジニアもクライアントMTGに同席し、課題やアウトプットイメージを直接ヒアリングして分析手法を考え、高い品質での提案に繋げております。 例えば、官公庁案件は、人的ネットワークの分析など民間企業での分析手法では対応出来ない困難なケースも多く、データドリブンで根拠のあるデータから解析を行える点を評価いただいております。また、脱炭素領域では、GPIFの報告書や日経新聞などにも評価と分析結果が掲載されました。 社内にはアカデミア(大学の元教授、博士号取得者)、研究者出身の社員が多くいることから、エンジニアが分析した結果を根拠のあるデータとして提供することが出来ております。 【業務詳細】 ・お客様の社内外のデータ収集及び統計解析に適した形への集計・加工処理 ・弊社サービスにおける機械学習の応用。多様なフォーマットのコンテンツを適切にクライアントへ届けるためのアルゴリズム(特許・論文・科研費など専門性の高いテキストのキュレーション、翻訳など)の開発、精度検証 ・ビジネス課題に応じた効果的な統計解析手法の選定 【募集背景】 今後、IPOに向けて事業も組織もさらに成長していくフェーズになるため、コンサルティングだけではなく、巨大な自社データベースとLLMを活用したプロダクト開発やグローバル展開も視野に入れて事業を推進していきたいと考えております。また、AIに何を学習させるかという点に重きをおいているため、今後は公開情報だけでなく、各企業様の持つ非公開情報へもアプローチしていくことで、各企業様がイノベーションを生み出していくための後押しがさらにできればとも考えており、体制強化のために3名程度の社員を募集したいと考えております。 【仕事の魅力】 世界中のイノベーションに関する網羅的なデータに加え、特許や論文などの独自性の高いデータを適切に活用していく事で、多くの(他社の)コンサルティング提案を受けてきたお客様が見聞きしたことのない意外性かつ実現性の高い提案をすることができます。 【開発手法】 言語: Python インフラ: Google Cloud Platform (実機はありません) データベース: PostgreSQL DWH: BigQuery ワークフロー: Google Cloud Composer (Apache Airflow) その他ミドルウェア: Dataflow(Apache Beam), Dataproc(Apach Spark) , Cloud Run その他開発環境: GitLab, Slack, Growi 個人環境: Mac/Windows/Linux(選択いただけます), Docker 機械学習ライブラリ:scikit-learn, PyTorch, TensorFlow, transformers, numpy, pandas, RAPIDS など プロジェクト管理: Asana, GitLab, Jenkins 開発手法:プロジェクトごとに選択、スクラム、チケット駆動開発 【開発環境】 ・フルリモート可(月1程度の出社) ・本人のご希望に応じたPC環境を手配します(限度額はございます) ・OSはWindowsとMacのどちらも選択可能 ・服装自由、イヤホン可、フリーソフト利用可 【技術向上、教育体制】 ・外部の勉強会への参加や発表を奨励しています(Developers Summit、AWSサミットなど1日のものも対象) ・書籍は会社の経費で購入できます ・社内勉強会を週1の持ち回り制で行っています ・情報アウトプット訓練の目的もかねてブログを運営 【その他、働き方】 ・フレックス制を導入しており、コアタイムは10:30~17:30となっています。 ・それぞれが課されたタスクによって、自分にあった仕事の仕方ができるので、みんな出社時間・帰社時間はバラバラです。だからこそ皆気にせず定時に帰れる雰囲気があります。 ・一部リモート/フルリモートのメンバーもおり、Slack・Google Meet・Zoomなどのコミュニケーションツールを活用しています。 ※現在はリモートワークを推奨。チーム開発の生産性などを考慮して、リモート/出社の両形態で柔軟に対応しています。 続きを見る
-
【バックエンドエンジニア】イノベーションを加速させる無形資産可視化データの価値創造をお任せします!
仕事内容 アスタミューゼの根幹であるデータ基盤を各サービスに活用できるように構築・整備していくチームとなります。エンジニアも全事業領域をまたいで業務に取り組んでいただけるため、事業拡大とともに個人の成長も実現できる環境となっています。 ◆会社概要 ●新規事業開発・技術活用のコンサルティングや金融機関向けの非財務情報の活用支援を展開 ●技術を有する各メーカーや金融機関・官公庁など、多様な業界の企業300社以上と取引実績あり アスタミューゼでは、世界193カ国、39言語、7億件を超える世界最大級の無形資産可視化データベースを構築しており、世界中のテクノロジー・無形資産(特許・論文・グラント(研究開発資金))や社会課題(炭素、地球環境など)、クラウドファンディングの調達金額データ、ベンチャー企業への投資金額データなどの膨大なデータで成り立っています。 今後の数十年に大きな影響を与える未来の姿を分析するために、ビジネス、テクノロジー、サイエンスの視点から世界の投資、イノベーションデータの収集、統合、整備を行っています。また、自然言語や論文・特許などのグラフ・表、画像、動画などの非構造化データが多いことがデータの特徴です。 データチームではグラントや特許などのデータの収集からデータサイエンティストやアナリストが分析しやすい形への整備までを一貫して行っており、世界中のデータを横並びで分析するための英語翻訳や、データ処理の高速化や自動化なども行っています。 例えば、各国の特許庁データの更新を検知、自動で取得する機能の開発など新しい試みや、データの取得から分析、翻訳、名寄せ、統合までの自動化についても進めており、決められたものを作るのではなく、自分たちでどうしていくべきか、何を作りたいかを決めていけるチャンスがある環境です。 ◆具体的な業務内容 ・科研費や特許など知財に関するオープンデータのETLパイプラインの開発・運用 ・BigQuery環境の維持管理 ・Prometheus, Zabbixを利用した運用課題の可視化 ・旧データ基盤のリファクタリング、モダン化 ・社内メンバー(非エンジニア)へのデータアクセス環境の提供とアクセス手法のレクチャー ◆業務の進め方について ・GitLabのissueベースで、エンジニアが主体的に話し合い、タスクの分担を行います。振り返りは別途全体でも行います ・GoogleCloudの最新のマネージドサービスを積極的に利用しています(得意な技術分野をおまかせします) ・プログラミング言語はPythonをメインに使用します ・週1回の全体のエンジニアと行う進捗会議や、週2回のチーム会議、各自の進捗を確認する行う昼会で、リモートワーク下でも円滑にコミュニケーションをとっています ◆開発環境/社内体制 言語:Python インフラ: Google Cloud Platform (実機はありません) データベース: PostgreSQL DWH:BigQuery ワークフロー: Google Cloud Composer (Apache Airflow) その他ミドルウェア: Dataflow(Apache Beam), Dataproc(Apach Spark) , Cloud Run その他開発環境: GitLab, Slack, Growi 個人環境: Mac/Windows/Linux(選択いただけます), Docker ・リモート勤務を推奨 ・社内の平均年齢は30代後半で落ち着いた環境、子育て世代も多く家庭の事情への理解あり ・各チームごとに卓越した技術や知識を持ったメンバー多数 続きを見る
全 2 件中 2 件 を表示しています