【フルリモート】LLM Inference Engineer
求人詳細
・大規模言語モデルの価値をユーザの価値に変えるシステムの構築
・チームの開発プロセスの設計管理や生産性向上のための各種活動
応募資格
必須
■応募資格(必須)
・実務経験 (5年以上)
・スケーラビリティと高可用性を要求される大規模分散システムの開発または運用経験があること
・常に理想を追いかけて開発に取り組めること
■応募資格(歓迎)
・オンプレまたはクラウドの GPU クラスタ上で稼働するシステムの設計・開発
・複数データセンタ (マルチリージョン) に跨る高可用システムの設計・開発・運用
・オンプレでの分散データベースや検索エンジンの開発・運用
・機械学習モデルオンラインサービング基盤の設計・開発
・機械学習モデル推論ワークロードの高速化に関する研究開発
・LLM 推論フレームワーク (vLLM, SGLang, TensroRT-LLM 等) を用いたシステムの運用
・分散処理基盤のモニタリングやオブザーバビリティに関するシステムの設計開発
・エンタープライズ向け API サービスにおけるセキュリティ・ガバナンス設計
・実装フェーズに手を動かすことを厭わず、詳細設計からレビューまで自らドライブできる能力
・OSSへの貢献、論文執筆、技術コミュニティでの活動
労働条件
週休2日制(土曜日および日曜日)、国⺠の祝日、
年末年始(12月29日〜1月3日)、その他会社が指定した日
年次有給休暇(6日〜21日)
※入社月によって付与日数は異なります。
募集要項
| 役職・部署 | 【フルリモート】LLM Inference Engineer |
|---|---|
| 勤務地 | 東京都 |
| リモートワーク | 可 |
| 受動喫煙対策 | 屋内禁煙 |
| 一次面接 | 通常面接 |
| 職種 | データサイエンティスト / 製品エンジニア(ハードウェア・ソフトウェア) / プロジェクトマネージャー(Web・オープン系) |
| 会社規模 | 31-100人 |
| 管理ID | 13992 |
会社概要
・国内通信インフラ大手グループ傘下の生成AI研究開発カンパニー
・日本語に特化した大規模言語モデルをスクラッチで自社開発
・言語モデルの高度化と応用展開、AIサービスの社会実装を推進
・親会社の豊富な計算基盤と国内データセンターを活用した開発体制
・2023年設立で立ち上げフェーズの新興企業ながらグループ屈指の人材が集結
・ソフト・ハード両面で国内顧客接点を活かした事業拡大を狙う成長フェーズ
この求人に興味がありますか?
この求人への応募・詳細確認はコンサルタントが無料でサポートします。
この求人について相談する ← 求人一覧に戻る