MENU
採用担当の方はこちら
業務委託案件をお探しの方はこちら
メルマガ/AI・Web3 Insight



    NTTコミュニケーションズ、生成AI向けデータ構造化技術「rokadoc」のパブリックベータ版を公開

    NTTコミュニケーションズは2025年2月19日、企業が保有する膨大な非構造化データを生成AIが扱える形に変換する「rokadoc」のパブリックベータ版を公開した。
    この技術は、企業の業務効率化を促進させ、生成AIの活用に新たな可能性をもたらすと期待されている。

    「rokadoc」が解決する課題と技術概要

    近年、多くの企業が業務効率化を目指し生成AIの活用を進めているが、その過程で大きな課題に直面している。それは、企業が保有するデータの大部分が非構造化データであるという事実だ。PDF、HTML、画像など、形式が統一されていない非構造化データは、生成AIが直接処理することが難しい。
    そのため、AIによる検索や回答精度が十分に向上せず、期待した効果を得られない状況が生まれている。

    NTTコミュニケーションズが開発した「rokadoc」は、この課題を解決するために生まれた。
    この技術は、企業が保有する様々な形式の非構造化データを、生成AIが扱える構造化データに変換する。具体的には、Word、PowerPoint、Excel、PDF形式のドキュメントを構造化データに変換するだけでなく、ドキュメント内の画像から説明文(キャプション)を生成したり、複雑な表構造にも対応したりできる。
    さらに、構造化データを用いて検索精度を向上させるRAG(Retrieval-Augmented Generation)(※)との併用も可能だ。

    「rokadoc」の利用方法と期待される効果

    「rokadoc」のパブリックベータ版は2025年2月19日に公開され、ユーザー登録を行うことで無料で利用できる。NTTコミュニケーションズは、パブリックベータ版を通じて顧客からのフィードバックを収集し、精度を高めながら本格提供に向けた準備を進める予定だ。

    「rokadoc」は、今後の生成AIの普及を後押しする可能性がある。特に、業界ごとの専門データに最適化された変換技術が開発されれば、精度向上が見込まれる。たとえば、医療、法律、金融などの分野では、高度なデータ整理が求められるため、特化型の拡張が進むと考えられる。

    また、データのセキュリティ対策が強化されることで、企業のクラウド環境でも安心して利用できるようになるかもしれない。オンプレミス対応や暗号化技術の導入が進めば、情報漏洩リスクの低減が期待されるだろう。

    今後、パブリックベータ版で得られたフィードバックをもとに、どのような改善が加えられるかが「rokadoc」の成否を左右するだろう。
    特に、変換精度の向上やセキュリティ強化に関するアップデートが進めば、多くの企業にとって不可欠なツールとなる可能性がある。

    ※RAG(Retrieval-Augmented Generation):外部の知識源から関連情報を取得し、それを基に回答を生成する技術。大規模言語モデルの弱点である情報不足や誤情報を補うために用いられる。

    🚀 AI・Web3業界への転職を考えているあなたへ

    「最先端技術に関わる仕事がしたい」「成長市場でキャリアを築きたい」そんな想いを抱いていませんか?

    Plus Web3は、AI・Web3領域などテクノロジーに投資する企業の採用に特化したキャリア支援サービスです。

    運営する株式会社プロタゴニストは、上場企業グループの安定した経営基盤のもと
    10年以上のコンサルタント歴を持つ転職エージェントが
    急成長する先端技術分野への転職を専門的にサポートしています。

    こんな方におすすめです

    ▼成長産業であるAI・Web3業界で新しいキャリアを始めたい
    ▼「未経験だけど挑戦してみたい」という熱意がある
    ▼今のスキルを最先端技術分野でどう活かせるか相談したい
    ▼表に出ない優良企業の情報を知りたい

    業界に精通したキャリアアドバイザーが、
    あなたの経験・スキル・志向性を丁寧にヒアリングし、
    最適な企業とポジションをマッチングします。

    Web3企業

    AI企業

    この記事が気に入ったら
    フォローしてね!

    • URLをコピーしました!
    目次