マクニカ、RAG実用化の壁「非構造化データ」の整備を自動化するUnstructured社と国内初の販売代理店契約を締結
RAG普及と非構造化データ整備の課題
近年、LLMの普及に伴い、生成AIを活用したナレッジ検索や業務効率化への期待が高まっています。これを受け、社内文書を活用したRAG(検索拡張生成)の構築に取り組む企業が増加しています。
しかし、企業内に存在する営業資料、契約書、マニュアル、技術文書といった多様な形式の非構造化データは、その構造(段落、見出し、表、画像など)をAIが正確に把握できないケースが多く見られます。これにより、RAGでは検索漏れや文脈の誤解釈が生じ、概念実証(PoC)段階では問題なく動作しても、本番環境では精度が安定しないという課題が顕在化しています。
RAG構築において、非構造化データをAI活用に適した形へ整備することは不可欠です。従来のデータ整備プロセスでは、設計担当者が文書ごとにチャンク設計や情報抽出ルールを設計・調整する必要があり、高い専門性が求められる上に属人化しやすいという問題があります。また、文書量の増加や内容更新のたびに再調整が必要となるため、運用フェーズでの工数負荷が継続的に増大します。結果として、AIモデル自体の性能ではなく、データ整備および運用の負荷がボトルネックとなり、生成AI活用の本格展開に至らなかったり、プロジェクトが停滞したりするケースも少なくありません。
Unstructuredによる解決のアプローチ
Unstructuredは、非構造化データをLLMが扱いやすい形へ自動的に整備するプラットフォームです。文書内に含まれる段落、見出し、表、画像などの構造を保持したままJSON(JavaScript Object Notation)形式へ変換することで、RAGの精度および安定性の向上に貢献します。これにより、設計担当者が文書ごとに行っていた細かいチューニング作業や更新文書への再対応に伴う工数を大幅に削減し、属人化の解消と継続的な運用負荷の軽減を実現します。

Unstructuredの主な特徴
-
Point1:各種クラウドサービスとの連携コネクターを標準装備
各種クラウドサービスと標準コネクターで連携し、非構造化データを他のストレージへ移動・複製することなく、更新を含めた継続的な処理を可能にします。 -
Point2:「RAG・生成AI活用」をゴールに据えた前処理設計
文書構造を考慮したパーティショニング、意味を損なわないチャンク設計、後段のAI処理を見据えたメタデータ付与により、非構造化データをそのまま業務で活用できる状態へ変換します。 -
Point3:ノーコードで始められる、迅速なPoC・導入
ノーコードのGUIを備えており、複雑な非構造化データ処理を、専門知識を持たないユーザーでも安定して実行できます。 -
Point4:コンプライアンス及びセキュリティ基準への準拠
HIPAA、SOC 2 Type 2、GDPR、ISO 27001など、データ保護および情報セキュリティ関連の法令、規制、業界標準に準拠しています。
マクニカは今後、企業が既に利用しているデータ基盤やコンテンツ管理基盤との連携設計から導入まで一貫して支援することで、日本企業における生成AIの実用化を加速する方針です。
本発表にあたり、Unstructured Technologies, Inc. CEOのBrian Raymond氏は、次のように述べています。
「世界中の企業データの約80%は非構造化データであり、PDF、メール、プレゼンテーション、各種ドキュメントの中に埋もれたまま、AIシステムからは十分に活用できていません。これこそが、企業における生成AI導入を阻む最大のボトルネックであり、業界を問わず多くの組織から寄せられている共通の課題です。日本のエンタープライズ市場に対する深い知見と、最先端のAIソリューションへの強いコミットメントを持つマクニカは、Unstructuredを日本に展開する上で理想的なパートナーです。両社の協業により、日本企業が自社データの持つ真の価値を解き放ち、生成AIのPoC(概念実証)から本番環境での大規模展開へと移行できるよう支援していきます。」
製品詳細およびお問い合わせ先
-
製品の詳細はこちら: https://www.macnica.co.jp/business/dx/manufacturers/unstructured/
-
製品に関するお問い合わせ先:
株式会社マクニカ Unstructured製品担当
E-mail: unstructured-sales@macnica.co.jp
Unstructured Technologies, Inc.について
-
社名: Unstructured Technologies, Inc.
-
設立: 2022年8月4日
-
代表取締役 CEO: Brian Raymond
-
所在地: 901 H St Ste 120 Sacramento, CA 95814
-
事業内容: LLM向けETLプラットフォームの開発および提供
株式会社マクニカについて
マクニカは、半導体、サイバーセキュリティをコアとして、最新のテクノロジーをトータルに取り扱う、サービス・ソリューションカンパニーです。世界28か国/地域91拠点で事業を展開し、50年以上の歴史の中で培った技術力とグローバルネットワークを活かし、AIやIoT、自動運転など最先端技術の発掘・提案・実装を手掛けています。


