自然言語処理

AI支援クエリシステム

本技術は、テキストから情報を抽出するためのAI支援型クエリシステムです。具体的には、数百万文書規模の大規模データベースからの情報発見能力を、通常のキーワード検索に比べて大幅に向上させることができます。

最も重要なことは、エンドユーザーがAIクエリシステムが動作するパラメータを指定できることで、検索プロセスを非常に的を絞ったものにすることができるということです。インテリジェントなダッシュボードは、関連するドキュメントのセクションをハイライトし、エンドユーザーが調整を行うことを可能にします。

機能

上の図(図1)は、電子メールのデータベースに適用されたクエリの例を示しています。色付きのドットは送信者と受信者を表しています。その後、類似した内容の電子メールのネットワークが、以下の手順でAIシステムによって生成されます。

  1. 電子メールが選択されています(赤矢印)。これは手動または半自動で行われます。
  2. ユーザーは、コンテンツの類似性、特定のAIモデル、日付、送信者と受信者のような他のデータベース固有のパラメータなどの検索パラメータを指定します。
  3. AIは2番で与えられたパラメータに基づいてメールのネットワークを構築します。
  4. 選択された電子メールは、ハイライトされたセクションでエンドユーザーに表示されます。

初期のメールは、手動で選択してもよいし、AIを使って選択してもよいです。例えば、実際のメールではなく、ユーザーが希望する内容の大まかな説明を与えることができます。すると、システムが自動的に最も関連性の高いメールを検出し、クエリ処理を進めます。

実装

クライアントには文書のデータベースが必要です。

これらの文書には、患者データ、製品説明、カスタマーレビュー、電子メール、研究論文、法的作業、特許などの技術文書が含まれます。

文書のデータベースには、クライアントが知りたいがAIの支援なしでは容易に入手できない情報が含まれている必要があります。

テキスト文書の数が数百万になると、追加の計算リソースが必要になる場合があります。

実例

この技術を使用する方法は複数あります。孤立した手動クエリに基づくものです。

クエリシステムは、必ずしもテキストの類似性だけで操作する必要はありません。テキスト情報を表現するために使用できる概念には、トピック分布とセンチメントスコアの 2 つがあります。