検索システムで培った企業データのインデキシング技術
認証認可技術を使用した生成AIチャット
オンプレのファイルサーバや社内ポータル、クラウドストレージなどの資料やデータを学習基盤にできるので、学習用データのアップロード等の作業が不要
資料内の情報と質問それぞれの意味をスコア化し、近しい資料やデータから回答を生成。キーワード検索とベクトル検索によるハイブリット検索で高い回答精度を実現
Chat EIはクラウドサービスではなく、社内のオンプレミス環境に構築するためセキュアに運用可能。またファイルの閲覧権限に応じた回答生成により、情報の取り扱いも安心
機能 | 説明 |
---|---|
会話履歴利用 | 入力した内容のみだけでなくチャットでのやり取りも用いて回答を生成します |
ファイル指定 | 問合せ内容に近い検索結果のファイルを指定できます |
ファイル数絞り込み | 生成AIの回答で利用する対象ファイル数の調整が行えます |
出力フォーマット | テキスト・JSON・テーブルから選択できます。表形式で回答結果が欲しい場合はテーブルを選択してください |
AIモデル指定 | 利用したいAIモデル(LLM)を指定することが可能です |
カテゴリー | Neuron ESで設定する取得元での絞り込みを行うことが可能です |
出典元・ファイル参照・プレビュー | 出典元が回答内容に表示されます。また、出典ドキュメントへのプレビュー・参照を行うことができます |
認証・認可 | 導入環境に応じた認証機構と連携し、ユーザー認証を行うことができます。また、ドキュメントのアクセス権限に応じた検索結果の制限(認可)を行うことができます。これにより、アクセスできるドキュメントのみから回答を生成することが可能となります。 |
クローリング設定 | Neuron ESで利用可能なレポジトリ・ファイル形式は、すべて利用することができます。 ※対応リポジトリ・解析対象ドキュメントを参照ください。 |
チャンク設定 | 文書から抽出したテキスト情報に対して、テキスト加工処理、最大チャンク長・オーバーラップ率の設定を行うことが可能です。 |
Embeddingモデルの変更 | 文章をベクトル化するモデルを変更して、インデックスを作成することが可能です。変更する際には、サーバー設定を変更してプロセスの再起動を行い、再度フルクローリングが必要となります。 |
セマンティック検索 | セマンティック/ハイブリッド検索の検索方法の選択が可能です。今後は、リランキング手法への対応も視野に入れています。 |
生成AIモデルの変更 | Azure OpenAI上にデプロイされた会話形式の生成AIモデルを設定することで、生成AIモデルの切り替えを行うことができます。(現状、共通設定となっておりプロセスの再起動が必要となります) |
既存のNeuron Enterprise Searchの資産(クローリング技術)を活用し
生成AI系の機能を追加した形での提供が可能
様々な企業内データを学習基盤に生成AIとの対話が可能
#多様なLLMとの連携 #データアップロード不要 #ファイルへのアクセス権も考慮
レポジトリ | 接続先 |
---|---|
Notes | Notes/Domino 6.5以降 |
SharePoint SharePoint Online |
SharePoint 2013, 2016, 2019 https://xxxx.sharepoint.com |
box | https://Box.com |
Dropbox | https://www.dropbox.com/xxxx/ |
Google Drive | https://drive.google.com/xxxx/ |
レポジトリ | 接続先 |
---|---|
ファイルサーバ | SMB1, SMB2, SMB3(SMB暗号化)対応ファイルサーバ(Windowsファイルサーバ, Samba, NetApp, NAS等) |
ファイルシステム | Windowsファイルシステム(NTFS) Linux |
Webサーバ | HTTP/HTTPS |
データベース* | Oracle SQL Server |
分類 | ファイル形式 |
---|---|
テキストファイル | txt, text, csv等 |
MS Office文書 | 【XP/2003形式】doc, xls, ppt 【2007以降 OOXML形式】docx, xlsx, pptx, ppsx, docm, xlsm, pptm, ppsm |
Visio | 【2003/2007/2010形式】vsd\*1 【2013以降 OOXML形式】vsdx |
PDF文書 | |
HTML | htm, html, xhtml, xhtm等 (HTML Version 1.0, 1.1, 2.0, Atom, RSS 2.0等) |
リッチドキュメント | rtf形式のリッチテキスト |
Open Document | odt, ods, odp, odg, ott, ots, otp, otg, sxw, sxc, sxi, sxd, stw, stc,sti, std形式のOpen Document |
分類 | ファイル形式 |
---|---|
DocuWorks | xdw, xbd形式のDocuWorksドキュメント\*2 |
圧縮ファイル | zip, bz2, tar, z, gz, tgz, 7zで圧縮された文書\*3 |
マルチメディア(オーディオ、ビデオ、画像) | mp3, jpeg, mpeg等\*4 |
メールファイル | msgファイル |
CADファイル | dwg形式のAutoCADファイル |
一太郎ファイル | 一太郎 ver5以降 |
*1 2002以前のバージョンで作成されたファイルやテンプレートを利用しているファイルは解析できない場合があります
*2 別途Fujixerox社のDocuWorks Viewer lightをインストールする必要があります
*3 圧縮されたファイル内の文書のタイトルがインデクシングされます。標準では圧縮文書のコンテンツはインデクシングされません
*4 ファイル名やサイズ、EXIF等のメタデータ(デフォルトでは検索対象外)のみ検索対象となります