SharePointのファイル検索機能とヒットしない場合の対処法

カテゴリ:技術課題・解決法

更新日:2026年2月26日

Microsoft社の「Microsoft 365」は、業務の生産性を向上する統合されたグループウェアです。メール、予定、ファイル共有、会議、チャットなどの様々なアプリケーションをクラウドサービスとして提供しています。

その中でも、SharePoint Onlineは、イントラネットとして利用されたり、文書管理、ファイル共有、簡易データベース(リストの利用)、Wiki、など、情報共有基盤として利用している企業も多いのではないでしょうか。また、Teamsを利用している場合には、チームとチャネルを使って情報共有している企業も多く見られます。

SharePoint Onlineの利用の課題の一つに、検索があります。例えば、当社には次のような課題が寄せられています。

  • 検索結果が多く、欲しい情報に辿り着けない
    検索結果に必要以上に候補が表示され、標準機能だと高度な絞り込みが難しい
  • あいまい検索の精度が高くない
    標準の検索機能は、日本語の表記揺れに対応をしておらず、新語や専門用語での検索精度が高くない
  • 検索結果表示が見にくい
    結果のページだけでは、なぜヒットしたのか分かりにくい場合がある。キーワードが含まれるページや、該当の文章を確認するには、Officeアプリで文書を開き、スクロールして探す必要がある

この記事は、SharePoint Onlineの検索について、Tipsをご紹介します。

SharePoint Onlineのファイル検索の特徴

はじめに、SharePoint Onlineを使って、「検索」の特徴を理解しましょう。

SharePoint Onlineの検索で「生成AI」とする場合の例

下図は、当社のデモ環境での検索結果です。注目したいのは、「生成AI」と検索しているにも関わらず、「AI」でもヒットしている点です。検索結果の画面の2番目と3番目では、表示されている文章の中のAIのところが太字になっています。

検索結果に多くのファイルが表示される理由の一つが、この現象です。検索システムでは、検索キーワードも形態素解析で解析されて単語に分割され、マッチする文書が検索されます。この時、検索システムが使っている形態素解析用の辞書を使って単語分割されます。「生成AI」の場合、「生成 AI」のように分割されます。

SharePoint Onlineの場合、ワードブレイクされた後、AND検索がされているようです。そのため、「生成AI」だけでなく、「生成」と「AI」が含まれるファイルがヒットしています。

SharePoint Onlineの検索で「生成AI」検索した結果

では、「生成AI」と単語分割しない検索はできないのでしょうか?検索の機能では、完全一致という検索方法があります。SharePoint Onlineの場合には、”(ダブルクォーテーション)で囲うと完全一致の検索ができます。下図は、「”生成AI”」で検索した場合の結果を示しています。上図で表示されていた「フィジカルAIのデモ用ファイル」が表示されていないのがわかります。

SharePoint Onlineの検索で「生成AI」と「ダブルクォーテーション生成AIダブルクォーテーション」検索した結果の比較

NeuronESの場合、検索キーワードは形態素解析だけでなく、2文字分割(2-Gram)という手法も使って解析されます。

完全一致の検索は、”を使うこともできますが、「完全一致」のチェックボックスをクリックするだけで完全一致検索ができます。

検索結果の絞り込み

SharePoint Onlineの検索では、サブサイトも含めて検索がされます。また、ドキュメントライブラリやリスト、ページが検索されます。多くの候補が出る時に、特定のサブサイトやドキュメントライブラリに絞り込みたい場合があります。しかしながら、サブサイトに移動して再検索を行ったり、ドキュメントライブラリに移動して再検索する必要があります。

NeuronESの場合、SharePoint Onlineのサイトの構造をツリービュで確認することができます。絞り込みたいサイトを選択することで、検索結果を簡単に絞り込むことができます。

あいまい検索

キーワードに完全一致しない情報も含めて検索結果に表示して欲しい場合があります。文字列の揺らぎや誤りを吸収することを目的とするのがあいまい検索です。例えば、全角英数字と半角英数字の違い、半角カナと全角カナの違い、動詞の場合は「動かす」と「動く」の違い、などが考えられます。

SharePoint Onlineでは、動詞の基本形への変換を行なっていないようです。例えば、「優れる」と「優れている」「優れた」は別々に検索する必要があります。

NeuronESの場合、動詞の基本形の変換をしています。そのため、「優れる」「優れている」「優れた」は、どのキーワードで検索してもヒットします。その他に、全角英数字は半角英数字に変換、半角カナは全角カナに変換されて検索されます。

類義語検索

検索のキーワードと意味が近い別の言い方の単語も検索結果に表示して欲しい場合があります。例えば、「自動車」「車」「クルマ」などです。検索キーワードと同じか近い意味の別の単語も一緒に探す検索が類義語検索です。企業内で利用する場合には、業界専門用語や社内用語があり、一般的な日本語辞書にない単語が使われることがあります。この場合、類義語辞書を使う方法が広く使われています。

また、表記揺れを許容する検索をする場合も類義語検索を使います。例えば、「割り引き」「割引」「割引き」のような表記揺れです。

SharePoint Onlineの場合には、類義語辞書を登録する仕組みが提供されていないようです。

NeuronESの場合には、csvファイルに類義語を入力してアップロードすることで類義語登録ができます。検索時には、類義語検索のチェックボックスをクリックするだけです。

プレビューの表示

ファイルを検索した後、候補のファイルの内容を確認する場合があります。検索キーワードが含まれる文章を素早く確認できると良いのですが、ファイルを開いた後の該当ページまでスクロールをして探すことになると、利用者にとって使い勝手が良いとは言えません。

SharePoint Onlineの場合、検索結果のファイル名をクリックすると、Web版Officeでファイルが開きます。この場合、文書の中にあるキーワードを、スクロールをしながら探すか、再度検索して内容を確認します。

NeuronESの場合、ファイルの内容を確認する手段が3つ用意されています。プレビューは、NeuronサーバーがファイルをPDFに変換し、WebブラウザのPDFビューアーの機能でプレビューを表示します。検索キーワードがビューワーの検索バーに自動コピーされ、ビューアー上でも検索キーワードがハイライトされて、キーワードをジャンプしながら内容を確認することができます。例えば、Wordファイルの77ページ目に入っている「1001010」というキーワードをNeuronESで検索すると、プレビュー表示で瞬時に「1001010」の場所を表示することができます。デモ動画をご覧ください。その​他に、​「サムネイル」と​生成AIで​「要約を​表示」と​いう​2つの​手段が​あります。​

画像のPDF(もしくは、TIFFやJPEGなどの画像ファイル)

紙の書類をスキャンした書類は画像でPDFファイルになっていることがあります。折角、電子ファイルにしたものの、画像PDFファイルではファイル名検索しかできません。画像の中の文字をテキストデータに変換する技術がOCR(Optical Character Recognition(光学文字認識))です。
SharePoint Onlineでは、OCRの機能がありません。OCRの機能を持つサービスなどを利用してテキストデータにしてからSharePoint Onlineのドキュメントライブラリに保存すれば検索可能になります。
NeuronESの場合、OCR機能が標準で搭載されております。OCRの利用事例として、シンク・エンジニアリング様の事例が参考になります。

SharePointのファイル検索でヒットしない場合の対処法

SharePoint Onlineでファイル検索をしても目的のファイルがヒットしない場合の対処方法をご紹介します。

1.ドキュメントのプロパティ言語設定を日本語にする

SharePoint Onlineの検索において、存在するはずのファイルが検索にヒットしないという声が聞かれます。

SharePoint Onlineの検索機能では、クローラと呼ばれる、文書を自動解析する機能がインデックス(索引情報)を生成します。その際、ファイルの内容を判断して言語設定を自動で付与します。SharePoint Onlineの検索機能は多言語対応しており、大変優秀は検索機能を提供しています。しかしながら、この付与が誤って日本語以外で設定されることがあります。

ファイルのプロパティ言語の設定が日本語になっていないと、日本語検索においてヒットしません。設定を変更するには、手動あるいはコマンドにて書き換える必要があります。

書き換えには、「PnP PowerShell」という、コマンドライブラリを利用して、ファイル更新日やファイル更新者のプロパティを変更せず、自動で書き換える方法があります。1ファイル当たり1秒程度かかるとすると、200万ファイルや500万ファイルを管理している場合は大変な時間がかかります。

NeuronESであれば、ファイルのプロパティ設定に関係なく、日本語での全文検索が可能となります。

2.演算子を効果的に利用する

SharePoint Onlineでは、検索ウィンドウに調べたいキーワードと演算子を入力して検索しすることができます。キーワードと演算子を適切に利用することで目的の検索結果を得られる可能性が高まります。

検索方法入力例どのような検索結果が得られるか

AND検索
○○ △△(○○と△△の間にスペースを入力)
入力された2つのキーワードに関連するファイルを優先的に表示

OR検索
○○ OR △△(○○と△△の間にORを入力)
入力された2つのキーワードの部分一致したファイルを表示

NOT検索
○○ -△△(除外したいキーワードの前に – を入力)
○○を含むファイルの中で、△△を含まないファイルのみ表示

完全一致検索
“○○○○”(キーワードをダブルクォーテーションで囲む)
入力された語句と完全に一致したファイルだけを表示

title検索
title:○○○○(キーワードの先頭にtitle:を付ける)
ファイル名に絞って検索

※上記以外にも効果的な検索キーワード(クエリ)を作成する方法はございます。詳しくは「MicroSoft」公式サポートページ内の「効果的なクエリを作成する」をご参照ください。

3.プロパティを使用してクエリを検索する

SharePoint Onlineでは、ファイルのメタデータ内のプロパティ値から検索することも可能です。

  • ファイル名で検索する
  • ファイルの種類で検索する
  • ワイルドカード
  • 複数のプロパティを使用して検索する
  • 特定の検索結果を除外する
  • ファイルプロパティを追加する
  • 同じプロパティの別の値を検索する
  • プロパティ値を除外する
  • 特定のサーバーに検索を絞り込む
  • 日付/時刻

※プロパティを使用した検索方法については、Microsoft公式サポートページ内の「プロパティを使用してクエリを実行する」をご参照ください。

SharePoint Onlineの検索性を向上する企業内検索システム

企業内検索システムとは、別名「エンタープライズサーチ」とも呼ばれます。従来から広く利用されているファイルサーバはもちろん、SharePoint Onlineなどのクラウドストレージ、さらには社内ポータルや社内DBなど、企業内に存在する様々システムに保存されたファイルを一括で高速に全文横断検索できるシステムです。

普段お使いのWebブラウザから、インターネット検索するように、社内のデータを網羅的に検索できるシステムとイメージしていただくと分かりやすいです。

NeuronESの場合、SharePoint Onlineのページ、サブサイト、リスト、リストのアイテムの添付ファイル、ドキュメントライブラリを検索対象とすることができます。

また、Teamsの​チームの中にチャネルを作った場合、SharePoint Onlineにサイトが作られます。そうすると、チャネルの「共有済み」タブにあるファイルはSharePoint Onlineに保存されているため、NeuronESで検索可能です。​Wikiが​SharePointOnlineに​保存されている​場合も​検索​可能です。

Teamsの​録画、​チャット会話、​チャットに添付されているファイルは​OneDriveに​保存されます。OneDriveは個人利用のサービスであるため、​NeuronESでは検索対象としていません。​

下図に、SharePoint Onlineの構成を示します。

SharePoint Onlineの全体構成図

SharePoint検索をNeuronで改善するランディングページへバナー

まとめ

SharePoint Onlineの検索機能は、多言語対応しており、ファイルを保存してから数分で検索できるようになります。大変優れた検索サービスです。この検索機能は、Microsoft SearchというMicrosoft 365で共通のサービスが使われており、SharePointのみならず、メール、OneDriveなどの検索にも利用されています。また、EntraIDという認証サービスと連動できるため、検索する人に関係するメールや予定、ファイルを優先的に表示します。他社に真似のできない強みを持っているサービスです。

問題は、日本語に対する検索精度です。英語やフランス語のようなスペース区切りの言語と比較すると、日本語はスペースで単語が区切られておらず、形態素解析が必要になる言語です。他の言語と同じ対応ではなく、日本語に特化した開発やチューニングが施される方が検索精度も向上し、ユーザー体験も高まると考えられます。今後の対応に注目です。

また、多くの企業においては、Microsoft 365のみに統一できれば良いのですが、さまざまなサービスを利用することになる企業が多いのが実情ではないでしょうか。検索についても、ファイルサーバーや他のクラウドサービスへの対応が求められます。

そして、近年の生成AIの目覚ましい発展で注目されるのが、ベクトル化によるセマンティック検索です。ベクトル化により、検索キーワードは文章(プロンプト)にすることができます。キーワード検索の場合と比較すると、ファイルの文中に同一のキーワードが含まれていなくても文脈や意味全体を捉えた的確な検索結果を得られることが期待されます。当社でも、ベクトル化を行うRAGの製品を提供しています。生成AIを利用する場合についても別のコラムで情報提供していきます。

関連ページ

SharePoint検索をNeuronで改善するランディングページへバナー
社内のデータ活用で注目されるRAGとは?仕組み・メリット・注意点をわかりやすく解説コラムへ導線

著者

柳澤政夫
NeuronES事業開発室 室長
Neuronのマーケティング、インサイドセールス、パートナーデベロップメント、新規事業を担当し、伴走支援者としてお客様対応も行う。化学企業、日本マイクロソフト、アマゾンウェブサービスジャパンなどに勤務。オンラインセミナー「はじめての生成AI」「生成AIで革新するナレッジマネジメント」を主宰。MBA(Finance)、中小企業診断士、日本ナレッジ・マネジメント学会会員

技術課題・解決法の記事一覧へ戻る