非構造化データ(Unstructured data)
データ様式の1つで、コンピュータやクラウド上のデータベースに格納したり検索・分析したりすることが容易ではないデータ。画像や音声、動画、テキストなどの情報が典型的である。
たとえば動画は動画全体そのものにメタデータ(例:タイトル、カテゴリーなど)を与えることは比較的容易だが、動画全体にわたってその中から何かを検索することは非常に難しい。たとえば1時間程度の売り場のモニター画面の中から、ある年代層の人々が来たシーンを検索したり、顧客が困った場面を検索したりするとなると、それをロボット検索に委ねるのは非常に難しい。
とはいえ、とりわけ21世紀に入ってデータ量が膨大に増えており、そこから意味を見出し企業活動に生かそうという動きが起こってきた。近年の技術の進化もあり、非構造化データを構造化データに移行する試みが様々な方法でなされている。たとえばテキストマイニングの手法を使って、もともと非構造化データであったメール等のテキストにメタデータを与えるなどは比較的早くからなされていた。
今後も、パターン認識や機械学習といった技術の進化に伴い、非構造化データから企業活動に役に立つ意味合いを見出し、マーケティングや製品・サービス等に組み込むといった活動が進むことが予想されている。