パターン認識：コンピュータが人間を超える第一歩？

パターン認識：コンピュータが人間を超える第一歩？

投稿日：2015/04/20更新日：2019/04/09

パターン認識（Pattern recognition）

画像や音声、動画といった様々な情報を含む元データの中から、何かしらの意味を持つ対象を選別・抽出し、再利用したり分析したりできる形にすること。古くはOCRによって、紙に印刷された文字を読み取り、デジタルデータに変換するといった研究がなされ、比較的早い段階から製品化もされていた。

近年は機械学習の発達により、より複雑な元データから意味のある対象を識別しようとしている。なかでも比較的研究が進み、製品に実装され始めているのが音声認識や自然言語処理の技術である。音声認識は人々の話した言葉をコンピュータで扱えるように変換する技術、自然言語処理とは人間が日常用いる言語をコンピュータで識別、解析する技術である。

たとえば機械に向かって「好きだよ」と話したとき、それを「す」「き」「だ」「よ」の4つの音として正しく認識するのが前者、そこに「I love you」といった意味があると解釈するのが後者である。

これらを身近な形で製品に実装した例が、アップルiPhone4で初めて搭載されたSiriである。「音楽が聞きたい」と話しかけると、「ミュージックライブラリには1つしかコンテンツがありません」といった回答を返してくる。2015年現在できる操作は限定的であるが、より性能が上がれば、検索画面にテキストを打ち込まなくても、iPhoneに話しかければ様々な機能が使えるわけであり、グーグルの検索機能の価値を低下させるという戦略的意図も読み取れる。

画像や動画に関するパターン認識はさらに難易度が上がるが、すでに2012年には、グーグルが大規模人工ニューロンネットワークの技術を用い、大量のユーチューブの動画をコンピュータに見せて「猫」を識別させることに成功した。これも技術の進化に伴い、さまざまなビジネス上の応用が可能となっていくと期待されている。