教師なし学習とは?
教師なし学習とは、対象物に関する事前情報なしに、機械が具体的なものから抽象的なものまで、様々な対象物をグループ化できるようにする機械学習の手法です。機械がグループ化する対象物は、顧客の購買行動や細菌の行動パターン、ハッカーによる攻撃など多岐にわたります。
教師なし学習の主な考え方は、機械に膨大かつ多種多様なデータを触れさせ、そのデータから学習・推論させることです。ただし、機械に対してデータから学習するように事前にプログラムする必要があります。
教師なし学習が適している場合とその例
コンピュータシステムは、構造化データと非構造化データの両方を大量に処理・理解することで、データ内に存在する新たなパターンを見つけ出します。コンピュータシステムが一定期間にわたって得る全データについて、事前情報を与えることは困難です。
そのため、常に新しいデータの事前情報が必要となる場合では、教師あり学習は適しません。例えば、金融システムや銀行のサーバーを狙うハッキング攻撃は、その手口やパターンが頻繁に変わるため、攻撃データから迅速に学習し、将来の攻撃パターンを推測し、事前に対策を講じる必要があります。このような場合、教師あり学習よりも教師なし学習が適していると考えられます。