データマイニングや機械学習のいろいろな教科書に頻繁に登場するデータに「フィッシャーのあやめ」があります。これは、機械学習レポジトリとして米国カリフォルニア大学アーバイン校におかれている世界的に有名なデータです。日本でも、「あやめ」「かきつばた」「(花)菖蒲」など、一見似ていて種類の違う植物が沢山ありますが、ちょうど今頃が、豊橋では、あやめ(総称のつもり)の季節です。豊橋鉄道渥美線の電車の「菖蒲」と本当の植物の「あやめ」の写真をとる機会がありました。「フィッシャーのあやめ」のほうは、「がくの長さ」「花びらの長さ」など4つの特徴量(素性)で3種類の異なる「あやめ」を分類しようというものですが、たったこれだけの特徴量で、結構分類精度が出てしまうのは驚きです。そうだ、久しぶりにちょっと「フィッシャーのあやめ」のデータを使ってみよう…
フィッシャーのあやめ (Fisher’s Iris)
コメントを残す