▲無料の使い勝手のいい統計ソフトが普及してきた。
人工知能の未来へ向かって、色々試みてみよう。
Rに組み込まれているオープンデータであるiris
を使って、散布図と確率密度曲線を重ねてみよう。
まず、iris
の概要から。
summary(iris)
Sepal.Length Sepal.Width
Min. :4.300 Min.
:2.000
1st
Qu.:5.100 1st
Qu.:2.800
Median :5.800 Median
:3.000
Mean :5.843 Mean
:3.057
3rd
Qu.:6.400 3rd
Qu.:3.300
Max. :7.900 Max.
:4.400
iris
の上のデータを使って、散布図・密度曲線(上から俯瞰した)を重ねてみよう。
R言語及び図は以下。なお、下の命令文をそのままコピーして、Rに貼り付け、リターンを押せば下の図が出てくる。
なお、iris のデータは、あやめの一部分を計測した数字を蓄積したもの。
ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width))+geom_point()+geom_density2d(aes(color=..level..))+xlim(3,9)