2020年3月1日日曜日

統計ソフトを利用して、グラフを作成してみよう。その11


無料の使い勝手のいい統計ソフトが普及してきた。
 人工知能の未来へ向かって、色々試みてみよう。

 Rに組み込まれているオープンデータであるiris を使って、散布図と確率密度曲線を重ねてみよう。

 まず、iris の概要から。

 summary(iris)
Sepal.Length      Sepal.Width
Min. :4.300     Min. :2.000
1st Qu.:5.100   1st Qu.:2.800
Median :5.800  Median :3.000
Mean :5.843     Mean :3.057
3rd Qu.:6.400    3rd Qu.:3.300
Max. :7.900       Max. :4.400

 iris の上のデータを使って、散布図・密度曲線(上から俯瞰した)を重ねてみよう。

 R言語及び図は以下。なお、下の命令文をそのままコピーして、Rに貼り付け、リターンを押せば下の図が出てくる。
 なお、iris のデータは、あやめの一部分を計測した数字を蓄積したもの。
  ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width))+geom_point()+geom_density2d(aes(color=..level..))+xlim(3,9)