2020年3月1日日曜日

統計ソフトを利用して、グラフを作成してみよう。その10


無料の使い勝手のいいソフトが普及してきた。
 人工知能へ近づくために練習してみよう。

 Rに組み込まれているiris というオープンデータを利用して、ヒストグラムと平均線を重ねてみよう。

 まず、iris の概要をみよう。

 summary(iris)
Sepal.Length
Min. :4.300
1st Qu.:5.100
Median :5.800
Mean :5.843
3rd Qu.:6.400
Max. :7.900

 縦横が揃わないので、対象とする部分だけを残した。

 iris を利用して、ヒストグラムと平均の線を重ねてみよう。

  ggplot(iris, aes(x=Sepal.Length)) + geom_histogram(binwidth=0.1, colour="black", fill="green",alpha=0.3) + geom_vline(aes(xintercept=mean(Sepal.Length, na.rm=T)),color="red", linetype="dashed", size=1)

 図は以下。
 summary で、mean 5.8 くらいの数字となっている。図においても確認してほしい。
 mean のところで、 na.rm=T となっている。これは欠損値を無視するため