▲無料の使い勝手のいいソフトが普及してきた。
人工知能へ近づくために練習してみよう。
Rに組み込まれているiris
というオープンデータを利用して、ヒストグラムと平均線を重ねてみよう。
まず、iris
の概要をみよう。
summary(iris)
Sepal.Length
Min. :4.300
1st
Qu.:5.100
Median :5.800
Mean :5.843
3rd
Qu.:6.400
Max. :7.900
縦横が揃わないので、対象とする部分だけを残した。
iris
を利用して、ヒストグラムと平均の線を重ねてみよう。
ggplot(iris,
aes(x=Sepal.Length)) + geom_histogram(binwidth=0.1, colour="black",
fill="green",alpha=0.3) +
geom_vline(aes(xintercept=mean(Sepal.Length, na.rm=T)),color="red",
linetype="dashed", size=1)
図は以下。
summary
で、mean
が5.8 くらいの数字となっている。図においても確認してほしい。
mean
のところで、 na.rm=T
となっている。これは欠損値を無視するため。