2020年3月27日金曜日

統計ソフトを利用して、グラフを作成してみよう。その15


無料の使い勝手のいいソフトが普及してきた。人工知能を目指していろいろやってみよう。

 geom_point というコマンドは、いろんな散布図を作成する。
 この散布図に回帰分析の線を重ねてみよう。

 データはオープンデータを使用する。ただ、詳細は省く。(大きなデータから、ホンの一部を抽出している。)

 R言語は、以下の通り。

 ggplot(ksh2,aes(x=`大きさ`,y=`値段`))+geom_point()+stat_smooth(method=lm,level=0.99)+coord_cartesian(xlim=c(0,4000))+labs(x="大きさ",y="値段")

 ksh2 が元データ。stat_smooth(method=lm,level=0.99 の部分が回帰分析の直線を描くところ。
    level=0.99 は、説明書きだと信頼区間99%との意味とのこと。(筆者には、まだ、よく理解できない)

 図は以下。