統計の基礎とブログのUU

統計を体系的に勉強したこと無い.
graph

データが取れてる.処理してみよう

統計って凄く面白い.多くのたくさんのデータから全体に関する情報を抜き出す.隠された情報を,先人の知恵に頼って引き出していく.もともと見えてなかった情報が,数学的な手法によってぐっと浮かび上がる.表現は何でもいいけど,とにかく面白い.
Livedoorブログはデフォルトでアクセス解析機能が搭載されていて,それを使えばページビューの数,ユニークユーザの数,閲覧者のデバイス種類,どの記事が読まれてるのか,結構多くの情報が引き出せる.時々見てるけど,特に見たからと言ってそのデータを参考に何か行動するわけでもなかった.たまには何かの役に立ててみようかと思って,とりあえずLibre OfficeのCalcで統計的に処理してみた.
2gatu
いろんな指標があると思うけど,よく分からないのでユニークユーザ数の増減の傾向を見てみることにした.直近の3ヶ月(2016/02/01-2016/04/15)のデータを取得して分析した結果,傾向としては微増な傾向が見られた.回帰直線の傾きは0.06なので,100日当たりに6人の読者を獲得しています.3ヶ月間のデータだから,ちょうどこの期間の間に6人くらい増えたって意味かな?

項目
相関係数 0.21
p値 0.07
回帰直線の傾き 0.06
回帰分析と仮説検定

ただ,ここからが統計の面白い点で,「傾向がありそうだね」で終わらない.「傾向がありそうに見えるけど,でもこれって偶然じゃない?」ということを検討する.意味分かるかな?
例えばサイコロを3回振って,1回目に1,2回目に2,3回目に3が出たとしよう.このデータだけを見たら「このサイコロを振って出る目には傾向がある!振る回数が増えるほど,大きな目が出るぞ!」となりかねない.でもそれは間違ってますね.だってサイコロは大きくて6までの目しか出ませんから.
howto01_m

データの中から見つかった傾向が,「偶然に傾向っぽくなってるだけ」なのか「何らかの要因に依る必然的な傾向」なのか区別する必要がある.統計ではそのための手法がたくさんあるけど,代表的なものに仮説検定がある.
121113366a

仮説検定とは,傾向を算出したあと,「その傾向が偶然である確率」を計算する.そして多くの場合で,その「傾向が偶然である確率」が5%より小さければ,「これが偶然である確率は小さい.すなわち必然的に見られる傾向だ!」と結論する.
その「傾向が偶然である確率」をp値という.今回計算してみたら,p値はp=0.07でした.つまり7%.偶然である確率が7%で,これは5%より大きい.こういうときは「まぁ今回は傾向らしきものが見つかったけど,偶然のばらつきの範囲内だね.”傾向がある”とは言えないね」と結論します.

今回の結論!

つまり,今回Livedoorブログに搭載されてるアクセス解析をした結果はこんな感じ.「このブログの訪問者数は,この3ヶ月間でほとんど伸びてない.毎日平均47人が見に来てくれてる」.
47人の皆様,ありがとうございます.僕は毎日47人と会話したも同然です.平日の活発に活動してる日だって,1日で47人とは話さない.ブログって面白いね.これからもたくさん発信しますので,沢山の人に読んでもらえるように頑張ろう!

コメントを残す

%d人のブロガーが「いいね」をつけました。