統計の基礎とブログのUU

最終更新日

統計を体系的に勉強したこと無い.

データが取れてる.処理してみよう

統計って凄く面白い.多くのたくさんのデータから全体に関する情報を抜き出す.隠された情報を,先人の知恵に頼って引き出していく.もともと見えてなかった情報が,数学的な手法によってぐっと浮かび上がる.表現は何でもいいけど,とにかく面白い.

Livedoorブログはデフォルトでアクセス解析機能が搭載されていて,それを使えばページビューの数,ユニークユーザの数,閲覧者のデバイス種類,どの記事が読まれてるのか,結構多くの情報が引き出せる.時々見てるけど,特に見たからと言ってそのデータを参考に何か行動するわけでもなかった.たまには何かの役に立ててみようかと思って,とりあえずLibre OfficeのCalcで統計的に処理してみた.

ブログの UU を集計

いろんな指標があると思うけど,よく分からないのでユニークユーザ数の増減の傾向を見てみることにした.直近の3ヶ月(2016/02/01-2016/04/15)のデータを取得して分析した結果,傾向としては微増な傾向が見られた.回帰直線の傾きは0.06なので,100日当たりに6人の読者を獲得しています.3ヶ月間のデータだから,ちょうどこの期間の間に6人くらい増えたって意味かな?

項目
相関係数0.21
p値0.07
回帰直線の傾き0.06
集計結果

回帰分析と仮説検定

ただ,ここからが統計の面白い点で,「傾向がありそうだね」で終わらない.「傾向がありそうに見えるけど,でもこれって偶然じゃない?」ということを検討する.意味分かるかな?

例えばサイコロを3回振って,1回目に1,2回目に2,3回目に3が出たとしよう.このデータだけを見たら「このサイコロを振って出る目には傾向がある!振る回数が増えるほど,大きな目が出るぞ!」となりかねない.でもそれは間違ってますね.だってサイコロは大きくて6までの目しか出ませんから.

データの中から見つかった傾向が,「偶然に傾向っぽくなってるだけ」なのか「何らかの要因に依る必然的な傾向」なのか区別する必要がある.統計ではそのための手法がたくさんあるけど,代表的なものに仮説検定がある.

仮説検定とは,傾向を算出したあと,「その傾向が偶然である確率」を計算する.そして多くの場合で,その「傾向が偶然である確率」が5%より小さければ,「これが偶然である確率は小さい.すなわち必然的に見られる傾向だ!」と結論する.

その「傾向が偶然である確率」をp値という.今回計算してみたら,p値はp=0.07でした.つまり7%.偶然である確率が7%で,これは5%より大きい.こういうときは「まぁ今回は傾向らしきものが見つかったけど,偶然のばらつきの範囲内だね.”傾向がある”とは言えないね」と結論します.

今回の結論!

つまり,今回Livedoorブログに搭載されてるアクセス解析をした結果はこんな感じ.「このブログの訪問者数は,この3ヶ月間でほとんど伸びてない.毎日平均47人が見に来てくれてる」.

47人の皆様,ありがとうございます.僕は毎日47人と会話したも同然です.平日の活発に活動してる日だって,1日で47人とは話さない.ブログって面白いね.これからもたくさん発信しますので,沢山の人に読んでもらえるように頑張ろう!

コメントを残す

回れ右の内輪差をもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む