数字はウソをつく
まったく非常に腹が立つ。なにがって、ココログのレスポンスの悪さだ。
フリー版のココログサービスが始まって以来、私が記事を書いてる時間帯は使い物にならない。
この件について@nifty側から説明が出ている。
スタッフによる説明
社長からの説明
要点は以下のとおりらしい。
●フリー版をはじめたことによってレスポンスが悪化したのではない。
●フリーと従来版はシステムが別である。
●負荷はトラックバックスパムによるもの。
(これに、加えて社長からはフリー版のほうが高機能であることについて、わけわからん説明文があるが、意味不明で要点がまとめられん。)
スタッフからの説明にはご丁寧にもトラックバック数についてグラフがのせてあるが、まったく説明になってない。
この件について、自称デジタル&心理戦のハイブリッドギャンブラーである私の視点で深読みする。
まず、グラフから読み取れることは以下の4点。
●日付が11/27から始まっている。
●縦軸の数字が書いてない。
●横軸の数字は書いてある。
●グラフは波が激しい。
第一にグラフが11/27から始まっている点について。
問題が起きたのは明らかにフリー開始の11/24以降である。それなのに、その前の部分をカットし問題が起きた箇所だけをグラフにしている。つまり、フリー開始前の部分まで含めてグラフにしてしまうと都合が悪いことがあるということだ。
要するに、11/24以前から大してトラックバック数は変わってないということだ。
横軸の数字とグラフは波が激しい点について
グラフを見ると、トラックバックスパムがくる時間帯には周期性があるため、比較的すいていることもある。
そして横軸の数字はしっかりと書いてある。つまり、システムで対応できないからユーザが書き込む時間帯をずらしてほしいということだ。
縦軸の数字が書いてない点について。
横軸はわざわざ文字を縦にしてまで記載しているのに対して、こちらは明らかにわざとつけてない。
つまり、縦軸の数字を書いてしまうと(サイトを運営している専門家からみれば)その数が実はそれほど負荷になる数字でないことがばれてしまうということだ。
普通に考えてみれば分かる。
トラックバックスパムが原因なら、どうして、フリー開始と同時にトラックバックが増えたのか?ほかのブログサービスは問題ないのになぜココログだけが?本当に従来版とフリー版でシステムが別なら、なぜ、メンテで従来システムを異常に長い期間(9:00~15:00)停止したのか?
Niftyの説明はまったく説明になってない。
それだけならまだしも、なんと、スタッフの説明には、システムで対応が遅れていると書いておきながら、その対策ができないトラックバックスパムの手法まで書いてある。
効果的な犯罪手法を公表してどうする。アホか。
これはよくある統計のトリックなのだ。
グラフというものは分かりやすく見える。
そして、数字というものは、本当の意味を理解できる人が少ない割りに、ただそこに書いてあるだけで文章に説得力がでるものだ。
グラフが書いてあるからといって信じて良い訳は無い。
形や色に惑わされず目盛りを読み取ることはもちろんだが、そこに書いてない範囲や日常からの経験も含めて、常識的な総合判断を下す必要がある。
他人の統計情報を利用するときはよくよく注意すべきた。
参考
銀玉親方のコラムでよく名前が出てくるダレル・ハフの本とはまさにこのことについて語ってます。
統計でウソをつく法--数式を使わない統計学入門
上記は名著なんですが、年代が古く、海外のものであるため、例題がピンとこないかもしれません。日本人にはこっちのほうがユーモラスで理解しやすいかもしれない。
反社会学講座
| 固定リンク
この記事へのコメントは終了しました。
コメント
kmos2さん、初めまして。TBさせていただくと同時に私のブログのエントリにリンクを貼らせていただきました。
「納得いく説明」と一応書きましたが疑問点が残っていて(グラフの日付や、縦軸に数字がないのはなぜかなど)、明快に答えてあり、とてもスッキリしました。
どうもありがとうございます。
投稿: ruko | 2005/12/02 15:21