ページスピードは一定ではない？みんなのスピード体験を想像するコツは「対数正規分布」

「自分のPCで見るとそんなに遅くないんですけど」。サイトの表示速度を議論するとき、こういう言葉を耳にすることがある。悪意ではなく本当にそう感じているのだ。

なぜなら自分以外のユーザーがどんなスピードでサイトを体験しているかを正確に想像するのは、とても難しいからだ。速い人と遅い人がいるのは頭では分かっているつもりだ。だが、それぞれどのくらいのスピードで、どのくらいの割合でいるのかと言われると途端に説明が難しくなる。

実はサイトスピードのばらつきは、統計的にどんな形になるかがほぼ決まっている現象だ。その特徴を一度つかんでしまえば自分以外のユーザーの体験をぐっと想像しやすくなる。この記事ではその考え方を実測データと一緒に紹介したい。

「みんな自分と同じくらいだろう」という認知バイアス

そもそも人は自分が経験していないことを正しく想像するのが苦手だ。加えてサイトスピードは時間的な体験である。長さや高さのような空間的な大きさであれば、並べて一度に見比べられる。だが時間的な体験は同時に比べることが物理的にできない。

サイトの開発者や運営者はたいてい高性能なPCなどストレスなく動く環境を基準にしている。その環境での動作確認によって「これが普通のスピードだ」と感じやすい。ところがユーザーの実態は想像以上に幅広い。古い格安スマートフォンの人もいれば、電波の不安定な場所や回線の混み合う時間帯にアクセスする人もいる。

このように「他のユーザーも自分と同じくらいのスピードで体験しているだろう」という強い思い込みが無意識のうちに生じる。サイトスピードは認知バイアスがかかりやすい問題なのだ。

では客観的に全体像を把握するにはどうすればいいのか。賢者は歴史に学ぶと言われたように、自分の経験に頼るのではなく、ユーザーが実際に体験した具体的な値の分布を見なければならない。

実測データで見るトップページのばらつき

弊社サービス Speed is Money を利用中のある通販（EC）サイトのトップページの実測データを見てみよう。計測対象は ページ読み込み時間（OnLoad） で、直近3か月（2026年3〜5月）に計測された 329,533件のPV（ページ表示）のデータだ。

ページ読み込み時間は超ロングテールを描く

まずページ読み込み時間を1秒ごとに区切る。その秒台に何件のPVが収まったかを描いたのが次のグラフだ。横軸がページ読み込み時間、縦軸がPV数である。点線は中央値（3.37秒）と p90（7.15秒）の位置を表す。中央値 3.37秒とは速い順に並べても遅い順に並べても、ちょうど真ん中にくるPVの読み込み時間。p90の7.15秒は、90%のPVが7.15秒以内に収まっていることを意味する。

ページ読み込み時間ごとのPV数（1秒ごと・0〜60秒）。2〜3秒台にピークがあり、中央値3.37秒・p90 7.15秒のあたりまでに多くが収まるが、そこから60秒近くまで細く長い裾が伸びる

多くのPVは5秒前後までに読み込みを終えている。だが遅いPVは非常に遅く、最も遅いものは60秒に迫る。しかもこの60秒はぽつんと離れた異常値ではない。0秒台から60秒台までどの秒台にもPVが存在している。

大半のPVはある範囲に収まる。それでもときどき極端に遅い体験を引いてしまうPVが確実に存在し、その値は右へ右へと長い裾を引く。この超ロングテールがページスピードを客観的に理解するための最初の事実だ。

速いPVにも偏りがある

では左側の頭の部分にズームインしてみよう。先ほどのグラフでは多くのPVが0〜5秒あたりに集中しているのは分かるが、山の形まではつかみにくい。上位95%に絞り、約0.5秒ごとの細かいヒストグラムにしたのが次の図だ。

上位95%（0〜10秒）のページ読み込み時間の度数分布（20階級）：2〜3秒付近に山があり、速い側に偏って長い裾を引く

山の頂上（最も多い秒数）は 約2.5〜3秒付近 にある。そこから右側に向かって裾を引きながらゆっくりと減衰していく形状だ。

数値で見ると 最頻値＜中央値（3.37秒）＜平均値（4.22秒） の順に並ぶ。山を描いてはいるが、速い秒数の側に偏った形となっている。この速い側に偏った形は 「対数正規分布」 によって理論的に説明できる。

サイトスピードを把握するための「対数正規分布」

速い側に偏った山の正体

先ほどのヒストグラムに対数正規分布の理論値（確率密度関数）を重ねてみよう。

実測のヒストグラムと理論曲線がかなり近しいと見て取れるはずだ。このデータは対数正規分布でよく説明できる（μ=1.214、σ=0.647、理論最頻値約2.21秒、理論中央値約3.37秒、理論平均約4.15秒）。

ズームした0〜10秒だけでなく、最初に見た0〜60秒の全体に同じ理論曲線を重ねてみる。長く伸びる裾までよく沿っている。一握りの「すごく遅い」体験までを含めて、分布全体が一本の対数正規分布で説明できるということだ。

0〜60秒の1秒ごとの実測PV数に対数正規分布の理論値を重ねた図：長い裾まで理論曲線とよく一致する

対数正規分布は変形した正規分布

「正規分布（左右対称の釣鐘型）」 は聞いたことがある人も多いだろう。一方で「対数正規分布」は初めて聞くという方も少なくないと思う。だがそこまで難しく考える必要はない。対数正規分布とは横軸を対数目盛に書き換えると、おなじみの正規分布になる分布のことだ。

試しに先ほどの山の横軸を対数目盛に変換してみよう。

このように対数目盛にすると左右対称のおなじみの正規分布の形にかなり近づく。つまりページ読み込み時間の表れ方は、根っこは正規分布でありながら時間軸の取り方が少し特殊なケースだということだ。

対数正規分布はサイトスピードの標準的な考え方

この通販サイトのトップページがたまたま対数正規分布になったという話ではない。

実は PageSpeed Insights（Lighthouse）のパフォーマンススコアも、各指標が対数正規分布となることを前提に設計されている。HTTP Archive の実データから対数正規曲線の制御点（25パーセンタイル相当のスコアが50、8パーセンタイル相当がスコア90）を決める。そこからスコアを算出している。

"The score is determined based on the performance score's distribution curve computed from HTTP Archive data, with that distribution modeled as a log-normal distribution."
— Lighthouse performance scoring | Chrome for Developers

つまり対数正規分布はサイトスピードの計測・評価を行う上で事実上の業界標準となっているのだ。

LCP も INP も同じく対数正規分布とされる

ここまで見てきたのはクラシックなページ読み込み時間（OnLoad）だが、対数正規でばらつくのはページ読み込み時間に限らない。同じトップページ・同じ期間で、Core Web Vitalsに含まれる LCP（主要コンテンツが描画されるまでの時間、中央値約1.1秒）と INP（操作への反応時間、中央値約89ミリ秒）も見てみよう。

LCPの分布

LCP もページ読み込み時間と同じく速い側に偏った山と、ロングテールを描く。対数正規分布の理論値（オレンジの線）ともおおむね重なる。

INPの分布

INP も同じく速い側へ偏った山を描く。ブラウザの制約上、INP はミリ秒単位で粗く記録される。そのため曲線には凹凸や小さないびつさが出るが、対数正規分布の特徴はかなり捉えられていると言える。

指標が変わっても同じ形が現れるのはばらつきの背後に共通の仕組みがあるからだ。

なぜ対数正規分布になるのか

メカニズムの面からも軽く確認しておこう。ウェブページの表示は一見すると単純だ。だがその裏では、ネットワークの通信、サーバーの処理、たくさんのリソースの取得と合成…といった工程の連なる複雑なパイプラインが走っている。

こうした工程の遅延は足し算ではなく 掛け算 的に効く。回線が混んでいれば転送やハンドシェイク、リソース取得まで同時に遅くなり、悪条件が相乗的に膨らむ。最終的なページ読み込み時間 T は各工程の遅延比率の積として表せる。

T = T_{0} \times r_{1} \times r_{2} \times \dots \times r_{n}

両辺の対数をとると掛け算は足し算に変わる。

\ln T = \ln T_{0} + \ln r_{1} + \ln r_{2} + \dots + \ln r_{n}

独立した変動の足し算は正規分布に近づく（中心極限定理）。つまり ln T が正規分布に近づき、T 自身は対数正規分布に従う。時間軸が「対数的」になるのはこのためだ。

掛け算的に積み重なる量が対数正規分布になることは一般的にも広く観察されており、インターネット上の応答時間やダウンロード時間も同じ構造を持つその一例だ（Downey, 2005／Limpert, Stahel & Abbt, 2001）。つまり実際に観測される分布としても、ページ表示の仕組みから考えたメカニズムとしても、サイトスピードを対数正規分布で捉えるのは妥当な考え方だといえる。

自分の体感ではなく「分布」で想像する

今回見てきたことを、3点にまとめておく。

同じトップページでも体験するスピードは大きく異なる。 ボリュームゾーンはあるが、遅い人はとことん遅い。
そのばらつきは対数正規分布でよく説明できる。 インターネット上の応答時間の経験則であり、Lighthouseのスコア設計もこれを前提にしている。
ばらつきの形はほぼ決まっている。 遅延要因が直列に連なり掛け算的に積み重なる以上、分布が右に長い裾を引くのは数学的に予測しやすい。

「自分が試したら3秒だった」は事実かもしれない。だがそれは中央値あたりの体験ができたに過ぎない。1%のPVでは20秒以上待たされていることは、その感覚からは見えてこない。

しかし、ここで対数正規分布の形を思い出すと他のユーザーの体験がぐっと想像しやすくなる。

弊社サービス Speed is Money はこのような RUM（Real User Monitoring）による実測データの収集と分析を提供している。p75・p90・p99などのパーセンタイルでスピードの分布を把握できる。「遅いユーザーがどれほどの体験をしているか」を客観的に可視化することで、施策の優先度づけに役立てられる。

参考文献

Downey, A. B. (2005). "Lognormal and Pareto distributions in the Internet." Computer Communications, 28(7), 790–801.
Limpert, E., Stahel, W. A., & Abbt, M. (2001). "Log-normal Distributions across the Sciences: Keys and Clues." BioScience, 51(5), 341–352.
Google Chrome for Developers. "Lighthouse performance scoring." https://developer.chrome.com/docs/lighthouse/performance/performance-scoring

「みんな自分と同じくらいだろう」という認知バイアス ​

実測データで見るトップページのばらつき ​

ページ読み込み時間は超ロングテールを描く ​

速いPVにも偏りがある ​

サイトスピードを把握するための「対数正規分布」 ​

速い側に偏った山の正体 ​

対数正規分布は変形した正規分布 ​

対数正規分布はサイトスピードの標準的な考え方 ​

LCP も INP も同じく対数正規分布とされる ​

LCPの分布 ​

INPの分布 ​

なぜ対数正規分布になるのか ​

自分の体感ではなく「分布」で想像する ​

参考文献 ​

「サイトスピード＝LCPなどの指標」ではない理由

「画像を軽くして」と言われたときの定量的な基準

サイトスピードとCVRの関係を数式で記述する - 指数減衰モデル