ウェブサイトの数

インターネット上のウェブサイトの数が、一億を越えたようです。

あら、意外と少なかったのね。という印象ですが、もっとも「ウェブサイト」の定義があいまい*1なので、Netcraftがどう定義しているのかに依りますね。

おいらの家鯖のWebサービスのログを覗いてみると、Netcraftのクローラさんがちょくちょくやってきていますが、追いかけてみても具体的なコンテンツの構造までは探っていませんし、解析されたデータをサーチした結果なんかを見ると、Netcraftで言うところの「ウェブサイト」はホスト(バーチャルホスト)単位のようです。とりとめのない言い換えをすれば、

HTTPを喋れるポートを開けている、インターネット上のホストが一億台を越えた

ってことです。
つまり、どんなにはてなダイアリーユーザが増えようとも、すべて d.hatena.ne.jp 上でサービスを提供している以上、Netcraftで言うところの「ウェブサイト」は増えないことになりますね。逆に、見た目は単一サイトのようでも、コンテンツの用途ごとにサーバとなるホストを分けていたりすると、その数だけウェブサイト数はカウントアップされます。

なんか公平じゃないよなぁ・・・。でも、同一サーバ上のコンテンツにはパス名以外の境界なんて無いから、ディレクトリ構成に万国公法なルールでもない限り、アルゴリズムを使った区別はできないから仕方が無いか。

とはいえ、Netcraftクローラさんが集めたデータの解析結果ってのは、眺めているだけでも結構面白です。

*1:そもそも統一された定義なんて存在するの?RFCとかにそれっぽいのある?