IIJでは広報誌「IIJ.news」を隔月で発行しています。本blogエントリは、IIJ.newsで連載しているコラム「インターネット・トリビア」と連動しています。
コラムの前半部分はIIJ.news vol.118(PDFで公開中)でご覧下さい。
前半では「取り扱うトラフィックの大小」という観点から、近年「ハイパージャイアント」と呼ばれる事業者達が急速に存在感を増しているという事を紹介しました。このような存在が議論に登るというのは、もちろんそれを裏付ける測定結果があってのことです。いったい「インターネットを流れるトラフィック」というのはどのようにして測定されているのでしょうか?
インターネットを流れるトラフィックを探る
実は、インターネットを流れているトラフィックがどのようなものかを調べるのは、とても困難なことです。インターネットは数多くのISPやインターネットを利用する組織・個人によって構成されているため、総合的な調査を行う事は事実上不可能です。
そこで、ある部分のトラフィックを観測し、そこからインターネット全体のトラフィック傾向を推測するという手法をとります。一見無造作に相互接続しているISPですが、トラフィックの流れから見ると、多くのトラフィックが主要なISP(Tier-1)を経由して流れています。このため、Tier-1 ISPを通過するトラフィックを解析することでインターネット全体のトラフィックの状況を推測することができました。
ところが、前述した「ハイパージャイアント」の取り扱うトラフィックが増えてくると、今までの推測方法では十分な結果が得られなくなりました。というのも、ハイパージャイアントは、自身で多数のISPと直接接続を行っています。このため、従来であればTier-1 ISPのトラフィックを観測していればTier-1以外のISPのトラフィックも把握することができたのですが、ハイパージャイアントから流れてくるトラフィックについてはそれが当てはまらなくなったのです。
また、ハイパージャイアントの中のいくつかの事業者は、データを配信するための設備を自社のネットワークに設置するだけでなく、世界中の主要なISPのネットワーク内に分散して配置しています。さらに、アクセス元によってそれら分散配置された設備の中で最も近いものから配信を受けるという仕組みが導入されています。このような仕組みは大変効率的ではありますが、インターネットトラフィックの観測という視点では、実態の把握がより困難になると言った悩ましさがあります。
このような状況の中で、インターネットのトラフィックがどこからどのように流れているのかを、調査するための手法が研究されています。例えば、ある研究1では、次のような手法が提案されています。
- アクセス数が多いWebサイトのリストを作成
- 多数のISPと実際に契約し、データが「どこから流れてくるのか」を調査するための環境を構築
- 2で用意した環境から1のリストに実際にアクセスし、データがどのように流れてくるのかを調査
この研究では、実際に日本国内3つの拠点で9本の回線を引き込み、13のISPを利用しています。このような環境で国内のブロードバンド利用者のトラフィックの7割程度に相当する環境を模擬できたのではないか、としています。
このように「インターネットを流れるトラフィック」を分析する作業は一筋縄ではいきません。ですが、インターネットを運用して行く上で、トラフィック傾向を把握する事はとても重要な事です。これからもインターネットの実態を調査するための様々な実験が行われると思います。