IIJでは広報誌「IIJ.news」を隔月で発行しています。本blogエントリは、IIJ.news連載コラム「インターネット・トリビア」を転載したものです。IIJ.newsはご希望者へ郵送でお送りしています。また、IIJ WebではPDF版をご覧頂けます。
IIJ.news vol.158 もくじ
- ぷろろーぐ「六月半ばの入社式」 鈴木 幸一
- Topics withコロナ時代のインターネット活用術
- インターネットにできること
- IIJ社内のリモートワーク事情
- 新型コロナウイルス感染拡大がブロードバンド・トラフィックにおよぼす影響
- テレワーク環境に必要なもの
- 「新しい生活様式」のためのテレワーク環境とは?
- 新型コロナウイルス感染症対策と共存する地域包括ケアシステムを目指して~IIJ電子@連絡帳サービスの活用~
- withコロナ時代のコラボレーションを支えるCisco Webex
- 切れないVPNを目指して~「フレックスモピリティサーピス」導入事例
- 人と空気とインターネット: コロナがもたらすインターネットファースト社会
- インターネット・トリビア: 遠隔コミュニケーションと遅延 ※この記事で掲載
- グローバル・トレンド: タイ、インドネシア、ベトナムの新型コロナウイルス事情
それぞれの記事はIIJ.news PDF版でお読み頂けます。
インターネット・トリビア: 遠隔コミュニケーションと遅延
遠く離れた場所同士で行なう映像や音声を使ったコミュニケーションには「遅延」が付きものです。遅延の原因の一つは、距離そのものです。わかりやすい例は、通信衛星を使った海外からのテレビ生中継です。スタジオと海外にいる出演者が会話すると、掛け合いのあいだに数拍の間が空きます。これは、映像と音声が地上 36000 キロメートルの位置にある静止衛星まで行って返ってくるのに、数百ミリ秒の時間がかかるためです。
デジタル通信では、信号を処理する際にも遅延が発生します。デジタル信号の処理では、ある程度の信号をためて、ひとかたまりにして処理するほうが効率的だからです。このような遅延は、家電量販店のテレビ売り場で体感できます。テレビ売場には複数メーカのさまざまなテレビが展示されていますが、それらを同じチャンネルに合わせると、音声にエコーがかかったように聞こえます。これは、受信した信号をテレビのなかでデジタル処理して表示する際に遅延が生じ、さらにテレビの機種によって遅延の時間がわずかに違うことに起因します。そして、最終的に表示される映像や音声がズレて、それらが混じることで、エコーのように聞こえるのです。
インターネットでもこの種の遅延は発生します。例えば YouTube のライブ中継では、まず、配信者のカメラで撮影した映像・音声を YouTube のサーバに送るために変換(エンコード)する遅延があります。次に、変換されたデータがサーバに届くまでに遅延があり、データを視聴者のパソコンやスマートフォンなどの環境に合わせてサーバで変換(トランスコード)するのにも遅延が生じます。さらに、多数の視聴者からのアクセスに耐えるために配信用サーバにデータをコピーするのに遅延があり、最終的に視聴者がデータをダウンロードして再生するのにも遅延が発生します。それぞれの行程で発生する遅延には大小がありますが、全体を通して 30 秒から 60 秒程度の遅延が発生しているようです。
これだけ遅延が発生すると、時々、奇妙なことが起こります。インターネットを使った生中継では Twitter などの SNS でリアルタイムにコメントを書いたりしますが、コメントが中継映像を追い越しているように見えることがないでしょうか? これは大きな遅延が生じていることに加え、個々の視聴者の遅延にバラツキがあるために起こる現象です。
配信者から一方的に映像を送るようなコンテンツであれば、あまり違和感はないでしょうが、インターネットを介して相互に会話するテレビ会議のような用途では、遅延は致命的です。30 秒も遅延があると会話は成立しないので、双方向のコミュニケーションツールでは、遅延をできるだけ減らすことが重要になってきます。例えば、複数人でのチャット・ビデオ通話ができる Discord というサービスは、低遅延での通話を重視しており、素早いコミュニケーションが要求されるオンラインゲームのプレーヤーに好まれています。
しかし、低遅延の実現と多人数の同時参加の両立は、むずかしい課題でもあります。インターネット上で複数の人が掛け合いながら、そこに数千人、数万人の視聴者が参加するようなイベントを単一システムで実現するのは、非常に難度が高いと言えます。そこで、Microsoft の会議サービス Teams に含まれる Teams ライブイベントという機能では、双方向で会話する「発表者」と視聴するだけの「参加者」という二つの立場を作り、発表者同士は低遅延のシステムで掛け合いする一方、その映像は多人数に配信するための(遅延が大きい)システムに流し込むというハイブリッド構成を採用しています。
オンラインのコミュニケーションを実現するシステムでも“適材適所”を考慮する必要があるのです。