An Active-Passive Measurement Study of TCP Performance over LTE on High-speed Rails を読んでみました

arxiv.org

https://arxiv.org/pdf/1812.04823.pdf

国鉄路高速の上海北京間で、TCP over LTEの性能を計測した論文。300km/h以上の速度で運行しているときの、車内Wi-FiからLTEで通信する実ユーザーの計測データをもとに議論をしています。

主な内容は以下の4点です

  • BBRとCUBICの比較 -300km/hと350km/hの時で、物理層のレートが下がることで、CUBICは47.5%、BBRは40.1% goodputが下がることを示しています
  • TCPフローの主な特徴の調査
    • トラフィックに占めるアプリケーション(text, image, video...)の割合や、電車の乗客の特性による通信内容の違いなどについて説明しています
  • ハンドオーバーの影響の確認
    • ハンドオーバーの発生の仕方を3種類に分類し、ハンドオーバーによるスループットの影響について述べています
  • BBRをより詳細に調査し、改善の余地があることの確認
    • RTpropに修正を加えてBBRに改善の余地があることを示しています

LTEのハンドオーバーによる性能への影響が興味深かったので、少し取り上げます

f:id:neko--suki:20191209193151p:plain

Fig 1. は、LTEのハンドオーバーを3つに分類しています。Type Ⅰはハンドオーバーが成功する場合を示しています。Type Ⅱは、user-equipment (UE) 側がhandover commandをデコードできない場合です。この場合、UE側がリンクレートに問題があることを検出し、Radio Link Failure タイマーというのが切れたら、新しいセルを検索し接続を再度確立します。もし接続を確立した先がsource cellによってデータが転送されていれば、セルにためられているバッファは失われません。Type Ⅲは、taget cellがデータの準備をできていない場合です。その場合、UEは新しい接続を確立します。この場合バッファリングされていたデータは失われるため、TCP層での再送が必要になります。

f:id:neko--suki:20191209193827p:plain

Table 3. は、異なる速度の時の、スループット物理層のレート、HOにかかる時間、HOの発生頻度を示しています。

スループットは、速度が上がるほど、非線形に落ちていることが分かります。また、同じ現象を物理層のレートでも見ることができます。

f:id:neko--suki:20191209194355p:plain

Figure 12は、ハンドオーバーにかかる時間を示しています。Type Ⅰの場合は85%のハンドオーバーが100ms以内に終わっています。一方で、Type Ⅱ/Ⅲの場合、半数以上が1秒以上ハンドオーバーに時間がかかっており、さらに上位25%はType Ⅱでは2秒以上、Type Ⅲでは5秒以上かかっていることが分かります。

なので、これらのハンドオーバーが送信レートにどのような影響を及ぼしているかをさらに調べています。

f:id:neko--suki:20191209195414p:plain

Figure 13では、200msec毎の物理レートを正規化したものを見ています。

(a)ではハンドオーバー終了後の、ある瞬間のレートを見ています。Type Ⅰの場合は、ほぼハンドオーバー前とレートが変わっていないことが見て取れます。これは、ほとんどのハンドオーバーが100msec以内に終わっているため、RTO (Retransmission Time Out) が発生していないからだと考えられます。

Type Ⅱ/Ⅲの場合は、スループットに影響を与えていることが分かります。接続を切断し、RTOが発生していることが見て取れます。Type Ⅱ/Ⅲの両者ともradio link failureをトリガーとしてハンドオーバーをしていますが、前者のほうはデータがセル間で転送されている分だけ、データレートが高いようです。

(b)では、ハンドオーバー開始からハンドオーバー終了+x秒後までのレートの平均を見ています。

Type Ⅰの場合は、瞬間のレートと同じ結果になっていることが分かります。一方で、Type Ⅱ/Ⅲの場合は、ハンドオーバーに時間がかかるので低いレートになっています。また、multiplicative decreaseや、パケットロスとRTOによるスロースタートも影響していると考えらえます。

Type Ⅲの場合は10秒経過しても元のレートの半分にも到達しません。

論文の内容を抜粋した紹介は以上です。

北京上海間の高速鉄道という一つのユースケースの知見とはいえ、ハンドオーバーの影響の大きさが興味深かったです。