# イレギュラーネットワークにおける 適応型ルーティングに関する研究

**平成**18年度

# 上樂明也

# 論文要旨

パーソナルコンピュータ (PC) を, Myrinet などの高速なシステムエリア ネットワーク (SAN) で相互結合することにより構築される PC クラスタは, 近年の半導体製造技術の進歩に伴なう PC の飛躍的な性能向上と低価格化に より,コストパフォーマンスに優れた高性能並列分散コンピューティング環境 として急速に普及が進んでいる.

SAN は, point-to-point リンクにより相互結合された高速スイッチ群から 構成され,従来の大規模並列計算機と同様に,バーチャルカットスルー方式 (VCT 方式)またはワームホール方式 (WH 方式)によるパケット転送とデッド ロックフリールーティングを用いることにより,低レイテンシかつ高バンド幅 の通信を実現している.一方で,SAN は,拡張性および耐故障性の要求を満 たすために,大規模並列計算機とは異なり,トポロジとして結合方式に制限が ないイレギュラーネットワークをサポートすることが多い.しかし,イレギュ ラーネットワークでは,経路保証とデッドロックフリーの実現のための制約が 厳しいため,大規模並列計算機で用いられるメッシュやトーラスなどのレギュ ラーネットワークに比べて,ルーティングアルゴリズムの設計が難しい.この ため,既存のルーティングアルゴリズムの多くは,トポロジ上にスパニングツ リーのマッピングを行ない,ツリー構造の接続性と非循環の性質を利用して経 路保証とデッドロックフリーを実現する方式を採用している.

Up\*/Down\* ルーティングは,スパニングツリーベースの代表的な適応型 ルーティングアルゴリズムであり,仮想チャネルやバッファ等のハードウェア を付加することなしに適用可能であることから,Autonet および Myrinet な どの SAN において利用されている.Up\*/Down\* ルーティングは,マッピン グしたスパニングツリーの階層構造に基づいて,ネットワークを1次元の方 向 (up/down)を持つ有向グラフに見立て,最も単純な1次元のTurn モデル を適用することにより,デッドロックフリールーティングを実現している.し かし,1次元のTurn モデルでは,トポロジの不規則性に基づく禁止ターン 分布の偏りが大きくなるため,トラフィックの分散が困難となる.このため, Up\*/Down\* ルーティングは,効率的にネットワークのバンド幅を利用するこ とが難しい.

本論文では,Up\*/Down\* ルーティングにおける上記の問題を解決するため,Up\*/Down\* ルーティングにおける1次元 Turn モデルを拡張した,2次元 Turn モデルに基づく適応型ルーティングアルゴリズムである Left-up first turn (L-turn) ルーティングおよび Right-down last turn (R-turn) ルーティングを提案し,フリットレベルの相互結合網シミュレータを C++ 言語で実装して,確率モデルシミュレーションにより,評価を行なった.L-turn ルーティングおよび R-turn ルーティングは,1次元有向グラフを拡張した H/V グラフと呼ばれる2次元有向グラフを導入し,ターンのパターン数および禁止ターン選択における自由度の増加を実現する.そして,H/V グラフに対して,2次元 Turn モデルの適用によるシステマティックな手法を用いて,より均等な禁止ターンの分散を実現し,トラフィック分散とスループット向上の実現を図る.

L-turn ルーティングおよび R-turn ルーティングは, Up\*/Down\* ルーティン グと同様に,付加的なハードウェアに依存しないため,任意のトポロジの SAN に適用可能な汎用性の高い手法である.

確率モデルシミュレーションの結果,L-turn ルーティングは,最も高いス ループットを達成し,Up\*/Down\*ルーティングに対し最大で約80%のスルー プット向上を実現することが確認された.一方,R-turn ルーティングは,全 体的に,最も低いスループットを示すことが確認された.L-turn ルーティング とR-turn ルーティングは,ほぼ同等の禁止ターン分散を実現するが,選択さ れた禁止ターンのパターンの違いにより,L-turn ルーティングでは,ツリー の葉方向にトラフィックが分散されやすくなるのに対し,R-turn ルーティン グではホットスポットが発生しやすいルート方向にトラフィックが集中してし まうことがわかった.これより,スループット向上のためには,より均等な禁 止ターンの分散と葉方向へのトラフィック分散の両立が重要であり,この条件 を満たす L-turn ルーティングが,優れたルーティングアルゴリズムであるこ とがわかった.

# Abstract

Network-based parallel processing using clusters of personal computers (PCs), which are interconnected by system area networks (SANs), has been researched as potential cost-effective parallel-computing environments.

SANs consist of switches connected with point-to-point links, uses wormhole routing (WH) or virtual cut-through switching (VCT) as its switching technique to provide low-latency and high-bandwidth communications like those of interconnection networks in massively parallel computers. Unlike the interconnection networks used in massively parallel computers, SANs usually accept arbitrary topologies so as to provide extensibility and dependability to cope with low-reliability commodity PCs. The interconnection adaptivity, however, makes it difficult to establish paths that are free of deadlocks. A deadlock-free routing algorithm is thus crucial for making efficient use of network resources, yet the current deadlock-free routing algorithms in massively parallel computers with regular topologies cannot be directly employed in most cases. Thus, traditional routing algorithms usually employ connectivity and acyclicity of mapped spanning-tree to ensure deadlock-freedom and connectivity in their target topologies.

Up\*/Down\* routing is the most popular spanning-tree based deadlockfree adaptive routing algorithm. Up\*/Down\* routing guarantees deadlockfreedom by using one-dimensional (up/down) turn model approach, and does not require additional hardware such as virtual channels or buffers. However, Up\*/Down\* routing tends to generates unbalanced traffic because the onedimensional turn model always generate unbalanced prohibited turns, and thus it leads to poor throughput.

This thesis introduces the systematic approach for designing deadlockfree adaptive routing algorithms called "left-up first turn (L-turn) routings" and "right-down last turn (R-turn) routings". The L-turn routings and the R-turn routings are based on a two-dimensional turn model to guarantee deadlock-freedom and make the paths as uniformly distributed as possible by selecting well-distributed prohibited turns. The extended two-dimensional directed graph, called H/V graph, provides the extra degree of freedom for the selection of prohibited turns. The L-turn routings and the R-turn routings can be applied to any networks in which Up\*/Down\* routing is used because they do not require additional hardware.

A flit-level interconnection network simulator written in C++ was used for evaluating Up\*/Down\* routing and the proposed routings by probabilistic simulation model. Results of simulations show that the L-turn routings achieved the highest and up to 80% improvement on throughput. On the other hand, the throughputs of R-turn routings were the lowest. Although the L-turn routings and the R-turn routings achieve almost the same degree of uniformity about the distribution of prohibited turns, there is difference in an approximate tendency in which the traffic is more likely to be distributed. The traffic would be distributed toward the leaf nodes when the L-turn routings are employed, and thus it leads to better traffic balance and throughput. However, the traffic would be distributed toward the root node when the R-turn routings are employed, and thus it leads to unbalanced traffic and poor throughput. Therefore, better throughput results from uniformly distributing the prohibited turns by which the traffic would be more distributed toward the leaf nodes, and the L-turn routings meet this condition.

# 目 次

| 第1章 | 緒 論                                       | 1        |
|-----|-------------------------------------------|----------|
| 第2章 | SAN のトポロジと                                |          |
|     | ルーティングアルゴリズム                              | <b>5</b> |
| 2.1 | トポロジ....................................  | 5        |
|     | 2.1.1 ネットワークモデル                           | 5        |
|     | 2.1.2 イレギュラーネットワーク                        | 7        |
|     | 2.1.3 レギュラーネットワーク                         | 8        |
|     | 2.1.3.1 n 次元メッシュ                          | 8        |
|     | 2.1.3.2 n 次元 トーラス                         | 8        |
|     | 2.1.3.3 Fat ツリー                           | 9        |
| 2.2 | <b>ルーティングアルゴリズム</b>                       | 0        |
|     | 2.2.1 パケット転送方式                            | 0        |
|     | 2.2.2 仮想チャネル                              | 2        |
|     | 2.2.3 デッドロック                              | .4       |
|     | 2.2.4 デッドロックリカバリー方式とデッドロックフリー方式1          | 5        |
|     | 2.2.5 固定型ルーティングと適応型ルーティング 1               | 5        |
|     | 2.2.6 ソースルーティング方式と分散ルーティング方式 1            | 7        |
| 第3章 | 関連研究 1                                    | 8        |
| 3.1 | イレギュラーネットワーク向けの                           |          |
|     | 既存のルーティングアルゴリズム                           | .8       |
|     | 3.1.1 Up*/Down* ルーティング                    | 9        |
|     | 3.1.2 DFS スパニングツリーベースの Up*/Down* ルーティング 2 | 21       |
|     | 3.1.2.1 DFS スパニングツリーの構築 2                 | 22       |
|     | 3.1.2.2 各スイッチへのラベルの割当て                    | 23       |
|     | 3.1.2.3 各チャネルへの方向の割当て                     | 23       |
|     | 3.1.2.4 DFS スパニングツリー構築時のヒューリスティックルール 2    | 25       |
|     | 3.1.3 Smart ルーティング 2                      | 26       |
|     | 3.1.4 Adaptive-Trail ルーティング $2$           | 27       |
|     | 3.1.5 既存のルーティングアルゴリズムにおける問題点 2            | 28       |
| 3.2 | SAN の実現例                                  | 50       |
|     | 3.2.1 Autonet                             | 50       |
|     | 3.2.2 Myrinet                             | 50       |
|     | 3.2.3 QsNET                               | 1        |

|       | 3.2.4          | InfiniBand                                                                                                                                                                 |  |
|-------|----------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--|
|       | 3.2.5<br>3.2.6 | RHINET                                                                                                                                                                     |  |
| 笛 4 辛 | т 4            | $p/\mathbf{P}  \text{turns}  \  = -\frac{1}{2} \sqrt{2}$                                                                                                                   |  |
|       |                | n/R-turn ルーティング 54                                                                                                                                                         |  |
| 4.1   |                | / フノの 梅柴                                                                                                                                                                   |  |
|       | 4.1.1          |                                                                                                                                                                            |  |
|       | 4.1.2          |                                                                                                                                                                            |  |
|       | 4.1.3          | 各チャネルへの 2 次元万回の割当て                                                                                                                                                         |  |
| 4.2   | 2 次元           | Turn モテルによるルーティングアルコリズムの設計 39                                                                                                                                              |  |
|       | 4.2.1          | $\operatorname{Turn} \mathbf{t} = \mathbf{f} \mathbf{h} \dots \dots$ |  |
|       | 4.2.2          | H/V グラフにおける Turn モデルの適用手順                                                                                                                                                  |  |
|       |                | 4.2.2.1 準備                                                                                                                                                                 |  |
|       |                | 4.2.2.2 <b>ターンの</b> 識別 (STEP1) 43                                                                                                                                          |  |
|       |                | 4.2.2.3 循環構造の識別と禁止ターンの選択 (STEP2) 43                                                                                                                                        |  |
|       |                | 4.2.2.4 循環構造検出アルゴリズムによる冗長禁止ターンの削除                                                                                                                                          |  |
|       |                | $(STEP3)  \dots  \dots  \dots  \dots  \dots  \dots  \dots  \dots  55$                                                                                                      |  |
|       | 4.2.3          | L-turn/R-turn <b>ルーティングの定義</b> 58                                                                                                                                          |  |
|       | 4.2.4          | 同 depth スイッチ間チャネルの方向割当ての効果 62                                                                                                                                              |  |
|       | 4.2.5          | H/V グラフ構築時の前順走査における訪問スイッチ選択ポリシー . 64                                                                                                                                       |  |
|       | 4.2.6          | 既存のルーティングアルゴリズムとの比較 64                                                                                                                                                     |  |
|       | 4.2.7          | イレギュラーネットワーク向けルーティングアルゴリズムの分類 65                                                                                                                                           |  |
| 4.3   | 研究の            | 過程と本論文の位置付けについて                                                                                                                                                            |  |
| 4.4   | まとめ            |                                                                                                                                                                            |  |
| 第5章   | 評価             | 69                                                                                                                                                                         |  |
| 5.1   | 評価環            | 境                                                                                                                                                                          |  |
|       | 5.1.1          | 相互結合網シミュレータ 69                                                                                                                                                             |  |
|       | 5.1.2          | <b>シミュレーション</b> 条件 70                                                                                                                                                      |  |
|       | 5.1.3          | 評価指標                                                                                                                                                                       |  |
| 5.2   | 分散ル            | ·ーティング方式における評価結果                                                                                                                                                           |  |
|       | 5.2.1          | イレギュラーネットワークにおける評価                                                                                                                                                         |  |
|       | 5.2.2          | 2次元メッシュにおける評価                                                                                                                                                              |  |
|       | 5.2.3          | 2次元トーラスにおける評価                                                                                                                                                              |  |
|       | 5.2.4          | ルートスイッチ選択の影響                                                                                                                                                               |  |
|       | 5.2.5          | 訪問スイッチ選択ポリシーの影響                                                                                                                                                            |  |
| 5.3   | ソース            | ルーティング方式における評価結果                                                                                                                                                           |  |
|       | 5.3.1          | イレギュラーネットワークにおける評価88                                                                                                                                                       |  |
|       | 5.3.2          | 2次元メッシュにおける評価                                                                                                                                                              |  |
|       | 5.3.3          | 2次元トーラスにおける評価                                                                                                                                                              |  |
| 5.4   | まとめ            | 90                                                                                                                                                                         |  |

# 第6章 結論

91

# 図目次

| SAN の構成例                                                             | 6                                                                                              |
|----------------------------------------------------------------------|------------------------------------------------------------------------------------------------|
| 図 2.1 に対応するグラフ G.............................                        | 6                                                                                              |
| イレギュラーネットワーク                                                         | 7                                                                                              |
| $2$ 次元メッシュ $(4 \times 4$ スイッチ)                                       | 8                                                                                              |
| $2$ 次元トーラス $(4 \times 4 \operatorname{Ad} \operatorname{yf})$        | 9                                                                                              |
| Fat ツリー (2,4,2)                                                      | 9                                                                                              |
| パケットの構成                                                              | 10                                                                                             |
| パケット転送方式................................                             | 11                                                                                             |
| パケットのブロック                                                            | 13                                                                                             |
| 仮想チャネルの利用によるブロックの回避                                                  | 13                                                                                             |
| デッドロックの例................................                             | 14                                                                                             |
|                                                                      | 00                                                                                             |
|                                                                      | 20                                                                                             |
| BFS スパープクツリーを用いた $Up^*/Down^*$ ルーナイブクにおける                            | 00                                                                                             |
|                                                                      | 22                                                                                             |
| DFS スパーングツリー                                                         | 23                                                                                             |
|                                                                      | 23                                                                                             |
| DFS スパーノク ツリーを用いた $Up^*/Down^*$ ルーナイノクにあける<br>タチャネル & のたちの割米エト林 にクーン | 0.4                                                                                            |
|                                                                      | 24                                                                                             |
|                                                                      | 25                                                                                             |
|                                                                      | 26                                                                                             |
| Up*/Down* ルーティングにおける禁止ターンペアの形成                                       | 28                                                                                             |
| depth の割当て                                                           | 35                                                                                             |
| depth と horizontal spread の割当て                                       | 37                                                                                             |
| H/V グラフ                                                              | 38                                                                                             |
| Turn モデル (2 次元メッシュ)                                                  | 40                                                                                             |
| Turn モデル (2 次元メッシュ) における失敗した切り方                                      | 40                                                                                             |
| e-cube ルーティングの Turn モデル (2 次元メッシュ)                                   | 41                                                                                             |
| West-first ルーティングによる故障 (混雑) 箇所の回避                                    | 41                                                                                             |
| H/V グラフにおける形成可能ターン                                                   | 44                                                                                             |
| 、<br>スパニングツリーベースの有向グラフにおける最も単純な循環構造                                  | 44                                                                                             |
| H/V グラフにおける循環構造 (C <sub>1</sub> , C <sub>2</sub> )                   | 45                                                                                             |
| $H/V$ グラフにおける循環構造 $(C_3, C'_3)$                                      | 45                                                                                             |
| H/V グラフにおける禁止ターンの偏り                                                  | 46                                                                                             |
|                                                                      | SAN の構成例.<br>図 2.1 に対応するグラフ G .<br>イレギュラーネットワーク .<br>2 次元メッシュ(4 × 4 スイッチ) .<br>Fat ツリー (2,4,2) |

| 4.13       | $H/V$ グラフにおける禁止ターン集合 $(P_1, P_2)$                                                                       | 47       |
|------------|---------------------------------------------------------------------------------------------------------|----------|
| 4.14       | ターン集合 $Q_{1b}$ における TDG $D_1$                                                                           | 48       |
| 4.15       | ターン集合 $Q_{2b}$ における TDG $D_2$                                                                           | 49       |
| 4.16       | TDG <i>D</i> <sub>1</sub> における冗長循環構造の例                                                                  | 50       |
| 4.17       | TDG <i>D</i> <sub>1</sub> における最小循環構造の例                                                                  | 50       |
| 4.18       | TDG $D_1$ における最小循環構造 $(C_4, C_5, C_6, C_7)$                                                             | 53       |
| 4.19       | TDG $D_2$ における最小循環構造 $(C_8, C_9, C_{10}, C_{11})$                                                       | 53       |
| 4.20       | $H/V$ グラフにおける禁止ターン集合 $(P_{1a}, P_{1b})$                                                                 | 54       |
| 4.21       | $H/V$ グラフにおける禁止ターン集合 $(P_{2a}, P_{2b})$                                                                 | 55       |
| 4.22       | 冗長な禁止ターンを含む循環構造                                                                                         | 56       |
| 4.23       | 循環構造検出アルゴリズムにより検出される循環構造                                                                                | 58       |
| 4.24       | L-turn/R-turn ルーティングにおける許可ターンと禁止ターン集合                                                                   | 60       |
| 4.25       | $2$ 次元メッシュ $(4 \times 4$ スイッチ) における禁止ターン                                                                | 61       |
| 4.26       | BFS Up*/Down* および L-turn/ $\alpha$ ルーティングの経路例                                                           | 63       |
| 4.27       | 同 depth スイッチ間チャネルの方向割当ての違いによる                                                                           |          |
|            | L-turn <b>ルーティングの禁止ターン分布の違い</b>                                                                         | 63       |
| 4.28       | イレギュラーネットワーク向けルーティングアルゴリズムの分類.....                                                                      | 66       |
| F 1        | イレギュニー ウットローク (16 フィッチ) にやけて平信トニフィックト                                                                   |          |
| 0.1        | イレキュラーネットワーク(10スイッテ)にのける文信トラフィックと                                                                       | 75       |
| F 9        | 半均レイテノン $\dots$                 | 19       |
| 0.2        | イレキュラーネットワーク (04 スイッテ) にのける文信トフノイックと                                                                    | 76       |
| E 9        | + 均レイテノシー・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・                                                           | 10       |
| 0.0<br>E 4 | $2$ 从ルスッシュ( $4 \times 4$ スイッナ) にのける文信トフノイックと平均レイナノシ<br>$2$ 次二 $1 \times 2$ スイッチ) にかける文信トラフィックと平均レイナノシ   | 00       |
| 0.4<br>5 5 | 2 从ルクッシュ(0×0人1ッナ)にのける文店トラフィックと平均レイナノン<br>2 次テトニラフ (4×4フイッチ)における受信トラフィックと変換しくこうシ                         | 81<br>04 |
| э.э<br>г.с | $2$ 从ルドーノス ( $4 \times 4$ 人1 ツナ) にのける文信ドフノ1ツクと平均レ1 ナノン<br>の次二ト ニュ ( $0 + 0$ スノッチ) にわけて受信トニュノックト 平均レイテノン | 84<br>05 |
| 0.6        | 2 从元 Fーフス (8×8 人1 ツナ) にのける 受信 Fフノ 1 ツリ と平均 レ1 ナノン                                                       | 85       |

# 表目次

| 1.1  | 本研究の要約                                    |       | 4  |
|------|-------------------------------------------|-------|----|
| 3.1  | 付加的なハードウェアに依存しないルーティングアルゴリズムの比較           |       | 29 |
| 3.2  | 既存の SAN の比較                               |       | 33 |
| 4.1  | H/V direction の定義                         |       | 38 |
| 4.2  | H/V グラフにおける Turn モデル適用手順                  |       | 43 |
| 4.3  | 付加的なハードウェアに依存しないルーティングアルゴリズムの比較           | •••   | 65 |
| 5.1  | 共通シミュレーションパラメータ                           |       | 71 |
| 5.2  | イレギュラーネットワークにおける平均スループット                  | •••   | 74 |
| 5.3  | イレギュラーネットワーク (16 スイッチ) における静的な評価指標        | • •   | 77 |
| 5.4  | イレギュラーネットワーク (64 スイッチ) における静的な評価指標        | •••   | 78 |
| 5.5  | 2次元メッシュにおけるスループット                         | •••   | 79 |
| 5.6  | $2$ 次元メッシュ $(4 \times 4$ スイッチ)における静的な性能指標 | •••   | 82 |
| 5.7  | $2$ 次元メッシュ $(8 \times 8$ スイッチ)における静的な性能指標 | •••   | 82 |
| 5.8  | 2次元トーラスにおけるスループット                         | •••   | 83 |
| 5.9  | 2 次元トーラス (4×4 スイッチ) における静的な性能指標           | •••   | 83 |
| 5.10 | 2 次元トーラス (8×8 スイッチ) における静的な性能指標           | •••   | 86 |
| 5.11 | イレギュラーネットワーク (16 スイッチ , Uniform) における     |       |    |
|      | 平均スループットと静的な評価指標                          | •••   | 86 |
| 5.12 | イレギュラーネットワーク (64 スイッチ , Uniform) における     |       |    |
|      | 平均スループットと静的な評価指標                          | •••   | 87 |
| 5.13 | イレギュラーネットワーク (16 スイッチ , Uniform) における     |       |    |
|      | 平均スループットと静的な評価指標                          | •••   | 87 |
| 5.14 | イレギュラーネットワーク (64 スイッチ , Uniform) における     |       |    |
|      | 平均スループットと静的な評価指標                          |       | 88 |
| 5.15 | イレギュラーネットワークにおける平均スループット                  | • • • | 89 |
| 5.16 | 2次元メッシュにおけるスループット                         |       | 89 |
| 5.17 | 2次元トーラスにおけるスループット                         |       | 90 |

# **第**1章 緒論

近年の半導体製造技術の進歩に伴ない,パーソナルコンピュータ (PC) およびワークス テーション (WS) の飛躍的な性能向上と低価格化が続いている.これに伴ない,安価な PC を 高速なシステムエリアネットワーク (SAN) [Mae91, RS91, N.J95, Myra, PFH01, I.T04, TSJ<sup>+</sup>99, 西 宏 00, STH<sup>+</sup>00, NKN<sup>+</sup>01] で相互結合することにより構築される PC クラスタは,大規模並列計算機に代わるコストパフォーマンスに優れた高性能並列分散コ ンピューティング環境として急速に普及が進んでいる.現在,世界の上位 500 のスーパー コンピュータ [TOP] の中でも, PC クラスタが占める割合は年々増加を続けており,当面 この傾向が続くものと考えられる.

PC クラスタの性能に影響を与える構成要素の一つである SAN は,高速な point-topoint リンクにより相互結合された高速スイッチ群から構成される高性能ネットワークで あり,バーチャルカットスルー方式 (VCT 方式) [KK79] またはワームホール方式 (WH 方 式)[DS87] などの,従来の大規模並列計算機向けのアーキテクチャに基づくパケット転送と デッドロックフリールーティングを行なうことにより,低レイテンシ,高バンド幅,高信 頼性の通信を実現している.このため,大規模並列計算機のネットワークと同様に,ルー ティングアルゴリズムが SAN の構成および性能に影響を与える重要な要素となる.

SAN におけるルーティングアルゴリズムは,大規模並列計算機のネットワークと同様 に,固定型ルーティングと適応型ルーティングに分類される.固定型ルーティングは,出 発地スイッチから目的地スイッチまで,常に同じ経路を用いてパケット転送を行なう手法 である.固定型ルーティングは,既存の高速スイッチの多くで採用されており,次の利点 を持つ.

- シンプルかつ実装が容易
- パケットが送信順に必ず到達する性質 (FIFO 性)を持つ

一方で,パケット転送中に代替経路を利用することができないため,次の欠点を持つ.

- ネットワークの資源を効率的に利用できない場合がある
- 故障箇所をその場で迂回することができない(耐故障性を持たない)

適応型ルーティングは,出発地スイッチから目的地スイッチまでに複数の経路を用意し, 状況に応じて,動的に経路を選択してパケット転送を行なうことができる手法である.こ のため,適応型ルーティングは次の利点を持つ.

- 混雑箇所を回避し,ネットワーク資源を効率よく利用することが可能
- 故障箇所の動的な迂回による耐故障性の実現が可能

一方で,ルーティングにおける経路選択などの処理が複雑になるため,次の欠点を持つ.

#### 実装が複雑

● FIFO 性の保証が困難

SAN では, 各スイッチが point-to-point リンクにより相互接続されているため, パケッ トが出発地スイッチから目的地スイッチに到達するまでの過程において,途中経路にある 複数のスイッチを経由する必要がある.SAN において,パケットがルーティングアルゴ リズムによって決定される移動先隣接スイッチについての情報を取得するための手法は、 ソースルーティング方式と分散ルーティング方式に分類される、ソースルーティング方式 では、出発地スイッチにおいて、ルーティングアルゴリズムに基づいて目的地スイッチに 到達するまでの全経路情報が計算され、パケットのヘッダに格納される、パケットのヘッ ダがスイッチに到達するたびに,ヘッダに格納された経路情報に従って,次の移動先スイッ チの決定と転送を行ない,これを目的地スイッチに到達するまで繰り返す.ソースルーティ ング方式では, 各経由スイッチにおける経路決定処理が簡素化されるため, その分スイッ チの実装コストを抑えられるという利点を持つ [Myra].しかし,全経路情報を格納する 分, ヘッダ長のオーバヘッドが大きくなる.また,目的地スイッチまでの経路が出発地ス イッチで決定されるため、適応型ルーティングを用いる場合、経路選択は、出発地スイッ チにおいてだけ可能となり,途中経路において動的に経路を選択することができない(こ の場合,固定型ルーティングとなる)という制限を持つ.分散ルーティング方式では,パ ケットが各スイッチに到達するたびに、スイッチに実装された経路計算用ハードウェアに より,ルーティングアルゴリズムに基づいた移動先隣接スイッチが決定される.一般的に は、スイッチに用意されたルーティングテーブルを参照する table-lookup 方式が用いら れる [Mae91, I.T04]. 分散ルーティング方式では,中間スイッチにおいて,動的に経路を 選択することが可能であるため,適応型ルーティングの長所をフルに活用することができ る.また,ヘッダに格納される経路情報が小さくて済むという利点も持つ.しかし,スイッ チの実装がより複雑となるため、ソースルーティング方式に比べて、実装コストの面では 劣る.

PC クラスタでは,拡張性,耐故障性および可用性が重視される.このため,SAN は, トポロジとして結合方式に制限がないイレギュラーネットワークをサポートすることが多 い.近年,大規模並列計算機に匹敵する高性能を重視する SAN のトポロジとしては,大 量のポートを持つスイッチと大量の中間リンクにより構成される Fat ツリーなどのレギュ ラーネットワークを用いる場合が多い [Myra, PFH01, FFA<sup>+</sup>02].しかし,少量のポート を持つスイッチから構成される低コストの構成を取る場合や,クラスタ間同士を相互接続 する場合などのケースにおいては,依然としてイレギュラーネットワークが必要となると 考えられる.また,専用のクラスタではなく,高速なネットワークを用いて机上に配置さ れた PC や WS を接続し,専用のクラスタシステムと同様の性能を実現することを目的 としたシステムも提案されており [TSJ<sup>+</sup>99,西宏00,STH<sup>+</sup>00,NKN<sup>+</sup>01],このような場 合は,物理的な配置の制約からトポロジとしてイレギュラーネットワークが必須となる.

イレギュラーネットワークでは,経路保証とデッドロックフリーの実現のための制約が 厳しいため,大規模並列計算機で用いられるメッシュやトーラスなどのレギュラーネット ワークに比べて,ルーティングアルゴリズムの設計が難しい.このため,既存のルーティン グアルゴリズムの多くは,トポロジ上にスパニングツリーのマッピングを行ない,ツリー 構造の接続性と非循環の性質を利用して経路保証とデッドロックフリーを実現する方式を 採用している.

 $Up^*/Down^*$  ルーティング  $[Mae91]^1$ は,スパニングツリーベースの代表的な適応型ルー ティングアルゴリズムであり,

- スイッチまたは PC に, 仮想チャネルや専用バッファ等のハードウェアを付加する ことなしに適用可能
- 固定型ルーティングとしての利用も可能

などの理由から高い汎用性を持ち,Autonet および Myrinet などのネットワークにおい て利用されている.Up\*/Down\* ルーティングは,マッピングした breadth first search (BFS) スパニングツリーの階層構造に基づいて,ネットワークを1次元の方向 (up/down) を持つ有向グラフに見立て,最も単純な1次元の Turn モデルを適用することによりデッ ドロックフリールーティングを実現している.しかし,1次元の Turn モデルでは,トポロ ジの不規則性に基づく禁止ターン分布の偏りが大きくなるため,非最短経路の割合が増加 し,トラフィックの分散が困難となる.このため,Up\*/Down\* ルーティングは,効率的に ネットワークのバンド幅を利用することが難しい.Up\*/Down\* ルーティングの改良案と して,ヒューリスティックルールに基づいた depth first search (DFS) スパニングツリーを 利用して,禁止ターンの削減を図る手法 [JAJ00, JA00] も提案されているが,Up\*/Down\* ルーティングが本質的に抱える禁止ターン分布の偏りに関する問題が残ったままとなって いる.

Up\*/Down\* ルーティングにおける問題を改善し,トラフィックの分散を実現するために提案された既存のルーティングアルゴリズムは,大きく次の2つに分類される.

- (a) 仮想チャネルおよびスパニングツリーに依存しない手法 [LVT96, QNR99]
- (b) 仮想チャネルまたは専用バッファを利用する手法 [SD00, FJ00, JPMJ02, JMPJ02, SLT02, JPJ<sup>+</sup>02, MAH03]

しかし,これらの手法は,汎用性に欠けるという問題を持つ.前者の手法は,経路計算の 計算量が現実的でない[LVT96],または,適用可能なトポロジが限定される[QNR99],と いう問題を持つ.また,後者の手法は,スイッチの付加的なハードウェアの利用を前提と しているため,適用可能なネットワークが限定されるという問題を持つ.このため,これ らの手法は,高い汎用性を持つ Up\*/Down\* ルーティングの代替手法として常に選択でき るわけではない.

そこで,本研究では,Up\*/Down\* ルーティングと同等の汎用性と Up\*/Down\* ルー ティングが抱える問題の改善を実現するために,Up\*/Down\*ルーティングにおける 1次 元 Turn モデルを拡張した 2次元 Turn モデルに基づく適応型ルーティングアルゴリズム である left-up first turn (L-turn) ルーティング および right-down last turn (R-turn) ルー ティングを提案する [MAAH01, AMAH02, 上樂 03].L-turn ルーティングおよび R-turn

<sup>&</sup>lt;sup>1</sup>パケットが up 方向に必要ホップ数移動した後, down 方向に移動するため, 名称に\*という表現を用いている.

ルーティングは,既存の1次元(垂直方向だけ)の有向グラフを拡張した2次元(垂直方向 と水平方向)の有向グラフである H/V グラフを用いる.H/V グラフでは,各チャネルに割 当てる論理方向が2つから4つに増加するため,スイッチを通過するパケットの方向転換 (ターン)のパターンが従来の2個から6倍となる12個に増加する.これにより,禁止ター ン選択の自由度が増加し,より均等な禁止ターン分散の実現が可能となる.H/V グラフに 対して2次元 Turn モデルをシステマティックに適用することにより,分散を考慮した禁 止ターンの集合を持つL-turn ルーティングおよびR-turn ルーティングの定義を行ない, トラフィック分散およびバンド幅の向上を図る.L-turn ルーティングあよび R-turn ルー ティングは,仮想チャネルや専用バッファ等の付加的なハードウェアを必要としないため, Up\*/Down\* ルーティングと同等の高い汎用性を持つ.これにより,容易に Up\*/Down\* ルーティングの代替手法として適用可能な現実性の高い手法となっている.

本論文の構成は次の通りである.

第2章では,本研究の基礎となった SAN におけるトポロジとルーティングアルゴリズム に関する基本要素について説明し,第3章でイレギュラーネットワーク向けの既存のルー ティングアルゴリズムにおける問題点と既存の SAN の実現例について述べる.第4章で は,2次元 Turn モデルの適用に基づく適応型ルーティングアルゴリズムである L-turn ルーティングと R-turn ルーティングを提案し,第5章にてフリットレベル相互結合網シ ミュレータを用いた確率モデルシミュレーションにより評価を行った結果を示す.最後に 第6章にて結論を述べる.

本研究で取り組んだ研究の要約を表 1.1 に示す.

| 従来技術の | ${ m Up}^*/{ m Down}^*$ ルーティングが用いられるが,トラフィックが偏るため, |
|-------|----------------------------------------------------|
| 問題点   | バンド幅の有効利用ができない.                                    |
| 目的    | Up*/Down*ルーティングと同等の高い汎用性とトラフィック分散による               |
|       | スループット向上を実現する適応型ルーティングの提案                          |
| 提案技術  | 2次元 Turn モデルに基づいてパケットの禁止ターン分布を分散させる                |
|       | L-turn ルーティングと R-turn ルーティング                       |
| 効果    | スループットの向上                                          |

表 1.1: 本研究の要約

# 第2章 SAN のトポロジと ルーティングアルゴリズム

SAN は,性能面および機能面に関する次の特徴を備えた PC クラスタ向けの高性能ネットワークとして定義される.

- 高バンド幅,低レイテンシ
  - 高速なリンクと高速なスイッチを用い、PCとスイッチおよびスイッチ間を pointto-point に接続
  - WH 方式または VCT 方式による低レイテンシのパケット転送
  - インテリジェントなネットワークインタフェースによるプロトコル処理オーバ ヘッドの低減
- 高信頼性通信
  - デッドロックフリールーティングによりパケット廃棄を回避
  - 極めて低いエラーレート
- 高拡張性
  - 数十から数千の PC を接続可能
  - トポロジとして、レギュラーネットワークまたはイレギュラーネットワークを サポート

本章では,本研究の基礎となる SAN におけるトポロジとルーティングアルゴリズムに ついて述べる.まず,第2.1節で,SAN で用いられるトポロジであるイレギュラーネット ワークとレギュラーネットワークについて述べる.そして,第2.2節で,SAN における ルーティングアルゴリズムについて,パケット転送に関連する基本的な要素と共に述べる.

## 2.1 トポロジ

## 2.1.1 ネットワークモデル

SAN は,図2.1 のような point-to-point リンク (各リンクは互いに反対の方向に向かう2つの単方向物理チャネル (双方向チャネル) から成る) により相互結合されたスイッチ 群により構成される.各スイッチは複数のポートを持ち,各ポートは他のスイッチまたは PC との接続に用いられる. SAN におけるルーティングアルゴリズムの設計は,各スイッチ間のパケット転送経路 を対象とするため,通常,SAN はグラフ G(N,C) で表される [JSL02].ここで,N はグ ラフのノード (スイッチ)の集合,C はグラフのエッジ (各スイッチを相互結合するリンク) の集合をそれぞれ表す.例えば,図 2.1 の SAN は,図 2.2 に示すグラフで表すことがで きる.



図 2.1: SAN の構成例



図 2.2: 図 2.1 に対応するグラフ G

各スイッチ間の結合パターンは,トポロジによって定まる.以下,SAN における代表 的なトポロジについて説明する. 2.1.2 イレギュラーネットワーク

イレギュラーネットワークは,図2.2および図2.3のように,各スイッチ間の結合パター ンに制限が無いトポロジである.



図 2.3: イレギュラーネットワーク

イレギュラーネットワークは,結合パターンに制限が無いため,次のような長所を持つ.

- リンクおよびスイッチの追加を柔軟かつ容易に行なえるため,拡張性および可用性が高い.
- 冗長なリンクおよびスイッチを追加することなどにより,耐故障性を持たせることができる.

しかし、結合パターンに制限が無いことにより、次のような問題も抱えている。

- レギュラーネットワーク向けに開発された既存の効率的なルーティングアルゴリズムが適用できない.
- 効率的なパケット転送を行なうためのルーティングアルゴリズムの設計が難しい.

このため,イレギュラーネットワークにおいては,ルーティングアルゴリズムが,特に 性能に大きな影響を与える重要な要素となる.

イレギュラーネットワークをサポートする SAN としては, Autonet <sup>1</sup>[Mae91], Myrinet [N.J95, Myra], InfiniBand[I.T04] および RHiNET[TSJ<sup>+</sup>99, 西 宏 00, STH<sup>+</sup>00, NKN<sup>+</sup>01] などが挙げられる.これらの SAN では,次に説明するレギュラーネットワークも選択可 能である.

<sup>&</sup>lt;sup>1</sup>Autonet は, Local Area Network (LAN) としての利用を目的として開発されたネットワークであるが, SAN と共通する特徴を多数持つため,本論文では SAN の一例として扱っている.

### 2.1.3 レギュラーネットワーク

レギュラーネットワークは,各スイッチ間が,特定の規則に基づいて結合されるトポロ ジである.レギュラーネットワークは,通常,イレギュラーネットワークよりも高いバイ セクションバンド幅<sup>2</sup>を持ち,ネットワークの性能が特に重視される大規模並列計算機で は一般的に用いられている.SAN においても,大規模並列計算機に匹敵する高性能を目 的とする場合には,レギュラーネットワークが用いられることが多い.

以下,代表的なレギュラーネットワークについて説明する.

#### 2.1.3.1 n次元メッシュ

スイッチ間を格子状に接続したトポロジをメッシュと呼ぶ.図2.4は,4×4スイッチ構成の2次元メッシュを示している.図2.4の例では各次元のスイッチ数は等しいが,次元毎にスイッチ数が異なる構成も可能である.メッシュは,ネットワークの端に位置するスイッチとそれ以外のスイッチでは隣接するスイッチ数が異なるという特徴を持つ.これまで多くの並列計算機において,2次元メッシュもしくは3次元メッシュが用いられており, Intel Paragon[Int91], Stanford DASH[Dea92], MIT J-Machine[MDW93], MIT Reliable Router[Wea94] などで採用されている.



図 2.4: 2次元メッシュ(4×4スイッチ)

2.1.3.2 n次元 トーラス

メッシュにおいて,各次元の端のスイッチ同士を接続し,すべてのスイッチにおける隣 接スイッチの数を等しくしたトポロジをトーラスと呼ぶ.図2.5は,4×4スイッチ構成の 2次元トーラスを示している.トーラスを一般化したものは,*k*-ary *n*-cube と呼ばれ,*k* は 各次元のリングのスイッチ数を表し,*n* は次元数を表している.図2.5のトーラスは,4-ary

<sup>&</sup>lt;sup>2</sup>ネットワークを2つのサブネットワーク(それぞれノード数が等しい)に分割する際に切断される最小数のリンクのバンド幅の合計値を指す.バイセクションバンド幅が高いほど,トポロジの転送性能が高くなるが,実装コストも高くなる.

2-cube となる.近年の大規模並列計算機においては,3次元トーラスが用いられる場合が 多く,Cray T3D[Oed93],Cray T3E[ST96],Cray XT3[D.H] および BlueGene/L[ea02] な どで採用されている.



図 2.5: 2次元トーラス (4×4スイッチ)

2.1.3.3 Fat ツリー

Fat ツリー [C.E85] は,図 2.6 に示すように,複数のルートを持つ多重化されたツリー であり,ツリーのルート方向へのリンク数 p,ツリーの葉方向へのリンク数 q および階層 数 r の組合せ (p,q,r) で定義される. Fat ツリーでは, PC は葉スイッチにおいてだけ接 続され,一般的に  $q^r$  個の PC を接続することができる.図 2.6 は, (2,4,2)の Fat ツリー であり, 16 台の PC が接続可能となっている.



図 2.6: Fat ツリー (2,4,2)

近年, SAN におけるレギュラーネットワークとして Fat ツリーが用いられる場合が多い. 代表例としては, QsNET[PFH01, FFA<sup>+</sup>02], Myrinet, InfiniBand, などの SAN が挙 げられる.

# 2.2 ルーティングアルゴリズム

パケットが,出発地スイッチから目的地スイッチに到達するまでに経由するスイッチお よびチャネル(物理チャネルまたは仮想チャネル)は,ルーティングアルゴリズムによって 決定される.ここでは,SANにおけるルーティングアルゴリズムについて,パケット転 送に関連する基本的な要素と共に説明する.

### 2.2.1 パケット転送方式

SAN において,ネットワークを介して PC 間でやりとりされるメッセージは,パケットの形で転送される.パケットは,物理チャネルもしくは仮想チャネルを通じて,隣接スイッチ間またはスイッチと PC 間で転送され,出発地から1つ以上のスイッチを経由して目的地まで到達する.パケットの形式は,システムによって異なるが,一般的には,図2.7のように,目的地 PC の番号(ルーティング情報),パケット長などの情報を含むヘッダ部分とデータ本体から成る.多くのマシンでは,物理チャネルは,8 bit から大きいもので64bit 程度のデータ幅を持つが,1回の転送では,パケット全体を送り切ることができない.物理チャネルに1クロックで挿入することができる単位をフリットと呼び,1つのパケットは,フリットを単位として転送される.





パケット長は,固定の場合と可変を許す場合があるが,可変長の場合でも最大長は決まっている.可変長パケットは,ヘッダ内にパケット長を入れておき,各スイッチ,PC でパケットの終わりを検出できるようにしておくのが普通である.

パケット転送方式は、次の3方式に大別される.

- (a) Store-and-Forward 方式 (SF 方式)
  - 各スイッチは,パケット全体を格納することができるチャネルバッファを持つ.図 2.8(a)に示すように,各スイッチはパケット全体をチャネルバッファに受けとってから,順に次のスイッチに渡していく.

(b) **ワームホール**方式 (WH 方式)[DS87]

各スイッチは,基本的には,数フリット分を格納することのできるチャネルバッファ を持つ.図2.8(b)に示すように,パケットの先頭は,送り先のチャネルバッファが空 いている限り,次々と先のスイッチに進んでいく.パケットは複数のスイッチのチャ ネルバッファの列にまたがって格納され,全体がいも虫のように前進する.先頭が進 もうとするバッファが,他のパケットによって使われていた場合,パケットの進行は そこでストップし,チャネルバッファが空くのを待って前進を再開する.

(c) バーチャルカットスルー方式 (VCT 方式)[KK79]

SF方式同様,各スイッチはパケット全体を格納することのできるチャネルバッファ を持つ.しかし,ワームホール方式同様,パケットの先頭は,本体の到着を待つこと なしに次々と先のスイッチに進んでいく.パケットの先頭が,他のパケットによって ブロックされた場合,パケット本体の転送は停止することなしに,先頭フリットのあ るスイッチのチャネルバッファに格納される.



図 2.8: パケット転送方式

SAN では,パケットの転送を開始する場合,専用のハンドシェーク線を使ってハンド シェークを取るが,転送を開始した後,クロックに同期して1フリットごとに転送を行なっ ていく.

この際,WH方式の場合,受信バッファのオーバフローを抑えるために,先頭フリット がブロックされていないか,専用のハードウェアで監視する必要がある.一方 SF方式の 場合,パケットを受けとりつつ,次のスイッチに送ることはせず,受信バッファのオーバ フローも起きないためソフトウェア処理が可能である.

SAN では, PC 間の低レイテンシ通信を実現するため,通常,WH 方式もしくは VCT 方式が用いられる.これは,WH 方式および VCT 方式のパケット転送時間が,SF 方式 に比べてずっと短いためである.これは次の式より明らかである.

ここで,ネットワークにおいて,スイッチ間の距離の最大値を示す直径をD,パケット ヘッダのフリット数を $F_h$ ,本体(データ部)のフリット数を $F_b$ とし,1フリットを1クロッ クで転送可能であるとする.SF方式では,全スイッチで一通り,パケットを格納する必 要があるため,パケット転送に要する時間は

$$(F_h + F_b) * D$$

となる.これに対して, WH 方式および VCT 方式では, 各スイッチは, ヘッダの格納だけが必要なので

### $F_h * D + F_b$

となる.通常, ヘッダは数フリットですむため, 上記2式において,  $F_h$ の値は,  $F_b$ より もずっと小さくなる.つまり, SF方式では, 転送遅延が直径Dの影響を大きく受けるの に対し, WH 方式および VCT 方式では, 転送遅延が直径Dの影響を受けないことを示 している.

VCT 方式では,先頭フリットが他のパケットにブロックされた場合も,後続のフリットは停滞せずに進む.このため,VCT 方式はブロックされたパケットが他のパケットの進行を妨げることが少ない点で,WH方式より優れている.一方,WH方式では,スイッチの内部に,パケットヘッダ分のバッファを用意すればよいため,バッファサイズを最小に抑えることができる.このため,WH方式は,スイッチのハードウェア量の点で,VCH方式よりも優れている.

#### 2.2.2 仮想チャネル

WH 方式の問題点は,パケットの先頭がブロックされると,そのパケットは複数のスイッチのバッファを占有しながら停止してしまう点にある.この場合問題となるのは,図2.9のように,ブロックされたパケット A によりバッファが占有されるため,進行方向のバッファが空いているパケット B もブロックされてしまう点である.

そこで,図2.10に示すように,スイッチ内に別のバッファを設け,そのバッファが空い ているかどうかを判断するハンドシェーク線を独立に設ける.このようにすると,パケッ トBは,空いている方のバッファを利用して,ブロックされることなしに先に進むこと ができるようになる.この方法は,ちょうど一車線しかない道路では,右折する車によっ て後続車がすべてブロックされてしまうのが,二車線にして右折レーンを設けることによ り,ブロックがなくなるのに似ている.

新たに設けられたバッファは,バッファの量を増やすだけでなく,独立のハンドシェーク線を用いて,独立にパケット転送を行なうことが必要である.この手法では,それぞれのバッファにより,スイッチ間に仮想チャネルと呼ぶ仮想的な転送経路を作ることができる.仮想チャネルを利用したスイッチ間の転送制御を,仮想チャネルフロー制御と呼ぶ [Dal92].仮想チャネルフロー制御を行なうことにより,複数の仮想チャネルで共有される



図 2.9: パケットのブロック



図 2.10: 仮想チャネルの利用によるブロックの回避

物理チャネルの利用率が向上し,物理チャネル数を増やすことなしに,結合網の転送容量 を飛躍的に上げることができる.図2.10では2本の仮想チャネルを使っているが,必要に 応じて何本も設けることが可能である.

仮想チャネルは,物理チャネル利用率の向上という長所を持つが,仮想チャネルバッファ とハンドシェーク線の追加よるハードウェア量の増加という短所も抱えている.このため, 仮想チャネルは,必ずしもすべての SAN でサポートされているわけではない.

2.2.3 デッドロック

SAN におけるルーティングアルゴリズムでは,高性能かつ高信頼性の通信を実現するために,デッドロックに対する処理が特に重要となる [JSL02, 天野 96].

デッドロックとは,ネットワークを通過中のパケットが,起こる可能性がない事象を待ち続けることにより,転送することが不可能となる状態のことをいう.



図 2.11: デッドロックの例

デッドロックが発生するのは、パケットが利用するスイッチのチャネルバッファ間に、論 理的な循環構造が形成されるためである。図 2.11 にデッドロックの例を示す。図 2.11 で は、4 つのパケットが、それぞれ進行方向のチャネルバッファが空くのを待っているが、互 いに他のパケットが必要とするチャネルバッファを循環的に占有しあっているため、先に 進むことができなくなっている。デッドロックは、チャネルバッファが有限かつ循環構造 を形成する可能性がある限り、WH方式に限らず、VCT方式、SF方式でも生じるが、複 数のチャネルバッファを占有した状態でパケットがブロックされる WH 方式では特に発 生しやすい. 2.2.4 デッドロックリカバリー方式とデッドロックフリー方式

デッドロックの対応策として次の2つの方式がある.

- (a) デッドロックリカバリー方式
- (b) デッドロックフリー方式

デッドロックリカバリー方式は,デッドロックが発生した場合,パケットの廃棄,再送 処理等を行なうことにより,パケット転送を保証する方法である.しかし,一般的にデッ ドロックリカバリー方式は,

- デッドロックの検出およびデッドロックからの回復機構などが複雑になるためソフトウェアのオーバヘッドが大きくなる
- デッドロックが頻繁に発生すると性能が極端に低下する、

などの問題があるため,様々な研究 [ST97, ST99, KT95b, KT95a, KTJ96] が行われてい るものの, SAN において実装された例は,ほとんどない.

一方,デッドロックフリー方式は,ルーティングアルゴリズムによって定められるチャネル利用方法に制限を課し,パケット転送時に,図2.11のような循環構造の形成を防ぐ ことにより,デッドロックの発生を無くす方式である.このようなルーティングアルゴリ ズムは,デッドロックフリールーティングと呼ばれ,SANでは,高性能,高信頼性の通 信を実現するために必要である.このため,本論文においては,デッドロックフリールー ティングを対象としている.

## 2.2.5 固定型ルーティングと適応型ルーティング

SAN におけるデッドロックフリールーティングアルゴリズムは,大規模並列計算機と 同様に,固定型ルーティングと適応型ルーティングの2つに分類される.

固定型ルーティングは,出発地スイッチと目的地スイッチが決まると,常に同じ経路を 用いてパケット転送を行なう方法である.固定型ルーティングは次の長所を持つ.

- 経路選択のための機能が単純であるため、スイッチの実装コストが抑えられ、高速 化がしやすい。
- パケットが送信順に必ず到達する性質 (FIFO 性)を持つ.
- 経路が固定されているため,パケット配送エラーの検出が容易である.

このため,固定型ルーティングは,既存の高速スイッチ [Myra, PFH01, FFA+02] の多 くで採用されている.しかし,パケット転送中に動的に経路を選択することができないた め,次の短所を持つ.

混雑箇所の回避ができないため、ネットワークの資源を効率良く利用できない場合がある、

故障箇所をその場で迂回することができない(耐故障性を持たない).

適応型ルーティングは,出発地スイッチから目的地スイッチまでに複数の経路を用意し, 途中経路で動的な経路選択を行なってパケットを転送する方法である.適応型ルーティン グの機能は,適応型アルゴリズムと出力選択機構 (output selection function: OSF)の2段 階に分けられる.前者は,対象ネットワーク上のすべてのスイッチ間におけるデッドロッ クフリーな経路の集合(各スイッチ間の経路は1つ以上存在する)を提供する機能である. 一方,後者は,適応型アルゴリズムによって提供される隣接スイッチへの経路候補から一 つの経路を提供する機能であり,転送中のパケットが隣接スイッチに移動する際に実行さ れる[BP89, Wu96, Wu99].これらは互いに独立した機能であり,また,一般的に適応型 ルーティングの性能は適応型アルゴリズムによって決定される場合が多いことから,前者 を指して適応型ルーティングという場合も多い.本論文においても,適応型ルーティング における適応型アルゴリズムを対象としている.

適応型ルーティングは,固定型ルーティングと対照的に次の点が長所となる.

- 混雑箇所を迂回することにより, 空きチャネルを効率よく利用できる.
- 故障箇所をその場で迂回することが可能である(耐故障性を持つ).

このため,適応型ルーティングは,チャネル利用率の向上や動的な耐故障性の実現を目的とする場合に用いられる [Mae91].一方,適応型ルーティングでは,固定型ルーティングと対照的な次の点が短所とされる.

- 出力選択機能のため,実装が複雑となり,高速化がしにくい.
- FIFO 性の保証が難しい.

しかし,前者の問題については,実用化された Autonet で用いられているような単純 な選択機構 [Mae91, AMAH01] を用いて,並列に出力チャネルの状態をチェックするなど により,実用可能なレベルに抑えることが可能であると考えられている.また,後者の問 題についても,近年,複雑なハードウェアを用いずに,適応型ルーティングの機能面およ び性能面におけるアドバンテージを維持しつつ FIFO 性を保証するために,FIFO 転送法 [MJJ<sup>+</sup>05],一対制限法 [MJJ<sup>+</sup>05] が提案されている.両手法とも,各出発地 PC 毎に,1 つの目的地 PC に一度に送信可能なパケット数を制限する.FIFO 転送法では,同一目的地 PC への(前の)パケットの ACK (acknowledgment) を受信した後に,次のパケットをネッ トワークに注入することにより,目的地 PC におけるパケットのソートなしに FIFO 性を 実現する.一方,一対制限法では,同一目的地 PC へ一度に送信可能なパケット数を最大 で2つとすることにより注入制限を緩和して性能向上を図る.2パケット間で out-of-order 転送が生じるため,FIFO 性の実現のために目的地 PC におけるパケットのソートを必要 とするが,ACK と NACK (negative acknowledgment)を併用することにより,ソートの ために必要となるバッファサイズを数パケット分に抑えている.

以上より,将来的には,チャネル利用率の向上と動的な耐故障性が重視される場面など において,適応型ルーティングの需要が高まると考えられる.

## 2.2.6 ソースルーティング方式と分散ルーティング方式

パケットが,ルーティングアルゴリズムによって決定される経路情報を取得する方式は, ソースルーティング方式と分散ルーティング方式に分類される.

ソースルーティング方式では、各出発地スイッチにおいて、ルーティングアルゴリズム に基づいて、目的地スイッチに到達するまでの全経路情報が計算される.通常、全経路情 報は、起動時またはトポロジ構成が変化した際などに計算され、各出発地スイッチまたは PC 上のルーティングテーブルに格納される.目的地までの経路情報は,パケット生成時 に,ルーティングテーブルから取得され,パケットヘッダに格納される.ネットワークに 注入されたパケットは、ヘッダが途中スイッチに到達するたびに、ヘッダに格納された経 路情報に従って、次の移動先スイッチの決定と転送を行ない、これを目的地スイッチに到 達するまで繰り返す. ソースルーティング方式では, 各経由スイッチにおける経路決定処 理が簡素化されるため,スイッチの実装コストを抑えられるという利点を持つ.しかし, 全経路情報を格納するため、その分ヘッダ長のオーバヘッドが大きくなる.また、目的地 スイッチまでの経路が出発地スイッチで決定されるため,途中経路において動的に経路を 選択することができないという制限を持つ.このため,ソースルーティング方式における パケット転送は,固定型ルーティングとなる.ソースルーティング方式において,適応型 ルーティングにより提供される複数経路を利用することは可能であるが,この場合,経路 選択は出発地スイッチにおいてだけ可能となり,パケット転送は固定型ルーティングによ リ行なわれる.

分散ルーティング方式では,パケットが経路途中のスイッチに到達するたびに,スイッ チに実装された経路決定用ハードウェアにより,ルーティングアルゴリズムに基づいて移 動先隣接スイッチが決定される.一般的には,スイッチのルーティングテーブルに格納さ れた計算済の経路情報を参照する table-lookup 方式が用いられることが多い.分散ルー ティング方式では,中間スイッチにおいて,動的に経路を選択することが可能であるため<sup>3</sup>, 適応型ルーティングの長所を十分に活用することができる.また,ヘッダに格納される経 路情報が小さくて済むという利点も持つ.一方,スイッチの実装がより複雑となるため, ソースルーティング方式に比べて,実装コストの面で劣る.

<sup>&</sup>lt;sup>3</sup>ただし,動的な経路選択が可能かどうかはスイッチの実装に依存する.

# 第3章 関連研究

本章では,イレギュラーネットワーク向けに開発された既存のルーティングアルゴリズ ムとその問題点について述べる.また,第4章で提案する適応型ルーティングアルゴリズ ムである L-turn および R-turn ルーティングの適用対象となる代表的な SAN の実現例 についても述べる.

# 3.1 イレギュラーネットワーク向けの

# 既存のルーティングアルゴリズム

従来より,第2.1節で述べたメッシュやトーラスなどのレギュラーネットワークを対象 とする多くの固定型および適応型ルーティングアルゴリズムが,大規模並列計算機におけ る利用を目的として提案されてきた [DS87, LH91, GN92, DA93, Dua93, Dua94]<sup>1</sup>.しか し,これらのルーティングアルゴリズムは,対象とするトポロジの規則性に依存している ため,結合パターンに規則性を持たないイレギュラーネットワークには適用することがで きない.ここでは,SAN のイレギュラーネットワークに適用可能な既存のルーティング アルゴリズムに焦点を当てて説明する.

イレギュラーネットワーク向けのルーティングアルゴリズムは,大きく分けて,仮想チャ ネルや専用バッファなどの,スイッチまたは PC 上の付加的なハードウェアに依存しな い手法と,依存する手法に分類することができる.前者の例としては,Up\*/Down\*ルー ティング [Mae91], DFS スパニングツリーベースの Up\*/Down\* ルーティング [JAJ00], Smart ルーティング [LVT96], Adaptive-Trail ルーティング [QNR99],などがあり,後者 の例としては,構造化チャネル法 (Structured Buffer Pool)[MJ80], Minimal ルーティング [SD00], LASH ルーティング [SLT02], In-Transit バッファを利用する手法 [JPMJ02], 複 数スパニングツリーを利用する手法 [JPMJ02], DL ルーティング [MAH03] などが挙げら れる.これらのうち,後者の各ルーティングアルゴリズムは,次の長所を持つ.

- ほとんど、もしくはすべての経路において、トポロジ上の最短経路を取ることができる.
- 仮想チャネルの利用により、物理チャネルをより効率的に利用することができる。

このため,前者のルーティングアルゴリズムに比べて,優れたトラフィック分散と高スルー プットを実現している.しかし,これらのルーティングアルゴリズムは,付加的なハード ウェアに依存するため,汎用性に欠け,適用可能なネットワークが限定されるという問題 を持つ.そこで,本論文では,付加的なハードウェアに依存しないイレギュラーネットワー

<sup>&</sup>lt;sup>1</sup>これらのルーティングアルゴリズムの詳細については, [舟橋 99] でまとめられている.

ク向けのルーティングアルゴリズムを対象とする.以下,そのような既存の4つのルー ティングアルゴリズムについて説明し,その後,それらの問題点について述べる.

## 3.1.1 Up\*/Down\* ルーティング

Up\*/Down\* ルーティングは,イレギュラーネットワーク向けの代表的な適応型ルーティングであり,Autonet[Mae91] や Myrinet[N.J95] などの SAN において利用されている.

Up\*/Down\* ルーティングは,任意のトポロジに対して,デッドロックフリーと任意のス イッチ間の経路を保証するために,対象ネットワークに対してスパニングツリーのマッピ ングを行なう.スパニングツリーとは,ネットワーク内のすべてのスイッチを含むツリー のことである.スパニングツリーは,(1)循環が存在しない,(2)任意のスイッチ間の経路 が常に存在する,という特性を持ち,Up\*/Down\* ルーティングでは,この特性を利用する ことにより,デッドロックフリーと経路保証を実現する.スパニングツリーの構築方法は, breadth first search (BFS) に基づく.例として,Autonet では,minimum depth スパニ ングツリー (MDST)[Mae91] および propagation order スパニングツリー (POST)[RS91] などの BFS スパニングツリー構築アルゴリズムがある.これらは共に,スパニングツリー の高さが最小となることを念頭に置いている (POST では必ず最小となることが保証され ないが,ほとんどの場合に最小となることが Autonet では,確認されている [RS91]).こ こでは,POST によるスパニングツリー構築アルゴリズムを簡単に示す.

- (1) 全スイッチの中からスパニングツリーのルートスイッチを選択する.
- (2) ルートスイッチは, すべての隣接スイッチに join 要求メッセージを送信し, 要求を 受諾したスイッチを子としてスパニングツリーに追加する.
- (3) あるスイッチの子となったスイッチは、同様にすべての隣接スイッチに join 要求メッ セージを送信し、要求を受諾したスイッチ(既にスパニングツリーに含まれている スイッチは要求を拒否する)を自身の子としてスパニングツリーに追加する.
- (4) 全スイッチがスパニングツリーに含まれるまで(3)の作業を繰り返す.

スパニングツリー構築の完了後,ネットワーク上のすべてのチャネル (ツリーを構成す るチャネル (tree channel) とそれ以外のチャネル (outer channel)) に対して,次の規則に 基づいて up または down の方向を割当て,1次元の方向を持つ有向グラフを構築する.

- (1) up 方向を,次の2つの条件のいずれかを満たすチャネルに対して割当てる.なお, ここではスイッチ数を n とし,各スイッチには0からn-1までの,一意の整数の ID が割当てられているとする.
  - (a) 接続先のスイッチが接続元のスイッチよりもルートスイッチに近い.
  - (b) 接続先のスイッチと接続元のスイッチのルートスイッチからの深さが同一であ り,かつ,接続先のスイッチの ID が接続元のスイッチの ID よりも小さい.
- (2) down 方向を残りのすべてのチャネルに対して割当てる.



図 3.1: BFS スパニングツリーに基づいた有向グラフ

以上の手順により,図3.1のような有向グラフが構築される.

上記の方向割当てにより,有向グラフにおけるパケットの方向転換(ターン)は,up方向から down 方向 のターンと down 方向から up 方向 のターンの2つとなる.したがって,有向グラフ内で形成されるすべての循環構造は,これら2つのターンの連鎖により形成される.Up\*/Down\* ルーティングは,デッドロックフリーと経路保証の実現のために,次の規則に従って,ルーティングを行う.

すべてのパケットは,0回以上 up 方向に移動した後に,0回以上 down 方向 に移動して目的地スイッチまで到達する.

この条件により,パケットは down 方向から up 方向へのターンができなくなるため,こ れによりすべての循環構造が除去され,デッドロックフリーが保証される.また,up 方 向から down 方向へのターンを許可することにより,パケットは常にスパニングツリーの チャネルを経由した移動が可能となるため,これにより経路保証が実現される.

Up\*/Down\* ルーティングは,上記のように,パケットのターンにより形成される循環 構造に着目して,デッドロックフリーを実現しているため,対象ネットワークのチャネル の実装(物理チャネルまたは仮想チャネル)に依存することがない.

Up\*/Down\* ルーティングは,上記の条件を守る限り,自由に経路を選択できるが,通常は,任意の非最短経路を許した場合に発生しやすいホットスポット形成を抑えて効率的なルーティングを行なうために,選択可能な経路のうち最短となる経路だけを選択する.ただし,常にトポロジ上の最短経路を取ることができるわけではないので,Up\*/Down\*ルーティングは,非最短型の適応型ルーティングとなる.例えば,図3.1において,スイッチ5からスイッチ0へパケットを転送する場合には,スイッチ1またはスイッチ2を経由してスイッチ0まで到達することができるので,すべての最短経路を選択することができる.これに対して,スイッチ3からスイッチ5へパケットを転送する場合には,down方

向から up 方向への移動が必要となるため,スイッチ7を経由するトポロジ上の最短経路 は選択することができず,スイッチ0 1またはスイッチ0 2を経由する非最短経路 しか選択することができない.

Up\*/Down\* ルーティングの経路計算のための計算量は,スイッチ数を n とすると  $O(n^2)$  となる.なお,Up\*/Down\* ルーティングでは,1つ以上の経路が選択可能であるため,適応型ルーティングが可能となっているが,各出発地スイッチ,目的地スイッチ間の経路を1つに固定することにより,固定型ルーティングとして利用することも可能となっている. このため,Up\*/Down\* ルーティングは,固定型ルーティングだけをサポートしているネットワークにおいても利用可能であるという長所も持つ.

#### 3.1.2 DFS スパニングツリーベースの Up\*/Down\* ルーティング

Up\*/Down\* ルーティングの性能は、各チャネルに対する方向の割当て方に大きく影響 されるため、スパニングツリーおよび有向グラフの構築アルゴリズムが重要となる.そこ で、前節で述べた BFS スパニングツリーを利用する手法の改良案として、Sancho らによ る、ヒューリスティックルールに基づいた depth first search (DFS) のスパニングツリー を利用する手法が提案された [JAJ00, JA00].

この手法は, BFS スパニングツリーベースの手法に比べて, 禁止ターン数を減少する ことにより性能向上を図っており, 禁止ターン数の削減は, 次の2つの特徴により実現される.

- 各スイッチに対して一意のラベルを割当てることにより, BFS スパニングツリーに おける同階層スイッチ間の冗長な禁止ターンを削除する.
- DFS スパニングツリー構築時に,禁止ターン数がより少なくなるようなヒューリス ティックルールを利用する.

前節で述べた通り, BFS スパニングツリーベースの手法では, 同階層スイッチ間のチャ ネルに対する方向の割当てが, ランダムに配置されるスイッチの ID に依存しているため, 同階層チャネル間に冗長な禁止ターンが発生する可能性があるという問題が存在する.こ の問題の具体例として, BFS スパニングツリーベースの手法を9スイッチのイレギュラー ネットワークに適用した図 3.2 を示す.

図 3.2 では,同階層スイッチ間を結ぶ太線で示された一連のリンク(5 7 6 8 5) がリング状に接続されている.これらのリンク間では,スイッチ7と8の2箇所におい て down から up のターンが発生するため,これら2つのスイッチにおいて禁止ターンを 課すことにより循環構造が除去されている.しかし,1つのリング内の循環構造を除去す るためには,1箇所でだけ禁止ターンを課せばよいことは明らかであり,例えば,スイッ チ7とスイッチ6の位置を入れ替えることにより,スイッチ7における禁止ターンを無 くすことができる.しかし,BFSスパニングツリーベースの手法では,同階層スイッチの 各 ID はランダムに決定されるため,この問題を解決することは難しい.

このような問題の解決と,更なる禁止ターンの削減のために,次の手順に基づいて DFS スパニングツリーを用いた Up\*/Down\* ルーティングを構築する.



図 3.2: BFS スパニングツリーを用いた Up\*/Down\* ルーティングにおける 冗長禁止ターン

- (1) DFS スパニングツリーの構築
- (2) 各スイッチへのラベルの割当て
- (3) 各チャネルへの方向の割当て

#### 3.1.2.1 DFS スパニングツリーの構築

DFS スパニングツリーの構築は,ルートスイッチを選択した後,ルートスイッチを起点 とした深さ優先ベースの探索を行ない,訪問順に残りのスイッチをスパニングツリーに組 み込むことにより行なわれる.この手続きにより,まず,ルートスイッチを始点とし,す べての隣接スイッチが訪問済となったスイッチを終点とする main branch と呼ばれるパ スが構築される.main branch にすべてのスイッチが組込まれなかった場合には,未訪問 の隣接スイッチを持つスイッチを起点とした secondary branch と呼ばれるパスを同様に して構築し,これをすべてのスイッチがスパニングツリーに組込まれるまで再帰的に行な う.探索時に,次に訪問可能な隣接スイッチが複数存在する場合があるが,隣接スイッチ の選択は禁止ターンの削減を目的としたヒューリスティックルールに基づいて行なわれる.

例として,図3.2のネットワークに対しては,図3.3のようなDFSスパニングツリーが 構築される.なお,図3.3では,後述のラベル(整数値)との混同を避けるため,図3.2の 各スイッチとの対応をアルファベットのIDで表している.



図 3.3: DFS スパニングツリー

3.1.2.2 各スイッチへのラベルの割当て

DFS スパニングツリーの各スイッチに対して,一意となる整数(ラベル)を割当てる.ラ ベルの割当ては,main branch に含まれるスイッチに対しては,スパニングツリーを構築 する際の訪問順に従い,0から始まる昇順の整数を割当てる.一方,secondary branch に 含まれるスイッチでは,訪問順に従い,分岐スイッチのラベルから始まる降順の整数を割 当てる.これにより,secondary branch の葉スイッチに対しては,その branch の中で最 も小さい整数が割当てられる.

図 3.4 に,図 3.3 の DFS スパニングツリーにおけるラベル割当ての例を示す.



図 3.4: 各スイッチへのラベルの割当て

なお,図3.4 において,太い線は,スパニングツリーを構成するリンク (tree link) を示し,細い線は,スパニングツリー構成外のリンク (outer link) を示している.

#### 3.1.2.3 各チャネルへの方向の割当て

各スイッチに割当てられたラベルに基づいて, すべてのチャネルに対して, 方向 (up または down)の割当てが行なわれる. 接続先のスイッチのラベルが, 接続元のスイッチのラ

ベルより大きいチャネルに対して up 方向を割当て,その逆となるチャネルに対して down 方向を割当てる.

L(x)をスイッチ x に割当てられたラベルを返す関数とすると,上記の割当てにより, すべての循環構造において, L(y) > L(x) < L(z)が成立する (down 方向 から up 方向へ の移動が発生する) 3 つの連続したスイッチ x, y, zが存在する. Up\*/Down\* ルーティン グでは, down 方向から up 方向への移動を禁止するので, y = x = zおよび z = x = yの移動が禁止される.このため,すべての循環構造が除去され,デッドロックフリーが保 証される.

DFS スパニングツリーを用いる場合も,スパニングツリーを経由することにより常に 任意のスイッチ間でパケット転送が可能であるため,BFS スパニングツリーベースの手 法と同様に,経路保証が実現されている.また,各スイッチに対して,昇順または降順に 基づく一意のラベルが割当てられたことにより,BFS スパニングツリーベースの手法に おいて問題となった同階層チャネル間の冗長な禁止ターンが発生しなくなる.



例として,図3.4のグラフに対して方向を割当てた有向グラフを図3.5に示す.

図 3.5: DFS スパニングツリーを用いた Up\*/Down\* ルーティングにおける 各チャネルへの方向の割当てと禁止ターン

図 3.5 では,図 3.2 の BFS スパニングツリーベースの手法で発生した同階層チャネル間 の冗長な禁止ターンが存在しないことがわかる.実際に,図 3.2 では,34 個 (17 ペア)の 禁止ターンが存在するのに対し,図 3.5 では 30 個 (15 ペア) となっており,DFS スパニン グツリーベースの手法により禁止ターン数の削減が実現されている.

図 3.5 の有向グラフにおいて,自身以外のすべてのスイッチから up 方向だけの移動に より到達可能なスイッチは,スイッチ 8 (図 3.3 のスイッチ c) である.つまり,図 3.5 の 有向グラフ上のルーティングにおけるルートスイッチは,スイッチ 8 となる.これは,ス パニングツリー構築時の深さ優先探索におけるルートスイッチであるスイッチ 0(図 3.3 の スイッチ b) とは異なる.このように,DFS スパニングツリーベースの Up\*/Down\* ルー ティングでは,スパニングツリー構築時とルーティング時で,ルートとなるスイッチがそ れぞれ異なる.

DFS スパニングツリーベースの Up\*/Down\*ルーティングは, BFS スパニングツリー ベースの手法と同様に,選択可能な経路のうち最短となる経路だけを選択する.このため, 経路計算のための計算量は, スイッチ数を n とすると同様に  $O(n^2)$  となる.

3.1.2.4 DFS スパニングツリー構築時のヒューリスティックルール

第3.1.2.1 節で述べたように, DFS スパニングツリー構築における探索時に, 訪問可能 な隣接スイッチが複数存在する場合, 禁止ターンの減少を目的とした次のヒューリスティッ クルールに基づいて訪問スイッチの選択が行なわれる.

訪問スイッチ選択ヒューリスティックルール

既にスパニングツリーに組み込まれているスイッチとの接続数の最も多いス イッチを選択する.該当スイッチが複数存在する場合は,該当スイッチの中で, 残りのスイッチとの average topological distance (スイッチ間のトポロジ上の 最短距離)が最も大きいスイッチを選択する.

このヒューリスティックルールの狙いは,各スイッチにおいて形成される禁止ターンの パターンとして,図3.6の(c)のような,禁止ターンが集中(図では6つ存在)するパター ンを避け,可能な限り,(a)または(b)のような禁止ターンが少ない(図では0または2 つ)パターンを選択することにある.これにより,冗長な禁止ターンの削除に加えて,更 なる禁止ターンの削減を図っている.



図 3.6: スイッチに接続されるリンクの方向と禁止ターン

なお, Sancho らは, ルートスイッチの選択が Up\*/Down\* ルーティングの性能に影響 を受けることに着目し, ルートスイッチの選択における次のようなヒューリスティックルー ルについての提案 [JA00] も行なっている.
ルートスイッチ選択ヒューリスティックルール

対象ネットワークのすべてのスイッチに対して, 各々をルートとした場合の

(a) ルーティングアルゴリズムによって決定される各スイッチ対の最短経路,

(b) crossing path(各チャネルを通過する経路数の中の最大値を示す),

(c) average distance(各スイッチ対の最短経路の平均距離を示す)

をそれぞれ計算する.これらのうち, crossing path が最小値となるルートスイッチを選択する.もし, crossing path の最小値が同数の場合, average distance が最小値となるルートスイッチを選択する.

このヒューリスティックルールの狙いは, crossing path を最小とすることによってトラフィックの分散を図ることであり, また, average distance についても考慮することによって, crossing path が同数の場合には,より多くの最短経路が選択可能となることを図っている.このヒューリスティックルールが必要とする計算量は,スイッチ数をnとすると, $O(n^3)$ である.

ルートスイッチ選択のヒューリスティックルールは,DFS スパニングツリーベースの Up\*/Down\* ルーティングだけでなく,BFS Up\*/Down\* ルーティングを始めとするスパ ニングツリーベースの任意のルーティングアルゴリズムに対して適用可能であり,一般性 の高い手法となっている.

## 3.1.3 Smart ルーティング

Smart ルーティング [LVT96] は,スパニングツリーでなく, channel dependency graph (CDG)の構築をベースとしてデッドロックフリーを実現する適応型ルーティングアルゴリズムである. CDG とは,対象とするトポロジにおける channel dependency を表した有向グラフである.例として,図 3.7(a)の $2 \times 2$ スイッチの2次元メッシュにおける CDG は,図 3.7(b)のように表される.図3.7(b)において,各ノードが図3.7(a)の各チャネルを表し,各チャネルが,図3.7(a)の各チャネル間の channel dependency を表す.



図 3.7: 2次元メッシュ(2×2スイッチ)の CDG

Smart ルーティングは,対象トポロジにおける CDG を構築した上で,CDG 内で形成さ れる循環構造を一つずつ識別し,循環構造を形成するいずれか 1 つの channel dependency を切断することにより循環構造の除去を行なう.トラフィックの分散を実現するために,循 環構造除去のために切断される channel dependency は,average path lengths (すべてのス イッチ間の最短経路長の平均値)が最小となるものが選択される.この選択の際に,循環構 造を形成するすべての channel dependency について, channel dependency を切断した場 合の average path lengths の計算が breadth first search (切断された channel dependency は移動不可とする)によりそれぞれ行なわれる.上記の手続きは,CDG において循環構 造が形成されなくなるまで行なわれる.なお,適切でない channel dependency の切断を 行なった結果,手続きの途中でどの channel dependency を切断しても,あるスイッチ間 における経路が切断されてしまう循環構造が識別される場合がある.このような場合にお いてだけ,循環構造除去の手続きを tree mode によって最初からやり直す.tree mode で は,まず,トポロジ上で breadth first search によるツリー構造 (backbone)の構築を行な う.そして,経路保証の実現のために,ツリーを構成するリンク間の channel dependency は切断しないものとして,同様に循環構造の識別と除去の手続きが行なわれる.

1つの循環構造除去のために1つの channel dependency を切断する際,多くの場合,それ以外の複数の循環構造も同時に除去される.このため,上記の手続きの結果切断された channel dependency の幾つかは,切断しなくても循環構造が形成されることがない.そのような channel dependency は,経路選択の自由度を高めるために,切断を解除される.

上記の手続きのための計算量は,スイッチ数をnとすると $O(n^9)$ となる.ただし,平均的には $O(n^4)$ で収まるとされている.

Smart ルーティングでは、切断されていない channel dependency を利用することに より各スイッチ間で1つ以上の経路を選択することができるため、適応型ルーティング が可能となる.また、CDGの構築をベースとしてデッドロックフリーを実現するため、 Up\*/Down\* ルーティングと同様に、仮想チャネルなどの付加的なハードウェアに依存す ることがない.

## 3.1.4 Adaptive-Trail ルーティング

Adaptive-Trail ルーティング [QNR99] は, Eulerian trail をベースとした adaptive trail と呼ばれるパスを用いてデッドロックフリーを実現する適応型ルーティングアルゴリズム である.

Eulerian trail は,対象トポロジ上のすべてのリンクをそれぞれ一度だけ辿ることによ り構築されるパスであり,各リンクが双方向チャネルから成るネットワークでは,互いに 反対の方向に向かう2つの Eulerian trail が形成される.各 Eulerian trail では,すべて のスイッチが循環の無い単方向の CDG に沿って接続されているため, Eulerian trail 上 でルーティングを行なうことにより,任意のスイッチ間の経路とデッドロックフリーが保 証される.しかし,Eulerian trail 上だけのルーティングでは,各スイッチ間においてト ポロジ上の最短経路を選択できない場合が多く,また,選択可能な経路数も限られる.

Adaptive-Trail ルーティングは, 各 Eulerian trail に shortcut を追加した adaptive trail と呼ばれる パスを構築し, 2 つの adaptive trail のいずれかの上でルーティングを行なう

ことにより,より多く,かつ,分散された最短経路とそれによるトラフィック分散の実現を 図る.adaptive trail に追加される shortcut は,free-style shortcut, destination shortcut, source shortcut の3つに分類される.これらのうち,free-style shortcut は任意のパケッ トが利用可能であるが,destination shortcut と source shortcut は,利用可能となるパ ケットが制限される.前者は,接続先のスイッチを目的地とするパケットだけを対象とし, 後者は,接続元のスイッチを出発地とするパケットだけを対象としている.追加された各 shortcut について,デッドロック発生の可能性がチェックされ,発生の可能性があると判 定された shortcut は除去される.これにより,adaptive trail に沿ったルーティングは, デッドロックフリーが保証される.また,adaptive trail 上では,各スイッチ間で1つ以 上の経路を選択することができるため,同様に適応型ルーティングが可能となる.

Adaptive-Trail ルーティングの経路計算のための計算量は,チャネル数を m とすると  $O(m^2)$  となる. Adaptive-Trail ルーティングは, Eulerian trail をベースとしているため, Up\*/Down\* ルーティングと同様に,仮想チャネルなどの付加的なハードウェアに依存す ることがない.しかし,対象トポロジ上で Eulerian trail が構築可能であることの必要十 分条件は,すべてのスイッチの degree が 偶数である,または,2つのスイッチだけが奇 数の degree を持つ,となる.このため,この条件を満たさないトポロジに対しては適用 することができない.また、各トポロジにおける対処可能な故障パターンが限定されるた め、耐故障性が若干落ちる。

## 3.1.5 既存のルーティングアルゴリズムにおける問題点

前述の付加的なハードウェアに依存しない 4 つのルーティングアルゴリズムは,スパニ ングツリーをベースとする手法 (BFS および DFS Up\*/Down\* ルーティング) と,それ以 外の手法 (Smart ルーティングおよび Adaptive-Trail ルーティング) の 2 つに分類される.

Up\*/Down\* ルーティングでは, up と down の 2 つの方向だけの 1 次元有向グラフを ベースとしているため,図 3.8 のように,禁止ターンが形成される 1 つのスイッチ上の 2 リンク間において,互いに反対の方向に向かう禁止ターンのペアが必ず形成される.



図 3.8: Up\*/Down\* ルーティングにおける禁止ターンペアの形成

図 3.8 において, スイッチ B と C に 1 つ, スイッチ A には 3 つの禁止ターンペアがそ

れぞれ形成されている.このような禁止ターンの偏りにより,ネットワーク内のトラフィックに偏りが生じやすくなり,ネットワークバンド幅の有効利用が困難になるという問題が 発生する.

この問題を改善するためには,禁止ターンの集中を緩和する必要があるが,第3.1.1節 で述べたように,1次元有向グラフでは,up down および down up の2つのター ンしか存在せず,また,経路保証のために up down のターンを禁止することができな いため,本質的に,禁止ターンを分散させるための選択の余地がない.

DFS ベースの手法では, ヒューリスティックルールに基づいてスパニングツリーを構築 することにより,図3.8のような同一スイッチ上における禁止ターンペアの集中を可能な 限り避け,禁止ターンを削減することにより性能向上を図っている.しかし,図3.5のよ うに,常に回避することができるわけではなく,また,禁止ターンペアの形成は1次元有 向グラフの利用を起因とするため,DFS ベースの手法は上記の問題の根本的な解決となっ ていない.

一方,Smart ルーティングと Adaptive-Trail ルーティングは,CDG または Eurelian trail の構築をベースとすることにより,Up\*/Down\* ルーティングにおけるトラフィック 集中の改善を図っている.しかし,これらの手法は,汎用性の面でそれぞれ大きな問題を 抱えている.まず,Smart ルーティングは,計算量が最悪の場合  $O(n^9)$  となり,これは 現実的な許容範囲を超えている.また,Adaptive-Trail ルーティングは,トポロジによっ ては,Eulerian trail が構築できないため,任意のトポロジに適用可能ではない.

各ルーティングアルゴリズムについては,表3.1の通りにまとめられる.表3.1の計算 量において,*n*はスイッチ数,*m*はチャネル数を指す.

|            | BFS                             | DFS                             | Smart    | Adaptive |
|------------|---------------------------------|---------------------------------|----------|----------|
|            | $\mathrm{Up}^*/\mathrm{Down}^*$ | $\mathrm{Up}^*/\mathrm{Down}^*$ |          | Trail    |
| スパニングツリー利用 | yes                             | yes                             | no       | no       |
| 禁止ターン集中    | high                            | medium                          | -        | -        |
| トポロジフリー    | yes                             | yes                             | yes      | no       |
| 計算量        | $O(n^2)$                        | $O(n^2)$                        | $O(n^9)$ | $O(m^2)$ |

表 3.1: 付加的なハードウェアに依存しないルーティングアルゴリズムの比較

以上より,既存の各ルーティングアルゴリズムは,それぞれ性能面または汎用性における問題を抱えている.しかし,現実には,高い汎用性を持つ Up\*/Down\* ルーティングが,性能面における問題点を抱えつつも,イレギュラーネットワーク向けのルーティングアルゴリズムとして一般的に利用されている.そこで,本研究では,Up\*/Down\* ルーティングと同等の高い汎用性を実現し,Up\*/Down\* ルーティングにおけるトラフィック集中の問題を解決する適応型ルーティングアルゴリズムである L-turn および R-turn ルーティングを提案する.

L-turn および R-turn ルーティングは,高い汎用性を実現するために,Up\*/Down\* ルーティングと同様に,スパニングツリーと有向グラフの構築をベースとしている.しか し,2次元に拡張された有向グラフを導入し,2次元 Turn モデルを適用することにより, Up\*/Down\* ルーティングにおけるトラフィック集中の問題改善を図っている.

## 3.2 SAN の実現例

本節では, Up\*/Down\* ルーティングおよび第4章で提案する L-turn および R-turn ルー ティングの適用対象となる代表的な SAN の実現例として, Autonet, Myrinet, QsNET, InfiniBand および RHiNET について説明する.

#### 3.2.1 Autonet

Autonet [Mae91, RS91] は, 10 Mbps のイーサネットに代わる,より高速かつ実用的な LAN の実現を目的として開発されたネットワークである.Autonet では,高性能,高可 用性および耐故障性を実現するために,SAN の基本となる様々な技術が用いられている.

各スイッチ間は,バス接続ではなく,より高速な 100Mbps の 全二重 point-to-point リ ンクで接続される.各スイッチは,12ポートのクロスバを持ち,低レイテンシ転送の実現 のため,cut-through 方式によるパケット転送が行なわれる.リンク長は,同軸ケーブル で 100 m,光ファイバで 2 km までサポートしており,バッファオーバフローの発生を防 ぐために,受信 FIFO バッファが半分以上埋まった時に,送信側に対してパケット転送停 止の信号を送る start-stop フロー制御を利用している.

Autonet は,任意のトポロジをサポートしており,トポロジの状態を定期的に監視する ことにより,スイッチやリンクの状態が変化(追加,故障など)した際に,自動的に再構 成(トポロジ情報の取得およびルーティングテーブルの更新など)を行なう.これにより, 高い可用性と耐故障性が実現されている.トポロジ情報の取得やルーティングテーブルの 更新は,各スイッチの制御用プロセッサ上で実行されるAutopilot と呼ばれるソフトウェ アにより行なわれる.任意のトポロジをサポートするために,ルーティングアルゴリズム は,分散ルーティング方式による 適応型の Up\*/Down\* ルーティングが用いられている. これにより,複数経路を利用した効率的なパケット転送が可能となっている.

#### 3.2.2 Myrinet

Myrinet [N.J95, Myra] は, Myricom 社により開発された現在の主要な SAN の1つで あり,高性能,高可用性を要求する PC クラスタを中心に広く用いられている.

現在の Myrinet の主要バージョンである Myrinet-2000 は, 2Gbps の高速な point-topoint リンクにより相互接続された 16 ポートまたは 32 ポートのクロスバを持つスイッチ から構成される.パケット転送方式として高速な WH 方式を用い,また,任意のトポロ ジおよび自動的な再構成をサポートしている.ルーティングアルゴリズムは,ソースルー ティング方式による Up\*/Down\* ルーティングが用いられる.ソースルーティング方式で あるため,パケットは途中スイッチで動的な経路選択を行なうことはできないが,出発地, 目的地間に複数の経路が存在する場合は,出発地スイッチにおいて経路選択を行なうこと ができる.

Myrinet では Glenn's Messages (GM) および Myrinet Express (MX) と呼ばれるローレベルメッセージパッシングシステムが用意されており、これにより、トポロジ情報の取

得およびルーティングテーブルの計算,セキュアなユーザレベルゼロコピー通信<sup>2</sup>および 高信頼性のメッセージパッシング,などが実現されている.

Myrinet-2000 のネットワークインタフェースは,LANai X [Myrb] と呼ばれる制御用 チップを備えている.LANai X には,LANai コア (プロセッサとパケットインタフェース を持つ),X-port と呼ばれるマルチプロトコルポート,ローカルバス,PCI-X インタフェー スなどが実装されており,プロセッサ上で動作する Myrinet Control Program (MCP) に より GM API の処理などが行なわれる,

#### 3.2.3 QsNET

QsNET[PFH01, FFA<sup>+</sup>02] は, Quadrics 社により開発された PC クラスタ向けの主要な SAN の 1 つである.

現在の主要バージョンは, QsNET II であり, 8.5Gbps の高速な point-to-point リンク により相互接続された 8 ポート (それぞれ 2 つの仮想チャネルを持つ)の Elite4 スイッチ から構成される.パケット転送方式として, WH 方式を用い,トポロジは Fat ツリーだ けをサポートしている.このため, Fat ツリー上を階層構造に沿って,単純に,出発地の 葉スイッチから up し,目的地の葉スイッチまで down するルーティングアルゴリズム<sup>3</sup>が 用いられ, Myrinet と同様に,ソースルーティング方式により実装されている.

QsNET II のネットワークインタフェースは, Elan4 と呼ばれる通信制御用プロセッサ を持つ. Elan4 は, 64bit の RISC プロセッサ, DMA エンジン, MMU (メモリマネージ メントユニット), 32kbyte キャッシュメモリ, PCI-X および SDRAM インタフェース, な どにより構成される. Elan4 は,高位の通信ライブラリをホストプロセッサの介在無しに 高速に処理するなどの,低レイテンシ,高バンド幅通信のための様々な機能を備えている.

### 3.2.4 InfiniBand

InfiniBand[I.T04] は, PC クラスタにおける PC 間通信, およびサーバクラスタにおけるサーバ I/O 間通信などにおける利用を目的として標準化された高性能 I/O ネットワークである. InfiniBand の標準化は, IBM, Intel, Hewlett-Packard, Microsoft などの多数の企業の参加により設立された InfiniBand Trade Association (IBTA) により進められており, プロプライエタリな Myrinet や QsNET などと異なり, オープンな規格となっているのが大きな特徴である.

現在の InfiniBand の規格は, 2004 年 10 月に発表された InfiniBand Architecture (IBA) Specification 1.2 であり, Voltaire 社<sup>4</sup>, SilverStorm Technologies 社<sup>5</sup>などにより製品化が 行なわれている.

<sup>&</sup>lt;sup>2</sup>PC 間の通信の際,通常,ホスト内ではシステムコールを介してカーネルが主記憶からネットワークイン タフェースへ複数回のコピーを通してデータを転送する.これに対し,システムコールなどのオーバヘッド を避けるために,ユーザプロセスが直接ネットワークインタフェースにアクセスして通信を行う方法をユー ザレベル通信と呼ぶ.また,ホスト内のデータコピーの回数を減らすためにネットワークインタフェースが 主記憶のデータを直接読み書きする方法をゼロコピー通信と呼ぶ.ユーザレベルゼロコピー通信とはユーザ レベルで実現するゼロコピー通信のことである.

 $<sup>^{3}</sup>$ Up\*/Down\* ルーティング , L-turn および R-turn ルーティングによりエミュレートすることが可能 $^{4}$ http://www.voltaire.com/

<sup>&</sup>lt;sup>5</sup>http://www.silverstorm.com/

InfiniBand は,他の SAN と同様に,point-to-point リンクで相互接続されたスイッチ ベースのネットワークである.リンクあたりのデータ転送レートは,2Gbps であり,4本ま たは12本のリンクを並列に利用することにより,8Gbps または24Gbps に拡張すること が可能である.また,IBA 1.2 では,DDR(Double Data Rate) および QDR(Quad Data Rate) により更に2倍,4倍となるデータ転送レートが実現されている.

InfiniBand ネットワークの構成単位はサブネットと呼ばれ,サブネットは,エンドノード (PC または I/O デバイス),スイッチ,スイッチ間リンク,サブネットマネージャにより構 成される.また,エンドノードとリンク間のインタフェースは Channel Adapter(CA)<sup>6</sup>と 呼ばれ,各 CA の各ポートと各スイッチに対して,サブネット内のルーティングに用いら れる Local Identifiers (LID) がサブネットマネージャにより割当てられる.

InfiniBand では, 任意のトポロジが選択可能であり, ルーティング (実装はベンダ依存) は, 各スイッチが持つルーティングテーブルを参照する分散ルーティング方式となる.また,パケット転送方式としては cut-through 方式が用いられる.ただし,利用経路は,目 的地 CA ポートの LID により一意に定まるため,固定型ルーティングとなり, Myrinet, QsNET と同様に,出発地 CA においてだけ複数経路が選択可能となる.

InfiniBand においても Up\*/Down\* ルーティングは適用可能であるが,途中スイッチ における出力チャネル決定が,目的地の LID だけをインデックスとして行なわれるため, Autonet や Myrinet と異なり,そのままでは適用することはできない.このため,(1) 最 短経路の割合をある程度犠牲にする方式 [JAJ01],もしくは,(2) destination renaming<sup>7</sup>を 実装する方式 [PJJ01] などを用いて適用が可能となる.

InfiniBand では,仮想チャネルに相当する最大15本の仮想レーンをデータトラフィックに使用することができる.仮想レーンは,Quality of Service (QoS),トラフィッククラスの分離などの他に,デッドロック回避のためにも利用可能となっている.このため,仮想チャネルを必要とするルーティングアルゴリズムを実装することも可能となっている.

#### 3.2.5 RHiNET

RWCP High Performance Network (RHiNET)[TSJ<sup>+</sup>99, 西 宏 00, STH<sup>+</sup>00, NKN<sup>+</sup>01] は, RWCP,日立製作所および慶應義塾大学天野研究室により開発されたネットワーク<sup>8</sup>で あり,高速な光インターコネクトと高速なスイッチにより,商用の SAN に匹敵する高性 能,高信頼性通信を実現している.RHiNET は,マシンルーム内の PC 間接続だけでな く,オフィス,もしくはビルのフロア内の PC 間接続に焦点を当てている.RHiNET の 実装としては,これまでに,RHiNET-1,RHiNET-2 および RHiNET-3 が開発されてい る.ここでは,RHiNET-3 について述べる.

RHiNET-3 は, ネットワークインタフェースのコントローラである Martini と高速な光 リンクで相互接続された RHiNET-3/SW スイッチにより構成される. RHiNET-3 では, 任意のトポロジが利用可能であり, ルーティングは, 固定型の構造化チャネル法が用いら

 $<sup>^{6}\</sup>mathrm{PC}$ の NIC に相当する Host CA (HCA) と I/O デバイスの NI に相当する Target CA (TCA) に分類 される

<sup>&</sup>lt;sup>7</sup>経路選択を柔軟に行うために,同一の目的地に対して複数の識別子を与え,経路制御をおこなう方法

<sup>&</sup>lt;sup>8</sup>提案者は SAN をマシンルームなどで、トポロジに制限を与え、短いリンク長で集中配線したネットワークであると狭義し、RHiNET がこの SAN と LAN の特徴を持つという点で Local Area System Network (LASN) と呼んでいる.

れる.このために,リンクあたり 32本の仮想チャネルが用意されている.ルーティング としては,Up\*/Down\* ルーティングを適用することも可能である.また,ルーティング 方式は,分散ルーティング方式とソースルーティング方式の両方をサポートしている.

RHiNET-3/SW は,0.14 µm CMOS エンベッデッドアレイで構成される1チップス イッチであり,高速な10 Gbpsのリンクバンド幅を持つ.また,リンクレベルのエラー 検出と修正,再送機構を塔載し,エラーレートの高い安価な媒体を用いた場合にもハード ウェアのレベルで信頼性を確保し,通信のソフトウェアオーバヘッドの削減を実現する. 1kmのリンク長をサポートするため,フロー制御として credit based 方式を採用してい る [NKN<sup>+</sup>01].

Martini は,ユーザレベルゼロコピー通信をサポートするためにユーザメモリ領域のプロテクション,アドレス変換機構などの機能をすべてハードウェアで高速に処理する.また,ハードウェアで実装されていない通信処理をコアプロセッサのソフトウェアで実現するといった高い柔軟性も併せ持つ.

3.2.6 SAN の実現例のまとめ

最後に,上記 5 つの SAN の実現例についてまとめたものを,表 3.2 に示す.

|                      | Autonet | Myrinet | InfiniBand | QsNET | RHiNET |
|----------------------|---------|---------|------------|-------|--------|
| トポロジフリー              | yes     | yes     | yes        | no    | yes    |
| 仮想チャネル利用可            | no      | no      | yes        | yes   | yes    |
| ルーティングアルゴリズム         | 適応型     | 固定型     | 固定型        | 固定型   | 固定型    |
| ルーティング方式             | 分散      | ソース     | 分散         | ソース   | 分散/ソース |
| Up*/Down* <b>適用可</b> | yes     | yes     | yes        | -     | yes    |
| L-turn/R-turn 適用可    | yes     | yes     | yes        | -     | yes    |

表 3.2: 既存の SAN の比較

L-turn および R-turn ルーティングは,表 3.2 に示すように,理論上,イレギュラー ネットワークをサポートする既存の SAN において適用可能である.これは,前述の通り, L-turn および R-turn ルーティングは,Up\*/Down\* ルーティングと同等の高い汎用性を 持つため,Up\*/Down\* ルーティングが適用可能なネットワークであれば,同様に適用可 能となるためである.なお,QsNET で用いられる Fat ツリー上のルーティングについて も,Up\*/Down\* ルーティング,L-turn および R-turn ルーティングによりエミュレート が可能であるが,これらを適用する意義に欠けるため,対象外としている.

# 第4章 L-turn/R-turn ルーティング

第 3.1.5 節で述べたように, Up\*/Down\* ルーティングにおける主な問題点は,次の2点である.

- 禁止ターンが形成されるスイッチ上では、常に禁止ターンのペアが発生するためトラフィックの偏りが発生しやすい
- 禁止ターン選択に自由度がないため禁止ターン分散の余地がない

これらの問題点は,1次元有向グラフにおける次の2つの特性に起因している.

- up と down の 2 つの方向だけが存在
- パケットの移動に伴ない発生するターンが 2 つだけに限定される

そこで,本章では上記の問題点を改善するために,Up\*/Down\* ルーティングで利用され ている1次元有向グラフを拡張して H/V (Horizontal/Vertical) グラフと呼ばれる2次元 有向グラフを導入する[AMAH02,上樂03].H/V グラフの導入により,形成可能なター ンの数は従来の6倍である12パターンに増加するため,トラフィックの分散を考慮した, より柔軟な禁止ターンの選択を行なうことが可能となる.

H/V グラフに基づいてトラフィック分散を考慮したルーティングアルゴリズムを設計す る際には,次の2つの条件を満たすことが重要となる.

- 必要最低限の禁止ターンだけを選択して,デッドロックフリーを実現する
- 可能な限り、分散された禁止ターン集合を選択する

H/V グラフの導入により,トラフィック分散実現のためのより柔軟な禁止ターンの選択 を行なう余地が生まれるが,一方で,1次元有向グラフに比べてより多くの複雑な循環構 造が形成されるため,その識別が難しくなるという問題も生じる.このため,H/V グラフ に対して上記2つの条件を考慮した禁止ターン選択を行なう方法は,極めて直観的な選択 による Up\*/Down\* ルーティングに比べて非常に複雑なものとなる.そこで,本章では, 2次元 Turn モデルの適用によるシステマティックな手法を用いてそのような禁止ターン 選択を行ない,トラフィックの分散を図る L-turn ルーティングおよび R-turn ルーティン グと呼ぶ適応型デッドロックフリールーティングアルゴリズムを提案する.L-turn および R-turn ルーティングは,仮想チャネルやバッファなどの付加的なハードウェアを必要と しないため,Up\*/Down\* ルーティングが適用可能なすべての SAN において適用可能と なっている.

以降,第4.1節で H/V グラフの構築手順を示し,第4.2節で,2次元 Turn モデルの適 用により L-turn および R-turn ルーティングを導出するシステマティックな手法を示す. そして,第4.3節で,L-turn および R-turn ルーティングの開発における研究過程と筆者 が担当した作業内容を示し,本論文の位置付けについて述べる.

# 4.1 H/V グラフの構築

horizontal direction と vertical direction の2つの方向を持つ2次元有向グラフである H/V グラフは,次の3つのステップにより構成される.

- (1) BFS スパニングツリーを構築する.
- (2) 各スイッチに 2 次元座標を割当てる.
- (3) 各チャネルに2次元方向を割当てる.

## 4.1.1 BFS スパニングツリーの構築

まず, Up\*/Down\* ルーティングと同様にして, BFS スパニングツリーの構築を行なう. そして,構築した BFS スパニングツリーの階層構造を反映した座標である depth を各ス イッチに対して割り当てる.depth は,各スイッチのルートスイッチからの最短距離を示 し,各チャネルの垂直軸における方向 vertical direction (up および down)の決定に用い られる.ルートスイッチ自身の depth は0 であり,同階層の各スイッチに対しては,そ れぞれ同一の depth が割当てられる.

定義 1 (depth) 各スイッチのルートスイッチからの最短距離を depth とする.

例として,9スイッチ構成のイレギュラーネットワークに対する depth の割当てを図 4.1 に示す.図の実線と破線はそれぞれスパニングツリーを構成するリンク (tree link) とそれ 以外のリンク (outer link) を示している.



図 4.1: depth の割当て

#### 4.1.2 各スイッチへの 2 次元座標の割当て

次に,2次元有向グラフを構築するための拡張として,depthに加えて各スイッチに対し horizontal spread を割当て,水平軸における方向 horizontal direction (left および right) の概念を導入する.

horizontal spread は,構築したスパニングツリー上で,前順走査<sup>1</sup>を行なったときの訪 問順序であり,走査における訪問順にしたがって,0から始まる昇順の値が各スイッチに 割当てられる.

定義 2 (horizontal spread) スパニングツリー上で,ルートスイッチを起点とした前順走 査を行ない,訪問順にしたがって各スイッチに割当てる 0 から始まる昇順の値を horizontal spread とする.

horizontal spread を前順走査により割当てている理由は,スパニングツリーにおける経 路保証と各スイッチに対する一意の depth および horizontal spread の組合せ(2次元座 標)の割当てを実現するために,次の2つの条件を満たす必要があるためである.

(a) 子スイッチの horizontal spread が常に親スイッチよりも大きい.

(b) 各スイッチの horizontal spread は互いに異なる.

前者の条件により, depth と同様にして, horizontal spread が小さくなる方向に進むこ とにより任意のスイッチからルートスイッチに到達可能となり, また, 大きくなる方向に 進むことによりルートスイッチから任意のスイッチへ到達可能であることが保証される. 一方,後者の条件により, depth と horizontal spread の組合せが同一となるスイッチが 存在しないことが保証される (同じ depth を持つスイッチは存在するが, 同じ horizontal spread を持つスイッチは存在しない).

horizontal spread は,図4.2 に示すように,直観的には,スパニングツリー上の水平方向における座標を表すものであり,各チャネルの horizontal direction および,同じ depth を持つスイッチ間の vertical direction の決定に用いられる.

以上より,各スイッチに対して horizontal spread (h) と depth (d) の組合せから成る一意の 2 次元座標 (h, d) を割当てることが可能となる.

例として,図4.1のネットワークに対する horizontal spread および2次元座標の割当 ては,図4.2の通りとなる.

前順走査においては,次に訪問するスイッチとして2つ以上の子スイッチが選択可能となる場合があるため,複数の選択ポリシーが適用可能である.このため,同一ネットワークに対する horizontal spread の割当て方は複数通り存在し,これにより異なる有向グラフが構築されうる.訪問スイッチの選択ポリシーについては,第4.2.5節で説明する.

<sup>&</sup>lt;sup>1</sup>ルートスイッチを起点として,スパニングツリー上の各スイッチを一つずつ訪問することを走査と呼ぶ. 親スイッチを訪問してから,子スイッチを順番に訪問する走査を前順走査[石畑 89]と呼ぶ.



図 4.2: depth と horizontal spread の割当て

## 4.1.3 各チャネルへの 2次元方向の割当て

各スイッチに割当てられた 2 次元座標を基に, 各チャネルに対する horizontal direction と vertical direction の割当てを行ない, H/V グラフの構築に必要となる H/V direction の割当てを行なう.

まず,次のようにして horizontal direction (left/right) を各チャネルに割当てる.

定義 3 (horizontal direction) 座標  $(x_s, y_s)$  から座標  $(x_d, y_d)$  に向かうチャネルにおい て,次のように *horizontal direction* を定める.

 $(a) x_s > x_d$ ,ならば left方向を割当て,

 $(b) x_s < x_d$ ,ならば right 方向 を割当てる.

次に,同様にして vertical direction (up/down) を各チャネルに割当てる.

定義 4 (vertical direction) 座標  $(x_s, y_s)$  から座標  $(x_d, y_d)$  に向かうチャネルにおいて, 次のように *vertical direction* を定める.

(a)  $(y_s > y_d) \lor ((y_s = y_d) \land (x_s < x_d)),$ ならば up 方向を割当て,

(b)  $(y_s < y_d) \lor ((y_s = y_d) \land (x_s > x_d)),$ ならば down 方向を割当てる.

そして, 各チャネルに対して, 次のように 4 つの方向から成る H/V direction を割当 てる. 定義 5 (H/V direction) H/V direction は, horizontal direction (h) と vertical direction (v) の組み合わせ HV(h,v) により次のように定める.

- (a) HV(left,up) に対し left-up(LU) 方向 を割当て,
- (b) HV(left,down) に対し left-down(LD) 方向 を割当て,
- (c) HV(right, up) に対し right-up(RU) 方向 を割当て,
- (d) HV(right, down) に対し right-down(RD) 方向 を割当てる.

以上をまとめたものを表 4.1 に示す.

|             | $x_s > x_d$ | $x_s < x_d$ |
|-------------|-------------|-------------|
| $y_s > y_d$ | LU          | RU          |
| $y_s = y_d$ | LD          | RU          |
| $y_s < y_d$ | LD          | RD          |

表 4.1: H/V direction の定義

本論文では,以降,H/V direction *dir* を持つチャネルを *dir* チャネルと呼ぶ.

各チャネルに対して H/V direction を割当てることにより,2次元有向グラフである H/V グラフが構築される.例として,図4.1におけるネットワークの H/V グラフは,図 4.3の通りとなる.



図 4.3: H/V グラフ

H/V グラフにおいて,スパニングツリーを構成するチャネルだけで構成される部分グラフを H/V ツリーと呼ぶ.

なお,同 depth スイッチ間チャネルの割当てを表 4.1 のように定めている理由は,一意 の方向割当てを行なうことにより,第 3.1.2 節で述べた BFS Up\*/Down\* ルーティング において問題となる同階層スイッチ間の冗長な禁止ターンの発生を抑制することと,禁止 ターンの分散を実現しやすくするためである.後者については,第 4.2.4 節で説明をする.

# 4.2 2 次元 Turn モデルによるルーティングアルゴリズムの設計

以下, H/V グラフに対する 2 次元 Turn モデルの適用により, L-turn および R-turn ルーティングを導出するシステマティックな設計手順を説明する.

## 4.2.1 Turn モデル

デッドロックが生じるのは, 結合網内のチャネルバッファが論理的な循環構造を作って しまうためということを第2.2.3節で述べた.Glassらによる Turn モデル [GN92] は,パ ケットがルーティング中に行なう方向転換(ターン)のパターンを制限して,循環構造の形 成を防ぐことにより,デッドロックフリールーティングアルゴリズムを設計する方法であ る.このモデルは,メッシュやトーラスなどのレギュラーネットワークへの適用を念頭に 置いて提案されているが,パケットのターンによって形成される論理的な循環構造の除去 に着目しているため,結合網のトポロジに依存することがない.このため,イレギュラー ネットワークを含む任意のトポロジに対して適用可能となっている<sup>2</sup>.

Turn モデルによるデッドロックフリールーティングアルゴリズムの設計は,次に示す 手順に従って行なわれる.ここで,チャネルは物理チャネル,仮想チャネルのいずれの場 合においても適用可能である.なお,ここで述べる手順の一部(ラップアラウンドチャネ ルや180度のターンの考慮)は,メッシュおよびトーラスへの適用を念頭に置いたものと なっているが,他の任意のトポロジを対象とする場合でも,適宜調整をした上で,ほぼ同 様の手順が適用可能である.

- (a) パケットが転送される方向に基づいてチャネルを分類する.各スイッチが1つの物理的な方向に対し v 個のチャネルを持つ場合,これらは, v 個の論理的な方向として区別する.
- (b) ある方向から別の方向へのターンのすべてのパターンを識別する.0度と180度の ターン<sup>3</sup>は無視する(0度のターンは,複数の仮想チャネルを利用する場合だけ考慮 する).
- (c) ターンの連鎖によって構成されるすべての循環構造を識別する.一般的には,トポ ロジ上の各平面における最も単純な循環構造をそれぞれ識別すればよい.

<sup>&</sup>lt;sup>2</sup>イレギュラーネットワークへの適用においては,基本的に有向グラフを構築する必要がある

<sup>&</sup>lt;sup>3</sup>仮想チャネルを切り替えて同一方向に移動する際に発生するターンを 0 度のターンと呼ぶ.一方,ある 方向から正反対となる方向に移動する際に発生するターンを 180 度のターンと呼ぶ.ここで,方向とは論理 的な方向を指す.

- (d) 識別されたすべての循環構造を防ぐために,各循環構造について1つのターンを禁止し,最低限必要なだけのターンを禁止する.循環構造はいくつかの循環の複合で生じる場合があるので,禁止するターンは慎重にチェックして決めなければならない.
- (e) トーラスの場合は、ネットワークの端で折り返しを行うラップアラウンドチャネル が存在するが、ラップアラウンドチャネルを使ったターンも、循環構造を形成しな いようにした上で可能な限り許可する。
- (f) 0 度あるいは 180 度のターンを,循環構造を形成しないようにした上で,可能な限 り許可する.

例として,2次元メッシュにおける Turn モデルの適用を考える.2次元メッシュにおい て可能な循環構造は,図4.4(a)に示す2種類になる.ここで,Turn モデルに従い,各循 環構造に含まれるターンを1つずつ禁止し,デッドロックを防いだ場合を図4.4(b)に示 す.図において,点線のターンが禁止されている.図の禁止ターンに基づくルーティング 方法は,先に西方向にパケットを送ることから West-first ルーティングと呼ばれる.デッ ドロックを防ぐための禁止ターンの選択肢は1つではなく,たとえば図4.4(c)に示す切 り方 (North-last ルーティング)も選択可能である.



図 4.4: Turn モデル (2 次元メッシュ)

しかし,どのような選択をしてもよいというわけではない.図4.5に示すように禁止ターンを定めると,防いだはずの循環構造が,8の字型に複合して新たな循環構造が生じてしまう.従って,このような状況を配慮しつつ禁止ターンを選択する必要がある.



図 4.5: Turn モデル (2 次元メッシュ) における失敗した切り方

2次元メッシュにおける一般的な固定ルーティングである e-cube ルーティング [DS87] を Turn モデルで考えると,図4.6に示すように,この循環構造のうち4つのターンしか許していないことになる.この場合,確かに循環構造を防ぐことができるのでデッドロックを生じないが,制限のし過ぎで代替経路を失ってしまうことがわかる.



図 4.6: e-cube ルーティングの Turn モデル (2 次元メッシュ)

Turn モデルにより生成された West-first または North-last ルーティングを使えば,パ ケットは 6 通りのターンを行なうことが許されるため,図 4.7 に示すような故障箇所や混 雑箇所を迂回する適応型ルーティングが可能となる.



図 4.7: West-first ルーティングによる故障 (混雑) 箇所の回避

先に述べたように, Turn モデルは,有向グラフの構築をベースとすることにより,イ レギュラーネットワークに対しても適用可能であり,Up\*/Down\*ルーティングは,up お よび down の 2 つの方向を持つ最も単純な 1 次元の Turn モデルの適用例として考えるこ とができる (この場合,180 度のターンが識別対象となる).しかし,Turn モデルの適用 に基づくイレギュラーネットワーク向けルーティングアルゴリズムの設計方法に関する研 究は,本研究がなされるまでほとんど行なわれておらず,2次元の Turn モデルの適用例 は本研究が初めてである. 4.2.2 H/V グラフにおける Turn モデルの適用手順

前節で述べたように,各チャネルに対して方向を割当てた後の Turn モデルによるデッドロックフリールーティング設計手順は,大きく分けて,次の4つのステップから成る

STEP1 パケット転送時に形成可能なすべてのターンを識別する.

STEP2 識別されたターンの連鎖により形成される循環構造をすべて識別する.

STEP3 識別されたすべての循環構造除去のために,最低限必要となる禁止ターン集合を 選択する.

STEP4 循環構造の形成に関与しないターンを可能な限り許可する.

H/V グラフでは,パケット転送のために,180度のターンが必要となるため,STEP1 において,180度のターンについても識別するものとする.仮想チャネルを利用しないた め,0度のターンについては考慮する必要がない.

H/V グラフでは,180 度のターンを含むことにより,複雑なターンの連鎖による循環 構造が多数形成されるため,直観的な循環構造の識別が可能である2次元メッシュおよび トーラスなどのレギュラーネットワークに比べて,すべての循環構造の識別と適切な禁止 ターンの選択による循環の除去(上記のSTEP2とSTEP3に相当)が難しい.そこで,厳 密かつ効率的にすべての循環構造の検出と除去を行なうために,上記のSTEP2とSTEP3 の手続きを次のように融合して適用する.

- (a) H/V グラフ上で最も単純な循環構造を識別する
- (b) (a) で検出された各循環構造を除去するために,最低限必要となる禁止ターン集合を 選択する.
- (c) (b) で選択された禁止ターン集合を除く残りのターンにより形成可能なすべての循環 構造を識別する.
- (d) (c) で検出された各循環構造を除去するために,最低限必要となる禁止ターン集合を 選択し,残りすべての循環構造を除去する.

なお,トラフィックの均等な分散を実現するために,上記手順において,可能な限り,禁 止ターンの分布が分散されるように,禁止ターンの選択を行なう.

更に, STEP4 において, 特定の循環構造を探索により検出するアルゴリズムを適用す ることにより, 冗長な禁止ターンを除去してルーティングの自由度の低下を抑え, より均 等なトラフィック分散の実現を図る.

H/V グラフにおける Turn モデル適用手順を表 4.2 にまとめる.

以下,上記の手順に従って,L-turn および R-turn ルーティングを設計するングを設計 する手順を具体的に説明する.

| STEP1 | <b>ペケット転送時に形成可能なすべてのターンを識別する</b> .  |   |  |  |  |
|-------|-------------------------------------|---|--|--|--|
| STEP2 | 形成可能なすべての循環構造の識別とそれらを除去するために        |   |  |  |  |
|       | 最低限必要な禁止ターンを選択する .                  |   |  |  |  |
|       | a) H/V <b>グラフ</b> 上で最も単純な循環構造を識別する. |   |  |  |  |
|       | b) (a) で検出された各循環構造において,最低限必要な禁止ターン  | を |  |  |  |
|       | 選択し循環構造の除去を行なう.                     |   |  |  |  |
|       | c) (b) で選択された禁止ターン集合を除いた残りのターンにより   |   |  |  |  |
|       | 形成可能なすべての循環構造を識別する.                 |   |  |  |  |
|       | d) (c) で検出された各循環構造において,最低限必要な禁止ターン  | を |  |  |  |
|       | 選択し残りすべての循環構造の除去を行なう.               |   |  |  |  |
| STEP3 | 寺定の循環構造を探索により検出するアルゴリズムを適用          |   |  |  |  |
|       | して冗長な禁止ターンを除去する.                    |   |  |  |  |

表 4.2: H/V グラフにおける Turn モデル適用手順

4.2.2.1 準備

最初に,以降で用いられる表記を次に示す.

定義 6 (ターン) スイッチ到着時のパケット転送方向  $p\_dir$  とスイッチ通過後のパケット 転送方向  $n\_dir$  により形成されるターンを  $T_{p\_dir,n\_dir}$  と表す.

定義 7 (ターン連鎖) ターン  $T_i$  を伴なうパケット転送直後に, ターン  $T_j$  を伴なう転送 が可能である場合のターンの連鎖を  $TD(T_i, T_j)$  と表す.

定義 8 (循環構造) H/V グラフにおいて,  $\{TD(T_i, T_j) \mid j = (i+1) \mod n, i = 0, 1, ..., n-1\}$  のターン連鎖を形成する n 個のターンの集合  $\{T_0, T_1, ..., T_{n-1}\}$ , により循環構造が形成される場合,その循環構造を  $C(T_0, T_1, ..., T_{n-1})$  と表す.

4.2.2.2 ターンの識別 (STEP1)

H/V グラフにおいて,ある H/V direction へ移動した後,その他の H/V direction へ 移動した際に形成可能なすべてのターンを図 4.8 に示す.先に述べたように,0度のター ンは無視している.図 4.8 より, H/V グラフでは 4 つの H/V direction が存在するため, 形成可能なターンは全部で 12 パターンとなる.

4.2.2.3 循環構造の識別と禁止ターンの選択 (STEP2)

図 4.8 に示したターンの連鎖により形成されるすべての循環構造の識別とその除去に必要な禁止ターンの選択を,第 4.2.2 節で示した手順に基づいて行なう.



図 4.8: H/V グラフにおける形成可能ターン

STEP2-(a) 循環構造の検出 (1回目)

スパニングツリーベースの有向グラフでは,ツリー構造の部分グラフ(2つ以上の tree link で接続された 3つ以上のスイッチから成る)に1つの outer link を追加することによ り常に循環構造が形成される.例として,図4.9は,2つの tree link と1つの outer link から構成される最も単純な循環構造を表している.



図 4.9: スパニングツリーベースの有向グラフにおける最も単純な循環構造

H/V グラフにおいて,図4.9 に相当する部分グラフは,図4.10 と図4.11 に示す2つの 部分グラフに分類される.2 つの部分グラフの違いは,子スイッチであるスイッチBとス イッチCの垂直方向における相対位置の違いである.



(a)  $C_3(T_{LU,RD}, T_{RD,LU})$  (b)  $C'_3(T_{LU,RD}, T_{RD,LU})$ 

図 4.11: H/V グラフにおける循環構造 (C<sub>3</sub>, C'<sub>3</sub>)

図 4.10 と図 4.11 において,各部分グラフには,互いに反対方向となる 2 つの循環構造がそれぞれ形成される.図 4.10(a) における循環構造は, $C_1(T_{LU,RD}, T_{RD,RU}, T_{RU,LU})$ であり,図 4.10(b) における循環構造は, $C_2(T_{LU,RD}, T_{RD,LD}, T_{LD,LU})$ である.同様に,図 4.11(a) における循環構造は, $C_3(T_{LU,RD}, T_{RD,LU})$ であり,図 4.11(b) における循環構造は, $C_3(T_{LU,RD}, T_{RD,LU})$ であり,図 4.11(b) における循環構造は, $C_3(T_{LU,RD}, T_{RD,LU})$ となる.ただし,循環構造 $C_3 \ge C'_3$ は論理的に同一であるため, $C_3$ だけを考慮すればよい.

STEP2-(b) 禁止ターンの選択 (1回目)

STEP2-(a) で識別した 3 つの循環構造の形成を防ぐために,各循環構造内の1 つのターンを次のポリシーに基づいて禁止する.

- (a) ターン  $T_{LU,RD}$  を禁止しない.
- (b) 可能な限り,選択した禁止ターンの組合せにより,図4.12のような同一スイッチ上の禁止ターンのペアが発生しないようにする.

上記の (a) において, ターン  $T_{LU,RD}$  を禁止しない理由は, H/V グラフ上の任意のス イッチ間の経路を保証するために, 任意のスイッチから LU 方向の tree channel を 0 回 以上辿って任意の目的地スイッチの祖先<sup>4</sup>となるスイッチに到達可能であり, かつ, 祖先ス イッチに到達後に, RD 方向の tree channel を 0 回以上用いて任意の目的地スイッチに 到達可能である, という条件を満たす必要があるためである.



図 4.12: H/V グラフにおける禁止ターンの偏り

上記の (a),(b) のポリシーを考慮すると,循環  $C_1$  および  $C_2$  を破るために禁止するターンの集合は, { $T_{RU,LU}, T_{LD,LU}$ } または { $T_{RD,RU}, T_{RD,LD}$ } となり,循環  $C_3$  を破るための禁止ターンは  $T_{RD,LU}$  となる.したがって,図 4.10 および図 4.11 に示したすべての循環構造を破るために禁止するターン集合は,2通り選択可能となる.これらを次のように定める.

$$P_1 = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}\},\$$

$$P_2 = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}\}$$

図 4.13(a),(b) に,禁止ターン集合  $P_1$  および  $P_2$  による禁止ターン分布の例を示す.図より,循環構造  $C_1$  および  $C_2$  を破るために選択した禁止ターンについて,分散が実現されていることがわかる.一方,循環構造  $C_3$  を破るための禁止ターン  $T_{RD,LU}$  については,偏りが発生してしまうが, $C_3$  を破るためには,これ以外に選択肢が無いので,この場合はやむをえないものとする.

<sup>&</sup>lt;sup>4</sup>ここでは,スイッチ間の関係を親族関係の用語を用いて説明している.あるスイッチから見て,親,親の親,… となるスイッチをまとめて祖先と呼ぶ.



(a)  $T_{LD,LU}, T_{RU,LU}, T_{RD,LU}$  (P<sub>1</sub>)

(b)  $T_{RD,RU}, T_{RD,LD}, T_{RD,LU}$  (P<sub>2</sub>)

図 4.13: H/V グラフにおける禁止ターン集合 (P<sub>1</sub>, P<sub>2</sub>)

STEP2-(c) 循環構造の検出 (2回目)

続いて,STEP2-(b) で選択した禁止ターン集合以外のターンの連鎖により形成される循環構造の識別を行なう.以下,禁止ターン集合として P<sub>1</sub> または P<sub>2</sub> を選んだ場合の手順をそれぞれ並行して示す.

禁止ターン集合 P<sub>1</sub> を除く残りの 9 パターンのターン集合は

 $Q_{1a} = \{T_{LU,n\_dir} \mid n\_dir \in \{LD, RU, RD\}\},\$ 

 $Q_{1b} = \{T_{p\_dir,n\_dir} \mid p\_dir,n\_dir \in \{LD, RU, RD\}, p\_dir \neq n\_dir\}$ 

の 2 種類のターン集合に分類することができる.同様に,禁止ターン集合 *P*<sub>2</sub> を除く残りの 9 パターンのターン集合は

 $Q_{2a} = \{T_{p\_dir,RD} \mid p\_dir \in \{LU, LD, RU\}\},\$ 

 $Q_{2b} = \{T_{p\_dir,n\_dir} \mid p\_dir,n\_dir \in \{LU,LD,RU\}, p\_dir \neq n\_dir\}$ 

の2種類のターン集合に分類することができる.

ここで次の定理が成り立つ.

定理 1 ターン集合  $Q_{1a}$  に属するターンを含む循環構造には,禁止ターン集合  $P_1$  に属するターンが必ず含まれる.  $\Box$ 

証明 ターン集合  $Q_{1a}$  に属するターン  $T_{1a}$  を含み,かつ禁止ターン集合  $P_1$  に属するターンを含まない循環構造が形成可能であると仮定する. $T_{1a}$  は LU 方向 からその他の H/V direction へのターンであるので,このとき,ターン  $T_{1a}$  の直前に連鎖して循環を形成するターンは,ターン集合  $\{T_{p,dir,LU} \mid p_{-}dir \in \{LD, RU, RD\}\}$  に属するものでなければならない.しかし,このターン集合は,禁止ターン集合  $P_1$  と同一であるため先の仮定に矛盾する.ゆえに,ターン集合  $Q_{1a}$  に属するターンを含む循環構造には,禁止ターン集合  $P_1$  に属するターンが必ず含まれる.□

定理 2 ターン集合  $Q_{2a}$  に属するターンを含む循環構造には,禁止ターン集合  $P_2$  に属するターンが必ず含まれる.  $\Box$ 

証明 ターン集合  $Q_{2a}$  に属するターン  $T_{2a}$  を含み,かつ禁止ターン集合  $P_2$  に属するターンを含まない循環構造が形成可能であると仮定する. $T_{2a}$  は RD 方向以外の H/V direction から RD 方向へのターンであるので,このとき,ターン  $T_{2a}$  の直後に連鎖して循環を形成するターンは,ターン集合  $\{T_{RD,n\_dir} \mid n\_dir \in \{LU, LD, RU\}\}$  に属するものでなければならない.しかし,このターン集合は,禁止ターン集合  $P_2$  と同一であるため先の仮定に矛盾する.ゆえに,ターン集合  $Q_{2a}$  に属するターンを含む循環構造には,禁止ターン集合  $P_2$  に属するターンが必ず含まれる.□

定理1より,禁止ターン集合  $P_1$ を選択することにより,ターン集合  $Q_{1a}$ に属するターンを含むすべての循環構造についても除去される.このため,禁止ターン集合  $P_1$ を選択した場合に形成可能な循環構造は,ターン集合  $Q_{1b}$ に属する LU 方向を伴なわないターンだけで構成されるものに絞られる.定理2から,同様の議論により,禁止ターン集合  $P_2$ を選択した場合に形成可能な循環構造は,ターン集合  $Q_{2b}$ に属する RD 方向を伴なわないターンだけで構成されるものに絞られる.

残りすべての循環構造を識別するために,ターン集合におけるターン間の依存関係を示す turn dependency graph (TDG)を導入する.TDG D は,D = G(V, E)で表わされ, V は形成可能なターン集合  $V = \{T_1, T_2, ..., T_n\}$ を表し, E は V に属する 2 つのターン 間で形成可能なターン連鎖の集合  $E = \{TD_1, TD_2, ..., TD_m\}$ を表す.

図 4.14 および図 4.15 に , ターン集合  $Q_{1b}$  および  $Q_{2b}$  における TDG  $D_1$  ,  $D_2$  をそれぞれ示す . 図 4.14 および図 4.15 において , 各ノードは , 各々のターン集合に属するターンの 1 つを表し , 各ノード間を結ぶチャネルは 2 つのターン間の連鎖を表している .



図 4.14: ターン集合 Q<sub>1b</sub> における TDG D<sub>1</sub>



図 4.15: ターン集合 Q<sub>2b</sub> における TDG D<sub>2</sub>

TDG  $D_1$ におけるターン間の依存関係により形成される循環構造には,例として,図4.16 に示す  $C_r(T_{RD,RU}, T_{RU,RD}, T_{RD,LD}, T_{LD,RU}, T_{RU,LD}, T_{LD,RD})$ のような循環構造が含まれ ている.図4.16の循環構造  $C_r$ では,例えば,ターン集合 { $T_{RD,RU}, T_{RU,LD}, T_{LD,RD}$ }を取り 除いても,残りのターンにより,図4.17(a)に示す循環構造  $C_{m1}(T_{RU,RD}, T_{RD,LD}, T_{LD,RU})$ が維持される.同様に, $C_r$ からターン集合 { $T_{LD,RU}, T_{RU,LD}$ }を除いても,4.17(b)に示 す循環構造  $C_{m2}(T_{RD,RU}, T_{RU,RD}, T_{RD,LD}, T_{LD,RD})$ が維持される.本論文では,このよう な循環構造を冗長循環構造と呼ぶ.

定義 9 (冗長循環構造) 循環を形成するターンの集合から,いずれかのターン集合を除去 した場合に,残りのターンの組み合わせにより循環が維持されるような循環構造を冗長循 環構造と定める.

循環構造 C<sub>m1</sub> および C<sub>m2</sub> では,循環を形成するターン集合のどのターンを除いても, 残りのターンの組み合わせにより循環構造が形成されることがない.このような循環構造 を,最小循環構造と定める.

定義 10 (最小循環構造) 循環を形成するターンの集合から,任意のターン集合を除去しても,残りのターンの組み合わせにより循環構造が形成されることがない循環構造を最小 循環構造と定める.

TDG において形成可能なすべての循環構造を破るためには, TDG におけるすべての 最小循環構造を破ればよい.

そこで, TDG におけるターン集合について, 次のアルゴリズムに基づく TDG 上の探 索を行なうことにより, 形成可能なすべての最小循環構造の識別を行なう.

まず,準備として,探索アルゴリズムにおいて用いられる用語の説明を行なう.



図 4.16: TDG D<sub>1</sub> における冗長循環構造の例





(a)  $C_{m1}(T_{RU,RD}, T_{RD,LD}, T_{LD,RU})$  (b)  $C_{m2}(T_{RD,RU}, T_{RU,RD}, T_{RD,LD}, T_{LD,RD})$ 



● 探索ステート

探索プロセスが起点ノード (ターン) から現在地ノードに至るまでに経由したノード リスト (ターンリスト) を表す. 探索プロセスは, ノードを訪問する度に, 訪問した ノード (ターン) を探索ステートの末尾に追加する. 探索プロセスが1つ前のノード に戻る場合には, 探索ステート末尾のノードを除去する.

- 通過済探索ステートリスト TDG上の各チャネル (ターン連鎖)が保持するリストを表す.探索プロセスがチャ ネルを通過した際に,探索プロセスの探索ステートが通過済探索ステートリストに 追加される.探索プロセスは,次のいずれかの条件を満たすチャネルを通過するこ とができない.
  - (a) 通過済探索ステートリストに探索プロセスの探索ステートが登録されている,
  - (b) 移動先のノードが探索ステートに含まれている(訪問済である).ただし、移動 先が起点ノードの場合は該当しない.

TDG D = G(V, E) に対する探索アルゴリズムは次の通りとなる.

TDG における探索アルゴリズム

- (1) ノード集合 V のうち,探索が完了していないノードを選択して起点ノードとし,(2) に進む.すべてのノードについて探索が完了した場合,探索を終了する.
- (2) 起点ノードから隣接ノードに向かうチャネルのうち,選択可能なチャネルがあれば, そのチャネルを通過して隣接ノードを訪問し,(3)に進む.起点ノードから隣接ノー ドに向かうすべてのチャネルを起点とする探索が完了した場合,現起点ノードにお ける探索を完了し(1)に戻る.
- (3) 現在地ノードが起点ノードでない場合,現在地ノードから隣接ノードに向かう選択可能なチャネルがあれば,そのチャネルをたどって隣接ノードを訪問し,(3)を繰り返す.

すべてのチャネルが選択不可である場合,一つ前のノードに戻る.1つ前のノードが 起点ノードである場合は(2)に戻り,それ以外の場合は,(3)を繰り返す.

現在地ノードが起点ノードである場合,探索ステートにおいて,次の4通りのターンが行なわれた回数をそれぞれ数える.

- (t1) up 方向から down 方向  $\land o g \nu$ ( $T_{LU,LD}, T_{LU,RD}, T_{RU,LD}, T_{RU,RD}$  のいずれか)
- (t2) down 方向から up 方向  $(T_{LD,LU}, T_{LD,RU}, T_{RD,LU}, T_{RD,RU}$  のいずれか)
- (t3) left 方向から right 方向  $(T_{LU,RU}, T_{LU,RD}, T_{LD,RU}, T_{LD,RD}$  のいずれか)

(t4) right 方向から left 方向  $(T_{LU,RU}, T_{LU,RD}, T_{LD,RU}, T_{LD,RD}$  のいずれか)

そして,上記の4通りのターンが行なわれた回数が次のいずれに該当するかを判定する.

- (n1) 4 通りのターンのいずれかが行なわれていない
   → 探索ステートは循環構造を形成しない
- (n2) 4 通りのターンがそれぞれ 1 回以上行なわれており,かつ,いずれかのターンが 2 回以上行なわれている
   → 探索ステートは循環構造を形成するが,冗長なターンを含むため最小循環構造ではない.
- (n3) 4 通りのターンがそれぞれ 1 回ずつ行なわれている
   → 探索ステートは最小循環構造を形成する.

判定後, (n3) に該当する場合だけ,最小循環構造リストに探索ステートの循環構造 を追加する(既に含まれている場合を除く).その後,一つ前のノードに戻って(3)を 繰り返す.

上記の探索アルゴリズムを TDG *D*<sub>1</sub> に適用することにより,ターン集合 *Q*<sub>1b</sub> に属する ターンによって形成されるすべての最小循環構造は,図 4.18 における次の 4 つの循環構 造となる.

- $C_4(T_{RU,RD}, T_{RD,LD}, T_{LD,RU}),$
- $C_5(T_{RD,RU}, T_{RU,LD}, T_{LD,RD}),$
- $C_6(T_{LD,RU}, T_{RU,LD}),$
- $C_7(T_{RD,RU}, T_{RU,RD}, T_{RD,LD}, T_{LD,RD})$

同様に, TDG D<sub>2</sub> に対して探索アルゴリズムを適用することにより, ターン集合 Q<sub>2b</sub> に属するターンによって形成されるすべての最小循環構造は,図4.19 における次の4つの 循環構造となる.

- $C_8(T_{LD,RU}, T_{RU,LU}, T_{LU,LD}),$
- $C_9(T_{LD,LU}, T_{LU,RU}, T_{RU,LD}),$
- $C_{10}(T_{LD,RU}, T_{RU,LD}),$
- $C_{11}(T_{LD,LU}, T_{LU,RU}, T_{RU,LU}, T_{LU,LD})$





図 4.19: TDG D<sub>2</sub> における最小循環構造 (C<sub>8</sub>, C<sub>9</sub>, C<sub>10</sub>, C<sub>11</sub>)

STEP2-(d) 禁止ターンの選択 (2回目)

STEP2-(c) で識別されたそれぞれ 4 つの循環構造を破るために,前述の選択ポリシーに 基づいて禁止ターンの選択を行なう.

まず, 禁止ターン集合  $P_1$  を選択した場合, ターン集合  $Q_{1b}$  によって形成される 4 つの 循環構造  $\{C_1, C_2, C_3, C_4\}$  を破るための禁止ターン集合としては, 次の 2 通りの禁止ター ン集合が選択される.

$$P_{1a} = \{T_{LD,RU}, T_{LD,RD}\},\$$
$$P_{1b} = \{T_{RU,LD}, T_{RU,RD}\}$$

図 4.20 に上記の 4 つの循環構造とそれらを破るための禁止ターン集合  $P_{1a}$  および  $P_{1b}$  に属するターンをそれぞれを示す.



図 4.20: H/V グラフにおける禁止ターン集合 (P<sub>1a</sub>, P<sub>1b</sub>)

次に,禁止ターン集合  $P_2$ を選択した場合,ターン集合  $Q_{2b}$ によって形成される 4つの 循環構造  $\{C_5, C_6, C_7, C_8\}$ を破るための禁止ターン集合としては,次の2通りの禁止ター ン集合が選択される.

$$P_{2a} = \{T_{LD,RU}, T_{LU,RU}\},\$$
$$P_{2b} = \{T_{RULD}, T_{LULD}\}$$

図 4.21 に上記の 4 つの循環構造とそれらを破るための禁止ターン集合  $P_{2a}$  および  $P_{2b}$  に属するターンをそれぞれを示す.

最終的に,禁止ターン集合 *P*<sub>1</sub> を選択した場合,次の2通りの禁止ターン集合が選択される.

$$P_{1} + P_{1a} = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}, T_{LD,RU}, T_{LD,RD}\}$$
$$P_{1} + P_{1b} = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}, T_{RU,LD}, T_{RU,RD}\}$$

禁止ターン集合  $P_1$  により, LU 方向を伴なうターンを含む循環構造が破れ,禁止ターン 集合  $P_{1a}$  または  $P_{1b}$  によりその他のターンを含む循環構造が破れる.これにより,H/V



図 4.21: H/V グラフにおける禁止ターン集合 (P<sub>2a</sub>, P<sub>2b</sub>)

グラフにおいて形成可能なすべての循環構造が破れ,デッドロックフリーであることが保 証される.

STEP2-(b) で禁止ターン集合  $P_2$  を選択した場合についても,同様に,次の2通りの禁止ターン集合が定められる.

 $P_{2} + P_{2a} = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}, T_{LD,RU}, T_{LU,RU}\},\$  $P_{2} + P_{2b} = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}, T_{RU,LD}, T_{LU,LD}\}$ 

禁止ターン集合 P<sub>2</sub> により RD 方向を伴なうターンを含む循環構造が破れ,禁止ターン集合 P<sub>2a</sub> または P<sub>2b</sub> によりその他のターンを含む循環構造が破れる.これにより, H/V グラフにおいて形成可能なすべての循環構造が破れ,同様にデッドロックフリーであることが保証される.

4.2.2.4 循環構造検出アルゴリズムによる冗長禁止ターンの削除 (STEP3)

前節 (STEP2) において, H/V グラフにおいて形成可能なすべての循環構造を破るため に 4 つの禁止ターン集合を導出した.ここでは,各禁止ターン集合における一部の禁止 ターンは,循環構造の形成に関与しない場合があることを示し,トポロジ毎にそのような 冗長な禁止ターンを削除するための手順を示す.なお,ここでは,禁止ターン集合として  $P_1 = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}\} \ge P_{1a} = \{T_{LD,RU}, T_{LD,RD}\}$ を選択した場合についての 手順を述べるが,その他の禁止ターン集合を選択した場合についても同様にして考えるこ とができる.

禁止ターン集合  $P_{1a}$  に属する 2つの禁止ターン  $\{T_{LD,RU}, T_{LD,RD}\}$  は 図 4.18 の 4 つの 循環構造  $C_4, C_5, C_6, C_7$  を破るために必要とされる.しかし,これら 2 つのターンを含む 循環構造は,図 4.22 のように,禁止ターン集合  $P_1$  に属するターンを含んでいる場合が ある.

図 4.22 における 2 つの循環構造には,禁止ターン集合  $P_1$  および禁止ターン集合  $P_{1a}$  に属するターンがそれぞれ 1 つずつ含まれている.このような場合, $P_{1a}$  に属するターン を禁止せずとも, $P_1$  に属するターンを禁止することにより循環構造は除去される.この



図 4.22: 冗長な禁止ターンを含む循環構造

ような循環構造が形成されるトポロジにおいて,禁止ターン集合 P<sub>1a</sub> に属するターンをす べて禁止してしまうと,ルーティングの自由度が低下し,不要な非最短経路の増加とトラ フィックの偏りの原因となりうる.

このような冗長な禁止ターンを削除するために,トポロジ毎に,H/V グラフにおける 図 4.18 の 4 つの循環構造(除去のために,禁止ターン集合  $P_{1a}$  を必要とする)を検出し,検出された循環構造に含まれる場合にだけ,禁止ターン集合  $P_{1a}$  に属するターンを個別に 禁止する.循環構造の検出は,H/V グラフ上で探索ベースのアルゴリズムを適用すること により行なう.

以下,循環構造検出アルゴリズムについて述べる.

循環構造の検出は,H/V グラフにおいて,次の2つの条件のいずれか,または両方を 満たす各スイッチをそれぞれ起点として深さ優先探索を行なうことにより行なわれる.

- (a) 禁止ターン集合  $P_{1a}$  に属するターン  $T_{LD,RD}$  が形成可能である (1つ以上の RU チャネルおよび RD チャネルが接続されている).
- (b) 禁止ターン集合 P<sub>1a</sub> に属するターン T<sub>LD,RU</sub> が形成可能である
   (2 つ以上の RU チャネルが接続されている).

探索において,隣接スイッチの訪問に利用される出力チャネルは,次の条件を満たす場合に選択可能であるとし,利用後に通過済マークをつける.

- (1) LU チャネルではない ( $P_1$  に含まれる禁止ターンを形成しない),
- (2) 通過済マークがついてない,
- (3) 過去の探索において禁止された,ターン集合 *P*<sub>1a</sub> に属するいずれかのターンを形成 しない

探索の手順を次に示す. 探索は 2 つの手順から成り, 起点となるスイッチが条件 (a) を 満たす場合に手順 1 を, 条件 (b) を満たす場合に手順 2 をそれぞれ実行する. 手順 1:条件 (a) に該当するスイッチを起点とした探索

- (1) 起点スイッチから隣接スイッチに向かう RD チャネルのうち,通過済マークがついていないものを選び,到達可能な隣接スイッチを訪問する.その後,(2)に進む.選択可能な RD チャネルがなければ,すべてのチャネルの通過済マークを消去し,探索を完了する.
- (2) 現在地スイッチが起点スイッチであり、かつ、最後に通過したチャネルが LD チャネルであるならば、循環構造が検出されたことになる.この場合、到着時に通過した LD チャネルと出発時に通過した RD チャネルの間に形成されるターン T<sub>LD,RD</sub> を禁止する.その後、直前のスイッチに戻り、(2)を繰り返す.
   それ以外の場合には、選択可能な出力チャネルがあれば、深さ優先探索に基づいて、 隣接スイッチを訪問し、(2)を繰り返す.選択可能な出力チャネルがない場合には、 直前のスイッチに戻る.直前のスイッチが起点スイッチであれば(1)に戻り、そうで

手順 2:条件 (b) に該当するスイッチを起点とした探索

手順1を次の条件で置き換えて実行する.

なければ (2) を繰り返す.

- (1) 起点スイッチからの最初の訪問には、ターン T<sub>LD,RU</sub> を形成するチャネルのうち、起 点スイッチから出る方向となる RU チャネルを用いる.
- (2) 循環構造検出時には, ターン T<sub>LD.RU</sub> が禁止される.

手順1により検出される循環構造は,ターン  $T_{LD,RD}$  を含み,かつ,禁止ターン集合  $P_1$ に属するターンを含まないので,循環構造  $C_5$  または  $C_7$  のいずれかとなる.同様に,手順2により検出される循環構造は,ターン  $T_{LD,RU}$  を含み,かつ,禁止ターン集合  $P_1$ に属するターンを含まないので,循環構造  $C_4$  または  $C_6$  のいずれかとなる.

上記のアルゴリズムは,禁止ターン集合として  $P_1 + P_{1b}$ ,  $P_2 + P_{2a}$  および  $P_2 + P_{2b}$  の いずれかを選択した場合についても,検出の対象となる禁止ターン集合  $P_{1a}$  を, $P_{1b} = \{T_{RU,LD}, T_{RU,RD}\}, P_{2a} = \{T_{LD,RU}, T_{LU,RU}\}$  および  $P_{2b} = \{T_{RU,LD}, T_{LU,LD}\}$  にそれぞれ 置き換えることにより同様にして実行可能である.ただし,禁止ターン集合として  $P_2$  を 選択した場合には,探索における禁止ターン集合  $P_1$  を  $P_2$  に置き換える.

図 4.23 に,禁止ターン集合として  $P_1 + P_{1a}$ を選択した場合に,循環構造検出アルゴリズムにより検出される循環構造の例を示す.

図 4.23 において,5つのターン  $T_1, ..., T_5$  は,ターン集合  $P_{1a}$  に属するターンであり,こ れらのターンが形成されているスイッチ 5,6,7,9 が前述の探索の起点となる.図 4.23 より, 循環構造検出アルゴリズムにより検出される循環構造は,循環  $C_1$  だけであるため,5つ のターンのうち,循環  $C_1$  に含まれるターン  $T_5$  だけを禁止すればよいことがわかる.

スイッチ数をn,スイッチあたりのリンク数をlとすると,探索アルゴリズムの計算量は $O(n^2 * l)$ となる.



図 4.23: 循環構造検出アルゴリズムにより検出される循環構造

4.2.3 L-turn/R-turn ルーティングの定義

第4.2.2.3 節で定めた4通りの禁止ターン集合と第4.2.2.4 節で定めた循環構造検出アル ゴリズムに基づいて,4つの適応型デッドロックフリールーティングアルゴリズムを次の ように定義する.

まず,循環構造検出アルゴリズムを対象トポロジに適用することにより禁止される全 ターン集合 DP を次のように表す.

$$DP = DA(H, P_{stat}, P_{cond})$$

DAは,対象とする H/V グラフ H において,常に禁止されるターン集合を  $P_{stat}$ ,検出 対象とする禁止ターン集合を  $P_{cond}$  として循環構造検出アルゴリズムを適用した結果禁止 されるすべてのターン集合 DP を返す関数とする.

次に,ターン集合  $P_1 = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}\}$ を禁止ターンとする 2つのルーティングアルゴリズムを定義する.

ターン集合  $P_1$ を禁止することにより, LU方向に向かうすべてのターンが禁止されるため,この場合, LU方向への移動は最初に行なう必要がある.そこで,このようなルーティングアルゴリズムをまとめて L-turn (Left-up first turn) ルーティングと呼ぶ.

**L-turn**/ $\alpha$ ルーティング H/V グラフ上で,ターン集合  $P_1 = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}\}$ に属するターンを禁止し,ターン集合  $P_{1a} = \{T_{LD,RU}, T_{LD,RD}\}$ を検出対象とする循環構造検出アルゴリズムの適用により,ターン集合  $DP_{1a} = DA(H, P_1, P_{1a})$ を禁止するルーティングアルゴリズムを L-turn/ $\alpha$ ルーティングと呼ぶ.

**L-turn**/ $\beta$ ルーティング H/V グラフ上で,ターン集合  $P_1 = \{T_{LD,LU}, T_{RU,LU}, T_{RD,LU}\}$ に属するターンを禁止し,ターン集合  $P_{1b} = \{T_{RU,LD}, T_{RU,RD}\}$ を検出対象とする循環構造検出アルゴリズムの適用により,ターン集合  $DP_{1b} = DA(H, P_1, P_{1b})$ を禁止するルーティングアルゴリズムを L-turn/ $\beta$ ルーティングと呼ぶ.

次に,ターン集合  $P_2 = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}\}$ を禁止ターンに含む2つのルーティングアルゴリズムを定義する.

ターン集合  $P_2$  を禁止することにより, RD 方向からその他の方向に向かうすべてのターンが禁止されるため, RD 方向への移動は最後に行なう必要がある. そこで, このようなルーティングアルゴリズムをまとめて R-turn (Right-down last turn) ルーティング と呼ぶ.

**R-turn**/ $\alpha$ ルーティング H/V グラフ上で,ターン集合  $P_2 = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}\}$ に属するターンを禁止し,ターン集合  $P_{2a} = \{T_{LD,RU}, T_{LU,RU}\}$ を検出対象とする循環構造検出アルゴリズムの適用により,ターン集合  $DP_{2a} = DA(H, P_2, P_{2a})$ を禁止するルーティングアルゴリズムを **R-turn**/ $\alpha$ ルーティングと呼ぶ.

**R-turn**/ $\beta$ ルーティング H/V グラフ上で,ターン集合  $P_2 = \{T_{RD,RU}, T_{RD,LD}, T_{RD,LU}\}$ に属するターンを禁止し,ターン集合  $P_{2b} = \{T_{RU,LD}, T_{LU,LD}\}$ を検出対象とする循環構造検出アルゴリズムの適用により,ターン集合  $DP_{2b} = DA(H, P_2, P_{2b})$ を禁止するルーティングアルゴリズムを **R-turn**/ $\beta$ ルーティングと呼ぶ.

L-turn ルーティングおよび R-turn ルーティングにおける許可ターンと禁止ターン集合 を図 4.24 にまとめて示す.図 4.24 において,実線は許可ターン,破線は禁止ターン,点 線は,循環構造検出アルゴリズムにより禁止となりうるターンを示す.

定理 3 L-turn ルーティングおよび R-turn ルーティングはデッドロックフリーである □

証明 H/V グラフにおいて形成可能なすべての循環構造は,各ルーティングアルゴリズ ムにおいて選択された禁止ターン集合により除去される.ゆえに,L-turn ルーティング および R-turn ルーティングは,デッドロックフリーである□

定理 4 L-turn ルーティング および R-turn ルーティングでは任意のスイッチ間の経路が 保証される.  $\Box$ 

証明 H/V ツリーに属するチャネルの方向は, LU 方向または RD 方向だけである. RD 方向から LU 方向へのターンは禁止されているので, H/V ツリー内で形成可能なターンは  $T_{LU,RD}$  だけとなる. ターン  $T_{LU,RD}$  は禁止されていないので H/V ツリーにおいては任意 のノード間でのパケット転送が保証される. ゆえに, L-turn ルーティング および R-turn ルーティングでは, 任意のスイッチ間の経路が保証される. □

図 4.25 は, 4×4 スイッチの 2次元メッシュにおいて, BFS Up\*/Down\* ルーティング, L-turn ルーティング( $\alpha$ および $\beta$ で同一), 2次元メッシュ向けの West-first ルーティングを適用した場合の禁止ターンの分布をそれぞれ示している.図 4.25(a) と図 4.25(b) を比較すると,いずれも禁止ターンの数は同じであるものの,Up\*/Down\* ルーティングでは禁止ターンの分散が実現されていることがわかる.また,図 4.25(b) と図 4.25(c) を比較すると,両者の禁止ターンの分布は同一となっていることが分かる.これは,トポロジによっては,L-turn ルーティングが,一般的に高い性能を示す2次元メッシュに特化したルーティングアルゴリズムと同等の禁止ターンの分散を実現しうることを示す.



図 4.24: L-turn/R-turn ルーティングにおける許可ターンと禁止ターン集合





(b) L-turn ルーティング



図 4.25: 2 次元メッシュ(4×4 スイッチ) における禁止ターン
L-turn および R-turn ルーティングでは, Up\*/Down\* ルーティングと同様に, 禁止 ターンを行なわない限り, 任意の経路を選択して適応型のルーティングを行なうことが可 能である.しかし, 効率的なルーティングの実現のため, 各ルーティングアルゴリズムで は,同様に,任意のスイッチ間における選択可能な経路のうち最短となるものだけを基本 的に選択するものとする.

各ルーティングアルゴリズムにおける各スイッチ間の経路計算は,次のように行なわれる.ここでは,L-turn/αの場合について述べるが,提案した他のルーティングアルゴリズムについても同様にして行なわれる.

- (a) 対象トポロジの H/V グラフ上の各スイッチにおいて,ターン集合 *P*<sub>1</sub> に属するター ンを形成するチャネル間の移動を禁止する.
- (b) H/V グラフにおいて,第4.2.2.4 節で示した条件 (a),(b) のいずれか,または両方を 満たす全スイッチにおいて循環構造検出アルゴリズムを順に適用し,循環構造の検 出を行なう.検出された循環構造において,ターン集合 P<sub>1a</sub> に属するターンを形成 するチャネル間の移動を禁止する.
- (c) H/V グラフの全スイッチにおいて、ダイクストラのアルゴリズム [E.W59] を適用し、
   全スイッチ間の最短経路を算出する、探索においては、禁止されたチャネル間の移動はできないものとする。

上記の経路計算のための計算量は,スイッチ数を n とすると O(n<sup>2</sup>) となる.最短経路 が複数存在する場合の経路選択方法については,Up\*/Down\* ルーティングと同様に,対 象とするネットワークで用いられるスイッチの実装に依存する.

図 4.26 に, L-turn/ $\alpha$  および BFS Up\*/Down\* ルーティングの経路例を示す.図 4.26 は, 16 スイッチ構成の H/V グラフにおけるスイッチ番号 11 からスイッチ番号 10 への パケット転送において,各ルーティングアルゴリズムにより選択可能なすべての経路を示している.図 4.26 において,各ルーティングアルゴリズムは,共に4通りの経路を持っている.しかし,Up\*/Down\* ルーティングの経路はすべて5 ホップを要し,かつ,ルートスイッチを必ず通らなくてはならないのに対し,L-turn/ $\alpha$  ルーティングの経路はすべて,3 ホップを要するだけであり,また,ルートスイッチを通る必要が無く,経路も分散されている.

#### 4.2.4 同 depth スイッチ間チャネルの方向割当ての効果

第 4.1.3 節で述べたように, H/V グラフにおける図 4.27(a) のような同 depth スイッチ 間チャネルの方向割当ては,図 4.27(b) に示すように,right 方向に向かうチャネルに対し て right-up, left 方向に向かうチャネルに対して left-down としている.方向割当てとし ては,図 4.27(c) に示すような,逆のケースも考えられる.

前者の方向割当てを行なっている理由は,この場合,図4.27(b)のような禁止ターンの 分散が常に実現されるためである.これに対し,後者の方向割当てでは,図4.27(c)のよ うに,*T<sub>RD,LU</sub>*による禁止ターンの集中が常に発生してしまう.



図 4.26: BFS Up\*/Down\* および L-turn/ $\alpha$  ルーティングの経路例



図 4.27: 同 depth スイッチ間チャネルの方向割当ての違いによる L-turn ルーティングの禁止ターン分布の違い

なお,図4.27 では L-turn ルーティングの場合の禁止ターン例を示しているが, R-turn ルーティングの場合も同様にして,禁止ターンが分散されている.

4.2.5 H/V グラフ構築時の前順走査における訪問スイッチ選択ポリシー

L-turn および R-turn ルーティングでは,第4.1.2節で述べたように,H/V グラフ構築時に行なう前順走査において,次に訪問する子スイッチとして2つ以上の子スイッチが選択可能となる場合がある.この選択は,訪問スイッチ選択ポリシーにより行なわれる.選択ポリシーの違いにより,同一ネットワークに対して異なる horizontal spread の割当てがなされるため,これにより異なる H/V グラフが構築されうる.

訪問スイッチ選択ポリシーの例として,次のポリシーが挙げられる.

- (a) random 訪問スイッチをランダムに選択する.
- (b) less child-node first
   サブツリー以下の子スイッチの数が最小となるスイッチを選択する.
- (c) more child-node first
   サブツリー以下の子スイッチの数が最大となるスイッチを選択する.
- (d) more upper-channel first
   サブツリー以下の子スイッチが持つ up 方向の スパニングツリー構成外チャネル数の合計が最大となるスイッチを選択する.

random 以外の選択ポリシーでは,同じ条件を満たすスイッチが複数存在する場合には, それらの中からランダムに選択をするものとしている.これらのうち more upper-channel first が,禁止ターンのより均等な分散の実現に適しており,他のポリシーに比べて,平均 的にスループットが向上することが確認されている.これは,more upper-channel first で は,他のポリシーに比べて,図4.27(b)のような禁止ターンの分散を実現しやすいためで ある.

これらの選択ポリシーの違いによる性能への影響については,第5章で述べる.

## 4.2.6 既存のルーティングアルゴリズムとの比較

ここでは,L-turn および R-turn ルーティングと,第3.1節で述べた付加的なハードウェ アに依存しない既存のルーティングアルゴリズムについてまとめたものを,表4.3に示す. 表4.3の計算量において,nはスイッチ数,mはチャネル数を指す.

表 4.3 に示すように,付加的なハードウェアに依存しないルーティングアルゴリズムは, Turn モデル (スパニングツリー) をベースとするか否かで,大きく 2 つに分類することが できる.

|             | L-turn     | BFS                             | DFS                             | Smart    | Adaptive |
|-------------|------------|---------------------------------|---------------------------------|----------|----------|
|             | R-turn     | $\mathrm{Up}^*/\mathrm{Down}^*$ | $\mathrm{Up}^*/\mathrm{Down}^*$ |          | Trail    |
| スパニングツリー利用  | yes (BFS)  | yes (BFS)                       | yes (DFS)                       | no       | no       |
| Turn モデルベース | yes $(2D)$ | yes $(1D)$                      | yes $(1D)$                      | no       | no       |
| 禁止ターン集中     | low        | high                            | medium                          | -        | -        |
| トポロジフリー     | yes        | yes                             | yes                             | yes      | no       |
| 計算量         | $O(n^2)$   | $O(n^2)$                        | $O(n^2)$                        | $O(n^9)$ | $O(m^2)$ |

表 4.3: 付加的なハードウェアに依存しないルーティングアルゴリズムの比較

## 4.2.7 イレギュラーネットワーク向けルーティングアルゴリズムの分類

イレギュラーネットワーク向けのルーティングアルゴリズムは,一般的に,仮想チャネルの利用およびスパニングツリーの利用の有無で大きく分類される.スパニングツリーベースのルーティングアルゴリズムである Up\*/Down\* ルーティングおよび本章で提案したL-turn および R-turn ルーティングは,先に述べたように,Turn モデルをベースとするルーティングアルゴリズムであるため,有向グラフにおける方向の次元数に基づいて更に分類することができる.そこで,第3.1節で述べたイレギュラーネットワーク向けのルーティングアルゴリズムおよび L-turn および R-turn ルーティングの分類を,Turn モデルの視点による分類を追加した上で行なうと,図4.28のように分類することができる.

理論上,有向グラフの次元数は,n次元(n > 2)に拡張することが可能であると考えられる.そこで,図4.28では,n次元有向グラフ(n次元 Turn モデル)を追加している.図4.28のように,仮想チャネルを利用するルーティングアルゴリズム [MJ80, SD00, SLT02, JPMJ02, MAH03]は,パケット転送中の仮想チャネルの切り替え (virtual channel transitions)の有無で更に分類される.理論上は,スパニングツリーおよび有向グラフをベースとすることにより,仮想チャネルを用いた Turn モデルベースのルーティングアルゴリズムを実装することが可能である.しかし,仮想チャネルを用いたルーティングアルゴリズムにおいては,図4.28のDLルーティングおよびMinimalルーティングなどのように,Turn モデルベースの手法を独自の手法と組み合わせて併用しているケースがあり,明確にTurn モデルとしての分類を行なうことが難しい.そのため,図4.28では仮想チャネル利用時のTurn モデルとしての分類については省略をしている.

## 4.3 研究の過程と本論文の位置付けについて

L-turn および R-turn ルーティングは,筆者と鯉渕の共同研究の成果であり,鯉渕の博 士論文 [鯉渕 02] の一部においても述べられている.以下,L-turn および R-turn ルーティ ングに関する研究の過程と筆者が担当した作業内容について述べ,本論文の位置付けにつ いてまとめる.

まず, L-turn および R-turn ルーティングの発端は, Up\*/Down\* ルーティングにおける2つの方向を4つに増加させた上で禁止ターン選択を行なうことにより, イレギュラーネットワークにおいて, より効率的なルーティングを実現できるのではないか, という鯉



図 4.28: イレギュラーネットワーク向けルーティングアルゴリズムの分類

渕の提案によるものである.そこでまず,筆者と鯉渕により,前順走査を利用した2次元 有向グラフであるH/V グラフの構築手順が確立された.当初は,H/V グラフにおける Turn モデルの適用手順が確立されておらず,まず,第4.2.1節で述べた2次元メッシュに おけるTurn モデルと同様の直観的な選択により,LU方向へ向かうターン集合だけを禁 止ターンとして選択したルーティングアルゴリズム<sup>5</sup>が鯉渕により提案され,確率モデル シミュレーションによる予備評価が行なわれた.予備評価およびこれ以降の評価では,筆 者が実装したフリットレベルの相互結合網シミュレータが用いられた.

予備評価の結果,選択した禁止ターン集合だけではデッドロックが発生することが確認 されたため<sup>6</sup>,その後,筆者と鯉渕により,シミュレーションの結果を基にして,形成可能 な循環構造の識別とデッドロックフリー実現のために必要な2つの禁止ターンの追加が行 なわれた.これにより,L-turn/αとほぼ同等の禁止ターンを課す(冗長禁止ターンの除去 は行なわれていない)1つのデッドロックフリールーティングアルゴリズムが導出された. しかし,改めて予備評価を行なった結果,イレギュラーネットワークにおけるスループッ

<sup>&</sup>lt;sup>5</sup>これが L-turn ルーティングの原形となった

 $<sup>^6</sup>$ 図 4.24 で示されている通り , L-turn ルーティングでは , LU 方向へ向かうターン以外に更に 2 つのター ンを禁止する必要がある

ト向上は予想よりも低い値となった.分析の結果,この原因は,冗長禁止ターンが存在す るためであることが確認された.そこで,更なる性能向上実現のために,筆者により冗長 禁止ターン除去のための循環構造検出アルゴリズムが提案された.これにより,L-turn/ に相当する1つのデッドロックフリールーティングアルゴリズムが確立し,評価の結果, 高い性能向上が確認された[MAAH01].

しかし,この時点ではまだ本論文で述べた H/V グラフにおける Turn モデルの適用手順が確立されておらず,L-turn/ $\beta$ ,R-turn/ $\alpha$  および R-turn/ $\beta$  ルーティングの定義がなされていなかった.そこで,その後筆者により,H/V グラフにおけるシステマティックな 2 次元 Turn モデルの適用手順が提案され,これにより本論文で提案した 4 つのデッドロックフリールーティングアルゴリズムの定義がなされた [AMAH02,上樂 03].

以上より,主に筆者が担当した作業内容をまとめると次の通りとなる.

- H/V グラフ構築手順の確立
- 循環構造検出アルゴリズムの確立
- H/V グラフにおける 2次元 Turn モデル適用手順の確立 (4 つのルーティングアルゴリズムの導出)
- 評価用フリットレベル相互結合網シミュレータの実装

- L-turn および R-turn ルーティングの構築手順における 2次元 Turn モデル適用手順の具体化 (第 4.2 節)
- より多くの評価指標を用いた性能評価(第5章)
  - 禁止ターン分散の度合いを示す静的な評価指標の分析
  - 経路分散の度合いを示す静的な評価指標の分析
- L-turn および R-turn ルーティングの性能に影響する要素の評価
  - ルートスイッチ選択ポリシー (第 5.2.4 節)
  - H/V グラフ構築時の前順走査における訪問スイッチ選択ポリシー (第 4.2.5 節, 第 5.2.5 節)
- L-turn および R-turn ルーティング をソースルーティング方式 (固定型ルーティング) として実装した場合の評価 (第 5.3 節)

## 4.4 まとめ

本章では,Up\*/Down\*ルーティングにおいて問題となるトラフィックの偏りを改善す るために,より均等なトラフィックの分散の実現を目的とする適応型ルーティングアルゴ リズムである L-turn ルーティングおよび R-turn ルーティングの提案を行なった.L-turn および R-turn ルーティングは,Up\*/Down\* ルーティングで利用されているスパニング ツリーベースの1次元有向グラフを拡張した H/V グラフと呼ばれる2次元有向グラフを 利用する.H/V グラフの導入により,形成可能なターンの数は従来の6倍である12パ ターンに増加し,これによりトラフィックの分散を考慮したより柔軟な禁止ターンの選択 を行なってデッドロックフリーを実現することが可能となる.そして,H/V グラフに対し て,禁止ターンの分散を考慮した2次元 Turn モデルをシステマティックな手法で適用す ることにより,L-turn および R-turn ルーティングが導出される.この際,循環構造検出 アルゴリズムを導入することにより,冗長な禁止ターンを削除し,更なる性能向上の実現 を図っている.L-turn および R-turn ルーティングは,スパニングツリーの構築と2次元 Turn モデルの適用をベースとすることにより,Up\*/Down\* ルーティングと同等の高い 汎用性を実現しており,任意のSAN およびトポロジに適用可能となっている.

## 第5章 評価

本章では,確率モデルシミュレーションにより L-turn および R-turn ルーティングと BFS および DFS Up\*/Down\* ルーティングの性能評価を行なった結果を示す.

以降,第5.1節で評価環境を示し,第5.2節と第5.3節で,各ルーティングアルゴリズ ムを分散ルーティング方式(適応型ルーティング)およびソースルーティング方式(固定型 ルーティング)により実装した場合の評価結果をそれぞれ順に示す.

## 5.1 評価環境

## 5.1.1 相互結合網シミュレータ

性能評価のために,フリットレベルでのパケット転送をシミュレートする相互結合網シ ミュレータを C++ により実装した.このシミュレータは,並列計算機,SAN などにお ける様々な相互結合網の性能評価を目的としており,トポロジ,ルーティングアルゴリズ ム,パケット転送方式,パケット長,リンク間レイテンシなどの相互結合網に関する各パ ラメータを選択可能となっている.汎用性を高めるため,相互結合網の一般的な構成要素 であるルータ,リンク,パケット,ネットワークインタフェースなどが,これらの動作を シンプルにシミュレートした基本クラスとして実装されており,対象とするネットワーク に応じて,適宜,スイッチ間結合パターン(トポロジ)の記述,各クラスの機能拡張(対象 とするルーティングアルゴリズムの実装など)を行なうことにより所望するシミュレータ が実装される.本論文の評価で用いたシミュレータは,単純なスイッチ間のパケット転送 動作をシミュレートしており,任意のトポロジ,スパニングツリーベースの各ルーティン グアルゴリズムを選択可能となっている.

このシミュレータは,シミュレーション方式として確率モデルシミュレーションを用い る.確率モデルシミュレーションは、メモリアクセスのパターンなどを乱数モデルに基づ いて発行して評価を行う方法であり,相互結合網やメモリシステムなどの評価を行なう際 によく用いられる.シミュレーション方式としては,確率モデルシミュレーションの他に, トレースドリブンシミュレーションおよび命令レベルシミュレーションなどが挙げられる. トレースドリブンシミュレーションは、実機上でアプリケーションプログラムを実行して メモリ参照のアドレスのトレースデータをとり、それをシミュレータに入力して評価を行 なう方法である.また,命令レベルシミュレーションは、CPUのインストラクションのレ ベルまでソフトウェアでシミュレートして、実機と同様の環境を構築して評価する方法で ある.これらの方式は,確率モデルシミュレーションに比べて,より現実的な評価を行う ことができるが,シミュレータの開発が困難であり,また、シミュレーションの実行時間 が膨大になるため、SANのルーティングアルゴリズムに関する性能評価では確率モデル シミュレーションが用いられることが多い.このため,本研究においても,性能評価に確 率モデルシミュレーションを用いている.

## 5.1.2 シミュレーション条件

L-turn および R-turn ルーティングと BFS および DFS Up\*/Down\* ルーティングにつ いて,(1) ルーティング方式,(2) トポロジ,(3) トポロジサイズ,(4) トラフィックパター ン,の組み合わせを変えてそれぞれ評価を行なった. これらは次の通りに指定した.

- (1) ルーティング方式
  - (a) 分散ルーティング方式 (適応型ルーティング)
  - (b) ソースルーティング方式 (固定型ルーティング)
- (2) トポロジ
  - (a) イレギュラーネットワーク
  - (b) 2次元メッシュ
  - (c) 2次元トーラス
- (3) トポロジサイズ
  - (a) 16 スイッチ (メッシュとトーラスでは  $4 \times 4$  スイッチ構成)
  - (b) 64 スイッチ (メッシュとトーラスでは  $8 \times 8$  スイッチ構成)
- (4) トラフィックパターン
  - (a) uniform
  - (b) bit-reversal

ソースルーティング方式の場合,各スイッチ間の経路は Sancho の経路選択アルゴリズ ム [JA00] を用いて決定された 1 つの経路だけを常に用いるようにした.このアルゴリズ ムは, crossing path が可能な限り小さくなるように経路選択を行なうという点が特徴であ り,これにより,固定型ルーティングにおける効率的なトラフィック分散の実現を図って いる.ソースルーティング方式における評価は,適応型ルーティングである各ルーティン グアルゴリズムを固定型ルーティングとして利用した場合の性能比較を目的としている.

イレギュラーネットワークについては, それぞれ 20 パターンの異なるトポロジを生成し てシミュレーションを行ない, それらの結果の平均値について評価を行なった.スパニング ツリーは, BFS スパニングツリーとして,第3.1.1節で述べた, minimum depth スパニン グツリー (MDST), DFS スパニングツリーとして,第3.1.2節で述べた, ヒューリスティッ クルールに基づいた DFS スパニングツリーを用いた.前者は, BFS Up\*/Down\* ルー ティングと L-turn および R-turn ルーティングの構築に用い,後者は, DFS Up\*/Down\* ルーティングの構築に用いた.各ルーティングアルゴリズムにおいて,スパニングツリー のルートスイッチは,第3.1.2.4 節で述べた, crossing path と average distance の値によ り決定するヒューリスティックルールにより選択した.また,L-turn および R-turn ルー ティングの H/V グラフ構築時の前順走査における訪問スイッチ選択は,第4.2.5 節で述 べた more upper-channel first を用いて行なった.

ルートスイッチの選択と訪問スイッチの選択が L-turn および R-turn ルーティングの 性能に影響を与えることを,評価結果の一例を挙げてそれぞれ 第 5.2.4 節 および第 5.2.5 節 でそれぞれ示す.

シミュレーションにおいて, 各パケットの目的地は, 次の2つのトラフィックパターン により決定した.

• uniform

すべての目的地はランダムに決定され,均一に分散される.

• bit reversal

まず,各 PC に 0 から n-1 (n は PC 数) までの昇順の 2 進数の番号を割当てる. 2 進数の番号 ( $a_0, a_1, \dots, a_{n-2}, a_{n-1}$ )を持つ PC は,自身の番号のビット列を逆順 に並べた番号 ( $a_{n-1}, a_{n-2}, \dots, a_1, a_0$ )の PC を目的地とする.なお,ビット列を逆 順に並べた番号が,自身と同じである場合には,全ビットを反転した番号の PC に パケットを送るものとした.

次に,シミュレーションにおけるその他の共通パラメータを述べる.

| へ ひ ひ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 |              |  |  |  |  |  |
|-----------------------------------------|--------------|--|--|--|--|--|
| 実行時間                                    | 500,000 クロック |  |  |  |  |  |
| スイッチのポート数                               | 8            |  |  |  |  |  |
| スイッチあたりの接続 PC 数                         | 4            |  |  |  |  |  |
| チャネル数                                   | 物理チャネル1本     |  |  |  |  |  |
| パケット長                                   | 128 フリット     |  |  |  |  |  |
| パケット転送方式                                | VCT 方式       |  |  |  |  |  |
| 1hop に要するフリット転送時間                       | 最低 23 クロック   |  |  |  |  |  |
| OSF(分散ルーティング方式時)                        | ランダム         |  |  |  |  |  |

表 5.1: 共通シミュレーションパラメータ

シミュレータのスイッチのポート数は,既存の Myrinet スイッチ M3F-SW8<sup>1</sup> および RHiNET-2/SW[STH<sup>+</sup>00] を想定して,8ポートとした.8ポートのうち,4ポートは各々 異なる PC に直結し,残りの4ポートは他のスイッチとの接続に利用した.パケットの先 頭フリットがスイッチに到着してから隣接スイッチに転送されるまでのフリット転送時間 は,ルーティングを行ないクロスバを通過可能となるまでに最短で20クロック,スイッ チ内のクロスバの移動に1クロック,スイッチ間の移動に2クロック要するものとした. L-turn ルーティングと R-turn ルーティングは,仮想チャネルを持たない SAN を主な対 象としているため,シミュレーションにおいて,各スイッチは,1本の物理チャネルだけを

<sup>&</sup>lt;sup>1</sup>http://www.myrinet.com/myrinet/product\_list.html

利用するものとした.分散ルーティング方式の場合,選択可能な物理チャネルの中からランダムに出力物理チャネルを選択するランダム選択機構 [SB97] を OSF として使用した.

#### 5.1.3 評価指標

次の指標について評価を行った.

#### スループット

全 PC がクロックあたりに受信するフリット数の平均値を受信トラフィックとし, 飽和 時点の受信トラフィック値をスループットとした.受信トラフィックは,全 PC が毎クロッ クに1フリット受信する場合を1とした.

## レイテンシ

出発地の PC が, パケットの先頭フリットを NIC の入力バッファに挿入した時刻を  $t_0$ , 目的地の PC の NIC がパケットの末尾のフリットを受け取った時刻を  $t_1$ とする.ここで,  $t_1 - t_0$ をレイテンシとした.

#### 経路制限の度合いを示す静的な評価指標

- *MPR*(Minimal Path Rate)
   全経路のうち,トポロジ的な最短経路と等しい経路の割合(%)を MPR とした.
- *PT*(Prohibited Turns)
   各スイッチにおける禁止ターン数の平均値を *PT* とした.

上記の2つの評価指標について, *MPR* はより大きいほど, *PT* はより小さいほど, ルー ティングアルゴリズムによる経路制限がより小さいことを示す目安となる.

#### 禁止ターン分散の度合いを示す静的な評価指標

- SDPT(Standard Deviation of Prohibited Turns) PT の標準偏差を SDPT とした .
- *PPT*(Pairs of Prohibited Turns)
   各スイッチにおける禁止ターンペア数の平均値を *PPT* とした.

上記の2つの指標は,より小さいほど,禁止ターンがより均等に分散されていることを 示す目安となる.

#### 経路分散の度合いを示す静的な評価指標

- *CPUP*(Crossing routing Paths on UP channel)
   up 方向に向かう各チャネルを通過する経路数 (crossing routing path)の平均値を
   *CPUP*とした.*CPUP*は,ルートスイッチ方向へのトラフィック量の目安となる.
- *CPDW*(Crossing routing Paths on DoWn channel) down 方向に向かう各チャネル上の crossing routing path の平均値を *CPDW* とした. *CPDW* は,葉スイッチ方向へのトラフィック量の目安となる.

## 5.2 分散ルーティング方式における評価結果

まず,分散ルーティング方式(適応型ルーティング)における評価結果を各トポロジについて,順に示す.

## 5.2.1 イレギュラーネットワークにおける評価

(1) スループットの評価

16 および 64 スイッチのイレギュラーネットワークにおける各ルーティングアルゴリズ ムの uniform および bit-reversal トラフィックにおけるスループットの平均値を,表 5.2 に示す.

表 5.2 より, すべての条件において, 2 つの L-turn ルーティングのいずれかがもっとも 高いスループットを実現していることがわかる.BFS Up\*/Down\* ルーティングに対する スループット向上は, 16 スイッチの場合に約 7~9%, 64 スイッチの場合に約 22~29%と なっており, DFS Up\*/Down\* ルーティングに対する性能向上は, 16 スイッチの場合に 約 3~9%, 64 スイッチの場合に約 8~14% となっている.これより, スイッチ数が大きく なるほど L-turn ルーティングの効果が大きくなっていることがわかる.L-turn ルーティ ングのスループットは, uniform トラフィックの場合よりも bit-reversal トラフィックの場 合の方がより高くなっているが, この傾向は,他のルーティングアルゴリズムについても 同様となっている.L-turn/ $\alpha$  と L-turn/ $\beta$  のスループット差は,最大でも 64 スイッチの 場合の約 3% であり,これらは,ほぼ同等のスループットを達成しているといえる.

一方,2つの R-turn ルーティングは,16スイッチの場合に BFS Up\*/Down\* ルーティングとほぼ同等のスループットを示すにとどまり,64スイッチの場合には,もっとも低いスループットにまで落ちこんでいることがわかる.L-turn ルーティングとは対照的に,スイッチ数が大きくなるほどスループット低下が大きくなっており,特に,64スイッチのbit-reversal トラフィックでは,BFS Up\*/Down\* ルーティングに対して,最大となる約16%のスループット低下となっている.R-turn/ $\alpha$ と R-turn/ $\beta$ のスループット差は,最大でも 64 スイッチの場合の約3% であり,L-turn ルーティングと同様に,ほぼ同等のスループットを実現しているといえる.

DFS Up\*/Down\* ルーティングは, 16 スイッチの bit-reversal トラフィックを除いて, 2 つの L-turn ルーティングに次ぐスループットを実現しており, L-turn と同様に, スイッ チ数が大きくなるほどスループット向上の度合いが大きくなっていることがわかる.

|                       | 16 スイッチ |              | 64 スイッチ |              |
|-----------------------|---------|--------------|---------|--------------|
|                       | Uniform | Bit-reversal | Uniform | Bit-reversal |
| BFS Up*/Down*         | 0.1050  | 0.1332       | 0.0357  | 0.0389       |
| DFS Up*/Down*         | 0.1090  | 0.1334       | 0.0383  | 0.0451       |
| $L$ -turn/ $\alpha$   | 0.1124  | 0.1435       | 0.0434  | 0.0486       |
| $L$ -turn/ $\beta$    | 0.1122  | 0.1450       | 0.0438  | 0.0500       |
| R-turn/ $\alpha$      | 0.1053  | 0.1343       | 0.0331  | 0.0336       |
| $\text{R-turn}/\beta$ | 0.1032  | 0.1347       | 0.0340  | 0.0338       |

表 5.2: イレギュラーネットワークにおける平均スループット

#### (2) レイテンシの評価

次に,16 および 64 スイッチのイレギュラーネットワークにおける各ルーティングアル ゴリズムの uniform および bit-reversal トラフィックにおける受信トラフィックとレイテ ンシの関係を示したグラフを,図 5.1 および図 5.2 にそれぞれ示す.図 5.1 および図 5.2 は,ランダムに生成した 20 のトポロジのうち,各 L-turn ルーティングと R-turn ルー ティングのレイテンシが平均に近いトポロジにおける結果を示している.図において,各 ルーティングアルゴリズムのレイテンシの優劣の傾向はスループットとほぼ同様であり, L-turn ルーティングがすべての条件でもっとも低いレイテンシを実現する一方で,R-turn ルーティングがもっとも高いレイテンシとなっている.

#### (3) 静的な評価指標の評価

次に,16 および 64 スイッチのイレギュラーネットワークにおける,各ルーティングア ルゴリズムの静的な評価指標について,表 5.3 および表 5.4 にそれぞれ示す.まず,表 5.3 において,経路制限の度合いを示す *MPR と PT* については,DFS Up\*/Down\* ルーティ ングが若干優れた値を示し,その他のルーティングについては,ほぼ同等であることがわ かる.これより,DFS Up\*/Down\* ルーティングは,禁止ターン数を減らすことにより, 他のルーティングよりも多くの最短経路を確保していると考えられる.これに対し,禁止 ターン分散の度合いを示す *SDPT と PPT* については,各 L-turn および R-turn ルー ティングが,各 Up\*/Down\* ルーティングに比べて大幅に小さな値を実現していることが わかる.各 L-turn および R-turn ルーティングの *SDPT と PPT* は,ほぼ同等であり, BFS Up\*/Down\* ルーティングに対して,*SDPT* については約 40%,*PPT* については 約 80% の減少を実現し,同様に,DFS Up\*/Down\* ルーティングに対しては,それぞれ 約 25%,約 75%の減少を実現している.これより,L-turn および R-turn ルーティング は,Up\*/Down\* ルーティングに比べて,より均等な禁止ターン分散を実現しているとい える.

しかし,ほぼ同等の SDPT と PPT を実現しているにもかかわらず,表 5.2 において,L-turn ルーティングがスループット向上を実現する一方で,R-turn ルーティングは, Up\*/Down\* ルーティングと同程度のスループットの実現にとどまっている.この原因は, 経路分散の度合いを示す CPUP と CPDW の違いによるものと考えられる.表 5.3 に



図 5.1: イレギュラーネットワーク (16 スイッチ) における受信トラフィックと 平均レイテンシ



図 5.2: イレギュラーネットワーク (64 スイッチ) における受信トラフィックと 平均レイテンシ

おいて,L-turn ルーティングでは,CPUP より CPDW の値が大きくなっていること から、ルートスイッチ方向よりも葉スイッチ方向により多くのトラフィックが流れやすく なっていると考えられる.これにより,L-turn ルーティングでは,ルートスイッチ周辺の ホットスポット発生が緩和され,葉スイッチ周辺により多くのトラフィックが分散された ことにより,スループットの向上を実現したものと考えられる.一方,R-turn ルーティン グでは,CPDW より CPUP の値が大きくなっていることから,L-turn ルーティング と対照的に,ルートスイッチ方向にトラフィックが流れやすくなり,ルートスイッチ周辺 のホットスポットがより発生しやすくなっているものと考えられる.この原因として,次 のような R-turn ルーティングの禁止ターンの特性が考えられる . R-turn ルーティングで は,ターン T<sub>RD LU</sub> を除く LU 方向へのターンをすべて許可しているため,これにより パケットがルートスイッチ方向に集中しやすくなるものと考えられる.一方, RD 方向か らその他の方向へのターンは禁止されているため,対照的に葉方向にはパケットが転送さ れにくくなっているものと考えられる.これらの特性により, R-turn ルーティングでは, L-turn ルーティングと異なり,スループット向上が実現できなかったものと考えられる. なお,各Up\*/Down\* ルーティングにおける CPUP と CPDW は等しくなっている が,これは,  $Up^*/Down^*$  ルーティングでは, (1) up と down の 2 つの方向しか存在し

が, これは, 0p-/Down ルーティングでは, (1) up と down の 2 つの方向じが存在し ない, (2) 任意のスイッチ間には, 互いに反対方向に向かう対照的な 2 つの経路が存在す る,という特性のためである.スパニングツリーベースの有向グラフでは, 葉スイッチ周 辺よりもルートスイッチ周辺に近づくにつれ利用可能な経路が少なくなるため, *CPUP* と *CPDW* が等しい場合, ルートスイッチ方向にトラフィックが偏りやすくなると考えら れる.

|                     | MPR  | PT    | SDPT  | PPT   | CPUP  | CPDW  |
|---------------------|------|-------|-------|-------|-------|-------|
| BFS Up*/Down*       | 89.6 | 3.181 | 3.723 | 1.591 | 11.40 | 11.40 |
| DFS Up*/Down*       | 92.9 | 2.863 | 3.061 | 1.431 | 11.73 | 11.73 |
| $L$ -turn/ $\alpha$ | 88.9 | 3.175 | 2.264 | 0.366 | 10.76 | 12.54 |
| $L$ -turn/ $\beta$  | 88.8 | 3.172 | 2.379 | 0.388 | 10.66 | 12.78 |
| R-turn/ $\alpha$    | 88.8 | 3.184 | 2.300 | 0.375 | 12.54 | 10.78 |
| m R-turn/eta        | 88.6 | 3.163 | 2.328 | 0.369 | 12.64 | 10.74 |

表 5.3: イレギュラーネットワーク (16 スイッチ) における静的な評価指標

次に,表 5.4 についてみると,64 スイッチの場合の各ルーティングアルゴリズムの優劣 の傾向は,16 スイッチの場合の表 5.3 と同様であり,各 L-turn および R-turn ルーティン グがもっとも均等な禁止ターンの分散を実現していることがわかる.ただし,64 スイッチ の場合には,各ルーティングアルゴリズムの *MPR* が 16 スイッチの場合に比べて約 20-25% 減少していることから,トポロジ的な最短経路が確保しにくくなっているといえる. これにより,スイッチ数が増加した場合には,禁止ターンのより均等な分散と葉スイッチ 方向へのトラフィックの分散が,スループット向上のためにより重要となるものと考えら れる.表 5.2 において,64 スイッチの場合に,L-turn ルーティングのスループット向上 の割合が増加する一方で,R-turn ルーティングのスループット低下の割合が増加した原 因は,このためであると考えられる.

|                     | MPR  | PT    | SDPT  | PPT   | CPUP  | CPDW  |
|---------------------|------|-------|-------|-------|-------|-------|
| BFS Up*/Down*       | 64.2 | 2.994 | 3.626 | 1.497 | 86.16 | 86.16 |
| DFS Up*/Down*       | 72.9 | 2.602 | 2.454 | 1.301 | 85.54 | 85.54 |
| $L$ -turn/ $\alpha$ | 66.9 | 2.890 | 2.288 | 0.316 | 82.94 | 91.63 |
| $L$ -turn $/\beta$  | 67.1 | 2.866 | 2.271 | 0.306 | 82.47 | 91.69 |
| m R-turn/lpha       | 67.0 | 2.886 | 2.281 | 0.316 | 91.14 | 82.38 |
| m R-turn/eta        | 67.0 | 2.863 | 2.269 | 0.302 | 91.96 | 82.74 |

表 5.4: イレギュラーネットワーク (64 スイッチ) における静的な評価指標

以上より,表 5.2 において,L-turn ルーティングが DFS Up\*/Down\* ルーティングよ りも高いスループットを実現していることから,スループットの向上には,禁止ターン数 の削減よりも禁止ターンのより均等な分散による効果の方が大きいと考えられる.ただし, 先に述べた L-turn ルーティングと R-turn ルーティングの性能差の原因から,スループッ ト向上のためには,より均等な禁止ターンの分散と葉スイッチ方向へのトラフィック分散 の両立が重要であると考えられる.

#### 5.2.2 2次元メッシュにおける評価

(1) スループットの評価

 $4 \times 4$  および  $8 \times 8$  スイッチの 2次元メッシュにおける各ルーティングアルゴリズムの uniform および bit-reversal トラフィックにおけるスループットを,表 5.5 に示す.イレギュラーネットワークにおける結果と同様に,すべての条件において,L-turn ルーティングがもっとも高いスループットを実現しており,スループット向上はスイッチ数が大きい ほどより大きくなっている.BFS Up\*/Down\* ルーティングに対するスループット向上は,イレギュラーネットワークの場合よりも大きく,約 10~50%の向上となっている.同様に,R-turn ルーティングは,すべての条件において,BFS Up\*/Down\* ルーティングに対し てスループットが低下しており,スループット低下はスイッチ数が大きいほどより大きくなっている.BFS Up\*/Down\* ルーティングに対するスループット低下は,同様に,イレギュラーネットワークの場合よりも大きく,約 10~30%の低下となっている.L-turn/αとL-turn/β および R-turn/αとR-turn/β のスループットがそれぞれ同じ値となっているが,これは,4×4 および 8×8 スイッチ構成の 2次元メッシュにおいて,これらによる全スイッチ間の経路 (禁止ターン分布) がそれぞれまったく同じものとなっているためである.

イレギュラーネットワークにおける結果と異なり,2次元メッシュでは,DFS Up\*/Down\* ルーティングのスループット低下が顕著となっている.16スイッチの uniform トラフィック の場合を除いたすべての条件で,もっとも低いスループットを示し,特に,BFS Up\*/Down\* ルーティングに対しては,最大で約40%,L-turn ルーティングに対しては,最大で約60% の低下となっている.

|                       | 4 × 4 スイッチ |              | 8 × 8 スイッチ |              |
|-----------------------|------------|--------------|------------|--------------|
|                       | Uniform    | Bit-reversal | Uniform    | Bit-reversal |
| BFS Up*/Down*         | 0.0863     | 0.0877       | 0.0357     | 0.0380       |
| DFS Up*/Down*         | 0.0796     | 0.0601       | 0.0215     | 0.0226       |
| $L$ -turn/ $\alpha$   | 0.0963     | 0.1069       | 0.0510     | 0.0575       |
| $L$ -turn/ $\beta$    | 0.0963     | 0.1069       | 0.0510     | 0.0575       |
| R-turn/ $\alpha$      | 0.0791     | 0.0769       | 0.0257     | 0.0300       |
| $\text{R-turn}/\beta$ | 0.0791     | 0.0769       | 0.0257     | 0.0300       |

表 5.5: 2次元メッシュにおけるスループット

(2) レイテンシの評価

次に,4×4 および8×8 スイッチの2次元メッシュにおける各ルーティングアルゴリズムの uniform および bit-reversal トラフィックにおける受信トラフィックとレイテンシの関係を示したグラフを,図5.3 および図5.4 にそれぞれ示す.図より,各ルーティングアルゴリズムのレイテンシの優劣の傾向は,イレギュラーネットワークと同様に,スループットとほぼ同様であり,L-turn ルーティングが,すべての条件でもっとも低いレイテンシを実現している.R-turn ルーティングは,DFS Up\*/Down\* ルーティングに比べると,ほぼ同等またはより低いレイテンシを実現しているが,BFS Up\*/Down\* ルーティングに対しては,より高いレイテンシとなっている.

(3) 静的な評価指標の評価

次に,  $4 \times 4$  および  $8 \times 8$  スイッチの 2 次元メッシュにおける, 各ルーティングアル ゴリズムの静的な評価指標について,表 5.6 および表 5.7 にそれぞれ示す.表 5.6 および 表 5.7 より, 経路制限に関する MPR と PT については,  $8 \times 8$  スイッチにおける DFS Up\*/Down\* ルーティングをのぞいて,各ルーティングアルゴリズムは,ほぼ同等の値を 示すことがわかる.特に, MPR の値から, 2次元メッシュにおける経路のほとんどは, トポロジ的な最短経路となることがわかる.これに対し,禁止ターン分散の度合いを示す SDPT と PPT については,  $8 \times 8$  スイッチにおける BFS Up\*/Down\* ルーティングの SDPT をのぞいて,イレギュラーネットワークの場合と同様に,各L-turn および R-turn ルーティングが,もっとも小さい値を実現しており,特に PPT については,4×4 スイッ チで 0 , 8 imes 8 スイッチで  $\mathrm{Up}^*/\mathrm{Down}^*$  ルーティングに対して 約 92% の減少となり , 大幅 に禁止ターンのペアを削減していることがわかる.これより,イレギュラーネットワーク の場合と同様に,L-turn ルーティングと R-turn ルーティングが,より均等な禁止ターン の分散を実現しているといえる.また,経路分散に関する各ルーティングアルゴリズムの CPUP と CPDW の差についても, イレギュラーネットワークと同様の傾向となってい ることがわかる.このため,同様に,L-turn ルーティングにおいてはスループットが向上 し, R-turn ルーティングにおいてはスループットが低下したものと考えられる.



図 5.3: 2次元メッシュ(4×4スイッチ)における受信トラフィックと平均レイテンシ



図 5.4: 2次元メッシュ(8×8スイッチ)における受信トラフィックと平均レイテンシ

|                       | MPR | PT    | SDPT  | PPT   | CPUP  | CPDW  |
|-----------------------|-----|-------|-------|-------|-------|-------|
| BFS Up*/Down*         | 100 | 1.125 | 0.992 | 0.563 | 35.67 | 35.67 |
| DFS Up*/Down*         | 100 | 1.125 | 0.992 | 0.563 | 31.17 | 31.17 |
| $L$ -turn/ $\alpha$   | 100 | 1.125 | 0.781 | 0     | 28.17 | 36.08 |
| $L$ -turn/ $\beta$    | 100 | 1.125 | 0.781 | 0     | 28.17 | 36.08 |
| R-turn/ $\alpha$      | 100 | 1.125 | 0.781 | 0     | 36.08 | 28.17 |
| $\text{R-turn}/\beta$ | 100 | 1.125 | 0.781 | 0     | 36.08 | 28.17 |

表 5.6: 2 次元メッシュ(4 × 4 スイッチ) における静的な性能指標

表 5.7:2 次元メッシュ(8×8 スイッチ) における静的な性能指標

|                       | MPR  | PT    | SDPT  | PPT   | CPUP    | CPDW    |
|-----------------------|------|-------|-------|-------|---------|---------|
| BFS Up*/Down*         | 100  | 1.531 | 0.847 | 0.766 | 1671.43 | 1671.43 |
| DFS Up*/Down*         | 83.5 | 1.750 | 1.953 | 0.875 | 622.96  | 622.96  |
| $L$ -turn/ $\alpha$   | 99.0 | 1.578 | 0.932 | 0.063 | 1075.21 | 1774.31 |
| $L$ -turn/ $\beta$    | 99.0 | 1.578 | 0.932 | 0.063 | 1075.21 | 1774.31 |
| R-turn/ $\alpha$      | 99.0 | 1.578 | 0.932 | 0.063 | 1774.31 | 1075.21 |
| $\text{R-turn}/\beta$ | 99.0 | 1.578 | 0.932 | 0.063 | 1774.31 | 1075.21 |

## 5.2.3 2次元トーラスにおける評価

(1) スループットの評価

 $4 \times 4$  および  $8 \times 8$  スイッチの 2次元トーラスにおける各ルーティングアルゴリズムの uniform および bit-reversal トラフィックにおけるスループットを,表 5.8 に示す.表よ り,その他のトポロジにおける結果と同様に,すべての条件において,L-turn ルーティン グがもっとも高いスループットを実現しており,また,スループット向上はスイッチ数が 大きいほどより大きくなっていることがわかる.BFS Up\*/Down\* ルーティングに対す るスループット向上は,もっとも大きく,約16~83%の向上となっている.一方,R-turn ルーティングは,同様に,一部の条件をのぞいて,BFS Up\*/Down\* ルーティングに対し てスループットが低下していることがわかる.しかし,BFS Up\*/Down\* ルーティングに対し オするスループット低下は,2次元メッシュよりは小さく,最大で約20%の低下となって いる.2次元メッシュほど顕著ではないが,2次元トーラスにおいてもDFS Up\*/Down\* ルーティングのスループットは,一部をのぞいて,BFS Up\*/Down\* ルーティングに比べ て低下しており,BFS Up\*/Down\* ルーティングに対しては,最大で約55%の低下となっている.

(2) レイテンシの評価

次に,  $4 \times 4$  および  $8 \times 8$  スイッチの 2 次元トーラスにおける各ルーティングアルゴリ ズムの uniform および bit-reversal トラフィックにおける受信トラフィックとレイテンシ の関係を示したグラフを,図 5.5 および図 5.6 にそれぞれ示す.

|                     | $4 \times 4$ | スイッチ         | 8 × 8 スイッチ |              |  |
|---------------------|--------------|--------------|------------|--------------|--|
|                     | Uniform      | Bit-reversal | Uniform    | Bit-reversal |  |
| BFS Up*/Down*       | 0.1195       | 0.1356       | 0.0386     | 0.0383       |  |
| DFS Up*/Down*       | 0.1201       | 0.1080       | 0.0362     | 0.0320       |  |
| $L$ -turn/ $\alpha$ | 0.1385       | 0.1590       | 0.0623     | 0.0655       |  |
| $L$ -turn/ $\beta$  | 0.1392       | 0.1574       | 0.0583     | 0.0700       |  |
| R-turn/ $\alpha$    | 0.1200       | 0.1088       | 0.0316     | 0.0331       |  |
| m R-turn/eta        | 0.1211       | 0.1104       | 0.0330     | 0.0393       |  |

表 5.8: 2次元トーラスにおけるスループット

図より,各ルーティングアルゴリズムのレイテンシの優劣の傾向は,その他のトポロジと同様に,スループットの場合とほぼ同様であり,L-turn ルーティングがすべての条件でもっとも低いレイテンシを実現している.

(3) 静的な評価指標の評価

次に,4×4 および8×8 スイッチの2次元トーラスにおける,各ルーティングアル ゴリズムの静的な評価指標について,表5.9 および表5.10 にそれぞれ示す.表5.9 およ び表5.10 より,経路制限に関する *MPR* と *PT* については,各ルーティングアルゴリ ズムは,ほぼ同等の値を示すことがわかる.これに対し,禁止ターン分散の度合いを示す *SDPT* と *PPT* については,その他のトポロジと同様に,各L-turn および R-turn ルー ティングが,もっとも小さい値を示しており,同様に,より均等な禁止ターンの分散を実 現していることがわかる.また,経路分散に関する各ルーティングアルゴリズムの *CPUP* と *CPDW* の差についても,その他のトポロジと同様の傾向であり,同様に,L-turn ルー ティングにおけるスループット向上と R-turn ルーティングにおけるスループット低下に つながっているものと考えられる.

|                     | MPR | PT | SDPT  | PPT   | CPUP  | CPDW  |
|---------------------|-----|----|-------|-------|-------|-------|
| BFS Up*/Down*       | 100 | 3  | 3.240 | 1.5   | 22.00 | 22.00 |
| DFS Up*/Down*       | 100 | 3  | 3.240 | 1.5   | 22.25 | 22.25 |
| $L$ -turn/ $\alpha$ | 100 | 3  | 2.208 | 0.438 | 19.75 | 29.06 |
| $L$ -turn/ $\beta$  | 100 | 3  | 2.208 | 0.438 | 19.75 | 29.06 |
| R-turn/ $\alpha$    | 100 | 3  | 2.208 | 0.438 | 29.06 | 19.75 |
| m R-turn/eta        | 100 | 3  | 2.208 | 0.438 | 29.06 | 19.75 |

表 5.9:2 次元トーラス (4×4 スイッチ) における静的な性能指標



図 5.5: 2次元トーラス  $(4 \times 4 \operatorname{Ad} \operatorname{yf})$ における受信トラフィックと平均レイテンシ



図 5.6: 2次元トーラス (8×8スイッチ) における受信トラフィックと平均レイテンシ

|                       | MPR  | PT    | SDPT  | PPT   | CPUP    | CPDW    |
|-----------------------|------|-------|-------|-------|---------|---------|
| BFS Up*/Down*         | 81.9 | 2.5   | 2.264 | 1.25  | 1014.56 | 1014.56 |
| DFS Up*/Down*         | 88.7 | 2.5   | 2.264 | 1.25  | 654.25  | 654.25  |
| $L$ -turn/ $\alpha$   | 86.5 | 2.516 | 1.601 | 0.234 | 411.07  | 689.68  |
| $L$ -turn/ $\beta$    | 86.3 | 2.516 | 1.649 | 0.234 | 405.73  | 691.76  |
| R-turn/ $\alpha$      | 86.5 | 2.516 | 1.601 | 0.234 | 689.68  | 411.07  |
| $\text{R-turn}/\beta$ | 86.3 | 2.516 | 1.649 | 0.234 | 691.76  | 405.73  |

表 5.10: 2次元トーラス (8×8 スイッチ) における静的な性能指標

#### 5.2.4 ルートスイッチ選択の影響

スパニングツリーの構造は,ルートスイッチの選択により変化するため,Up\*/Down\* ルーティングの性能は,ルートスイッチ選択の影響を受ける [JA00].ここでは,スパニン グツリーベースである L-turn および R-turn ルーティングの性能も,同様にルートスイッ チ選択により影響を受けることを示す.

表 5.11 および表 5.12 は, 16 スイッチおよび 64 スイッチのイレギュラーネットワーク における L-turn/ $\alpha$  および R-turn/ $\alpha$  ルーティングについて,ルートスイッチの選択を, (R1) 先の評価で用いた Sancho のヒューリスティックルールに従ってルートスイッチを決定, (R2) 同ヒューリスティックルールにおいて,最悪の場合の選択を行なうように変更し てルートスイッチを決定,という正反対の 2 つのポリシーに基づいて行なった場合の,ス ループットと静的な評価指標を示している (L-turn/ $\beta$  および R-turn/ $\beta$  においても同等の 結果となるため,ここでは省略する).各トポロジサイズにおいて,先の評価と同じ 20 の 異なるトポロジが用いられており,トラフィックパターンとして,uniform トラフィック を用いている.

表 5.11: イレギュラーネットワーク (16 スイッチ, Uniform) における 平均スループットと静的な評価指標

|                           | Throughput | MPR  | PT    | SDPT  | PPT   |
|---------------------------|------------|------|-------|-------|-------|
| $L$ -turn/ $\alpha(R1)$   | 0.1124     | 88.9 | 3.175 | 2.264 | 0.366 |
| $L$ -turn/ $\alpha(R2)$   | 0.1022     | 86.8 | 3.256 | 2.553 | 0.453 |
| $R$ -turn/ $\alpha(R1)$   | 0.1053     | 88.8 | 3.184 | 2.300 | 0.375 |
| $ m R-turn/\alpha( m R2)$ | 0.0919     | 87.1 | 3.234 | 2.515 | 0.431 |

表 5.11 および表 5.12 より, L-turn/ $\alpha$  および R-turn/ $\alpha$  ルーティングにおいて, ルート スイッチ選択を R2 により行なった場合は, いずれも R1 に対して, スループットとすべ ての静的な評価指標が劣ることがわかる.特に, R2 を用いた場合の L-turn/ $\alpha$  ルーティ ングのスループットは, R1 を用いた場合の R-turn/ $\alpha$  ルーティングのスループットに対 して, 16 スイッチの場合で劣っており, 64 スイッチの場合についてもほぼ同じ程度まで に減少することがわかる.

以上より, L-turn および R-turn ルーティングの性能は, ルートスイッチ選択により影響を受けることが確認された.

|                           | Throughput | MPR  | PT    | SDPT  | PPT   |
|---------------------------|------------|------|-------|-------|-------|
| $L$ -turn/ $\alpha(R1)$   | 0.0434     | 66.9 | 2.890 | 2.288 | 0.316 |
| $L$ -turn/ $\alpha(R2)$   | 0.0346     | 64.7 | 2.950 | 2.381 | 0.357 |
| $R$ -turn/ $\alpha(R1)$   | 0.0331     | 67.0 | 2.886 | 2.281 | 0.316 |
| $ m R-turn/\alpha( m R2)$ | 0.0276     | 64.7 | 2.948 | 2.384 | 0.355 |

表 5.12: イレギュラーネットワーク (64 スイッチ, Uniform) における 平均スループットと静的な評価指標

## 5.2.5 訪問スイッチ選択ポリシーの影響

ここでは,第4.2.5節で述べた,H/V グラフ構築時の前順走査における訪問スイッチ選 択ポリシーが性能に与える影響を示し,4つの選択ポリシーのうち,more upper-channel first がもっとも高い性能を実現することを示す.

表 5.13 および表 5.14 は, 16 スイッチおよび 64 スイッチのイレギュラーネットワーク における L-turn/ $\alpha$  および R-turn/ $\alpha$  ルーティングについて (L-turn/ $\beta$  および R-turn/ $\beta$  においても同等の結果となるため,同様に省略した),異なる 4 つの訪問スイッチ選択ポリシー,(V1) random,(V2) less child-node first,(V3) more child-node first (V4) more upper-channel first,を適用した場合のスループットと静的な評価指標をそれぞれ示している.各トポロジサイズにおいて,先の評価と同じ 20 の異なるトポロジが用いられており,トラフィックパターンとして,uniform を用いている.

表 5.13: イレギュラーネットワーク (16 スイッチ, Uniform) における 平均スループットと静的な評価指標

|                          | Throughput | MPR  | PT    | SDPT  | PPT   |
|--------------------------|------------|------|-------|-------|-------|
| $L$ -turn/ $\alpha(V1)$  | 0.1022     | 86.5 | 3.306 | 2.533 | 0.447 |
| $L$ -turn/ $\alpha(V2)$  | 0.0946     | 86.7 | 3.216 | 3.206 | 0.738 |
| $L$ -turn/ $\alpha(V3)$  | 0.1022     | 86.8 | 3.281 | 2.551 | 0.459 |
| $L$ -turn/ $\alpha$ (V4) | 0.1124     | 88.9 | 3.175 | 2.264 | 0.366 |
| $R$ -turn/ $\alpha$ (V1) | 0.0912     | 86.7 | 3.300 | 2.526 | 0.441 |
| $ m R-turn/\alpha(V2)$   | 0.0924     | 86.7 | 3.216 | 3.204 | 0.738 |
| R-turn/ $\alpha$ (V3)    | 0.0927     | 87.0 | 3.247 | 2.488 | 0.425 |
| R-turn/ $\alpha$ (V4)    | 0.1053     | 88.8 | 3.184 | 2.300 | 0.375 |

表 5.13 および表 5.14 より, L-turn/ $\alpha$  および R-turn/ $\alpha$  ルーティングにおいて, 訪問ス イッチ選択ポリシーとして more upper-channel first (V4) を用いた場合のスループット とすべての静的な評価指標は, その他 3 つの選択ポリシーを用いた場合よりも優れている ことがわかる.特に, less child-node first (V2) を用いた場合の L-turn/ $\alpha$  のスループットは, V4 を用いた場合の R-turn/ $\alpha$  のスループットに対して, 16 スイッチおよび 64 ス イッチの場合でともに劣っており,訪問スイッチ選択ポリシーの違いによる影響が少なく ないことがわかる.

以上より, H/V グラフ構築時の前順走査における訪問スイッチ選択ポリシーが, L-turn

および R-turn ルーティングの性能に影響を与えており,4つの選択ポリシーのうち,more upper-channel first がもっとも高い性能を実現するということが確認された.

|                          | Throughput | MPR  | PT    | SDPT  | PPT   |
|--------------------------|------------|------|-------|-------|-------|
| $L$ -turn/ $\alpha(V1)$  | 0.0353     | 65.0 | 2.960 | 2.417 | 0.352 |
| $L$ -turn/ $\alpha(V2)$  | 0.0307     | 64.1 | 2.878 | 2.917 | 0.603 |
| $L$ -turn/ $\alpha(V3)$  | 0.0340     | 64.4 | 2.959 | 2.443 | 0.373 |
| $L$ -turn/ $\alpha$ (V4) | 0.0434     | 66.9 | 2.890 | 2.288 | 0.316 |
| R-turn/ $\alpha$ (V1)    | 0.0284     | 64.9 | 2.962 | 2.418 | 0.355 |
| m R-turn/lpha(V2)        | 0.0275     | 64.1 | 2.882 | 2.931 | 0.608 |
| R-turn/ $\alpha$ (V3)    | 0.0276     | 64.4 | 2.944 | 2.423 | 0.370 |
| R-turn/ $\alpha$ (V4)    | 0.0331     | 67.0 | 2.886 | 2.281 | 0.316 |

表 5.14: イレギュラーネットワーク (64 スイッチ, Uniform) における 平均スループットと静的な評価指標

## 5.3 ソースルーティング方式における評価結果

次に, ソースルーティング方式 (固定型ルーティング) における評価結果を各トポロジに ついて,順に示す.

## 5.3.1 イレギュラーネットワークにおける評価

16 および 64 スイッチのイレギュラーネットワークにおける各ルーティングアルゴリズム の uniform および bit-reversal トラフィックにおけるスループットの平均値を,表 5.15 に 示す.表 5.15 より,分散ルーティング方式(適応型ルーティング)の場合と同様に,L-turn ルーティングが,すべての条件で最も高いスループットを実現していることがわかる.BFS Up\*/Down\* ルーティングに対するスループット向上は,最大で約 25% であり,分散ルー ティング方式の場合に比べて若干小さくなっているが,これは,選択経路が1つに固定 されたことがトラフィック分散能力に影響を与えているためと考えられる.また,R-turn ルーティングについてもこれまでの傾向と同様に,一部を除いてスループットが低下して いることがわかる.以上より,複数経路の選択ができない固定型ルーティングにおいても, L-turn および R-turn ルーティングのトラフィック分散能力がスループットに反映されて いるものと考えられる.

なお,ここでは省略するが,各ルーティングアルゴリズムのレイテンシについても,分 散ルーティング方式の場合と同様に,スループットにおける優劣の傾向がほぼ同様に反映 されることが確認されている.また,各ルーティングアルゴリズムの静的な評価指標につ いては,分散ルーティング方式の場合と同等となるため,同様に省略する(2次元メッシュ および2次元トーラスについても同様).

|                       | 16 スイッチ |              | 64 スイッチ |              |  |
|-----------------------|---------|--------------|---------|--------------|--|
|                       | Uniform | Bit-reversal | Uniform | Bit-reversal |  |
| BFS Up*/Down*         | 0.1036  | 0.1442       | 0.0359  | 0.0394       |  |
| DFS Up*/Down*         | 0.1047  | 0.1441       | 0.0376  | 0.0482       |  |
| $L$ -turn/ $\alpha$   | 0.1107  | 0.1476       | 0.0430  | 0.0486       |  |
| $L$ -turn/ $\beta$    | 0.1102  | 0.1465       | 0.0436  | 0.0492       |  |
| R-turn/ $\alpha$      | 0.1043  | 0.1384       | 0.0331  | 0.0324       |  |
| $\text{R-turn}/\beta$ | 0.1047  | 0.1407       | 0.0329  | 0.0318       |  |

表 5.15: イレギュラーネットワークにおける平均スループット

## 5.3.2 2次元メッシュにおける評価

 $4 \times 4$  および  $8 \times 8$  スイッチの 2次元メッシュにおける各ルーティングアルゴリズムの uniform および bit-reversal トラフィックにおけるスループットを,表 5.16 に示す.表 5.16 より,2次元メッシュにおいても同様にして,L-turn ルーティングが,すべての条件で最 も高いスループットを実現していることがわかる.R-turn ルーティングについては,8×8 スイッチの場合に,これまでと同様にスループットが低下しているが,4×4 スイッチの 場合には,各 Up\*/Down\* ルーティングに対して高いスループットを実現していることが わかる.これは,この条件においては,Sanchoの経路選択アルゴリズムの適用による経 路分散の効果が R-turn ルーティングにおけるトラフィックの集中を改善する方向にうま く働いたためと考えられる.

|                     | $4 \times 4 $ スイッチ |              | 8×8スイッチ |              |  |
|---------------------|--------------------|--------------|---------|--------------|--|
|                     | Uniform            | Bit-reversal | Uniform | Bit-reversal |  |
| BFS Up*/Down*       | 0.0681             | 0.0834       | 0.0295  | 0.0362       |  |
| DFS Up*/Down*       | 0.0681             | 0.0728       | 0.0286  | 0.0298       |  |
| $L$ -turn/ $\alpha$ | 0.1045             | 0.1172       | 0.0398  | 0.0474       |  |
| $L$ -turn/ $\beta$  | 0.1045             | 0.1172       | 0.0398  | 0.0474       |  |
| R-turn/ $\alpha$    | 0.0873             | 0.0961       | 0.0274  | 0.0310       |  |
| m R-turn/eta        | 0.0873             | 0.0961       | 0.0274  | 0.0310       |  |

表 5.16: 2 次元メッシュにおけるスループット

## 5.3.3 2次元トーラスにおける評価

 $4 \times 4$  および  $8 \times 8$  スイッチの 2次元トーラスにおける各ルーティングアルゴリズムの uniform および bit-reversal トラフィックにおけるスループットを,表 5.17 に示す.表 5.17 より,2次元トーラスにおいても同様にして,L-turn ルーティングが,すべての条件で最 も高いスループットを実現していることがわかる.一方,これまでと異なり,R-turn ルー ティングについても,すべての条件で,BFS Up\*/Down\* ルーティングに対して高いス ループットを実現していることがわかる.これは,2次元メッシュの場合と同様に,Sanchoの経路選択アルゴリズムの影響によるものと考えられる.

|                     | $4 \times 4$ スイッチ |              | 8 × 8 スイッチ |              |  |
|---------------------|-------------------|--------------|------------|--------------|--|
|                     | Uniform           | Bit-reversal | Uniform    | Bit-reversal |  |
| BFS Up*/Down*       | 0.0945            | 0.1067       | 0.0292     | 0.0325       |  |
| DFS Up*/Down*       | 0.1047            | 0.1352       | 0.0316     | 0.0406       |  |
| $L$ -turn/ $\alpha$ | 0.1201            | 0.1547       | 0.0519     | 0.0552       |  |
| $L$ -turn/ $\beta$  | 0.1198            | 0.1826       | 0.0514     | 0.0560       |  |
| m R-turn/lpha       | 0.1052            | 0.1351       | 0.0309     | 0.0407       |  |
| m R-turn/eta        | 0.1058            | 0.1151       | 0.0314     | 0.0422       |  |

表 5.17:2次元トーラスにおけるスループット

以上より, L-turn および R-turn ルーティングをソースルーティング方式 (固定型ルー ティング)として適用した場合も,分散ルーティング方式 (適応型ルーティング)の場合と 同等の効果が得られることがわかった.これにより,L-turn ルーティングは,固定型ルー ティングとして適用しても性能向上が実現可能であるといえる.

## 5.4 まとめ

本章では, L-turn および R-turn ルーティングと BFS および DFS Up\*/Down\* ルー ティングの性能評価を確率モデルシミュレーションにより行なった.シミュレーション の結果,L-turn ルーティングは,すべての条件で最も高いスループットを実現し,BFS Up\*/Down\* ルーティングに対して,イレギュラーネットワークにおいては最大で約30%, レギュラーネットワークにおいては最大で約80%のスループット向上を実現することが確 認された.一方,R-turn ルーティングは,対照的にほとんどの条件で,最も低いスルー プットを示す結果となった.禁止ターンの分散に関する静的な評価指標から,L-turn ルー ティングと R-turn ルーティングは,ほぼ同等の禁止ターン分散を実現することが確認さ れたが,選択された禁止ターン集合のパターンの違いにより,L-turn ルーティングでは, 葉スイッチ方向にトラフィックが分散されやすくなるのに対し, R-turn ルーティングでは, ホットスポットが発生しやすいルートスイッチ方向にトラフィックが集中してしまうこと がわかった.これより,スループット向上のためには,より均等な禁止ターンの分散と葉 スイッチ方向へのトラフィック分散の両立が重要であることがわかった.また,L-turn お よび R-turn ルーティングは, ソースルーティング方式 (固定型ルーティング) として適用 した場合も,分散ルーティング方式(適応型ルーティング)の場合と同等の効果が得られる ことがわかった.これにより, L-turn ルーティングは, 適応型ルーティングとしてだけで なく,固定型ルーティングとして適用した場合も性能向上が可能である有効なルーティン グアルゴリズムであるといえる.

# 第6章 結論

近年,従来の大規模並列計算機に代わる高性能並列分散コンピューティング環境として PC クラスタの普及が急速に進んでいる.PC クラスタにおける PC 間の接続に用いられ る SAN は,拡張性および耐故障性などの要求からトポロジとして,イレギュラーネット ワークをサポートすることが多い.イレギュラーネットワークにおけるルーティングアル ゴリズムは,SAN の性能に影響を与える重要な要素であり,これまで多くの提案がなさ れている.その中でも,Up\*/Down\*ルーティングは,任意のSAN およびトポロジに適 用可能であり,汎用性の高い適応型ルーティングアルゴリズムとして,一般的に利用され ている.しかし,Up\*/Down\*ルーティングは,1次元の有向グラフをベースとしている ために禁止ターン分布の偏りが大きくなり,高スループット実現のためのトラフィックの 分散が困難となるという問題を持つ.

本研究では,Up\*/Down\*ルーティングにおける上記の問題の解決と,Up\*/Down\*ルー ティングと同等の高い汎用性の実現の両立を目的として,適応型ルーティングアルゴリズ ムである L-turn および R-turn ルーティングを提案し,確率モデルシミュレーションに より評価を行なった.L-turn および R-turn ルーティングは,Up\*/Down\*ルーティング で利用されているスパニングツリーベースの1次元有向グラフを拡張した H/V グラフ と呼ばれる新たな2次元有向グラフを利用する.H/V グラフの導入により,形成可能な ターンの数は従来の6倍である12パターンに増加し,これにより,トラフィックの分散 を考慮したより柔軟な禁止ターンの選択を行なってデッドロックフリーを実現することが 可能となる.そして,H/V グラフに対して,禁止ターンの分散を考慮した2次元 Turn モ デルをシステマティックな手法で適用することにより,L-turn および R-turn ルーティン グが定義される.この際,循環構造検出アルゴリズムを導入することにより,冗長な禁止 ターンを削減し,更なる性能向上の実現を図っている.L-turn および R-turn ルーティン グは,スパニングツリーの構築と2次元 Turn モデルの適用をベースとすることにより, Up\*/Down\* ルーティングと同等の高い汎用性を実現している.

確率モデルシミュレーションの結果,L-turn ルーティングは,全体的に最も高いスルー プットを実現し,BFS Up\*/Down\* ルーティングに対して,最大で約80%のスループッ ト向上を実現することが確認された.一方,R-turn ルーティングは,全体的に,最も低 いスループットを示す結果に終わった.禁止ターンの分散に関する静的指標の評価から, L-turn ルーティングと R-turn ルーティングは,ほぼ同等の禁止ターン分散を実現するこ とが確認されたが,選択された禁止ターン分布の違いにより,L-turn ルーティングでは, ッリーの葉スイッチ方向にトラフィックが分散されやすくなるのに対し,R-turn ルーティ ングではホットスポットが発生しやすいルートスイッチ方向にトラフィックが集中してし まうことがわかった.これより,スループット向上のためには,より均等な禁止ターンの 分散と葉スイッチ方向へのトラフィック分散の両立が重要であることがわかった.この条 件を満たす L-turn ルーティングは, 適応型ルーティングとして適用しただけでなく, 固定型ルーティングとして適用した場合も最も高い性能を示し, Up\*/Down\* ルーティング に代わる優れたルーティングアルゴリズムであることが確認された.

謝辞

本研究の機会を与えてくださり,絶えず御指導頂いた慶應義塾大学理工学部 天野 英晴 教授に深く感謝致します.

また,本研究をまとめるにあたり,本論文の草稿を丁寧に査読していただき,貴重な御助言を頂いた慶應義塾大学理工学部 寺岡 文男教授,山本 喜一助教授,西 宏章専任講師に深く感謝致します.

本研究を共に行った国立情報学研究所 鯉渕 道紘助手には,数々のご助言をいただき大 変お世話になりました.深く感謝致します.

在学中絶えず御指導いただき,精神的な面においても大きく支えていただいた北野共生 システムプロジェクト (ERATO-SORST) 舟橋 啓博士には大変お世話になりました.深 く感謝致します.

また,普段より御助言,御協力頂いた慶應義塾大学理工学部情報工学科天野研究室の皆様,北野共生システムプロジェクト (ERATO-SORST)の皆様に心より感謝致します. 最後に,私の長い研究生活を支えてくれた両親,家族に深く感謝致します.

2007年3月

# 論文目録

【本研究に関する論文】

## 1. 公刊論文

- (掲載決定済:)<u>Akiya Jouraku</u> and Michihiro Koibuchi and Hideharu Amano: "An Effective Design of Deadlock-Free Routing Algorithms Based on 2-D Turn Model for Irregular Networks", IEEE Transaction on Parallel and Distributed Systems, Mar. 2007
- 上樂 明也, 鯉渕 道紘, 天野 英晴: "2 次元 Turn モデルに基づくイレギュラー ネットワーク向けルーティングアルゴリズムの設計と評価", 情報処理学会論 文誌ハイパフォーマンスコンピューティングシステム Vol.44 No.SIG11 (ACS 3), pp.157-168, Aug. 2003
- 3. 鯉渕 道紘, 舟橋 啓,<u>上樂 明也</u>, 天野 英晴: "L-turn routing: Irregular Network における Adaptive Routing", 情報処理学会論文誌ハイパフォーマンスコン ピューティングシステム Vol.42 No.SIG9 (HPS 3), pp.119-134, 2001
- 2. 国際会議,査読付きシンポジウム
  - 4. <u>上樂 明也</u>, 鯉渕 道紘, 天野 英晴: "2 次元 Turn モデルに基づくイレギュラー ネットワーク向けルーティングアルゴリズムの設計と評価", 先進的計算基盤 システムシンポジウム, SACSIS 2003 論文集, pp.37-44, May. 2003
  - <u>Akiya Jouraku</u> and Michihiro Koibuchi and Akira Funahashi and Hideharu Amano: "Routing Algorithms based on 2D Turn Model for Irregular Networks", the Sixth International Symposium on Parallel Architectures, Algorithms, and Networks (I-SPAN'02), pp.289-294, May. 2002
  - 6. 舟橋 啓, 鯉渕 道紘,<u>上樂 明也</u>: "Irregular Network における Adaptive Routing の提案", 並列処理シンポジウム JSPP'2001 論文集, pp.247-254, Jun. 2001
  - Michihiro Koibuchi and Akira Funahashi and <u>Akiya Jouraku</u> and Hideharu Amano: "L-turn routing: An Adaptive Routing in Irregular Networks", the 2001 International Conference on Parallel Processing (ICPP'01), pp.384-393, Sep. 2001

## 3. 研究会

8. <u>上樂 明也</u>, 鯉渕 道紘, 舟橋 啓, 天野 英晴: "L-turn routing: Irregular Network における Adaptive Routing", 電子情報通信学会技術研究報告 CPSY2001-12, pp.89-96, Apr. 2001

#### 【その他の論文】

#### 1. 公刊論文

- Michihiro Koibuchi and Kenichiro Anjo and Yutaka Yamada and <u>Akiya Jouraku</u> and Hideharu Amano: "A Simple Data Transfer Technique Using Local Address for Networks-on-Chips", IEEE Transaction on Parallel and Distributed Systems, Volume 17, Number 12, pp.1425-1437, Dec. 2006
- 山田 裕, 天野 英晴, 鯉渕 道紘, <u>上樂 明也</u>, 安生 健一郎: "リコンフィギャラブ ルプロセッサアレー向けチップ内接続網: Fat H-Tree", 電子情報通信学会論文 誌 D1, VOL.J89-D, No.9, pp.1923-1934, Sep. 2006
- Michihiro Koibuchi and <u>Akiya Jouraku</u> and Hideharu Amano: "Path selection algorithm: the strategy for designing deterministic routing from alternative paths", PARALLEL COMPUTING, Volume 31, Issue 1, pp.117-130, Jan. 2005
- Hideharu Amano and <u>Akiya Jouraku</u> and Kenichiro Anjo: "A Dynamically Adaptive Hardware on Dynamically Reconfigurable Processor", IEICE TRANSACTIONS on Communications, Vol.E86-B, No.12, pp.3385-3391. Dec. 2003
- 13. 鯉渕 道紘,<u>上樂 明也</u>, 天野 英晴: "イレギュラーネットワークにおける仮想チャ ネルを用いた固定ルーティング", 情報処理学会論文誌ハイパフォーマンスコ ンピューティングシステム Vol.43, No.SIG 6 (HPS 5), pp.112-121, 2002.
- 14. Yulu Yang and Akira Funahashi and <u>Akiya Jouraku</u> and Hiroaki Nishi and Hideharu Amano and Toshinori Sueyoshi: "Recursive Diagonal Torus: An Interconnection Network for Massively Parallel Computers", IEEE Transaction on Parallel and Distributed Systems, Volume 12, Number 7, pp.701-715, Jul. 2001
- Akira Funahashi and Michihiro Koibuchi and <u>Akiya Jouraku</u> and Hideharu Amano: "The Impact of Output Selection Function on Adaptive Routing", ISCA Information: An International Journal, Vol 4, No.4, pp.541-550, 2001

## 2. 国際会議,査読付きシンポジウム

- Tomohiro Otsuka and Michihiro Koibuchi and <u>Akiya Jouraku</u> and Hideharu Amano: "VLAN-based Minimal Paths in PC Cluster with Ethernet on Mesh and Torus", the International Conference on Parallel Processing (ICPP'05), pp.567-576, Jun. 2005
- Kenichiro Anjo and Yutaka Yamada and Michihiro Koibuchi and <u>Akiya Jouraku</u> and Hideharu Amano: "BLACK-BUS: A New Data-Transfer Technique using Local Address on Networks-on-Chips", 18th International Parallel and Distributed Processing Symposium (IPDPS'04), pp.10-17, Apr. 2004
- Michihiro Koibuchi and <u>Akiya Jouraku</u> and Konosuke Watanabe and Hideharu Amano: "Descending Layers Routing: A Deadlock-Free Deterministic Routing using Virtual Channels in System Area Networks with Irregular Topologies", Proceedings of the International Conference on Parallel Processing (ICPP'03), pp.527-536, Oct. 2003
- Akira Funahashi and <u>Akiya Jouraku</u> and Hideharu Amano: "Adaptive routing on the Recursive Diagonal Torus.", ISCA 12th International Conference on Parallel and Distributed Computing Systems (PDCS'99), pp.171-177, Aug. 1999

## 3. 研究会

- <u>上樂 明也</u>, 舟橋 啓, 西村 克信,, 天野 英晴: "相互結合網 RDT における adaptive routing",
   電子情報通信学会技術研究報告 CPSY97-110, pp.66-74, Jan. 1998
- 上樂 明也, 舟橋 啓, 鯉渕 道紘, 若林 正樹, 天野 英晴: "命令レベルシュミレーションによる adaptive routing の評価", 情報処理学会技術研究報告 2000-ARC-137, 2000-HPC-80, pp.47-52, Mar. 2000

# 参考文献

- [AMAH01] A.Funahashi, M.Koibuchi, A.Jouraku, and H.Amano. The Impact of Output Selection Function on Adaptive Routing. In Proceedings of International Conference on Computers And Their Applications, pp. 241–246, March 2001.
- [AMAH02] A.Jouraku, M.Koibuchi, A.Funahashi, and H.Amano. Routing Algorithms Based on 2D Turn Model for Irregular Networks. In Proceedings of the International Symposium on Parallel Architectures, Algorithms, and Networks, pp. 289–294, June 2002.
- [BP89] S. Badr and P. Podar. An Optimal Shortest-Path Routing Policy for Network Computers with Regular Mesh-Connected Topologies. *IEEE Transactions on Computers*, Vol. 38, No. 10, pp. 1362–1371, October 1989.
- [C.E85] C.E.Leiserson. "Fat-trees: Universal networks for hardware-efficient supercomputing". *IEEE Transactions on Computers*, Vol. C-34, No. 10, pp. 892–901, October 1985.
- [DA93] W. J. Dally and H. Aoki. Deadlock-Free Adaptive Routing in Multicomputer Networks Using Virtual Channels. *IEEE Transaction on Parallel and Distributed Systems*, Vol. 4, No. 4, pp. 466–475, 1993.
- [Dal92] W. J. Dally. Virtual-channel flow control. *IEEE Transaction on Parallel and Distributed Systems*, Vol. 3, No. 2, pp. 194–205, 1992.
- [Dea92] D.Lenoski and et al. The Stanford DASH multiprocessor. *IEEE Transactions on Computers*, Vol. 25, No. 3, pp. 63–79, 1992.
- [D.H] D.H. Brown Associates, Inc. Cray XT3 MPP Delivers Scalable Performance. available from the Cray Inc., http://www.cray.com/producsts/xt3/.
- [DS87] W. J. Dally and C. L. Seitz. Deadlock-Free Message Routing in Multiprocessor Interconnection Networks. *IEEE Transactions on Computers*, Vol. 36, No. 5, pp. 547–553, May 1987.
- [Dua93] J. Duato. A New Theory of Deadlock-Free Adaptive Routing in Wormhole Networks. *IEEE Transaction on Parallel and Distributed Systems*, Vol. 4, No. 12, pp. 1320–1331, 1993.
- [Dua94] J. Duato. A Necessary And Sufficient Condition For Deadlock-Free Adaptive Routing In Wormhole Networks. Proceedings of the International Conference on Parallel Processing, Vol. 1, pp. 142–149, 1994.
- [ea02] NR Adiga et al. An Overview of the Blue Gene/L Supercomputer, NR. In Proceedings of IEEE/ACM Conference on Supercomputing, pp. 1–22, November 2002.
- [E.W59] E.W.Dijkstra. A Note on Two Problems in Connexion with Graphs. Numerische Mathematik, Vol. 1, pp. 269–271, October 1959.
- [FFA<sup>+</sup>02] F.Petrini, W.C Feng, A.Hoisie, S.Coll, and E.Frachtenberg. The Quadrics network: high-performance clustering technology. *IEEE Micro*, Vol. 22, No. 1, pp. 46–57, 2002.
- [FJ00] F.Silla and J.Duato. On the Use of Virtual Channels in Networks of Workstations with Irregular Topology. *IEEE Transactions on parallel and distributed systems*, Vol. 11, No. 8, pp. 813–828, 2000.
- [GN92] C. J. Glass and L. M. Ni. The Turn Model for Adaptive Routing. Proceedings of International Symposium on Computer Architecture, pp. 278–287, 1992.
- [Int91] Intel. Paragon XP/S Product Overview. Beaverton, OR, Supercomputer Systems Division, 1991.
- [I.T04] I.T.Association. Infiniband architecture. specification volume 2 release 1.2. available from the InfiniBand Trade Association, http://www.infinibandta.org/, October 2004.
- [JA00] J.C.Sancho and A.Robles. Improving the Up\*/Down\* Routing Scheme for Networks of Workstations. In Proceedings of the European Conference on Parallel Computing, pp. 882–889, August 2000.
- [JAJ00] J.C.Sancho, A.Robles, and J.Duato. A New Methodology to Compute Deadlock-Free Routing Tables for Irregular Networks. In Proceedings of Communication and Architectural Support for Network-Based Parallel Computing, pp. 45–60, January 2000.
- [JAJ01] J.C.Sancho, A.Robles, and J.Duato. Effective Strategy to Compute Forwarding Tables for InfiniBand Networks. In *Proceedings of the International Conference on Paralel Processing*, pp. 48–57, January 2001.
- [JMPJ02] J.Flich, M.P.Malumbres, P.Lopez, and J.Duato. Removing the latency overhead of the ITB mechanism in COWs with source routing. In Proceedings of Euromicro Workshop on Parallel, Distributed and Network-based Processing, pp. 463–470, 2002.

- [JPJ<sup>+</sup>02] J.Flich, P.Lopez, J.C.Sancho, A.Robles, and J.Duato. Improving InfiniBand Routing through Multiple Virtual Networks. In *Proceedings of International* Symposium on High Performance Computing, pp. 49–63, May 2002.
- [JPMJ02] J.Flich, P.Lopez, M.P.Malumbres, and J.Duato. Boosting the Performance of Myrinet Networks. *IEEE Transactions on Parallel and Distributed Systems*, Vol. 13, No. 7, pp. 693–709, July 2002.
- [JSL02] J.Duato, S.Yalamanchili, and L.Ni. Interconnection Networks: an engineering approach. Morgan Kaufmann, 2002.
- [KK79] P. Kermani and L. Kleinrock. Virtual cut-through: A new computer communication switching techniques. *Computer Networks*, Vol. 3, No. 4, pp. 267–286, 1979.
- [KT95a] K.V.Anjan and T.M.Pinkston. An efficient fully adaptive deadlock recovery scheme: DISHA. In Proceedings of International Symposium on Computer Architecture, pp. 201–210, June 1995.
- [KT95b] K.V.Anjan and T.M.Pinkston. DISHA: A deadlock recovery scheme for fully adaptive routing. In *Proceedings of International Parallel Processing* Symposium, pp. 537–543, April 1995.
- [KTJ96] K.V.Anjan, T.M.Pinkston, and J.Duato. Generalized theory for deadlock-free adaptive routing and its application to Disha Concurrent. In *Proceedings of International Parallel Processing Symposium*, pp. 815–821, April 1996.
- [LH91] D. H. Linder and J. C. Harden. An adaptive and fault tolerant wormhole routing strategy for k-ary n-cubes. *IEEE Transaction on Computer*, Vol. 40, No. 1, pp. 2–12, 1991.
- [LVT96] L.Cherkasova, V.Kotov, and T.Rokicki. Fibre channel fabrics: evaluation and design. In Proceedings of the 29th Hawaii International Conference on System Science, January 1996.
- [MAAH01] M.Koibuchi, A.Funahashi, A.Jouraku, and H.Amano. L-turn routing: An adaptive routing in irregular networks. In *Proceedings of the International Conference on Parallel Processing*, pp. 374–383, September 2001.
- [Mae91] M.D.Schroeder and al et. Autonet: a high-speed, self-configuring local area network using point-to-point links. *IEEE Journal on Selected Areas in Communications*, Vol. 9, pp. 1318–1335, 1991.
- [MAH03] M.Koibuchi, A.Jouraku, and H.Amano. Descending Layers Routing: A Deadlock-Free Deterministic Routing using Virtual Channels in System Area

Networks with Irregular Topologies. In *Proceedings of the International Conference on Parallel Processing*, pp. 527–536, October 2003.

- [MDW93] M.Noakes, D.A.Wallach, and W.J.Dally. The j-machine multicomputer: An architectural evaluation. In Proceedings of International Symposium on Computer Architecture, pp. 224–235, May 1993.
- [MJ80] M.P.Merlin and J.P.Schweitzer. Deadlock Avoidance in Store-and-Forward Networks. *IEEE Transactions on Computers*, Vol. COM-28, No. 3, pp. 345–354, 1980.
- [MJJ<sup>+</sup>05] M.Koibuchi, J.C.Martinez, J.Flich, A.Robles, P.Lopez, and J.Duato. Enforcing In-Order Packet Delivery in System Area Networks with Adaptive Routing. *Journal of Parallel and Distributed Computing (JPDC)*, Vol. 65, pp. 1223–1236, October 2005.
- [Myra] Myricom, Inc. http://www.myri.com/.
- [Myrb] Myricom, Inc. http://www.myri.com/vlsi/.
- [N.J95] N.J.Boden and et al. Myrinet: A Gigabit-per-Second Local Area Network. IEEE Micro, Vol. 15, No. 1, pp. 29–35, 1995.
- [NKN<sup>+</sup>01] S. Nishimura, T. Kudoh, H. Nishi, J. Yamamoto, K. Harasawa, N. Matsudaira, S. Akutsu, K. Tasho, and H. Amano. RHiNET-3/SW: an 80-Gbit/s high-speed network switch for distributed parallel computing. In *Hot Interconnect*, pp. 119–123, 2001.
- [Oed93] W. Oed. The Cray Research Massively Parallel Processing System: Cray T3D. Cray Research, 1993.
- [PFH01] F. Petrini, W.C. Feng, and A. Hoisie. The Quadrics network (QsNet): high-performance clustering technology. In *Proceedings of Hot Interconnects*, pp. 125–130, August 2001.
- [PJJ01] P.Lopez, J.Flich, and J.Duato. Deadlock-free Routing in InfiniBand<sup>TM</sup> through Destination Renaming. In Proceedings of the International Conference on Parallel Processing, pp. 427–434, September 2001.
- [QNR99] W. Qiao, L. M. Ni, and T. Rokicki. Adaptive-Trail Routing and Performance Evaluation in Irregular Networks Using Cut-Through Switches. *IEEE Trans. on Parallel and Distributed Systems*, Vol. 10, No. 11, pp. 1138–1158, November 1999.
- [RS91] T.L. Rodeheffer and M.D. Schroeder. Automatic reconfiguration in Autonet. Technical Report SRC research report 77, DEC, September 1991.

| [SB97]                | L. Schwiebert and R. Bell. The Impact of Output Selection Function Choice<br>on the Performance of Adaptive Wormhole Routing. In <i>Proceedings of</i><br><i>International Conference on Parallel and Distributed Computing Systems</i> ,<br>pp. 539–544, October 1997. |
|-----------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| [SD00]                | F. Silla and J. Duato. High-Performance Routing in Networks of<br>Workstations with Irregular Topology. <i>IEEE Transactions on parallel and</i><br><i>distributed systems</i> , Vol. 11, No. 7, pp. 699–719, 2000.                                                     |
| [SLT02]               | T. Skeie, O. Lysne, and I. Theiss. Layered Shortest Path (LASH) Routing in<br>Irregular System Area Networks. In <i>Proceedings of International Parallel</i><br>and Distributed Processing Symposium, pp. 162–169, April 2002.                                         |
| [ST96]                | S. L. Scott and G. T.Horson. The Cray T3E network: adaptive routing in a high performance 3D torus. In <i>Proceedings of Hot Interconnects IV</i> , pp. 147–156, August 1996.                                                                                           |
| [ST97]                | S.Warnakulasuriya and T.M.Pinkston. Characterization of deadlocks in<br>interconnection networks. In <i>Proceedings of IEEE Symposium on Parallel</i><br>and Distributed Processing, pp. 80–86, April 1997.                                                             |
| [ST99]                | S.Warnakulasuriya and T.M.Pinkston. characterization of deadlocks in<br>irregular networks. In <i>Proceedings of the International Conference on</i><br><i>Parallel Processing</i> , pp. 75–84, October 1999.                                                           |
| [STH <sup>+</sup> 00] | S.Nishimura, T.Kudoh, H.Nishi, J.Yamamoto, K.Harasawa, N.Matsudaira, S.Akutsu, K.Tasho, and H.Amano. High-speed network switch RHiNET-2/SW and its implementation with optical interconnections. In <i>Hot Interconnect</i> , pp. 31–38, August 2000.                   |
| [TOP]                 | TOP500 Supercomputing Sites. http://www.top500.org/.                                                                                                                                                                                                                    |
| [TSJ <sup>+</sup> 99] | T.Kudoh, S.Nishimura, J.Yamamoto, H.Nishi, O.Tatebe, and H.Amano.<br>RHiNET: A network for high performance parallel computing using locally<br>distributed computing. In <i>Proceedings of IWIA</i> , pp. 69–73, November 1999.                                        |
| [Wea94]               | W.J.Dally and et al. The reliable router: A reliable and high-performance communication substrate for parallel computers. In <i>Proceedings of the Workshop on Parallel Computer Routing and Communications</i> , pp. 241–255, May 1994.                                |
| [Wu96]                | J. Wu. An Optimal Routing Policy for Mesh-Connected Topologies.<br>Proceedings of International Conference on Parallel Processing, Vol. 1, pp. 267–270, 1996.                                                                                                           |

- [Wu99] J. Wu. Maximum-shortest-path (MSP): an optimal routing policy for mesh-connected multicomputers. *IEEE Transaction on Reliability*, Vol. 48, No. 3, pp. 247–255, 1999.
- [鯉渕 02] 鯉渕 道紘. システムエリアネットワークにおけるルーティングに関する研究. 2002 年度慶應義塾大学大学院博士論文, 2002.
- [舟橋 99] 舟橋 啓. 相互結合網における適応型ルーティングアルゴリズムに関する研究. 1999 年度慶應義塾大学大学院博士論文, 1999.
- [上樂 03] 上樂 明也, 鯉渕 道紘, 天野 英晴. 2次元 Turn モデルに基づくイレギュラー ネットワーク向けルーティングアルゴリズムの設計と評価. 情報処理学会論文 誌コンピューティングシステム, Vol. 44, No. SIG 11 (ACS 3), pp. 157–168, August 2003.
- [西 宏 00] 西 宏章, 西村 信治, 多昌 廣治, 工藤 知宏, 天野 英晴. 効率良い並列処理をサ ポートするローカルエリア向けネットワークスイッチ. 電子情報通信学会論文 誌, Vol. J83D-I, No. 7, 2000.
- [石畑 89] 石畑清. アルゴリズムとデータ構造. 岩波書店, 1989.
- [天野 96] 天野英晴. 並列コンピュータ. 昭晃堂, 1996.