5.5.2 Die parallele ILU-Faktorisierung

Next: 5.5.3 Die parallele IUL-Faktorisierung Up: 5.5 Unvollständige Zerlegungen Previous: 5.5.1 Der serielle Algorithmus

5.5.2 Die parallele ILU-Faktorisierung

Die erste Idee zur Parallelisierung der ILU ist die einfache Übertragung von Algorithmus 5.12 auf eine akkumulierte Matrix ${\ensuremath{\color{red} \mathfrak{K} } }$ . Natürlicherweise sind ${\ensuremath{\color{red} \mathfrak{L} } }$ und $\ensuremath{\color{red} \mathfrak{U} }$ ebenfalls akkumuliert. Jedoch müssen nun wegen (4.9) und (4.10) die Forderungen 3a und 3b an die Vernetzung aus Abschnitt 4.3.1 erfüllt sein.
$\begin{algorithmus}% latex2html id marker 20055 [H]\caption{Parallelisierte $\pr... ...space & DD $\rightarrow$\space block matrices \end{tabular} \end{algorithmus}$
Da die redundant gespeicherten Matrizen ${\ensuremath{\color{red} \mathfrak{K} } }_V$ , ${\ensuremath{\color{red} \mathfrak{K} } }_E$ , ${\ensuremath{\color{red} \mathfrak{K} } }_E$ , ${\ensuremath{\color{red} \mathfrak{K} } }_{EV}$ und ${\ensuremath{\color{red} \mathfrak{K} } }_{VE}$ nach der Akkumulation bis zur Zerlegung nicht mehr modifiziert werden, kann die Akkumulation vor der Faktorisierung ausgeführt werden.
In 3D kommt noch ein Block mit den Faces ''

'' hinzu. Die entsprechende Faktorisierung ist analog, jedoch müssen an die Vernetzung weitere Forderungen gestellt werden.

Betrachtet man den Auflösungsschritt $\underline{{\ensuremath{\color{red} \mathfrak{w} } }} = {\ensuremath{\color{red... ...} \mathfrak{L} } }^{-1} \cdot \underline{{\ensuremath{\color{green} {\sf r}} }}$ näher und trägt den mit akkumulierten Matrizen erlaubten Matrix-Vektor-Multiplikationen (4.9) und (4.10) Rechnung, so sieht man aus Gleichung (4.13a), daß 3 Vektortypumwandlungen auftreten müssen.
$\begin{algorithmus}% latex2html id marker 20205 [H]\caption{Paralleler Aufl\uml ... ...suremath{\color{green} {\sf w}} }}_i$\space \\ \end{tabular} \end{algorithmus}$
Die Diagonalmatrix mit der Anzahl der am Knoten anliegenden Teilgebiete wurde in (4.4) definiert.

Verbesserung : Der Nachteil von Algorithmus 5.15 besteht vor allem darin, daß jeweils gerade ein anderer als der gegebene Vektortyp benötigt wird. Dadurch sind 3 Vektortypumwandlungen mit 2 Akkumulationsschritten notwendig. Dies bedeutet in einem Iterationsverfahren mit der als Vorkonditionierer doppelten Kommunikationsaufwand gegenüber dem $\omega$ -Jacobi-Verfahren.

$\Longrightarrow$ Ein Auflösungsschritt $\underline{{\ensuremath{\color{red} \mathfrak{w} } }} = {\ensuremath{\color{red... ...} \mathfrak{U} } }^{-1} \cdot \underline{{\ensuremath{\color{green} {\sf r}} }}$ würde laut (4.12a) nur eine Vektortypumwandlung mit einer Akkumulation benötigen.

$\displaystyle\downarrow$

Next: 5.5.3 Die parallele IUL-Faktorisierung Up: 5.5 Unvollständige Zerlegungen Previous: 5.5.1 Der serielle Algorithmus

Gundolf Haase
1998-12-22