next up previous
Next: 5.5.3 Die parallele IUL-Faktorisierung Up: 5.5 Unvollständige Zerlegungen Previous: 5.5.1 Der serielle Algorithmus

   
5.5.2 Die parallele ILU-Faktorisierung

Die erste Idee zur Parallelisierung der ILU ist die einfache Übertragung von Algorithmus 5.12 auf eine akkumulierte Matrix  ${\ensuremath{\color{red} \mathfrak{K} } }$. Natürlicherweise sind  ${\ensuremath{\color{red} \mathfrak{L} } }$ und  \ensuremath{\color{red} \mathfrak{U} } ebenfalls akkumuliert. Jedoch müssen nun wegen (4.9) und (4.10) die Forderungen 3a und 3b an die Vernetzung aus Abschnitt 4.3.1 erfüllt sein.
 \begin{algorithmus}% latex2html id marker 20055
[H]\caption{Parallelisierte $\pr...
...space &
DD $\rightarrow$\space block matrices
\end{tabular}
\end{algorithmus}
Da die redundant gespeicherten Matrizen ${\ensuremath{\color{red} \mathfrak{K} } }_V$, ${\ensuremath{\color{red} \mathfrak{K} } }_E$, ${\ensuremath{\color{red} \mathfrak{K} } }_E$, ${\ensuremath{\color{red} \mathfrak{K} } }_{EV}$ und  ${\ensuremath{\color{red} \mathfrak{K} } }_{VE}$ nach der Akkumulation bis zur Zerlegung nicht mehr modifiziert werden, kann die Akkumulation vor der Faktorisierung ausgeführt werden.
In 3D kommt noch ein Block mit den Faces ''$F$'' hinzu. Die entsprechende Faktorisierung ist analog, jedoch müssen an die Vernetzung weitere Forderungen gestellt werden.

Betrachtet man den Auflösungsschritt $\underline{{\ensuremath{\color{red} \mathfrak{w} } }} = {\ensuremath{\color{red...
...} \mathfrak{L} } }^{-1} \cdot \underline{{\ensuremath{\color{green} {\sf r}} }}$ näher und trägt den mit akkumulierten Matrizen erlaubten Matrix-Vektor-Multiplikationen (4.9) und (4.10) Rechnung, so sieht man aus Gleichung (4.13a), daß 3 Vektortypumwandlungen auftreten müssen.
 \begin{algorithmus}% latex2html id marker 20205
[H]\caption{Paralleler Aufl\uml ...
...suremath{\color{green} {\sf w}} }}_i$\space \\
\end{tabular}
\end{algorithmus}
Die Diagonalmatrix $R$ mit der Anzahl der am Knoten anliegenden Teilgebiete wurde in (4.4) definiert.

Verbesserung : Der Nachteil von Algorithmus 5.15 besteht vor allem darin, daß jeweils gerade ein anderer als der gegebene Vektortyp benötigt wird. Dadurch sind 3 Vektortypumwandlungen mit 2 Akkumulationsschritten notwendig. Dies bedeutet in einem Iterationsverfahren mit der $ILU$ als Vorkonditionierer doppelten Kommunikationsaufwand gegenüber dem $\omega $-Jacobi-Verfahren.

$\Longrightarrow$ Ein Auflösungsschritt $\underline{{\ensuremath{\color{red} \mathfrak{w} } }} = {\ensuremath{\color{red...
...} \mathfrak{U} } }^{-1} \cdot \underline{{\ensuremath{\color{green} {\sf r}} }}$ würde laut (4.12a) nur eine Vektortypumwandlung mit einer Akkumulation benötigen.

$\displaystyle\downarrow$

next up previous
Next: 5.5.3 Die parallele IUL-Faktorisierung Up: 5.5 Unvollständige Zerlegungen Previous: 5.5.1 Der serielle Algorithmus
Gundolf Haase
1998-12-22