7.2.3 Die Parallelisierung mittels verteilter Boxen

Next: 7.2.4 Die Parallelisierung mittels Up: 7.2 Die Euler-Gleichungen Previous: 7.2.2 Die serielle Auflösung

7.2.3 Die Parallelisierung mittels verteilter Boxen

Die Verteilung von kompletten Boxen auf die Prozessoren entspricht der Aufteilung mit nichtüberlappenden Knoten aus Abschnitt 4.3.2.
Der einzige kritische Punkt bei der Parallelisierung von (7.17) besteht dann in der effizienten Berechnung der Summe

in (7.18).

Die Unbekannten kann man sich als in den Boxschwerpunkten gespeichert denken. Die lokalen Flußanteile $\sigma_{jl}$ in Algorithmus 7.8 liegen an den Kanten (Flächen) vor, sind jedoch inkonsistent (i.a. $\sigma_{jl} \neq \sigma_{lj}$ ). Für die parallele Implementierung empfiehlt sich bzgl. der Speicherung von und $\sigma$ eine Aufteilung in überlappende Elemente mit einem Element Überlappungsbreite. Das erweiterte Teilgebiet von $\Omega _i$ sei mit $\widetilde{\Omega} \makebox[0pt]{}_i$ bezeichnet, der erweiterte Lösungsvektor sei $\underline{\widetilde{u} \makebox[0pt]{}}_i \,=\, \Big( \underbrace{ \left\{ u... ...mega} \makebox[0pt]{}_i\setminus\Omega_i} }_{\mathrm{externe \; Komp.}} \Big)$ , analog $\widetilde{\sigma} \makebox[0pt]{}$ .

**Abbildung 7.3:** Verteilte Boxen
$\begin{figure} \begin{center} \unitlength0.016\textwidth \begin{picture} (25,2... ...ga}} \makebox[0pt]{}_{\boldsymbol{j}}$ }} \end{picture}\end{center} \end{figure}$

$\begin{algorithmus}% latex2html id marker 33539 [H] \caption{(K+1)-ter Zeitschri... ...box{\textbf{\sf od}} $ \end{minipage}\end{minipage}\end{center}\end{algorithmus}$
Bemerkungen :

1.

Algorithmus 7.10 ist für alle 3 Formeln (7.19)-(7.21) anwendbar.

2.

Bei Benutzung von (7.19) kann Schritt 1.) weggelassen werden, da $\widetilde{u} \makebox[0pt]{}_l$ nicht benötigt wird.

3.

Bei Verwendung von (7.20) und (7.21) kann man den Datenaustausch in Schritt 3.) einsparen, indem in $\widetilde{\Omega} \makebox[0pt]{}_j$ die Größe $\widetilde{\sigma} \makebox[0pt]{}_{lj} := - C_2(u_j,\widetilde{u} \makebox[0pt]{}_l)$ redundant (zu $C_1(u_l,\widetilde{u} \makebox[0pt]{}_j$ ) in $\widetilde{\Omega} \makebox[0pt]{}_{l}$ ) berechnet wird.

Nachteile:

Höherer arithmetischer Aufwand (fast verdoppelt).
Falls man nur in den Randelementen redundant rechnet, muß man im Programm Fallunterscheidungen einbauen.

Next: 7.2.4 Die Parallelisierung mittels Up: 7.2 Die Euler-Gleichungen Previous: 7.2.2 Die serielle Auflösung

Gundolf Haase
1998-12-22