next up previous
Next: 7.2.4 Die Parallelisierung mittels Up: 7.2 Die Euler-Gleichungen Previous: 7.2.2 Die serielle Auflösung

   
7.2.3 Die Parallelisierung mittels verteilter Boxen

Die Verteilung von kompletten Boxen auf die Prozessoren entspricht der Aufteilung mit nichtüberlappenden Knoten aus Abschnitt 4.3.2.
Der einzige kritische Punkt bei der Parallelisierung von (7.17) besteht dann in der effizienten Berechnung der Summe $C_1(w,v)w+C_2(w,v)v$ in (7.18).

Die Unbekannten $u_j$ kann man sich als in den Boxschwerpunkten gespeichert denken. Die lokalen Flußanteile $\sigma_{jl}$ in Algorithmus 7.8 liegen an den Kanten (Flächen) vor, sind jedoch inkonsistent (i.a. $\sigma_{jl} \neq \sigma_{lj}$). Für die parallele Implementierung empfiehlt sich bzgl. der Speicherung von $u$ und $\sigma$ eine Aufteilung in überlappende Elemente mit einem Element Überlappungsbreite. Das erweiterte Teilgebiet von $\Omega _i$ sei mit $\widetilde{\Omega} \makebox[0pt]{}_i$ bezeichnet, der erweiterte Lösungsvektor sei $ \underline{\widetilde{u} \makebox[0pt]{}}_i \,=\, \Big(
\underbrace{ \left\{ u...
...mega} \makebox[0pt]{}_i\setminus\Omega_i} }_{\mathrm{externe \; Komp.}}
\Big) $, analog  $\widetilde{\sigma} \makebox[0pt]{}$.

  
Abbildung 7.3: Verteilte Boxen
\begin{figure}
\begin{center}
\unitlength0.016\textwidth
\begin{picture}
(25,2...
...ga}} \makebox[0pt]{}_{\boldsymbol{j}}$ }}
\end{picture}\end{center} \end{figure}


 \begin{algorithmus}% latex2html id marker 33539
[H]
\caption{(K+1)-ter Zeitschri...
...box{\textbf{\sf od}} $ \end{minipage}\end{minipage}\end{center}\end{algorithmus}
Bemerkungen :
1.
Algorithmus 7.10 ist für alle 3 Formeln (7.19)-(7.21) anwendbar.
2.
Bei Benutzung von (7.19) kann Schritt 1.) weggelassen werden, da $\widetilde{u} \makebox[0pt]{}_l$ nicht benötigt wird.
3.
Bei Verwendung von (7.20) und (7.21) kann man den Datenaustausch in Schritt 3.) einsparen, indem in $\widetilde{\Omega} \makebox[0pt]{}_j$ die Größe $\widetilde{\sigma} \makebox[0pt]{}_{lj} := - C_2(u_j,\widetilde{u} \makebox[0pt]{}_l)$ redundant (zu $C_1(u_l,\widetilde{u} \makebox[0pt]{}_j$) in $\widetilde{\Omega} \makebox[0pt]{}_{l}$) berechnet wird.

Nachteile:





next up previous
Next: 7.2.4 Die Parallelisierung mittels Up: 7.2 Die Euler-Gleichungen Previous: 7.2.2 Die serielle Auflösung
Gundolf Haase
1998-12-22