Next: 7.2.4 Die Parallelisierung mittels
Up: 7.2 Die Euler-Gleichungen
Previous: 7.2.2 Die serielle Auflösung
7.2.3 Die Parallelisierung mittels verteilter Boxen
Die Verteilung von kompletten Boxen auf die Prozessoren entspricht der Aufteilung
mit nichtüberlappenden Knoten aus Abschnitt 4.3.2.
Der einzige kritische Punkt bei der Parallelisierung von (7.17)
besteht dann in der effizienten Berechnung der Summe
in (7.18).
Die Unbekannten
kann man sich als in den Boxschwerpunkten
gespeichert denken. Die lokalen Flußanteile
in
Algorithmus 7.8 liegen an den Kanten (Flächen) vor, sind jedoch
inkonsistent (i.a.
).
Für die parallele Implementierung empfiehlt sich bzgl. der
Speicherung von
und
eine Aufteilung in überlappende Elemente
mit einem Element Überlappungsbreite.
Das erweiterte Teilgebiet von
sei mit
bezeichnet, der erweiterte Lösungsvektor sei
,
analog
.
Abbildung 7.3:
Verteilte Boxen
![\begin{figure}
\begin{center}
\unitlength0.016\textwidth
\begin{picture}
(25,2...
...ga}} \makebox[0pt]{}_{\boldsymbol{j}}$ }}
\end{picture}\end{center} \end{figure}](img981.gif) |
Bemerkungen :
- 1.
- Algorithmus 7.10 ist für alle 3 Formeln
(7.19)-(7.21) anwendbar.
- 2.
- Bei Benutzung von (7.19) kann Schritt 1.) weggelassen
werden, da
nicht benötigt wird.
- 3.
- Bei Verwendung von (7.20) und (7.21) kann man
den Datenaustausch in Schritt 3.) einsparen, indem in
die Größe
redundant
(zu
)
in
)
berechnet wird.
Nachteile:
- Höherer arithmetischer Aufwand (fast verdoppelt).
- Falls man nur in den Randelementen redundant rechnet,
muß man im Programm Fallunterscheidungen einbauen.
Next: 7.2.4 Die Parallelisierung mittels
Up: 7.2 Die Euler-Gleichungen
Previous: 7.2.2 Die serielle Auflösung
Gundolf Haase
1998-12-22