Next: 5.4.4.2 Variante 2 : Gauß-Seidel-Jacobi
Up: 5.4.4 Das parallele Verfahren
Previous: 5.4.4 Das parallele Verfahren
5.4.4.1 Variante 1 : formales Übertragen
Schreibt man den Updateschritt aus Algorithmus 5.7 mit den parallelen
Datentypen, ist folgender Algorithmus denkbar :
Auf den ersten Blick ist man mit Algorithmus 5.9 bereits am
Ziel seiner Wünsche, jedoch werden sich bei der Implementierung
Schwierigkeiten einstellen, welche eine effiziente Parallelisierung
fast unmöglich machen. Die gewählte Datenverteilung ist in
Abb. 5.4 dargestellt.
Abbildung 5.4:
Gebietsaufteilung Einheitsquadrat
 |
Durch die Knotennumerierung analog zu Punkt 4.3.1
wird eine Matrix und Vektorstruktur analog zu (4.2)
erzeugt.
Für eine detailierte Analyse schlüsselt man die Berechnungen
in Algorithmus 5.9 entsprechend der entstehenden Blockstruktur auf:
Die Summe
bedeutet
in jedem Update einer Komponente
die Akkumulation
des Residuums dieser Komponente.
Die Anzahl der übertragenen Worte (
)
ist hierbei genauso
groß wie beim
entsprechenden Updateschritt im
-Jacobi-Verfahren,
jedoch sind dies hier
einzelne Kommunikationen
für welche auch
Startupzeiten hinzukommen.
Es gelte
,
dann ergibt sich
im Vergleich :
In obiger Ungleichung hat der Faktor
keinerlei Einfluß auf das
Verhältnis der Kommunikationszeiten der zwei Verfahren, es gilt vielmehr
d.h. die Effizienz des Gauß-Seidel-Verfahrens mit dem
Updateschritt (5.3) wird weit unter dem Jacobi-Verfahren liegen.
Durch Ausnutzung von Nachbarschaftsbeziehungen kann dieses
Kommunikationsverhältnis
bis auf die maximale Anzahl von
Daten auf einer Interfacekante reduziert werden.
Damit (5.3) überhaupt vernünftig parallelisierbar ist, müssen die
Anforderungen 3a und 3a an das FE-Netz erfüllt sein,
siehe Abb. 4.6 . Ist dies nicht der Fall, so
müssen (5.3b) und (5.3d)) sequentiell abgearbeitet
werden !
Ansonsten muß eine Red-Black-Numerierung der Interfacekanten
durchgeführt werden, was bei allgemeinen Gebieten zu Problemen führt.
Next: 5.4.4.2 Variante 2 : Gauß-Seidel-Jacobi
Up: 5.4.4 Das parallele Verfahren
Previous: 5.4.4 Das parallele Verfahren
Gundolf Haase
1998-12-22