Next: 4.1.3 Matrix-Matrix-Operationen (BLAS3)
Up: 4.1.2 Matrix-Vektor Operationen (BLAS2)
Previous: 4.1.2 Matrix-Vektor Operationen (BLAS2)
Betrachten
mit vollbesetzter
Matrix
.
Je nach Aufteilung der Matrix unterscheidet sich
die programmtechnische Realisierung der Multiplikation auf dem
Parallelrechner. Zwei Varianten werden betrachtet.
Variante 1 : Verteilen
blockzeilenweise auf die
Prozesse, analog die Teilvektoren.
Abbildung 4.2:
Matrix blockzeilenweise verteilt
 |
Variante 1b : Durch einen ALL/SMALL>_TO/SMALL>_ALL/SMALL>_SCATTER-Ruf
besitzt jeder Prozeß den gesamten Vektor
.
Danach läßt sich
die Multiplikation ohne weitere Kommunikation ausführen.
Variante 2 : Verteilen
blockspaltenweise auf die
Prozesse, Vektor
entsprechend der Spalten von
.
Abbildung 4.3:
Matrix blockspaltenweise verteilt
 |
Ein weiterer Matrix-Vektor Algorithmus funktioniert analog dem
Broadcast-Multiply-Roll Algorithmus (Alg. 4.4)
im nächsten Abschnitt.
Gundolf Haase
1998-12-22