next up previous
Next: 4.2 Operationen mit dünnbesetzten Up: 4.1.3 Matrix-Matrix-Operationen (BLAS3) Previous: 4.1.3.2 Algorithmen für

4.1.3.3 Parallelisierung von $ C_{n\times n} \;:=\; C_{n\times n}
+ A_{n\times n} \ast B_{n\times n} $

Ausgangspunkt :

- outer product mit Zeilenzugriff
- Blockmatrizen $C^{i,j}$, $A^{i,j}$, $B^{i,j}$
- 2D-Torus ( $n \times n$) Topologie, verteilter Speicher




     DO $ k \;:=\; 1 \,,\, n $

DO $ i \;:=\; 1 \,,\, n $
$C_{i,\ast} \;:=\; C_{i,\ast} + A_{i,k} \ast B_{k,\ast}$
END DO
END DO
Dieser Algorithmus geht auf Fox zurück [Fox88,KGGK94].

 \begin{algorithmus}% latex2html id marker 8512
\caption{broadcast-multiply-roll ...
...akebox[0pt]{}_{i,j}$\space an ${\cal P}^{[i-1,j]}$\end{itemize}\end{algorithmus}
Bemerkung : Am Ende gilt wieder $\widetilde{B} \makebox[0pt]{}_{i,j}\,=\,B_{i,j}$ .



Gundolf Haase
1998-12-22