Wissenschaftliches Rechnen III / CP III
Ziel ist eine Implementierung des Algorithmus 1 aus der Vorlesung auf der GPU.
Anforderungen / Hinweise:
double Zahlen übertragen werden, wobei \(M=O(1)\) sein soll.Die Implementierung kann ausgehend von Ihren Programmen aus den vorherigen Übungsblättern erfolgen oder Sie starten von dem Paket uebung5.zip. Dies enthält ein README.md, welches erklärt, wie die Dateien darin kompiliert werden. Sie können sich auch aus den Dateien Teile kopieren, um Ihre eigenen Programme zu ergänzen.
Messen Sie den Speedup für 10 Iteration als Funktion von \(N\) für eine sinnvolle/optimale execution configuration.
10 Punkte
Definitionen:
Nehmen Sie an, dass jede Operation eine Zeiteinheit benötigt und das ein Teil \(0<f<1\) der Operationen sequentiell ausgeführt werden müssen, also nicht parallelisiert werden können.
Beweisen Sie das Amdahlsches Gesetz \[S_p(N)\le 1/f\]
5 Punkte