25.07.2011

Neue Methode macht Supercomputer schneller

Weltrekord-Algorithmus aus Jülich berechnet mehr als drei Billionen Teilchen.

Weltrekord-Algorithmus aus Jülich berechnet mehr als drei Billionen Teilchen.

Mit einer von Jülicher Wissenschaftlern verbesserten Methode lassen sich Computersimulationen entscheidend beschleunigen. Während eines Tests mit dem Supercomputer Jugene berechneten die Forscher ein System aus 3.011.561.968.121 Teilchen in gut elf Minuten – Weltrekord! Bei dem Verfahren handelt es sich um die optimierte Form eines der Top-10-Algorithmen für wissenschaftliche Simulationen, der sogenannten schnellen Multipol-Methode (FMM = "Fast Multipole Method"). Die Wissenschaftler Ivo Kabadshow und Holger Dachsel vom Jülich Supercomputing Centre (JSC) stellen den Quellcode für interessierte Anwender ab sofort frei zur Verfügung.

 

Abb.: Vergleich unterschiedlicher Methoden: Um ein System aus drei Billionen Teilchen direkt zu berechnen, würde ein gewöhnlicher PC eine Milliarde Jahre benötigen. Mit der Jülicher FMM schaffte er es dagegen in 220 Tagen. Deutschlands schnellster Rechner Jugene war sogar schon nach gut elf Minuten fertig. (Bild:  Forschungszentrum Jülich)

Auch andere und deutlich kleinere Anwendungen können von dem optimierten Algorithmus profitieren. Die schnelle Multipol-Methode dient generell dazu, räumlich unbegrenzt wirkende Wechselwirkungen zwischen Teilchen zu berechnen. Dazu zählen die in der Praxis häufig wichtigsten physikalischen Kräfte: die Gravitation und die elektromagnetische Wechselwirkung, der Grundlage für die Ausbreitung von Licht, Elektrizität, chemische Reaktionen und den Aufbau von Feststoffen, Molekülen und Atomen. Da in solchen Systemen jedes Teilchen mit jedem anderen wechselwirkt, steigt die Gesamtanzahl aller zu berücksichtigenden Wechselwirkungen quadratisch an und nimmt schnell extreme Ausmaße an.

Wollte man die Wechselwirkungen zwischen drei Billionen Teilchen direkt berechnen, würde ein Superrechner wie Jugene mit seinen 294.912 Prozessoren für einen einzigen Durchgang 32.000 Jahre benötigen. Ein gewöhnlicher PC wäre sogar eine Milliarde Jahre lang beschäftigt. Mit Hilfe der schnellen Multipol-Methode lassen sich weit entfernte Teilchen zu Clustern zusammenfassen, die durch sogenannte Multipol-Momente beschrieben werden. So müssen nicht mehr alle Wechselwirkungen einzeln berechnet werden, was die Rechenzeit mit dem in Jülich optimierten Algorithmus auf Deutschlands schnellstem Superrechner Jugene auf 695 Sekunden verkürzte.

Großangelegte Simulationen wie etwa in der Astrophysik zur Evolution des Universums waren bisher auf mehrere hundert Milliarden Teilchen beschränkt. Um diese Grenze nach oben zu verschieben, "schraubten" die Jülicher Wissenschaftler am benötigten Speicheraufwand. "Superrechner wie Jugene haben trotz ihrer extremen Rechenleistung häufig relativ kleine Speicher pro Prozessor, in der Regel weniger als ein PC. Deshalb ist die Teilchenanzahl eher durch den Speicher als durch die Prozessorleistung beschränkt", berichtet der Wissenschaftler Ivo Kabadshow.

Zur Optimierung entwickelte das Jülicher Team einen neuen Algorithmus zur automatischen Fehlerkontrolle und Rechenzeitminimierung. Dieser reduziert den Speicherbedarf und beschleunigt die Rechnung. "Die FMM galt schon immer als schnelle Methode. Aber bisher war es kaum möglich, sie optimal einzustellen. Die benötigte Rechenzeit hängt von drei verschiedenen Parametern ab, die sich gegenseitig beeinflussen und im Prinzip fortlaufend neu angepasst werden müssten. Durch eine unzureichende Anpassung dieser Parameter kann sich die Rechenzeit schnell um das zehn- bis hundertfache erhöhen", erläutert Dachsel. Besonders die Anwender werden deshalb von der einfachen Handhabbarkeit der verbesserten Methode profitieren. Denn die Jülicher FMM stellt alle Parameter automatisch fortlaufend optimal ein und erlaubt so einen einfacheren Zugang zum Algorithmus. Die in Zusammenarbeit mit dem Argonne National Laboratory (ANL) und der TU Chemnitz entwickelte Bibliothek ist ab sofort frei verfügbar.

FZ Jülich / OD

ContentAd

Kleinste auf dem Markt erhältliche Hochleistungs-Turbopumpe
ANZEIGE

Kleinste auf dem Markt erhältliche Hochleistungs-Turbopumpe

Die HiPace 10 Neo ist ein effizienter, kompakter Allrounder für den Prüfalltag, der geräuscharm und besonders energieeffizient ist.

Sonderhefte

Physics' Best und Best of
Sonderausgaben

Physics' Best und Best of

Die Sonder­ausgaben präsentieren kompakt und übersichtlich neue Produkt­informationen und ihre Anwendungen und bieten für Nutzer wie Unternehmen ein zusätzliches Forum.

Meist gelesen

Themen