Maschinelles Lernen mit Licht beschleunigen
Photonische Strukturen zur Mustererkennung untersucht.
Die Anforderungen von Muster- und Spracherkennungen sowie dem autonomen Fahren übersteigen oft die Kapazitäten herkömmlicher Computer-Prozessoren. Wissenschaftler der Uni Münster entwickeln in Zusammenarbeit mit einem internationalen Forscherteam neue Ansätze und Prozessor-Architekturen, die diesen Aufgaben gewachsen sind. Jetzt fanden sie heraus, dass photonische Prozessoren, bei denen Daten mittels Licht transportiert werden, Informationen sehr viel schneller und parallel verarbeiten als elektronische Chips.
Lichtbasierte Prozessoren zur Beschleunigung von Aufgaben im Bereich des maschinellen Lernens erlauben komplexe Rechenaufgaben mit enorm hohen Geschwindigkeiten von 10¹² bis 10¹⁵ Operationen pro Sekunde zu verarbeiten. Herkömmliche Chips, wie zum Beispiel Grafikkarten oder spezielle Hardware wie die Tensor Processing Unit von Google basieren auf einer elektronischen Datenübertragung und sind wesentlich langsamer. Das Forscherteam um Wolfram Pernice implementierte einen Hardwarebeschleuniger für Matrixmultiplikationen, die die Hauptrechenlast in der Berechnung von neuronalen Netzen darstellen.
Die Wissenschaftler kombinierten die photonischen Strukturen mit Phasenwechselmaterialien – kurz PWMs – als energieeffiziente Speicherelemente. PWMs werden üblicherweise in der optischen Datenspeicherung mit DVDs oder Blue-Rays eingesetzt. Im dem neuen Prozessor ermöglicht das die Speicherung und den Erhalt der Matrixelemente, ohne die Notwendigkeit Energie zuzuführen. Als Lichtquelle nutzten die Forscher einen chipbasierten Frequenzkamm. Ein Frequenzkamm bietet verschiedene optische Wellenlängen, die unabhängig voneinander im selben System verarbeitet werden. Dadurch ergibt sich eine parallele Datenverarbeitung, das Wellenlängenmultiplexverfahren.
In ihrem Experiment verwendeten die Wissenschaftler ein „Convolutional Neural Network“ zur Erkennung handgeschriebener Ziffern. Die Faltungsoperation zwischen Eingangsdaten und einem oder mehreren Filtern, die zum Beispiel eine Hervorhebung von Kanten in einem Bild sein kann, lässt sich sehr gut auf unsere Matrixarchitektur übertragen. Das Ausnutzen von Licht für die Signalübertragung erlaubt dem Prozessor eine parallele Datenverarbeitung durch Wellenlängenmultiplexen, die zu einer höheren Rechendichte führt. Dabei werden viele Matrixmultiplikationen in nur einem Zeitschritt durchgeführt. Anders als bei herkömmlicher Elektronik, die üblicherweise im niedrigen Gigahertz-Bereich arbeitet, können optisch Modulationsgeschwindigkeiten im Bereich von 50 bis 100 Gigahertz realisiert werden. Das Verfahren ermöglicht somit bisher unerreichte Datenraten und Rechendichten, also Operationen pro Prozessorfläche.
Die Ergebnisse sind vielfältig einsetzbar: Im Bereich der künstlichen Intelligenz können mehr Daten zeitgleich und energieeffizient verarbeitet werden. Der Einsatz von größeren neuronalen Netzen erlaubt zudem genauere und bisher unerreichte Vorhersagen sowie präzisere Datenanalysen. Beispielsweise unterstützen photonische Prozessoren die Auswertung großer Datenmengen in der medizinischen Diagnostik, etwa bei hochaufgelösten 3-D-Daten spezieller Bildgebungsverfahren. Weitere Anwendungsgebiete sind zum anderen das autonome Fahren, das auf eine schnelle und genaue Auswertung der Sensordaten angewiesen ist, sowie IT-Infrastrukturen wie „Cloud Computing“, die unter anderem Speicherplatz, Rechenleistung oder Anwendungssoftware bereitstellen.
WWU / RK
Weitere Infos
- Originalveröffentlichung
J. Feldmann et al.: Parallel convolution processing using an integrated photonic tensor core, Nature 589, 52 (2021); DOI: 10.1038/s41586-020-03070-1 - Responsive Nanosystems (W. Pernice), Physikalisches Institut, Westfälische Wilhelms-Universität Münster