KI-gestützte Software schafft Durchblick bei komplexen Daten
Erfolgreicher Einsatz für die Photonendiagnostik beim Freien Elektronenlaser FLASH.
Experimentelle Daten sind oft nicht nur hochdimensional, sondern auch verrauscht und voller Artefakte. Das erschwert es, die Daten zu interpretieren. Jetzt hat ein Team am Helmholtz-Zentrum Berlin für Materialien und Energie eine Software konzipiert, die mit Hilfe von selbstlernenden neuronalen Netzwerken die Daten smart komprimiert und im nächsten Schritt eine rauscharme Version rekonstruieren kann. Das ermöglicht Einblicke in Zusammenhänge, die sonst nicht erkennbar wären. Die Software wurde jetzt erfolgreich für die Photonendiagnostik beim Freien Elektronenlaser FLASH bei DESY eingesetzt. Sie eignet sich jedoch für viele unterschiedliche Anwendungen in der Wissenschaft.
Das Team verwendet eine besondere Klasse von neuronalen Netzen, genannt „disentangled variational autoencoder networks“, kurz β-VAEs. Vereinfacht gesagt sorgt das erste neuronale Netz für die Komprimierung der Daten, während das zweite neuronale Netz im Anschluss die Daten wieder rekonstruiert. „Dabei sind die beiden Netze so trainiert, dass die komprimierte Form für den Menschen interpretierbar wird“, erklärt Physiker Gregor Hartmann, der am HZB das Joint Lab zu Methoden der künstlichen Intelligenz, das vom HZB gemeinsam mit der Universität Kassel betrieben wird, betreut
Google Deepmind hatte bereits im Jahr 2017 vorgeschlagen, β-VAEs zu nutzen. Viele Experten gingen davon aus, dass die Anwendung in der echten Welt herausfordernd werden wird, da gerade nicht-lineare Komponenten schwer entwirrbar sind. „Nach mehreren Jahren, in denen wir lernen mussten, wie die neuronalen Netze lernen, funktionierte es dann endlich”, sagt Hartmann. Die β-VAEs sind in der Lage, ein zugrunde liegende Kernprinzip ohne Vorkenntnisse aus Daten zu extrahieren.
In ihrer Studie hat die Gruppe die Software genutzt, um die Photonenenergie von FLASH aus Einzelphotoelektronenspektren zu bestimmen. „Es ist uns gelungen, aus verrauschten Elektronflugzeitdaten diese Informationen zu extrahieren, und zwar deutlich besser als mit herkömmlichen Analysemethoden“, sagt Hartmann. Auch Daten mit detektorspezifischen Artefakten können so bereinigt werden.
„Die Methode ist richtig gut, wenn es um beeinträchtigte Daten geht“, betont Hartmann. Das Programm ist sogar in der Lage, winzige Signale, die in den Rohdaten nicht erkennbar waren, zu rekonstruieren. Solche Netzwerke können dazu beitragen, unerwartete physikalische Effekte oder Korrelationen in großen experimentellen Datensätzen aufzudecken. „Die KI-basierte intelligente Datenkompression ist ein sehr leistungsstarkes Werkzeug, nicht nur in der Photonenforschung“, sagt Hartmann.
HZB / RK
Weitere Infos
- Originalveröffentlichung
G. Hartmann et al.: Unsupervised realworld knowledge extraction via disentangled variational autoencoders for photon diagnostics, Sci. Rep. 12, 20783 (2022); DOI: 10.1038/s41598-022-25249-4 - Artificial Intelligence Methods for Experiment Design, Universität Kassel & Helmholtz-Zentrum Berlin für Materialien und Energie GmbH