Blogpost vom 17. Oktober 2019

Warum Computer Vision (KI) gute Daten braucht

Unreife Weizenähren Nahaufnahme

Viele leistungsstarke Machine-Learning-Verfahren in der KI sind so genannte Black-Box-Algorithmen. Das heißt, dass sie keinen direkten Zugang zum Gelernten bieten – dafür sind sie meistens zu komplex. Daher fallen Fehler, die beim Sammeln der Daten gemacht werden, nicht sofort auf, sondern wirken sich unbemerkt auf das Ergebnis aus! Warum es wichtig ist, sich mit der Erklärbarkeit von Machine-Learning-Algorithmen zu beschäftigen und wie das dabei hilft, bessere Lösungen zu entwickeln, zeige ich hier anhand eines Beispiels von KI in der Landwirtschaft, mit dem Ziel der Pflanzenerkennung.

Weichweizen oder Acker-Fuchsschwanzgras?

In der Landwirtschaft kann es vorteilhaft sein, frühzeitig zu erkennen, welche Pflanzen auf einem Feld wachsen, da sie in der frühen Keimphase stark um Nährstoffe und Wasser konkurrieren. Denn wer sie früh bestimmen kann, kann unerwünschte Wildpflanzen frühzeitig entfernen und das Wachstum der Kulturpflanzen stärken. KI in der Landwirtschaft ist also eine Zukunftstechnologie.

Die Forschungsgruppe „Computer Vision and Biosystems Signal Processing“ der Universität Aarhus betreibt im Internet eine öffentliche Datenbank, die u. a. Fotos von 12 verschiedenen Wild- und Kulturpflanzen enthält, die häufig auf dänischen Feldern zu finden sind. Um einen Algorithmus zur Erkennung dieser Pflanzen zu entwickeln, können wir diese Daten nutzen. Wer jedoch naiv an diese Aufgabe herangeht, startet einen nicht offensichtlichen Fehler, der zum Versagen des Algorithmus auf dem Feld oder im Gewächshaus führen wird. Was genau ist das für ein Fehler?

Auf den ersten Blick sieht das Ergebnis ganz gut aus!

Bei einer kleinen Menge von Daten, sagen wir etwa 3800 Bildern, ist es üblich, ein Künstliches Neuronales Netz für das so genannten „Transfer Learning“ zu verwenden. Bei dieser Methode wird ein bereits fertig trainierter Algorithmus wie z. B. ResNet durch das Fine-Tuning einzelner Neuronenverbindungen auf die neue Aufgabe angepasst. Auf diese Weise lässt sich der große Datenhunger umgehen, der sonst befriedigt werden müsste, um gute Ergebnisse zu erzielen.

Wenden wir dieses Verfahren nun auf unsere Bilder von Pflanzen an, so kann ResNet von insgesamt 1600 zuvor ungesehenen Bildern in 80 % der Fälle berechnen, um welche Pflanzenart es sich handelt. Das klingt zunächst vielversprechend, doch es bleibt unklar, welche Eigenschaften im Bild für die Klassifizierung der einzelnen Pflanzen ausschlaggebend waren. Aus diesem Grund können wir dem guten Ergebnis nicht einfach blind vertrauen und unseren Algorithmus direkt in der Landwirtschaft einsetzen.

Vertrauen ist gut – Kontrolle ist besser

Heutzutage helfen Tools wie SHAP (SHapley Additive exPlanations) oder LIME (Local Interpretable Model-Agnostic Explanations) dabei, Machine-Learning-Algorithmen zu debuggen und Vorhersagen zu erklären. In unserem Pflanzenbeispiel wird durch den Einsatz von LIME sehr schnell deutlich, dass das Künstliche Neuronale Netz sein Wissen nicht aus der Form und Farbe der Pflanzen bezogen hat, sondern – oh Schreck – aus der Größe und Beschaffenheit der Kieselsteine im Hintergrund des Bildes!

Warum ist das passiert? Der Einfluss des Menschen

Schaut man sich an, wie die Daten gesammelt wurden, so fällt schnell auf, dass Weite und Höhe der Fotos mit zunehmendem Wachstum der Pflanzen größer werden. Dadurch erscheinen die Kieselsteine im Hintergrund bei den späteren Fotos kleiner. In frühen Keimphasen wurden jedoch andere Pflanzenarten häufiger aufgenommen als andere. Dadurch lernt der Algorithmus, dass es sich bei sehr großen Steinen im Bild wahrscheinlich eher um den Gemeinen Windhalm handelt muss, statt tatsächlich um den Mais. Diese so genannten „unbewussten Verzerrungen“ im Machine Learning sind oft schwierig zu finden und würden in unserem Showcase dazu führen, dass der Algorithmus im realen Einsatz auf dem Feld oder im Gewächshaus kläglich scheitert.

Train as you fight!

Wie kann man es besser machen? Der Militärspruch „Train as you fight!“ passt auch beim Einsatz von KI. Zunächst ist es prinzipiell wichtig, dass die gesammelten Daten dem entsprechen, was wir auch im realen Einsatz oder in der Produktion erwarten können. Wer also davon träumt, Kultur- von Wildpflanzen auf dem Feld mit Hilfe von Machine Learning zu unterscheiden, der braucht Bilddaten, die nicht im Forschungslabor bzw. unter künstlichen Bedingungen gewonnen wurden, sondern am besten direkt auf dem Feld.

Welche Bedingungen sind auf dem Feld zu erwarten?

Aber wie können wir dem Algorithmus dabei helfen, die Daten auf den Fotos richtig zu bewerten und KI in der Landwirtschaft erfolgreich zu machen?

Dafür ist es sehr wichtig, die Vielfalt in den Fotos einzufangen, die wir im realen Einsatz auf dem Feld erwarten. So können z. B. die Lichtverhältnisse je nach Jahreszeit und Wetter variieren, der Boden könnte lehmig, sandig oder humusreich sein, was sich ebenfalls auf Farbe und Beschaffenheit der Pflanzen auswirkt. Benachbarte Pflanzen können sich zudem überlappen, auch Moos kann im Hintergrund zu finden sein usw.

Darüber hinaus kann auch die Art und Weise, wie die Fotos aufgenommen wurden, variieren. So ist der Abstand der Kamera zur Pflanze sicher nicht immer gleich und auch die Bildschärfe kann nicht als konstant vorausgesetzt werden.

Warum benötigt man Vielfalt in den Daten?

Wer also beim Datensammeln die Vielfalt der realen Welt berücksichtigt, sorgt dafür, dass sich der KI-Algorithmus auf das Wesentliche konzentrieren kann und nur die wirklich wichtigen Informationen aus den Daten extrahiert.

Dass das gut funktionieren kann, zeigt die hohe Qualität und Erklärbarkeit, die Künstliche Neuronale Netze u. a. bei der Objekterkennung auf den Bildern der großen, visuellen Datenbank ImageNet leisten können. Deren Bilder dienen zurzeit als Benchmark zur Forschung und Entwicklung moderner KI-Algorithmen im Bereich Computer Vision. Für die KI in der Landwirtschaft kann das beispielhaft sein.

Hier geht’s zum zweiten Teil: KI in der Landwirtschaft: Deep Learning

Copyright-Informationen:
Plant Seedlings Dataset
© 2014 Mads Dyrmann, Peter Christiansen, University of Southern Denmark, and Aarhus University
The images and annotations are distributed under the Creative Commons BY-SA license.
If you use this dataset in your research or elsewhere, please cite/reference the following paper:
PAPER: A Public Image Database for Benchmark of Plant Seedling Classification Algorithms