Blog

Open Source: Natürlicher Verbündeter von Data Science

Data Science ist ohne Open Source nicht vorstellbar. Eine der meistgenutzten Sprachen in Data Science ist das quelloffene Python. Auch beliebte OS-Bibliotheken wie pandas, numpy oder sklearn sind quelloffen – und überdies essenzielle Bestandteile der meisten Data-Science-Projekte.

OS-Technologien unterstützen Data Scientists außerdem bei der Datenhaltung und stellen Algorithmen, Modelle und Metriken zur Evaluierung bereit. Darüber hinaus können OS-Sprachmodelle für die Ergebnisauswertung des Data-Science-Prozesses genutzt werden.

  • Einfachheit: Leicht zu erlernen und zu lesen
  • Vielseitigkeit: Für viele Anwendungsbereiche geeignet
  • Große Community: Weltweite Unterstützung
  • Integration: Leicht mit anderen Technologien integrierbar
  • Dynamische Typisierung: Flexibilität in der Programmierung
  • Hohe Produktivität: Schnellere Entwicklungszeiten
  • Kosteneffizienz: Kostenlos verfügbar
  • Flexibilität: Anpassbarkeit an spezifische Bedürfnisse
  • Community-Support: Ständige Updates durch weltweite Community
  • Zuverlässigkeit: Gut erprobt durch weltweite und breite Nutzung
  • Interoperabilität: Nahtlose Integration mit anderen Bibliotheken
  • Dokumentation: Umfassende Anleitungen und Tutorials
  • Schnelle Entwicklung: Ermöglicht schnelle Prototypenentwicklung
  • Wiederverwendbarkeit: Vermeidung doppelter Arbeit
  • Anpassbarkeit: Können auf individuelle Bedürfnisse abgestimmt werden
  • Zugang zu Innovationen: Auf Basis aktueller Forschungsergebnisse
  • Community-Unterstützung: Weltweiter Austausch und Weiterentwicklung
  • Kostenersparnis: Keine Lizenzgebühren
  • Schnelle Iteration: Rasches Testen und Verbessern von Modellen
  • Transparenz: Einsicht in Modellarchitektur und -funktionen

Dr. Stefan Jakob

Data Scientist
& Softwareentwickler

Beispiel Anomalieerkennung

Ein überzeugendes Beispiel für die Nutzung von OS-Technologien in Data Science ist die Erkennung von Anomalien. Diese ist ein echter Game Changer, wenn es etwa darum geht, Fehler im Softwareverhalten oder in Produktionsprozessen aufzuspüren – oder auch Hackern auf die Schliche zu kommen:

  • Erkennung von Ressourcenfressern: Mit OS Data Science finden wir unnötige Mehrverbräuche von Strom, Wasser, Gas, Druckluft, Schmierstoffe etc.
  • Detektion von Betrugsfällen: Mit OS Data Science enttarnen wir Unregelmäßigkeiten bei Warenkörben, Retourenquoten, Kaufabbrüchen u. v. m.
  • Optimierung der Maschinenperformance: Mit OS Data Science erkennen wir Abweichungen im gesamten Fertigungsprozess (Druck, Drehzahl, Vibration etc.).
  • Korrektur des Rohstoffeinsatzes: Mit OS Data Science erkennen wir, an welchen Stellen wir den Materialeinsatz verbessern und Verschwendung vermeiden können.