Computer Vision

Computer Vision ist ein Feld der künstlichen Intelligenz, das sich darauf konzentriert, Computern das Sehen und Verstehen von Bildern und Videos ähnlich wie das menschliche Sehvermögen zu ermöglichen. Ohne die Fortschritte im Bereich des Deep Learnings wären viele Projekte der Computer Vision nur bedingt erfolgreich. Allerdings benötigen Projekte, aus dem Deep Learning Bereich, in jedem Fall einen optimalen Input. Ohne optimalen Input funktioniert die Erkennung oft nicht. Damit ist die Computer Vision nach wie vor unverzichtbar. 

histogram

Ohne Computer Vision sind die Merkmale nur unzureichend "zu sehen".

Mit Computer Vision werden sie wieder Sichtbar.

Ein weiterer Vorteil der Computer Vision ist die Performanz. Auf heutigen Systemen können Operationen in wenigen Millisekunden ausgeführt werden. Auch ohne den Einsatz einer GPU. 

Auch im Bereich der Segmentierung ist die Computer Vision (CV) sehr Performant.

Im Beispiel rechts benötigt die CV 4 milli Sekunden und eine Deep Learning Version benötigt 750 milli Sekunden (ohne GPU).

segmentation

Grundlegende Techniken

  • Histogrammausgleich: Verbessert den Kontrast in Bildern, um die Bildqualität zu erhöhen.
  • Farbmodelle: Verwendung von Farbräumen wie RGB, HSV, um Farbinformationen für die Bildverarbeitung effektiver zu nutzen.
  • Morphologische Operatoren: Erosion, Dilatation, Öffnen und Schließen zur Bearbeitung der Bildstruktur, hauptsächlich um Rauschen zu entfernen oder Objekte hervorzuheben.

Merkmalsextraktion

  • SURF (Speeded Up Robust Features): Ermöglicht die schnelle und effiziente Erkennung von Merkmalen in Bildern.
  • BRISK (Binary Robust Invariant Scalable Keypoints): Für die schnelle Erkennung von Schlüsselpunkten und deren Beschreibung.
  • ORB (Oriented FAST and Rotated BRIEF): Kombiniert schnelle Schlüsselpunkt-Erkennung mit einer robusten Beschreibung für Echtzeitanwendungen.

Fortgeschrittene Anwendungen

  • Image Retrieval: Suchen und Abrufen von Bildern aus großen Datenbanken basierend auf visuellem Inhalt.
  • Geometrie: Verständnis der räumlichen Anordnung und der Perspektive von Objekten in Bildern.
  • Kalman-Filter: Wird in der Bewegungsverfolgung und bei Zeitreihenanalysen eingesetzt, um Unsicherheiten zu minimieren.