Robotern das Sehen beibringen: RPA und Maschinelles Sehen

In einem unserer vorherigen Blogposts haben wir bereits darüber gesprochen, wie man Robotern das Lesen beibringen kann. Mit Hilfe von natürlicher Sprachverarbeitung, die auf künstlicher Intelligenz basiert können Roboter unstrukturierte und halbstrukturierte Daten wie Emails und Rechnungen aufnehmen. In diesem Blogpost behandeln wir einen weiteren Sinn, den wir den Robotern geben können- den des Sehens.

Wahrscheinlich wunderst du dich erstmal, wieso Softwareroboter überhaupt etwas sehen müssen. Gibt es dafür nicht schon echte Roboter und fahrerlose Autos? RPA kann bei der Arbeit mit maschineller Bildverarbeitung, etwa bei der Klassifizierung von Fotos (zum Beispiel bei der Suche nach missbräuchlichem Material), dem Lesen von handgeschriebenen Texten, der Gesichtserkennung oder der Identifikation von potenziell erkrankten Organen in Röntgen- oder MRT Bildern) sehr hilfreich sein. Während die künstliche Intelligenz hier den „intelligenten“ Teil übernimmt (mehr dazu gleich), wird RPA verwendet, um die Bilder zuzuführen und, basierend auf dem Ergebnis des Algorithmus, entsprechende Maßnahmen zu ergreifen.

Schauen wir uns einmal von einer nicht-technischen Seite an, wie KI überhaupt funktioniert -anhand eines einfachen Beispiels, indem erkannt werden muss, ob ein Bild einen Hund

abbildet oder nicht. Das ist, sowie die meisten Anwendungsfällen der maschinellen Bildverarbeitung, ein Beispiel von überwachtem Lernen. Dies bedeutet, dass die KI mit Hilfe von entsprechend gekennzeichneten Beispielbildern trainiert wird. (Meist wird die Markierung von Menschen übernommen – es gibt jedoch schon ein paar Fälle von KI, die Bilder für KI kennzeichnet). Beim überwachten Lernen muss die KI aus einer großen Anzahl von mit „Hund“ gekennzeichneten Bildern lernen, welche Eigenschaften und Merkmale ein Hund hat, wie z.B Kanten, die Dinge wie Ohren definieren, Form, Farbe usw. (Vergiss jedoch nicht, dass die KI nicht wirklich versteht, was ein Hund ist, sondern nur, welche Pixelmuster in einem Foto meistens mit dem Label «Hund» in Verbindung stehen.)

In den meisten Fällen braucht KI tausende, wenn nicht, hunderttausende markierte Bilder. Allein diese Menge zu bekommen, kann für einige Systeme eine große Herausforderung darstellen, weshalb für diesen Prozess oft Crowdsourcing verwendet wird. In manchen komplexen Fällen, wie beispielsweise bei der Verwendung von medizinischen Bildern, werden Millionen von Beispielen benötigt, um die erforderliche Genauigkeit zu gewährleisten. Und es wird noch schwieriger: Die KI benötigt eine ausgeglichene Anzahl an Bildern – also die gleiche Menge beider Szenarien, krank und gesund, was nicht immer möglich ist.

Sobald das KI-Modell einmal trainiert ist, kann es in einem automatisierten Prozess eingebettet werden. Die führenden RPA-Anbieter, einschließlich UiPath, machen diese Integration relativ fließend. Wichtig ist natürlich, dass die Automatisierung für die ausgeführte Anwendung geeignet ist. So ist es beispielsweise relativ einfach und risikoarm zu erkennen, ob ein Paket beschädigt wurde, um einen Schadensfall einzureichen, während die Erkennung von kanzerogenen Schatten auf einem Röntgenbild sehr sorgfältig gehandhabt werden muss. Wir wollen nicht, dass RPA automatisch E-Mails, auf Grundlage des KI-Modells an Patienten rausschickt. In diesem Fall müssen wir die möglichen Werte von falsch-positiven (die Maschine sagt, es wäre Krebs vorhanden, wenn es keinen gibt) und falsch-negativen (die Maschine sagt, dass kein Krebs vorliegt, wenn es Krebs gibt – was wesentlich schlimmer sein kann) verstehen und Menschen im Prozess haben, um die Ergebnisse zu erfassen, die grenzwertig oder beunruhigend für Patienten sein könnten.

Deinen Robotern das Sehen beizubringen, kann bei richtiger und geeigneter Anwendung, in der Automatisierung eine wertvolle Fähigkeit darstellen. Um zu erfahren, wie Bildverarbeitung in deinem Unternehmen eingesetzt werden kann, kontaktiere uns.

 

Tags: Ai, machine vision, RPA