Maschinelles Lernen mit Microsofts Project Bonsai
HeimHeim > Nachricht > Maschinelles Lernen mit Microsofts Project Bonsai

Maschinelles Lernen mit Microsofts Project Bonsai

Jun 19, 2023

Von Simon Bisson, Kolumnist, InfoWorld |

Da maschinelles Lernen (ML) im Mittelpunkt vieler moderner Computer steht, stellt sich die interessante Frage: Wie lernen Maschinen? Beim maschinellen Lernen steckt viel tiefgreifende Informatik, die Erstellung von Modellen, die Feedback-Techniken zur Verbesserung nutzen, und das Training auf riesigen Datensätzen, um Modelle zu konstruieren, die statistische Techniken nutzen können, um Ergebnisse abzuleiten. Aber was passiert, wenn Sie nicht über die Daten verfügen, um mit diesen Techniken ein Modell zu erstellen? Oder wenn Ihnen die datenwissenschaftlichen Kenntnisse fehlen?

Nicht alles, was wir mit maschinellem Lernen verwalten wollen, generiert große Mengen an Big Data oder verfügt über die erforderliche Kennzeichnung, um diese Daten nutzbar zu machen. In vielen Fällen verfügen wir möglicherweise nicht über die erforderlichen historischen Datensätze. Vielleicht automatisieren wir einen Geschäftsprozess, der noch nie instrumentiert wurde, oder wir arbeiten in einem Bereich, in dem menschliches Eingreifen von entscheidender Bedeutung ist. In anderen Fällen versuchen wir möglicherweise, ein maschinelles Lernsystem vor gegnerischen Angriffen zu schützen und Wege zu finden, um vergiftete Daten zu umgehen. Hier kommt maschinelles Lernen ins Spiel, das maschinelle Lernalgorithmen zu einem Ziel führt und mit Experten zusammenarbeitet.

Microsoft steht seit einiger Zeit an der Spitze der KI-Forschung und die daraus resultierenden Cognitive Service APIs sind in die Azure-Plattform integriert. Es bietet jetzt Tools zum Entwickeln und Trainieren eigener Modelle mithilfe von in Azure gespeicherten Big Data. Allerdings sind diese traditionellen Plattformen und Tools für maschinelles Lernen nicht das einzige Angebot von Microsoft, denn das Low-Code-Entwicklungstool Project Bonsai bietet eine einfache Möglichkeit, maschinelles Lernen zu nutzen, um die ML-Entwicklung für industrielle KI voranzutreiben.

Project Bonsai wird als Teil der Autonomous Systems-Suite von Microsoft bereitgestellt und ist ein Tool zum Erstellen und Trainieren von Modellen für maschinelles Lernen. Dabei wird ein Simulator mit menschlichen Eingaben verwendet, um Experten die Erstellung von Modellen zu ermöglichen, ohne dass Programmier- oder maschinelle Lernerfahrungen erforderlich sind. Es dient gleichzeitig als Werkzeug zur Bereitstellung erklärbarer KI, da die maschinelle Lernphase des Prozesses zeigt, wie das zugrunde liegende ML-System zu einer Entscheidung gelangt ist.

Im Mittelpunkt von Project Bonsai steht das Konzept der Trainingssimulation. Diese implementieren ein reales System, das Sie mit Ihrer Anwendung für maschinelles Lernen steuern möchten, und müssen daher mit vertrauter technischer Simulationssoftware wie Simulink von MATLAB oder benutzerdefiniertem Code, der in einem Container ausgeführt wird, erstellen. Wenn Sie Simulatoren bereits als Teil einer Steuerungssystem-Entwicklungsumgebung oder als Trainingstool verwenden, können diese für die Verwendung mit Project Bonsai umfunktioniert werden.

Trainingssimulatoren, die über eine Benutzeroberfläche verfügen, sind hier ein nützliches Werkzeug, da sie Benutzereingaben im Rahmen des Trainingsprozesses erfassen können. Simulatoren müssen sehr deutlich machen, wann ein Vorgang fehlgeschlagen ist, warum er fehlgeschlagen ist und wie der Fehler aufgetreten ist. Diese Informationen können als Eingaben für das Trainingstool verwendet werden, um dem Modell beizubringen, wo Fehler auftreten können, und um es in die Lage zu versetzen, Anzeichen für das Auftreten des Fehlers zu finden. Beispielsweise könnte ein Simulator, der zum Trainieren eines Projekt-Bonsai-Modells zur Steuerung eines Flughafengepäcksystems verwendet wird, zeigen, dass ein zu schnelles Laufen von Förderbändern dazu führt, dass Gepäck herunterfällt, und dass ein zu langsames Laufen zu Engpässen führen kann. Das System lernt dann, die optimale Geschwindigkeit für einen maximalen Beuteldurchsatz zu finden.

Es besteht eine enge Verbindung zwischen Project Bonsai und Kontrollsystemen, insbesondere solchen, die sich die moderne Kontrolltheorie zunutze machen, um Systeme innerhalb einer Reihe von Grenzen zu verwalten. Um gut mit ML-Modellen zu funktionieren, muss ein Simulator ein gutes Bild davon liefern, wie das simulierte Objekt oder der simulierte Dienst auf Eingaben reagiert und entsprechende Ausgaben liefert. Sie müssen in der Lage sein, einen bestimmten Startzustand festzulegen, damit sich der Simulator und das ML-Modell an sich ändernde Bedingungen anpassen können. Die Eingaben müssen quantifiziert werden, damit Ihr ML-System diskrete Änderungen am Simulator vornehmen und beispielsweise unser simuliertes Gepäcksystem um 1 m/s beschleunigen kann.

Den richtigen Simulator zu finden, ist wahrscheinlich der schwierigste Aspekt bei der Arbeit mit Project Bonsai. Möglicherweise benötigen Sie keine datenwissenschaftlichen Kenntnisse, aber auf jeden Fall Simulationsfähigkeiten. Es ist eine gute Idee, sowohl mit Fachexperten als auch mit Simulationsexperten zusammenzuarbeiten, um Ihren Simulator so genau wie möglich zu gestalten. Eine Simulation, die von dem realen System abweicht, das Sie mit ML verwalten möchten, führt zu einem schlecht trainierten Modell.

Sobald Sie über eine Simulation verfügen, können Sie mit dem Unterrichten Ihres Project Bonsai ML-Modells in der Training Engine beginnen. Microsoft nennt diese Modelle „Gehirne“, da sie auf neuronalen Netzen basieren. Es gibt vier Module: einen Architekten, einen Ausbilder, einen Lernenden und einen Prädiktor. Der Architekt verwendet den Schulungsplan, um einen Lernalgorithmus auszuwählen und zu optimieren (derzeit unter Verwendung einer von drei verschiedenen Optionen: Distributed Deep Q Network, Proximal Policy Optimization oder Soft Actor Critic).

Sobald der Architekt ein Lernmodell ausgewählt hat, geht der Ausbilder den Trainingsplan durch, steuert interaktiv den Simulator und reagiert auf die Ergebnisse des Lernenden. Sie können sich den Ausbilder und den Lernenden vielleicht als ein Paar vorstellen, wobei der Lernende dort ist, wo das ML-Modell mit dem gewählten Algorithmus trainiert wird und Daten aus dem Simulator mit Eingaben des Ausbilders verwendet. Sobald der Lernprozess abgeschlossen ist, liefert das System einen Prädiktor, einen trainierten Algorithmus mit einem API-Endpunkt, der als Inferenz-Engine und nicht als Training ausgeführt wird. Die Ausgaben des Prädiktors können mit den Ausgaben des Lernenden verglichen werden, um zu testen, ob Änderungen das Modell verbessern.

Der maschinelle Unterricht konzentriert sich, zumindest im Projekt Bonsai, auf das Erreichen bestimmter Ziele. Sie können sich diese ähnlich wie die Randbedingungen für ein Kontrollmodell vorstellen. Die verfügbaren Ziele sind relativ einfach, z. B. das Festlegen von etwas, das vermieden werden soll, oder das Festlegen eines Ziels, das so schnell wie möglich erreicht werden soll. Weitere Ziele sind die Festlegung von Höchst- oder Mindestwerten und die Aufrechterhaltung eines Systems in der Nähe eines bestimmten Zielwerts. Die Schulungs-Engine unterstützt so viele Ziele, wie Sie in Ihrem Schulungslehrplan festlegen. Ziele wie diese vereinfachen maschinelles Lernen erheblich. Es besteht keine Notwendigkeit, komplexe Trainingsalgorithmen zu erstellen; Sie müssen lediglich die Ziele definieren, die Ihr ML-Modell erreichen muss, und Project Bonsai erledigt den Rest für Sie.

Das Ergebnis von Project Bonsai ist ein Modell für maschinelles Lernen mit den Endpunkten, die für die Funktion Ihres Codes erforderlich sind. Das Modell kann im Laufe der Zeit aktualisiert werden, indem neue Ziele hinzugefügt und das Training nach Bedarf verfeinert werden, indem vorhergesagte Ergebnisse mit tatsächlichen Abläufen verglichen werden.

Der Lehrplan ist in einer Sprache namens Inkling verfasst. Es handelt sich um eine domänenspezifische Sprache, die benannte Objekte aus einem Simulator übernimmt und Sensoren und Aktoren verknüpft. Inkling verwendet Sensoren, um Zustände zu ermitteln, und Aktoren, um Aktionen voranzutreiben, mit sogenannten „Konzeptknoten“, um die Ziele zu beschreiben. Es ist nicht schwer, Inkling zu lernen, und die meisten Fachexperten sollten in der Lage sein, sehr schnell ein einfaches Schulungsmodul zu schreiben. Komplexere Modelle können erstellt werden, indem einer Inkling-Anwendung weitere Funktionen hinzugefügt werden. Microsoft stellt eine vollständige Inkling-Sprachreferenz zur Verfügung, die Ihnen den Einstieg in das Schreiben von Project Bonsai-Schulungen erleichtern soll.

Project Bonsai läuft auf Azure und Sie müssen ein Budget für den Betrieb einplanen. Modelle und Simulatoren werden in der Azure Container Registry gespeichert und verwenden Container zum Ausführen von Simulationen. Protokolle werden mit Azure Monitor verwaltet und Azure Storage speichert archivierte Simulatoren. Die Kosten sollten nicht zu hoch sein, aber es lohnt sich, sie zu überwachen und unerwünschte Ressourcengruppen zu entfernen, sobald Sie Ihre Modelle trainiert haben.

Maschinelles Lernen bietet einen alternativen Ansatz zur ML-Entwicklung, der gut bei Steuerungsproblemen funktioniert, beispielsweise bei der Arbeit mit Industrieanlagen. Es werden keine großen Datenmengen benötigt, und durch die Verwendung von Zielen zum Unterrichten eines Modells kann es von jedem trainiert werden, der das Problem versteht und über grundlegende Programmierkenntnisse verfügt. Es handelt sich nicht ganz um ein No-Code-System, da das Training in Inkling geschrieben werden muss und Sie Expertenbeiträge beim Schreiben und Instrumentieren eines Simulators benötigen, der in der Project Bonsai-Trainingsumgebung ausgeführt werden soll. Mit einem gut konzipierten Schulungsplan und einer genauen Simulation sollten Sie in der Lage sein, überraschend schnell früher sehr komplexe ML-Modelle zu erstellen und maschinelles Lernen von Vorhersagen auf Kontrolle umzustellen.

Lesen Sie als nächstes Folgendes:

Simon Bisson, Autor des Enterprise Microsoft-Blogs von InfoWorld, hat in der akademischen und Telekommunikationsforschung gearbeitet, war CTO eines Startups, leitete die technische Seite von UK Online und war in der Beratung und Technologiestrategie tätig.

Copyright © 2021 IDG Communications, Inc.

Lesen Sie als nächstes Folgendes: