Maschinelles Lernen: PyCaret 2.0 Low-Code-Bibliothek, automatisiert in ML-Workflow
3 min readDie offene Version der PyCaret-Bibliothek für maschinelles Lernen ist in Version 2.0 veröffentlicht. PyCaret ist ein durchgängig verschlüsseltes Tool zur Verwaltung von ML-Modellen im experimentellen Bereich und basiert auf dem Low-Code-Prinzip.
Mit dem Tool können Benutzer beispielsweise automatisch Code eingeben, indem sie Vorschläge für gängige Codezeilen hinzufügen, und Dienste anbieten, die von der Datenaufbereitung über die Modellauswahl bis zur Bereitstellung reichen. Während des Setups führt das Tool anscheinend automatisch die üblichen Vor-Daten-Transformationen durch, mit denen Entwickler arbeiten möchten.
Bereiten Sie Aufzeichnungen vor und vergleichen Sie Modelle mit PyCaret
PyCaret hat angekündigt, dass PyCaret zum Vorbereiten von Datensätzen verwendet werden kann, z. B. zum Aufteilen und Extrahieren von Testsätzen, zum Normalisieren von Daten oder eines Clusters und zum automatischen Entfernen von Rückständen. Aus etwa 20 Transformationsoptionen können Benutzer auswählen, welche Option das Tool mit seiner Datenaufzeichnung ausführen soll.
In den beobachteten ML-Szenarien kann PyCaret Modelle mit Standard-Hyperparametern zur Klassifizierung und Regression testen und die erhaltenen Leistungsindikatoren vergleichen. Dies soll den Benutzern offensichtlich dabei helfen, das am besten geeignete Modell für ihr jeweiliges Szenario auszuwählen, das als Funktion bezeichnet wird. compare_model
,, ,,.
Nach Angaben der Herausgeber eignet sich das Tool auch zum Trainieren von Modellen und zur Feinabstimmung von Hyperparametern. Es enthält auch Funktionen zur Datenanalyse und -interpretation und ermöglicht jetzt die Aufzeichnung von Experimenten. Neu, da Version 1.x auch Parameter für die Systemregistrierung und zur Korrektur von Ungleichgewichten in Datensätzen sind (fix_imbalance
und fix_imbalance_method
). Der Parameter save
erweitert dies nun plot_model
und die Möglichkeit, Grafiken als PNG- oder HTML-Dateien zu speichern: Wenn Benutzer diesen Wert auf True setzen, speichert PyCaret den aktuellen Zeitplan im aktiv bearbeiteten Arbeitsverzeichnis.
Die Installation in einer virtuellen Umgebung wird empfohlen
Um Konflikte mit der Ausführung von Anwendungen und deren Bibliotheken zu vermeiden, empfiehlt das PyCaret-Team, das Tool in einer virtuellen Umgebung zu installieren, in der es nicht auf andere Bibliotheken zugreifen kann. Beispielsweise kann die Installation einer Conda-Entwicklungsumgebung mit den folgenden Befehlen durchgeführt werden:
# create a conda environment
conda create --name yourenvname python=3.6# activate environment
conda activate yourenvname# install pycaret
pip install pycaret==2.0# create notebook kernel linked with the conda environment python -m
ipykernel install --user --name yourenvname --display-name "display-name"
Wenn Sie Azure Notebooks oder Google Colab verwenden, können Sie die Installation mit dem folgenden Befehl ausführen: !pip install pycaret==2.0
, Installation mit pip
Integriert automatisch alle Abhängigkeiten.
Genauer Beispiele für Anwendungen finden Sie im angekündigten Blogbeitragalles Interessenten finden technische Details in den Publikationsnotizen in GitHub, wo das Projekt gehostet wird.
(sgan)
“Zertifizierter Schriftsteller. Totaler Problemlöser. Alkoholiker. Entdecker. Wütend bescheidener Student. Wannabe-Unternehmer. Twitter-Liebhaber.”