Apprentissage automatique (ML). Entraîner des modèles mathématiques avec un algorithme Les réseaux de neurones méthodes de régression et de classification

Bouton [Formation et application d'un modèle mathématique utilisant des réseaux de neurones (régression et classification).]

Les réseaux de neurones sont un type d’algorithme d’apprentissage automatique/deep learning qui imite le fonctionnement du cerveau humain. Ils sont constitués de plusieurs couches de neurones qui se connectent les unes aux autres et interagissent entre elles grâce à une fonction d’activation. Les réseaux de neurones utilisent des couches d'entrée (données en entrée), des couches cachées (contiennent des neurones artificiels qui traitent les données) et des couches de sortie (qui génèrent une sortie à partir des données traitées). L'algorithme de réseau neuronal entre dans la catégorie des algorithmes d'apprentissage supervisé et est utilisé pour prédire les variables de sortie continues (régression) et catégorielles (classification). Cette fonctionnalité de notre logiciel rend la technologie d'apprentissage automatique accessible à un large éventail d'utilisateurs.

Vous pouvez télécharger un exemple de fichier de feuille de calcul structuré pour créer un modèle mathématique et une prédiction par un algorithme de réseau neuronal pour l'analyse de régression : XLSX et pour le classement XLSX .

Les données structurées des fichiers de tableaux peuvent être utilisées pour l'importation : classeur Excel (*.xlsx) ; Classeur binaire Excel (*.xlsb) ; Feuille de calcul OpenDocument (*.ods).

Où est-il utilisé ?

L'analyse des données à l'aide de la méthode des réseaux de neurones peut être utilisée :

comme une alternative efficace (coût, temps, ressources)" Planification des expériences "pour rechercher les modes optimaux de paramètres d'entrée ;
pour une évaluation préliminaire ou alternative des paramètres de sortie lorsque les procédures de mesure de ces paramètres sont effectuées au moyen d'essais coûteux et/ou longs ;
pour les systèmes experts d’aide à la décision (DSS), lorsque les décisions sont associées à des risques d’erreurs humaines.

Fichiers de modèle de données

Notre logiciel peut utiliser des modèles mathématiques de réseaux neuronaux entraînés pour la bibliothèque scikit-learn, créés sur d'autres ordinateurs et enregistrés dans des fichiers (*.sav).

Réseaux de neurones par méthode de régression pour grandeurs continues (mesures) en entrée et en sortie

Fenêtre permettant d'accéder aux fonctions d'apprentissage automatique (ML)

Figure 1. Fenêtre d'accès aux fonctions d'apprentissage automatique (ML). Une liste de menus déroulants s'affiche lorsque vous passez la souris sur l'élément du menu principal.

Une info-bulle s'affiche lorsque vous passez la souris sur le bouton pour accéder aux fonctions des réseaux de neurones (régression et classification).

Figure 2. Fenêtre des fonctions d'apprentissage automatique (ML). Une info-bulle s'affiche lorsque vous passez la souris sur le bouton pour accéder aux fonctions des réseaux de neurones (régression et classification).

Une info-bulle déroulante apparaît lorsque vous passez votre souris sur le bouton pour accéder au panneau de configuration des algorithmes de réseaux neuronaux (régression)

Figure 3. Fenêtre de transition vers les fonctions de gestion des algorithmes d'apprentissage automatique à l'aide de méthodes de réseaux de neurones (régression et classification). Une info-bulle déroulante apparaît lorsque vous passez votre souris sur le bouton pour accéder au panneau de configuration des algorithmes de réseau neuronal (régression).

Fenêtre de la fonction de contrôle de l'algorithme de machine learning par la méthode des réseaux de neurones (régression). La variable à prédire est sélectionnée. Les valeurs par défaut sont définies : le nombre de couches cachées et le nombre de neurones dans chaque couche cachée, le nombre d'itérations (époques).

Figure 4. Fenêtre de la fonction de contrôle de l'algorithme d'apprentissage automatique par la méthode des réseaux de neurones (régression). La variable à prédire est sélectionnée. Les valeurs par défaut sont définies : le nombre de couches cachées et le nombre de neurones dans chaque couche cachée, le nombre d'itérations (époques). La case est cochée pour enregistrer le modèle dans le dossier d'application approprié (SCCPython\resources\Model_AI). Les caractéristiques et les indicateurs de précision du modèle mathématique formé sont affichés au-dessus du diagramme de réseau neuronal. La zone de traçage affiche le graphique « Diagramme du réseau neuronal, valeurs réelles et valeurs prédites ».

Fenêtre de la fonction de contrôle de l'algorithme de machine learning par la méthode des réseaux de neurones (régression). En cliquant avec le curseur de la souris, une liste déroulante s'ouvre avec une sélection de graphiques pour évaluer le modèle de réseau neuronal.

Figure 5. Fenêtre de la fonction de contrôle de l'algorithme d'apprentissage automatique par la méthode des réseaux de neurones (régression). Les valeurs des champs pour le nombre de couches cachées et de neurones dans chaque couche cachée du réseau neuronal ont été modifiées.

Fenêtre de la fonction de contrôle de l'algorithme de machine learning par la méthode des réseaux de neurones (régression). Une liste déroulante avec les types de graphiques d'évaluation de modèles mathématiques s'ouvre.

Figure 6. Fenêtre de la fonction de contrôle de l'algorithme d'apprentissage automatique par la méthode des réseaux de neurones (régression). Une liste déroulante avec les types de graphiques d'évaluation de modèles mathématiques s'ouvre.

Fenêtre de la fonction de contrôle de l'algorithme de machine learning par la méthode des réseaux de neurones (régression). La zone de traçage affiche un graphique [Valeurs actuelles par rapport aux valeurs prévues] pour l'ensemble de données de test.

Figure 7. Fenêtre de la fonction de contrôle de l'algorithme d'apprentissage automatique par la méthode des réseaux de neurones (régression). La zone de tracé affiche le graphique « Valeurs réelles par rapport aux valeurs prévues » pour l'ensemble de données de test.

Fenêtre de la fonction de contrôle pour l'application du modèle mathématique du réseau de neurones (régression). Le graphique est mis à l'échelle le long de l'axe X pour afficher moins de points (de 140 à 196) à l'aide de l'outil [Échelle] situé sous le graphique.

Figure 8. Fenêtre de la fonction de contrôle de l'application du modèle mathématique du réseau de neurones (régression). La zone de tracé affiche le graphique « Valeurs réelles par rapport aux valeurs prévues » pour l'ensemble de données de test. Le graphique est mis à l'échelle sur l'axe X pour afficher moins de points (de 140 à 196) à l'aide de l'outil Zoom situé sous le graphique.

La fonction de chargement d'un fichier avec un modèle mathématique enregistré d'un réseau de neurones (régression) et de l'appliquer à vos données pour la prédiction est similaire à la fonction décrite sur la page Arbres de décision (régression) .

Si vos données importées contiennent une ou plusieurs colonnes de variables explicatives avec des valeurs catégorielles, telles que [homme, femme], une procédure automatique de codage One-Hot sera effectuée pour convertir les données en nouvelles colonnes codées numériques [0, 1]. Les données codées à chaud seront enregistrées dans le fichier [xlsx] original dans une nouvelle feuille.

Raisons pour lesquelles la précision d'un modèle mathématique utilisant la méthode des réseaux neuronaux (régression) peut donner une faible précision

Quantité limitée de données : si vous disposez d'une quantité limitée de données pour entraîner un modèle, le réseau neuronal peut ne pas disposer de suffisamment d'informations pour créer un modèle précis. Des données volumineuses et variées sont souvent nécessaires pour entraîner un réseau neuronal avec une grande précision.
Architecture de réseau inappropriée : la sélection d'une architecture de réseau neuronal appropriée est très importante. Si l'architecture de réseau neuronal choisie n'est pas adaptée à un ensemble de données spécifique ou à un problème de régression, cela peut entraîner une mauvaise précision du modèle. Il est nécessaire d’expérimenter différents types de couches, nombre d’unités cachées et structure de réseau pour obtenir de meilleurs résultats.
Pas assez de formation : la formation d'un réseau neuronal peut être un processus complexe, nécessitant un nombre suffisant d'époques et un réglage minutieux des hyperparamètres. Si le modèle n'est pas entraîné pendant suffisamment d'époques ou avec des hyperparamètres mal sélectionnés, cela peut entraîner une faible précision du modèle.
Surajustement : un réseau de neurones peut rencontrer un problème de surajustement si l'ensemble d'apprentissage est trop petit et que le modèle comporte trop de paramètres. Cela peut conduire à une faible capacité de généralisation du modèle et à une faible précision sur les nouvelles données. Lors du recyclage, il est recommandé d'utiliser des méthodes de régularisation, telles que la réduction du taux d'apprentissage ou l'introduction de restrictions sur la norme de poids.
Prétraitement incorrect des données : un prétraitement incorrect des données, tel que la mise à l'échelle, la normalisation ou la gestion des valeurs aberrantes, peut avoir un impact significatif sur la précision d'un modèle de réseau neuronal. Il est nécessaire d'analyser et de préparer soigneusement les données avant de former le modèle.
Données déséquilibrées : si votre ensemble de données contient un nombre impair d'exemples de différentes valeurs de la variable cible, cela peut entraîner une mauvaise précision du modèle. Dans de tels cas, des exemples de techniques de pondération peuvent être appliqués.
Problèmes d'échantillonnage des données : si les données sont sélectionnées de manière aléatoire ou incorrecte, cela peut entraîner une faible précision du modèle. Il est important de sélectionner soigneusement les données afin qu'elles soient représentatives du problème de régression.

Réseaux de neurones par méthode de classification pour les quantités continues (mesures) en entrée et les données catégorielles (classes) en sortie

Exemple 1. Sur la base des résultats des tests cliniques du patient, il est nécessaire de prendre une décision sur son diagnostic, par exemple malade/non malade.

Exemple 2. Il est nécessaire de tirer une conclusion sur l'appartenance d'un objet ou d'un événement à une classe (type) spécifique sur la base des résultats de mesures de plusieurs de ses caractéristiques (propriétés).

Figure 9. Fenêtre de la fonction de gestion de l'entraînement et de l'évaluation du modèle mathématique d'un réseau de neurones (classification). Une info-bulle déroulante s'affiche lorsque vous passez la souris sur le bouton pour accéder au panneau de configuration des algorithmes de réseau neuronal utilisant la méthode de classification.

Fenêtre de la fonction de gestion de l'entraînement et de l'évaluation du modèle mathématique d'un réseau de neurones (classification). La variable catégorielle prédite (variable de classe) est sélectionnée. Les valeurs par défaut sont définies : le nombre de couches cachées et le nombre de neurones dans chaque couche cachée, le nombre d'itérations (époques).

Figure 10. Fenêtre de la fonction de gestion de l'entraînement et de l'évaluation du modèle mathématique d'un réseau de neurones (classification). La variable catégorielle prédite (variable de classe) est sélectionnée. Les valeurs par défaut sont définies : le nombre de couches cachées et le nombre de neurones dans chaque couche cachée, le nombre d'itérations (époques). La case est cochée pour enregistrer le modèle dans le dossier d'application approprié (SCCPython\resources\Model_AI). Les caractéristiques et les indicateurs de précision du modèle mathématique formé sont affichés au-dessus du diagramme de réseau neuronal. Une liste déroulante avec des graphiques permettant d'évaluer le modèle mathématique s'ouvre. La zone de traçage affiche le graphique « Diagramme du réseau neuronal, valeurs réelles et valeurs prédites ».

Fenêtre de la fonction de gestion de l'entraînement et de l'évaluation d'un modèle mathématique d'un réseau de neurones (classification) avec des graphiques de [matrice de confusion]

Figure 11. Fenêtre de la fonction de gestion de l'entraînement et de l'évaluation du modèle mathématique du réseau de neurones (classification) avec graphiques de la « matrice de confusion ».

La fonction de chargement d'un fichier avec un modèle mathématique enregistré d'un réseau neuronal (classification) et de l'appliquer à vos données pour la prédiction est similaire à la fonction décrite sur la page Arbres de décision (classification) .

Raisons pour lesquelles la précision d'un modèle mathématique utilisant la méthode des réseaux de neurones (classification) peut donner une faible précision

Données insuffisantes : si le modèle est entraîné sur une petite quantité de données, cela peut entraîner une faible précision. Plus il y a de données disponibles pour la formation, plus le modèle peut être précis.
Mauvaise architecture de réseau neuronal : il est important de choisir une architecture de réseau neuronal appropriée. Le fait de ne pas faire correspondre l'architecture aux données ou à la tâche de classification peut affecter la précision du modèle.
Hyperparamètres mal choisis : les réseaux de neurones comportent de nombreux hyperparamètres qui doivent être correctement réglés. Un mauvais choix d'hyperparamètres peut conduire à une faible précision du modèle.
Utilisation de fonctionnalités incorrectes : la sélection de fonctionnalités correctes et pertinentes est également importante. L'utilisation de fonctionnalités inappropriées ou non pertinentes peut réduire la précision de la classification.
Prétraitement incorrect des données : un prétraitement incorrect des données peut affecter la précision du modèle de réseau neuronal. Cela peut inclure une mise à l’échelle, une normalisation ou une gestion incorrecte des valeurs aberrantes.
Mauvais choix de fonction de perte : la fonction de perte d'un réseau neuronal doit être adaptée à une tâche de classification particulière. Choisir la mauvaise fonction de perte peut affecter la précision du modèle.

Cartes de contrôle Shewhart PRO-Analyste +IA pour Windows, Mac, Linux Registre des logiciels russes (entrée n° 18857 du 05/09/2023)