Cartes de contrôle Shewhart
PRO-Analyste +IA
pour Windows, Mac, Linux

Registre des logiciels russes (entrée n° 18857 du 05/09/2023)

Acheter un logiciel

Apprentissage automatique (ML). Entraîner des modèles mathématiques avec un algorithme La régression linéaire multiple

Bouton [Régression linéaire multivariée]

La régression linéaire est un modèle de régression utilisé en statistique de la dépendance d'une variable (expliquée, dépendante) à une ou plusieurs autres variables (facteurs, régresseurs, variables indépendantes) avec une fonction de dépendance linéaire.

La régression linéaire est définie comme le processus consistant à déterminer la ligne droite qui correspond le mieux à un ensemble de points de données disparates. Cette ligne peut ensuite être projetée pour prédire de nouveaux points de données. En raison de sa simplicité et de ses fonctionnalités importantes, la régression linéaire est une méthode fondamentale en apprentissage automatique.

Dans le cas de la construction d'une dépendance de régression d'une variable aléatoire sur un ensemble de plusieurs variables aléatoires (une variable dépendante avec plusieurs variables indépendantes), on parle de construction de régression linéaire multiple (Multiple Linear Regression). Si la variable indépendante n’en est qu’une, ils parlent de construire une régression linéaire simple.

Vous pouvez télécharger un exemple de fichier de feuille de calcul structuré pour créer un modèle mathématique et effectuer des prédictions avec l'algorithme de régression linéaire multiple (un échantillon de ces données est également utilisé dans les algorithmes d'arbre de décision et de réseau neuronal pour les modèles de régression : XLSX .

Les données structurées des fichiers de tableaux peuvent être utilisées pour l'importation : classeur Excel (*.xlsx) ; Classeur binaire Excel (*.xlsb) ; Feuille de calcul OpenDocument (*.ods).

Où est-il utilisé ?

L'analyse des données utilisant la régression linéaire multiple peut être appliquée :

  • comme une alternative efficace (coût, temps, ressources)" Planification des expériences "pour rechercher les modes optimaux de paramètres d'entrée ;
  • pour une évaluation préliminaire ou alternative des paramètres de sortie lorsque les procédures de mesure de ces paramètres sont effectuées au moyen d'essais coûteux et/ou longs ;
  • pour les systèmes experts d’aide à la décision (DSS), lorsque les décisions sont associées à des risques d’erreurs humaines.
Fichiers de modèle de données

Notre logiciel peut utiliser des modèles mathématiques de régression linéaire multivariée entraînés pour la bibliothèque scikit-learn, créés sur d'autres ordinateurs et enregistrés dans des fichiers (*.sav).

Régression linéaire multiple pour les mesures d'entrée et de sortie continues
Fenêtre permettant d'accéder aux fonctions d'apprentissage automatique (ML)

Figure 1. Fenêtre d'accès aux fonctions d'apprentissage automatique (ML). Une liste de menus déroulants s'affiche lorsque vous passez la souris sur l'élément du menu principal [Méthodes d'analyse des données].

Fenêtre permettant d'accéder aux fonctions d'apprentissage automatique (ML)

Figure 2. Fenêtre des fonctions d'apprentissage automatique (ML). Une info-bulle apparaît lorsque vous passez votre souris sur le bouton pour accéder à plusieurs fonctions de régression linéaire.

Fenêtre de fonction de régression linéaire multiple - 1

Figure 3. Fenêtre de fonction de régression linéaire multiple.

Fenêtre de fonction de régression linéaire multiple - 2

Figure 4. Fenêtre de fonction de régression linéaire multiple. Dans la liste déroulante [Types de graphiques pour l'évaluation du modèle], le graphique [Graphique linéaire. Actuel vs prédit].

Fenêtre de fonction de régression linéaire multiple - 3

Figure 5. Fenêtre de fonction de régression linéaire multiple. Dans la liste déroulante [Types de graphiques pour l'évaluation du modèle], le graphique [Graphique linéaire. Actuel vs prédit]. Le graphique est mis à l'échelle le long de l'axe X.

Fenêtre de fonction de régression linéaire multiple - 4

Figure 6. Fenêtre de fonction de régression linéaire multiple. Dans la liste déroulante [Types de graphiques pour l'évaluation du modèle], le graphique [Tableau des coefficients de régression linéaire multiple] est sélectionné.

Fenêtre de fonction de régression linéaire multiple - 5

Figure 7. Fenêtre de fonction de régression linéaire multiple. Une info-bulle déroulante apparaît lorsque vous passez votre souris sur le bouton de sélection d'un fichier de table pour importer de nouvelles données.

Fenêtre de fonction de régression linéaire multiple - 6

Figure 8. Fenêtre de sélection d'un fichier de table pour entraîner un modèle mathématique à l'aide de la régression linéaire multivariée.

Fenêtre de fonction de régression linéaire multiple - 7

Figure 9. Fenêtre de fonction de régression linéaire multiple. Une info-bulle déroulante apparaît lorsque vous passez la souris sur la case [Enregistrer le modèle] cochée. Le modèle est automatiquement enregistré dans le dossier d'application approprié [SCCPython\resources\Model_AI] lorsque vous sélectionnez la variable dépendante requise dans la liste déroulante [Prédire les valeurs des variables dépendantes :]

Fenêtre de fonction de régression linéaire multiple - 8

Figure 10. Fenêtre de fonction de régression linéaire multiple. Une fenêtre de message concernant l'enregistrement du fichier de modèle mathématique s'affiche.

Fenêtre de fonction de régression linéaire multiple - 9

Figure 11. Fenêtre de fonction de régression linéaire multiple. Une info-bulle déroulante s'affiche lorsque vous passez la souris sur le bouton pour accéder au panneau de configuration permettant de sélectionner un modèle mathématique enregistré.

Fenêtre de fonction de régression linéaire multiple - 10

Figure 12. Fenêtre de fonction de régression linéaire multiple. Panneau de contrôle pour sélectionner un modèle mathématique enregistré. Une info-bulle déroulante s'affiche lorsque vous passez la souris sur le chemin d'accès au fichier du modèle mathématique sélectionné.

Fenêtre de fonction de régression linéaire multiple - 11

Figure 13. Fenêtre de fonction de régression linéaire multiple. Panneau de contrôle pour sélectionner un modèle mathématique enregistré. Une info-bulle déroulante apparaît lorsque vous passez votre souris sur le bouton pour accéder au panneau de configuration permettant de sélectionner un fichier contenant des données permettant de prédire la variable dépendante.

Fenêtre de fonction de régression linéaire multiple - 12

Figure 14. Fenêtre de fonction de régression linéaire multiple. Tableau de bord pour sélectionner des données avec des variables indépendantes et appliquer un modèle mathématique pour prédire la variable dépendante. Une info-bulle déroulante apparaît lorsque vous passez la souris sur le chemin d'accès au fichier de données. Une feuille du fichier de données est sélectionnée pour prédire les valeurs de l'indicateur.

Fenêtre de fonction de régression linéaire multiple - 13

Figure 15. Fenêtre de fonction de régression linéaire multiple. Tableau de bord pour sélectionner des données avec des variables indépendantes et appliquer un modèle mathématique pour prédire la variable dépendante. Une info-bulle déroulante apparaît lorsque vous passez la souris sur le bouton [Prédire les résultats].

Fenêtre de fonction de régression linéaire multiple - 14

Figure 16. Fenêtre de fonction de régression linéaire multiple. En cliquant sur le bouton « Prédire les résultats », le modèle est appliqué aux données importées à l'étape précédente et à la fin de l'opération, une fenêtre de notification s'ouvre pour enregistrer les valeurs prédites dans un fichier Excel.

Si vos données importées contiennent une ou plusieurs colonnes de variables explicatives avec des valeurs catégorielles, telles que [homme, femme], une procédure automatique de codage One-Hot sera effectuée pour convertir les données en nouvelles colonnes codées numériques [0, 1]. Les données codées à chaud seront enregistrées dans le fichier [xlsx] original dans une nouvelle feuille.

Raisons pour lesquelles la précision d'un modèle mathématique utilisant la méthode de régression linéaire peut donner une faible précision
  1. Incohérence des hypothèses de régression linéaire : la régression linéaire suppose une relation linéaire entre les caractéristiques et la variable cible. Si des relations non linéaires existent, la régression linéaire peut alors être peu précise.
  2. Mauvaise sélection de fonctionnalités : la sélection des bonnes fonctionnalités est très importante pour la précision du modèle de régression linéaire. Si des fonctionnalités inappropriées ou non pertinentes sont incluses dans le modèle, cela peut réduire sa précision.
  3. Données insuffisantes : si le modèle est entraîné sur une petite quantité de données, cela peut entraîner une faible précision. Plus il y a de données disponibles pour la formation, plus le modèle de régression linéaire peut être précis.
  4. Violation des hypothèses d'indépendance des erreurs : La régression linéaire nécessite que les erreurs du modèle soient indépendantes et distribuées de manière identique. Si cette hypothèse n’est pas respectée, la précision du modèle peut être faible.
  5. Multicolinéarité des entités : la multicolinéarité se produit lorsque les entités du modèle sont fortement corrélées les unes aux autres. Cela peut affecter la précision de la régression linéaire.
  6. Normalisation inappropriée des caractéristiques : si les caractéristiques ne sont pas standardisées, les caractéristiques avec des échelles différentes peuvent contribuer de manière inégale au modèle, ce qui peut conduire à une faible précision.