Cartes de contrôle Shewhart
PRO-Analyste +IA
pour Windows, Mac, Linux

Registre des logiciels russes (entrée n° 18857 du 05/09/2023)

Acheter un logiciel

Diagrammes de corrélation de paires (nuages ​​de points) avec histogrammes de distribution et matrice de corrélation thermique pour un nombre illimité de facteurs

Analyse statistique multivariée MSA (Analyse Statistique Multivariée).

Bouton [Analyse statistique multivariée]

La fonction de nuage de points, avec histogrammes de distribution et carte thermique de corrélation, constitue un moyen efficace de représenter visuellement les relations fonctionnelles statistiques entre les nombreux facteurs (mesures et comptages) représentés dans vos données. Chaque graphique affiche l'équation de la ligne de tendance, le coefficient de corrélation de Pearson [R] et le coefficient de détermination [R²].

Vous pouvez télécharger un exemple de feuille de calcul structurée pour créer des nuages ​​de points avec des histogrammes de distributions de valeurs et un diagramme thermique de corrélations : XLSX .

Les données structurées des fichiers de tableaux peuvent être utilisées pour l'importation : classeur Excel (*.xlsx) ; Classeur binaire Excel (*.xlsb) ; Feuille de calcul OpenDocument (*.ods).

Il est important de noter qu'un coefficient de corrélation élevé ne prouve pas une relation de cause à effet entre les facteurs analysés, mais indique leur lien fonctionnel statistique. Par exemple, les deux facteurs peuvent dépendre d’un autre ou d’un groupe d’autres facteurs.

Le menu de la fenêtre principale du programme s'ouvre pour accéder au panneau de contrôle de l'analyse des données multidimensionnelles.

Figure 1. Le menu de la fenêtre principale du programme s'ouvre pour accéder au panneau de configuration de l'analyse des données multidimensionnelles.

Analyse de corrélation multifactorielle des caractéristiques qualitatives-1.

Figure 2. Une info-bulle déroulante s'affiche lorsque vous passez la souris sur le bouton pour accéder au panneau de commande du graphique de corrélation de paires (diagrammes de dispersion) avec des histogrammes de la distribution des valeurs individuelles.

Analyse de corrélation multivariée des caractéristiques qualitatives-2.

Figure 3. Panneau de configuration du nuage de points avec histogrammes. En cliquant avec le bouton gauche de la souris sur un point sélectionné par l'utilisateur sur le graphique à nuages ​​de points, une légende avec le numéro du point de données (ligne) s'affiche. En cliquant avec le bouton gauche de la souris sur la zone colorée sélectionnée par l'utilisateur dans la carte thermique, une légende s'affiche avec les noms des colonnes de données sources le long des axes Y, X et le coefficient de corrélation. Le masquage des signatures se fait en cliquant avec le bouton droit sur la zone de signature.

Avec un grand nombre de facteurs mesurables surveillés, il est difficile, même pour un technologue expérimenté, de maintenir une compréhension des relations possibles entre les caractéristiques du processus surveillées. Grâce à notre logiciel, vous pouvez analyser un nombre illimité de facteurs en un clic, prêter attention aux valeurs aberrantes anormales (points en dehors de la population globale sur le graphique) ou aux écarts dans la taille et la direction attendues de la corrélation (négative, nulle, positive) par paires. des valeurs analysées.

Analyse de corrélation multivariée des caractéristiques qualitatives Viscosité et pH

Figure 4. Panneau de configuration du nuage de points avec histogrammes. Ouverture de la liste déroulante de l'info-bulle lorsque vous passez la souris sur le bouton Aller dans le contrôle du diagramme thermique.

Analyse de corrélation multivariée Ensemble de données sur le logement Ames

Figure 5. Panneau de commande du diagramme thermique. Les étiquettes des coefficients de corrélation dans le diagramme thermique sont désactivées. Dans le panneau de commande du diagramme thermique, la plage des 35 colonnes de données sources est sélectionnée. Une légende s'affiche pour la zone de corrélation sélectionnée par l'utilisateur sur la carte thermique. Source des données : Ensemble de données sur le logement Ames.

L'expression « 4.552e+04 » désigne le nombre 45.520. Ce nombre est représenté en notation scientifique, où « e+04 » signifie multiplier par 10 à la puissance 4, c'est-à-dire que le nombre est multiplié par 10, quatre fois.

Analyse de corrélation multivariée Ensemble de données sur le logement Ames

Figure 6. Panneau de commande du diagramme thermique. Dans la zone de contrôle du diagramme thermique, les étiquettes de valeurs de corrélation sont activées et la plage allant de la colonne 25 à la colonne 35 (incluse) des données sources est sélectionnée. Source des données : Ensemble de données sur le logement Ames.

Définitions

Le coefficient de corrélation et le coefficient de détermination sont liés l'un à l'autre et tous deux sont utilisés pour mesurer le degré de relation entre deux variables.

Le coefficient de corrélation (noté R ou r) mesure le degré de relation linéaire entre deux variables (x) et (y). Il prend des valeurs de -1 à 1, où -1 signifie une relation linéaire négative complète, 1 signifie une relation linéaire positive et 0 signifie aucune relation linéaire. Le coefficient de corrélation montre à quel point les points de données sont proches d'une ligne de tendance ou d'une ligne de régression. Ainsi, plus les points de données sont proches de la ligne de tendance, plus le coefficient de corrélation est élevé et plus la relation entre les variables (x) et (y) est forte.

Le coefficient de détermination (noté R² ou r²) est le carré du coefficient de corrélation. Il montre dans quelle mesure la variance de la variable dépendante (y) peut être expliquée par la variable indépendante (x). Le coefficient de détermination varie de 0 à 1, où 0 signifie que la variable indépendante n'explique pas la variabilité de la variable dépendante, et 1 signifie que la variable indépendante explique pleinement la variabilité de la variable dépendante.

Ainsi, le coefficient de corrélation montre le degré de relation entre les variables, tandis que le coefficient de détermination montre dans quelle mesure la variable indépendante explique la variabilité de la variable dépendante.

Définition des émissions

Souvent, à l'aide de méthodes graphiques simples, il est possible de comprendre lequel des deux facteurs d'une paire est responsable de la valeur aberrante observée, pour ce faire, il suffit de regarder les graphiques de corrélation avec les histogrammes de chaque facteur et avec lui-même, voir la figure 6.

Analyse de corrélation multivariée : graphiques de corrélation des facteurs 1 et 3 avec lui-même

Figure 7. Tableau de bord du diagramme thermique de corrélation : graphiques de corrélation de tous les facteurs et du facteur 1 avec eux-mêmes. Il y a un problème avec l'enregistrement de deux valeurs du Facteur-1.

Nez signification opérationnelle une telle compréhension du « coupable de la valeur aberrante » ne peut être confirmée ou infirmée que par la carte XmR de contrôle de Shewhart pour les valeurs individuelles, construite selon les données initiales du Facteur-1, voir la figure 5 ci-dessous.

Graphique de contrôle XmR des valeurs individuelles, construit selon les données initiales du Facteur-1 (avant de supprimer les valeurs aberrantes).

Figure 8. Graphique XmR de contrôle des valeurs individuelles, construit selon les données initiales du Facteur-1 (avant de supprimer les valeurs aberrantes).

Carte XmR de contrôle des valeurs individuelles, construite selon les données initiales de Factor-2

Figure 9. Graphique XmR de contrôle des valeurs individuelles, construit selon les données initiales de Factor-2. La série de points rouges de 81 à 89 sur le graphique mR-map est une raison pour comprendre les raisons particulières qui apparaissent à ces points. Il est important de noter que l’analyse multivariée de la figure 4 n’a pas cette capacité.

Carte XmR de contrôle des valeurs individuelles, construite selon les données initiales de Factor-3

Figure 10. Graphique XmR de contrôle des valeurs individuelles, construit selon les données initiales de Factor-3.

Important

Parfois, la suppression d’un seul point aberrant peut changer la direction de la corrélation (la direction de la ligne de tendance) d’une corrélation positive à une corrélation négative. Vous devez être conscient de la possibilité d'un tel comportement de la ligne de tendance et de toutes les dérivées calculées automatiquement, par exemple : l'équation de la fonction de tendance, le coefficient de détermination R2 (la valeur de la fiabilité de l'approximation) et la corrélation R. Cette remarque s'applique également à l'équation de régression linéaire et à d'autres types de régressions construites à partir des données originales. La première étape consiste à examiner vos données, présentées graphiquement sur une carte de contrôle Shewhart. Faites attention au processus initial de saisie des données de l'opérateur et améliorez-le grâce à la validation automatisée des valeurs saisies.

Exemple. Dans une grande entreprise manufacturière produisant un type de produit, légèrement différent uniquement en longueur et en diamètre, les résultats d'une analyse de corrélation multivariée de deux indicateurs de rondeur de produit ont démontré des directions de corrélation opposées de ces indicateurs, sans aucune preuve de valeurs aberrantes dans l'original. données. Cela m'a permis de montrer à la direction de la production les différentes manières dont un opérateur de ligne peut contrôler les mêmes processus en fonction de la taille du produit, ce qui a conduit à une enquête sur ce que fait réellement l'opérateur.

Les émissions sont souvent causées par des raisons triviales, par exemple une erreur dans l'enregistrement des valeurs lues sur les appareils par les contrôleurs (et c'est une raison particulière). Les cartes de contrôle Shewhart gèrent facilement ces entrées erronées qui se trouvent en dehors de la zone limitée par les limites de contrôle supérieure et inférieure du processus, par exemple, le signe séparant les parties entières et fractionnaires est décalé d'un chiffre. Par exemple, au lieu de 0,232, 0,0232 ou 2,32 est écrit.

Mais il existe des cas où le contrôleur commet une erreur en enregistrant une valeur, qui reste en même temps dans la zone limitée par les limites de contrôle supérieure et inférieure du processus, en cas d'erreur dans l'enregistrement d'un chiffre. Par exemple, au lieu de (0,232) il est écrit (0,282). Dans ce cas, les fonctions statistiques multivariées auront plus de chances d’identifier une ligne de données comportant une erreur d’écriture. Mais vous devez comprendre que la robustesse (applicabilité universelle) des cartes de contrôle Shewhart est due au fait que de telles erreurs n'auront pas d'impact significatif sur le calcul des limites de contrôle du processus, et c'est la propriété la plus importante des cartes de contrôle Shewhart.

Les spécialistes des chiffres peuvent utiliser les fonctionnalités d'apprentissage automatique pour les modèles de régression (prédiction de variables continues) de notre logiciel, ou le package d'analyse de données inclus avec Microsoft Excel pour calculer un modèle de régression linéaire des données. Ensuite, vous pouvez utiliser la carte de contrôle Shewhart (XmR ou XbarR) pour analyser les résidus (la différence entre les valeurs réelles et prédites par le modèle). Si la carte de contrôle montre des sous-groupes (points rouges) présentant des signes de causes particulières de variabilité, ce qui peut également indiquer une inadéquation entre le modèle de données et le processus actuel, ces causes devront être traitées et éliminées.

Par exemple, un graphique XmR de contrôle de valeurs individuelles et de plages mobiles, construit à partir des valeurs des [résidus] du modèle de régression, servira de définition opérationnelle , plutôt qu'un jugement subjectif sur les valeurs aberrantes observées dans les nuages ​​de points (valeurs aberrantes ou non aberrantes).

De plus, une telle analyse conservera des informations sur le biais de la valeur réelle par rapport aux valeurs prédites par la fonction de régression linéaire, ce qui facilite grandement l'interprétation de vos données et constitue une différence importante par rapport à l'analyse des données à l'aide des graphiques Hotelling T2.

À propos de la passion pour la CPS multifactorielle

La déclaration de nombreux spécialistes qui aiment travailler avec des chiffres, et non avec des processus au niveau de l'atelier, sur l'objectif du contrôle statistique multivarié des processus pour un contrôle plus efficace des processus multifactoriels, contrairement aux cartes de contrôle Shewhart conventionnelles, n'a aucun sens. Comme si Shewhart, Deming et Wheeler avaient construit leurs cartes de contrôle pour des processus à un seul facteur, de tels processus n'existent tout simplement pas. De plus, les processus de production, si vous n’avez même pas commencé à les gérer à l’aide des cartes de contrôle Shewhart, sont très probablement dans un état statistiquement incontrôlable (imprévisible). Les cartes de contrôle Shewhart pour de tels processus comporteront déjà des signaux qui devront être traités afin d'éliminer les causes particulières et d'amener les processus dans un état statistiquement contrôlé.

Bien que l'analyse multivariée puisse sembler avant-gardiste pour la direction, expliquer aux travailleurs de l'atelier ce que vous avez appris en utilisant le contrôle statistique multivarié ne fera que les dérouter, confirmer le travail « très difficile » d'amélioration des processus d'atelier et décourager davantage l'entreprise. employés au niveau du sol.