Regression Logistique Python

July 31, 2024

La fonction h qui définit la régression logistique s'écrit alors: Tout le problème de classification par régression logistique apparaît alors comme un simple problème d'optimisation où, à partir de données, nous essayons d' obtenir le meilleur jeu de paramètre Θ permettant à notre courbe sigmoïde de coller au mieux aux données. C'est dans cette étape qu'intervient notre apprentissage automatique. Une fois cette étape effectuée, voici un aperçu du résultat qu'on peut obtenir: Il ne reste plus, à partir du seuil défini, qu'à classer les points en fonction de leurs positions par rapport à la régression et notre classification est faite! La régression logistique en pratique En Python c'est assez simple, on se sert de la classe LogisticRegression du module near_model comme un classificateur normal et que l'on entraîne sur des données déjà nettoyées et séparées en ensembles d'entraînement et de test puis le tour est joué! Niveau code, rien de plus basique: Pour des cas d'applications plus poussés, pourquoi ne pas suivre le cours dispensé par l'équipe Datascientest?

Régression logistique python sklearn
Regression logistique python programming

Régression Logistique Python Sklearn

Introduction: La régression logistique est un algorithme d'apprentissage supervisé qui est utilisé lorsque la variable cible est catégorique. La fonction hypothétique h (x) de la régression linéaire prédit des valeurs illimitées. Mais dans le cas de la régression logistique, où la variable cible est catégorique, nous devons restreindre la plage des valeurs prédites. Prenons un problème de classification, où nous devons classer si un e-mail est un spam ou non. Ainsi, la fonction hypothétique de la régression linéaire ne peut pas être utilisée ici pour prédire car elle prédit des valeurs non liées, mais nous devons prédire 0 ou 1. Pour ce faire, nous appliquons la fonction d'activation sigmoïde sur la fonction hypothétique de régression linéaire. La fonction hypothétique résultante pour la régression logistique est donc donnée ci-dessous: h (x) = sigmoïde (wx + b) Ici, w est le vecteur de poids. x est le vecteur de caractéristiques. b est le biais. sigmoïde (z) = 1 / (1 + e (- z)) Intuition mathématique: La fonction de coût de la régression linéaire (ou erreur quadratique moyenne) ne peut pas être utilisée dans la régression logistique car il s'agit d'une fonction non convexe des poids.

Regression Logistique Python Programming

Dans cet article nous allons appliquer une régression logistique avec python en utilisant deux packages très différents: scikit-learn et statsmodels. Nous verrons les pièges à éviter et le code associé. La régression logistique porte assez mal son nom car il ne s'agit pas à proprement parler d'une régression au sens classique du terme (on essaye pas d'expliquer une variable quantitative mais de classer des individus dans deux catégories). Cette méthode présente depuis de nombreuses années est la méthode la plus utilisée aujourd'hui en production pour construire des scores. En effet, ses atouts en ont fait une méthode de référence. Quels sont ses atouts: La simplicité du modèle: il s'agit d'un modèle linéaire, la régression logistique est un cas particulier du modèles linéaire généralisé dans lequel on va prédire la probabilité de la réponse 1 plutôt que la valeur directement (0 ou 1). La simplicité d'interprétation: le modèle obtenu est un modèle linéaire, c'est-à-dire qu'on obtient des coefficients associés à chaque variable explicative qui permettent de comprendre l'impact de chaque variable sur le choix (entre 0 et 1).

333333333333336 Précision sur l'ensemble de test par modèle sklearn: 61. 111111111111114 Remarque: Le modèle formé ci-dessus consiste à implémenter l'intuition mathématique non seulement pour améliorer la précision. Article written by mohit baliyan and translated by Acervo Lima from Implementation of Logistic Regression from Scratch using Python.