La fonction h qui définit la régression logistique s'écrit alors: Tout le problème de classification par régression logistique apparaît alors comme un simple problème d'optimisation où, à partir de données, nous essayons d' obtenir le meilleur jeu de paramètre Θ permettant à notre courbe sigmoïde de coller au mieux aux données. C'est dans cette étape qu'intervient notre apprentissage automatique. Une fois cette étape effectuée, voici un aperçu du résultat qu'on peut obtenir: Il ne reste plus, à partir du seuil défini, qu'à classer les points en fonction de leurs positions par rapport à la régression et notre classification est faite! La régression logistique en pratique En Python c'est assez simple, on se sert de la classe LogisticRegression du module near_model comme un classificateur normal et que l'on entraîne sur des données déjà nettoyées et séparées en ensembles d'entraînement et de test puis le tour est joué! Niveau code, rien de plus basique: Pour des cas d'applications plus poussés, pourquoi ne pas suivre le cours dispensé par l'équipe Datascientest?
Dans cet article nous allons appliquer une régression logistique avec python en utilisant deux packages très différents: scikit-learn et statsmodels. Nous verrons les pièges à éviter et le code associé. La régression logistique porte assez mal son nom car il ne s'agit pas à proprement parler d'une régression au sens classique du terme (on essaye pas d'expliquer une variable quantitative mais de classer des individus dans deux catégories). Cette méthode présente depuis de nombreuses années est la méthode la plus utilisée aujourd'hui en production pour construire des scores. En effet, ses atouts en ont fait une méthode de référence. Quels sont ses atouts: La simplicité du modèle: il s'agit d'un modèle linéaire, la régression logistique est un cas particulier du modèles linéaire généralisé dans lequel on va prédire la probabilité de la réponse 1 plutôt que la valeur directement (0 ou 1). La simplicité d'interprétation: le modèle obtenu est un modèle linéaire, c'est-à-dire qu'on obtient des coefficients associés à chaque variable explicative qui permettent de comprendre l'impact de chaque variable sur le choix (entre 0 et 1).
333333333333336 Précision sur l'ensemble de test par modèle sklearn: 61. 111111111111114 Remarque: Le modèle formé ci-dessus consiste à implémenter l'intuition mathématique non seulement pour améliorer la précision. Article written by mohit baliyan and translated by Acervo Lima from Implementation of Logistic Regression from Scratch using Python.
Sitemap | wwropasx.ru, 2024