Lineer Regresyon ve Lojistik Regresyon Arasındaki Fark

İçindekiler:

Anonim

NS asıl fark doğrusal regresyon ve lojistik regresyon arasındaki doğrusal regresyon sürekli bir değeri tahmin etmek için kullanılırken lojistik regresyon ayrı bir değeri tahmin etmek için kullanılır.

Makine öğrenimi sistemleri, geçmiş girdilerin eğitimine dayalı olarak gelecekteki sonuçları tahmin edebilir. Denetimli öğrenme ve denetimsiz öğrenme olarak adlandırılan iki ana makine öğrenimi türü vardır. Regresyon ve sınıflandırma denetimli öğrenme kapsamına girerken kümeleme denetimsiz öğrenme kapsamına girer. Denetimli öğrenme algoritmaları, veri kümesini eğitmek için etiketlenmiş verileri kullanır. Doğrusal regresyon ve lojistik regresyon, iki tür denetimli öğrenme algoritmasıdır. Bağımlı değişken sürekli olduğunda ve model doğrusal olduğunda doğrusal regresyon kullanılır. Lojistik regresyon, bağımlı değişken kesikli olduğunda ve model doğrusal olmadığında kullanılır.

Lineer Regresyon, Lojistik Regresyon, Makine Öğrenimi

Doğrusal Regresyon Nedir?

Doğrusal regresyon, bağımsız ve bağımlı değişkenler arasındaki ilişkiyi bulur. İkisi de bitişiktir. Bağımsız değişken, diğer değişkenler tarafından değiştirilmeyen değişkendir. x ile gösterilir. x1, x2, x3 gibi birden fazla bağımsız değişken de olabilir. Bağımlı değişken bağımsız değişkene göre değişir ve y ile gösterilir.

Bir bağımsız değişken olduğunda, regresyon denklemi aşağıdaki gibidir.

y = b0+ b1x

Örneğin, x'in yağışı ve y'nin mahsul verimini temsil ettiğini varsayalım.

Şekil 1: Doğrusal Regresyon

Veri seti yukarıdaki gibi görünecektir. Ardından, veri noktalarının çoğunu kapsayan bir çizgi seçilir. Bu çizgi, tahmin edilen değerleri temsil eder.

Şekil 2: Gerçek veri noktaları ile tahmin edilen değerler arasındaki mesafe

Daha sonra, yukarıdaki grafikte gösterildiği gibi her bir veri noktasından çizgiye olan mesafe bulunur. Bu, gerçek değer ile tahmin edilen değer arasındaki mesafedir. Bu mesafe aynı zamanda hata veya artıklar olarak da bilinir. En uygun çizgi, en küçük kareler toplamına sahip olmalıdır. Yeni yağış değeri (x) verildiğinde, bu çizgiyi kullanarak karşılık gelen ürün verimini (y) bulmak mümkündür.

Gerçek dünyada birden fazla bağımsız değişken olabilir (x1, x2, x3…). Buna çoklu doğrusal regresyon denir. Çoklu lineer regresyon denklemi aşağıdaki gibidir.

Lojistik Regresyon Nedir?

Lojistik regresyon, iki sınıfı sınıflandırmak için kullanılabilir. olarak da bilinir ikili sınıflandırma. Bir e-postanın spam olup olmadığını kontrol etmek, bir müşterinin bir ürünü satın alıp almayacağını tahmin etmek, promosyon alıp alamayacağını tahmin etmek diğer lojistik regresyon örnekleridir.

Şekil 3: Lojistik Regresyon

Bir öğrencinin günde çalıştığı saat sayısının bağımsız değişken olduğunu varsayın. Buna bağlı olarak, bir sınavı geçme olasılığı hesaplanır. 0,5 değeri eşik olarak kabul edilir. Yeni saat sayısı verildiğinde, bu grafiği kullanarak sınavı geçme olasılığını bulmak mümkündür. Olasılık 0,5'in üzerinde ise 1 olarak kabul edilir veya geçer. Olasılık 0,5'in altındaysa, 0 olarak kabul edilir veya başarısız olur.

Doğrusal regresyon denklemini sigmoid fonksiyona uygulamak, lojistik regresyon denklemini verecektir.

sigmoid işlevi

Dikkat edilmesi gereken bir diğer önemli nokta, lojistik regresyonun sadece 2 sınıfı sınıflandırmak için geçerli olmasıdır. Çok sınıflı sınıflandırma için kullanılmaz.

Lineer Regresyon ve Lojistik Regresyon Arasındaki Fark

Tanım

Doğrusal regresyon, bağımlı bir değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi modelleyen doğrusal bir yaklaşımdır. Buna karşılık, lojistik regresyon, yalnızca iki değeri olabilen bir sonucun olasılığını tahmin eden istatistiksel bir modeldir.

kullanım

Regresyon problemlerini çözmek için doğrusal regresyon kullanılırken, sınıflandırma problemlerini (ikili sınıflandırma) çözmek için lojistik regresyon kullanılır.

metodoloji

Doğrusal regresyon, bağımsız değişkende bir değişiklik olduğunda bağımlı değişkeni tahmin eder. Lojistik regresyon, bir olayın meydana gelme olasılığını hesaplar. Bu, doğrusal regresyon ve lojistik regresyon arasındaki önemli bir farktır.

Çıkış değeri

Ayrıca lineer regresyonda çıkış değeri süreklidir. Lojistik regresyonda çıkış değeri kesiklidir.

modeli

Doğrusal regresyon düz bir çizgi kullansa da, lojistik regresyon bir S eğrisi veya sigmoid işlevi kullanır. Bu, doğrusal regresyon ile lojistik regresyon arasındaki bir diğer önemli farktır.

Örnekler

Bir ülkenin GSYİH'sini tahmin etmek, ürün fiyatını tahmin etmek, ev satış fiyatını tahmin etmek, puan tahmini, bazı doğrusal regresyon örnekleridir. Bir e-postanın spam olup olmadığını tahmin etmek, kredi kartı işleminin dolandırıcılık olup olmadığını tahmin etmek, bir müşterinin kredi alıp almayacağını tahmin etmek lojistik regresyonun bazı örnekleridir.

Çözüm

Doğrusal regresyon ve lojistik regresyon arasındaki fark, doğrusal regresyon sürekli bir değeri tahmin etmek için kullanılırken lojistik regresyon ayrı bir değeri tahmin etmek için kullanılır. Kısacası, regresyon için doğrusal regresyon, sınıflandırma için lojistik regresyon kullanılır.

Referans:

1. Doğrusal Regresyon Analizi | Python'da Doğrusal Regresyon | Makine Öğrenimi Algoritmaları | Simplilearn, 26 Mart 2018, Buradan ulaşabilirsiniz.2. Lojistik Regresyon | Python'da Lojistik Regresyon | Makine Öğrenimi Algoritmaları | Simplelearn, 22 Mart 2018, Buradan ulaşabilirsiniz.

Görünüm inceliği:

1. "Doğrusal regresyon" Sewaqu tarafından - Kendi çalışması, Kamu Malı) Commons Wikimedia2 aracılığıyla. “Doğrusal Regresyon Uyumu için Artıklar” Thomas.haslwanter tarafından - Commons Wikimedia3 aracılığıyla kendi çalışmanız (CC BY-SA 3.0). “Lojistik eğri” Qef (konuşma) - Commons Wikimedia aracılığıyla gnuplot (Public Domain) ile sıfırdan oluşturuldu

Lineer Regresyon ve Lojistik Regresyon Arasındaki Fark