The source code for this blog is available on GitHub.

X Technology.

Popüler Makine Öğrenimi Algoritmaları

Cover Image for Popüler Makine Öğrenimi Algoritmaları
Ahmet İnanç Koca
Ahmet İnanç Koca
Posted underYapay Zeka

Bu kılavuz, gelecek vadeden veri bilimcilerinin ve makine öğrenimi mühendislerinin daha iyi bilgi ve deneyim kazanmalarına yardımcı olacaktır. 

1. Doğrusal Regresyon 

Doğrusal Regresyon
Kaynak: Vikipedi

Doğrusal Regresyon, Denetimli Öğrenmeden ayrılan en basit Makine öğrenimi algoritmasıdır. Öncelikle regresyon problemlerini çözmek ve bağımsız değişkenlerden elde edilen bilgilerle sürekli bağımlı değişkenler hakkında tahminlerde bulunmak için kullanılır.

Doğrusal Regresyonun amacı, sürekli bağımlı değişkenler için çıktıyı tahmin etmeye yardımcı olabilecek en uygun çizgiyi bulmaktır. Örneğin, sürekli değerler ev fiyatları, yaş ve maaştır.

Basit Doğrusal Regresyon, tek bir bağımsız değişken ile bir bağımlı değişken arasındaki ilişkiyi düz bir çizgi kullanarak tahmin eden bir modeldir. Çoklu Doğrusal Regresyon, ikiden fazla bağımsız değişkenden oluşur.

2. Lojistik Regresyon

Lojistik regresyon
Kaynak: Vikipedi 

Lojistik Regresyon, denetimli öğrenmeden ayrılan başka bir Makine Öğrenimi algoritmasıdır. Hem Regresyon hem de Sınıflandırma görevleri için kullanılabilir, ancak esas olarak Sınıflandırma için kullanılır. Sınıflandırma görevleri için kullanılan Lojistik Regresyon hakkında daha fazla bilgi edinmek isterseniz, bağlantıya tıklayın . 

Lojistik Regresyon, bağımsız değişkenlerin bilgisi ile kategorik bağımlı değişkeni tahmin etmek için kullanılır. Amaç, sadece 0 ile 1 arasında olabilen çıktıları sınıflandırmaktır. Girdilerin ağırlıklı toplamı, 0 ile 1 arasındaki değerleri eşleyen Sigmoid Fonksiyonu adlı bir aktivasyon fonksiyonundan geçirilir.

Lojistik Regresyon, gözlemlenen bazı veriler göz önüne alındığında, varsayılan bir olasılık dağılımının parametrelerini tahmin etmek için bir yöntem olan Maksimum Olabilirlik Tahminine dayanır.

Doğrusal ve Lojistik Regresyon arasında kafa karıştırmak kolaydır, bu nedenle ikisi hakkında daha derin bir açıklama istiyorsanız, şu makaleyi okuyun: Doğrusal ve Lojistik Regresyon: Kısa Bir Açıklama .

3. Karar Ağacı

Karar ağacı
Kaynak: keşif

Karar Ağacı, denetimli öğrenmeden ayrılan başka bir makine öğrenimi algoritmasıdır. Karar ağacı algoritması hem regresyon hem de sınıflandırma problemleri için kullanılabilir. 

Kararları ve olası sonuçlarını, sonuçlarını ve maliyetlerini görsel olarak göstererek karar verme sürecinde kullanılan ağaç benzeri bir modeldir. Konsept insan zihnine benzer; verileri parçalara bölerek. Verileri elimizden geldiğince granüle ederken, onları benzersiz parçalara ayırdık.

Karar Ağacının genel amacı, hedef değişkenin sınıfını tahmin etmek için kullanılabilecek bir eğitim modeli yaratmaktır. 

Hedef değişkenin türüne göre iki tür karar ağacı vardır:

  1. Kategorik Değişken: Hedef değişkenin Kategorik olduğu bir Karar ağacı. 
  2. Sürekli Değişken: Hedef değişkenin Sürekli olduğu bir Karar ağacı.

4. Rastgele Orman®

Rastgele Orman
Kaynak: Vikipedi 

Bir sonraki makine öğrenmesi algoritması, sınıflandırma ve regresyon problemlerinde yaygın olarak kullanılan denetimli bir makine öğrenmesi algoritması olan rastgele orman algoritmasıdır. Tıpkı bir karar ağacı gibi, aynı zamanda ağaç tabanlı bir algoritmadır. Bununla birlikte, rastgele orman algoritması, karar vermek için birden fazla karar ağacı kullanır – bir ağaç ormanı.

Rastgele orman algoritması, sınıflandırma görevlerini işlemek için kategorik değişkenleri kullanırken, sürekli değişkenler içeren veri kümelerini kullanarak regresyon görevlerini gerçekleştirir.

Rastgele orman algoritması, tek bir model kullanmak yerine tahminler yapmak için bir model koleksiyonunun kullanıldığı birden çok modeli birleştirmek anlamına gelen bir topluluktur.

Topluluk iki tür yöntem kullanır:

  1. Torbalama: Bu, eğitim veri kümesi için ek veriler üretir. Bu, tahminlerdeki varyansı azaltmak için yapılır. 
  2. Güçlendirme: Bu, zayıf öğrenicileri birleştirir ve nihai modelin en yüksek doğruluğa sahip olması için sıralı modeller oluşturarak onları güçlü öğrenicilere dönüştürür. 

5. Naif Bayes

Naif bayanlar
Kaynak: Orta

Naive Bayes, Bayes Teoremine dayalı bir sınıflandırma tekniğidir. Bayes Teoremi, koşullu olasılıkları hesaplamak için kullanılan matematiksel bir formüldür.

Yukarıdaki formül:

  • E gerçekleştiğine göre H’nin gerçekleşme olasılığı ne kadardır (Arka Olasılık) 
  • H gerçekleştiğine göre E’nin olma olasılığı ne kadardır? 
  • H’nin kendi başına olma olasılığı ne kadardır?
  • E’nin kendi başına olma olasılığı ne kadardır? 

Bir sınıfta belirli bir özellik bulunduğunda, bunun başka herhangi bir özelliğin varlığıyla ilgisi olmadığını varsayar. Çeşitli niteliklere dayalı olarak farklı sınıfların olasılığını tahmin eder. En yüksek olasılığa sahip sınıf, en olası sınıf olarak kabul edilir.

Naive Bayes, tek bir algoritma değil, tümü Bayes Teoremine dayanan ortak bir ilkeyi paylaştığı birden çok algoritmadır. 

6. k-En Yakın Komşular

kNN
Kaynak: rapidminer

K-en yakın komşuların kısaltması olan kNN, hem sınıflandırma hem de regresyon problemlerini çözmek için kullanılabilen denetimli makine öğreniminden ayrılan bir algoritmadır. KNN algoritması, benzer şeylerin yakınlarda var olduğunu varsayar. Bir tüyün kuşlarının birlikte akın etmesi olarak hatırlıyorum. 

kNN, mesafe, yakınlık veya yakınlık kullanarak diğer veri noktaları arasındaki benzerlik kavramını kullanır. Bir grafikteki noktalar arasındaki mesafeyi hesaplamak için matematiksel bir yaklaşım kullanılır ve daha sonra gözlemlenmeyen verileri en yakın etiketlenmiş gözlemlenen veri noktalarına dayalı olarak etiketler. 

En yakın benzer noktaları bulmak için veri noktaları arasındaki mesafeyi bulmanız gerekecektir. Bu, Öklid mesafesi, Hamming mesafesi, Manhattan mesafesi ve Minkowski mesafesi gibi mesafe ölçüleri kullanılarak yapılabilir.

K, genellikle tek bir sayı olmak üzere en yakın komşu sayısı olarak adlandırılır. 

7. K-Araçlar

K-Araçları
Kaynak: Wikimedia

K-araç kümeleme, denetimsiz öğrenmeden ayrılan bir tür makine öğrenimi algoritmasıdır. Benzer öğeleri/veri noktalarını kümeler şeklinde gruplayan bir kümeleme algoritmasıdır, burada grup sayısı K olarak adlandırılır.

Küme içindeki veri noktaları, akran grupları için homojen ve heterojen olarak kabul edilir.

K-means, bu veri noktaları arasındaki benzerliği bulur ve bunları şu şekilde kümeler halinde gruplandırır:

  1. k değerlerini seçin.
  2. Merkezler başlatılıyor.
  3. Grubu seçin ve ortalamayı bulun.

K değerini belirlemek için iki yöntem kullanabilirsiniz:

  • Dirsek Yöntemi
  • Siluet Yöntemi

8. Boyutsallık Azaltma

Boyutsal küçülme
Kaynak: TDS

Boyut azaltma, eğitim verilerindeki girdi değişkenlerinin sayısını azaltmak için kullanılan bir tekniktir. Layman’ın terimleriyle, özellik setinizin boyutunu küçültme sürecidir. Diyelim ki yüz sütunlu bir veri kümeniz var, boyutsallık azaltma sütun sayısını yirmiye indirecek.

Özellik sayısı arttığında, model otomatik olarak daha karmaşık hale gelir ve fazla uydurma olasılığı artar.

Boyutsallık laneti, konu daha yüksek boyutlardaki verilerle çalışmak olduğunda en büyük sorundur ve verilerinizin çok fazla özelliğe sahip olması anlamına gelir.

Boyut azaltma, aşağıdaki bileşenler kullanılarak gerçekleştirilebilir: 

  • Özellik seçimi, ilgili özellikleri belirlemek ve seçmek için kullanılır
  • Özellik mühendisliği, mevcut özellikleri kullanarak manuel olarak yeni özellikler oluşturur.

Boyutsallık Azaltma Yöntemleri şunları içerir:

  • Temel Bileşen Analizi (PCA)
  • Lineer Diskriminant Analizi (LDA)
  • Genelleştirilmiş Diskriminant Analizi (GDA)


More Stories

Cover Image for Windows 10 Unutulan Kullanıcı Şifresini Sıfırlama (Programsız)

Windows 10 Unutulan Kullanıcı Şifresini Sıfırlama (Programsız)

Bilgisayarımızda kullanıcı şifresini unutmak hepimizin başına gelmiştir. Windows 7 ve daha önce kullanılan işletim sistemlerinde de karşımıza çıkan bu şifre sıfırlama işlemi, bu kez daha basit bir yolla karşımıza çıkıyor. Eskiden başlangıç Cd veya Dvdsi ile şifre kırma işlemi yapıyorduk. Bu kendini zamanla USB belleğe bıraktı. Şimdi ise Windows10 boot USB belleği olmasına gerek kalmadan… Okumaya devam et Windows 10 Unutulan Kullanıcı Şifresini Sıfırlama (Programsız)

Ahmet İnanç Koca
Ahmet İnanç Koca
Cover Image for İstihbarat ve İstihbaratın Önemi

İstihbarat ve İstihbaratın Önemi

Özet İstihbarat, günlük hayatta yaşanan olaylar karşısında aklın kullanılmasıyla, uyum sağlamasıyla, bilgi ve tecrübelerin ışığında hayata geçirme yeteneğini ifade etmektedir.En basitten, en karmaşık olaylara kadar hayatın her alanında ve anında istihbarat yer almaktadır. İstihbarat her şeyden önce aklın ve zekanın kullanılmasıyla ilgilidir. En basit ve temel olarak; akıl yürütme, planlama, soyut düşünme, kavrama, öğrenme ve… Okumaya devam et İstihbarat ve İstihbaratın Önemi

Ahmet İnanç Koca
Ahmet İnanç Koca