Veri Madenciliği Nedir? Temelleri ve Teknikleri.

Dördüncü sanayi devriminin temeli büyük ölçüde Veri(Data) ve Bağlantıya(Connectivity) bağlı olacaktır . Veri madenciliği çözümleri geliştirebilen veya oluşturabilen Analiz Servisleri bu konuda kilit rol oynayacaktır. (Analysis Services)Potansiyel alıcıları hedeflemek için müşteri satın alma davranışının(customer purchasing behavior) sonuçlarını analiz etmeye ve tahmin etmeye yardımcı olabilir . Veriler(Data) yeni bir doğal kaynak haline gelecek ve bu sıralanmamış verilerden ilgili bilgilerin çıkarılması süreci büyük önem kazanacaktır. Bu nedenle, Veri Madenciliği (Data Mining)teriminin(term –) doğru anlaşılması, süreçleri ve uygulaması, bu moda kelimeye bütünsel bir yaklaşım geliştirmemize yardımcı olabilir.

Veri Madenciliği Temelleri(Data Mining Basics) ve Teknikleri

veri madenciliği

Verilerde Bilgi Keşfi(Knowledge Discovery in Data) ( KDD ) olarak da bilinen veri madenciliği, basit analizin ötesine geçen kalıpları ve eğilimleri ortaya çıkarmak için büyük veri depolarını aramakla ilgilidir. Ancak bu, tek aşamalı bir çözüm değil, çok aşamalı bir süreçtir ve çeşitli aşamalarda tamamlanır. Bunlar şunları içerir:

1] Veri Toplama ve Hazırlama

Veri toplama ve uygun organizasyonu ile başlar. Bu, veri madenciliği yoluyla keşfedilebilecek bilgileri bulma şansını önemli ölçüde artırmaya yardımcı olur.

2] Model Oluşturma ve Değerlendirme

Veri madenciliği sürecindeki(mining process) ikinci adım , çeşitli modelleme tekniklerinin uygulanmasıdır. Bunlar parametreleri optimum değerlere kalibre etmek için kullanılır. Kullanılan teknikler, büyük ölçüde, bir dizi kurumsal ihtiyacı ele almak ve bir karara varmak için gereken analitik yeteneklere bağlıdır.

Bazı veri madenciliği tekniklerini kısaca inceleyelim. Çoğu kuruluşun, iş gereksinimlerini karşılayan uygun bir süreç oluşturmak için iki veya daha fazla veri madenciliği tekniğini birleştirdiği bulunmuştur.

Okuyun(Read) : Büyük Veri Nedir?

Veri Madenciliği Teknikleri

  1. İlişkilendirme –  (Association – )İlişkilendirme(Association) , yaygın olarak bilinen veri madenciliği tekniklerinden biridir. Bunun altında, aynı işlemdeki öğeler arasındaki ilişkiye dayalı olarak bir modelin şifresi çözülür. Bu nedenle (Hence)ilişki tekniği(relation technique) olarak da bilinir . Büyük marka perakendeciler, müşterilerin satın alma alışkanlıklarını/tercihlerini araştırmak için bu tekniğe güvenirler. Örneğin, perakendeciler insanların satın alma alışkanlıklarını takip ederken, bir müşterinin çikolata aldığında her zaman krema aldığını belirleyebilir ve bu nedenle bir sonraki çikolata satın aldıklarında krema da almak isteyebileceklerini önerebilirler.
  2. Sınıflandırma(Classification) - Bu veri madenciliği tekniği , (data mining technique)makine öğrenimine dayanması ve (machine learning)Doğrusal programlama(Linear programming) , Karar(Decision) ağaçları, Sinir ağı(Neural network) gibi matematiksel teknikleri kullanması bakımından yukarıdakilerden farklıdır . Sınıflandırmada şirketler, veri öğelerini gruplara ayırmayı öğrenebilen yazılımlar oluşturmaya çalışırlar. Örneğin, bir şirket, uygulamada “işten ayrılmayı teklif eden çalışanların tüm kayıtları göz önüne alındığında, gelecekte şirketten ayrılma olasılığı olan kişi sayısını tahmin eden” bir sınıflandırma tanımlayabilir. Böyle bir senaryoda şirket, çalışanların kayıtlarını “git” ve “kal” olmak üzere iki gruba ayırabilir. Daha sonra verilerini kullanabilir(mining software)çalışanları daha önce oluşturulmuş ayrı gruplara ayırmak için madencilik yazılımı .
  3. Kümeleme(Clustering) – Benzer özelliklere sahip farklı(Different) nesneler otomasyon yoluyla tek bir kümede gruplandırılır. Bu tür birçok küme, sınıflar olarak oluşturulur ve nesneler (benzer özelliklere sahip) buna göre yerleştirilir. Bunu daha iyi anlamak için kütüphanede kitap yönetimi(book management) örneğini ele alalım . Bir kütüphanede, geniş kitap koleksiyonu tamamen kataloglanmıştır. Aynı türden öğeler birlikte listelenir. Bu, ilgilendiğimiz bir kitabı bulmamızı kolaylaştırır. Benzer şekilde, kümeleme tekniğini(clustering technique) kullanarak, bazı benzerlikleri olan kitapları bir kümede tutabilir ve buna uygun bir isim verebiliriz. Bu nedenle, bir okuyucu ilgili bir kitap almak istiyorsa(book relevant)kendi yararına, tüm kütüphaneyi aramak yerine sadece o rafa gitmesi gerekiyor. Böylece, kümeleme tekniği(clustering technique) sınıfları tanımlar ve nesneleri her sınıfa koyarken, sınıflandırma tekniklerinde nesneler önceden tanımlanmış sınıflara atanır.
  4. Tahmin(Prediction) – Tahmin, genellikle diğer veri madenciliği teknikleri(data mining technique) ile birlikte kullanılan bir veri(data mining technique) madenciliği tekniğidir . Eğilimleri, sınıflandırmayı, örüntü eşleştirmeyi(pattern matching) ve ilişkiyi analiz etmeyi içerir. Geçmiş olayları veya örnekleri uygun bir sırayla(sequence one) analiz ederek , gelecekteki bir olayı güvenle tahmin edebilirsiniz. Örneğin, satış bağımsız bir değişken olarak ve kâr(variable and profit) , satışa bağlı bir değişken olarak seçilirse, satışta gelecekteki karı tahmin etmek için tahmin analizi tekniği kullanılabilir. (prediction analysis technique)Daha sonra, tarihsel satış ve kar verilerine(sale and profit data) dayanarak , şu amaçlar için kullanılan uygun bir regresyon eğrisi çizilebilir .(regression curve)kâr tahmini(profit prediction) .
  5. Karar ağaçları(Decision trees)Karar ağacında(decision tree) , birden çok yanıtı olan basit bir soruyla başlıyoruz. Her cevap, kategorize edilebilmesi veya her bir cevaba dayalı olarak bir tahminin yapılabilmesi için verileri sınıflandırmaya veya tanımlamaya yardımcı olacak başka bir soruya götürür. Örneğin, kriket ODI oynayıp oynamayacağımızı belirlemek için aşağıdaki karar ağacını(decision tree) kullanırız : Veri Madenciliği Karar Ağacı : (Data Mining Decision Tree)Kök düğümden(root node) başlayarak , eğer hava durumu(weather forecast) yağmuru o zaman tahmin ederse, o gün için maçtan kaçınmalıyız. Alternatif olarak, hava tahmini(weather forecast) açıksa , maçı oynamalıyız.

Veri Madenciliği , iletişim, (Data Mining)Sigorta(Insurance) , Eğitim(Education) , İmalat(Manufacturing) , Bankacılık ve Perakende(Banking and Retail) gibi çeşitli endüstri ve disiplinlerdeki analitik çabalarının merkezinde yer alır . Bu nedenle, farklı teknikleri uygulamadan önce bu konuda doğru bilgilere sahip olmak önemlidir.



About the author

Merhaba! Alanında 10 yılı aşkın deneyime sahip bir bilgisayar programcısıyım. Akıllı telefonlar ve Windows güncellemeleri için yazılım geliştirme ve bakımı konusunda uzmanım. Ek olarak, hizmetlerimi aylık e-posta müşteri destek temsilcisi olarak sunuyorum.



Related posts