Veri Madenciliği Nedir? Temelleri ve Teknikleri.
Dördüncü sanayi devriminin temeli büyük ölçüde Veri(Data) ve Bağlantıya(Connectivity) bağlı olacaktır . Veri madenciliği çözümleri geliştirebilen veya oluşturabilen Analiz Servisleri bu konuda kilit rol oynayacaktır. (Analysis Services)Potansiyel alıcıları hedeflemek için müşteri satın alma davranışının(customer purchasing behavior) sonuçlarını analiz etmeye ve tahmin etmeye yardımcı olabilir . Veriler(Data) yeni bir doğal kaynak haline gelecek ve bu sıralanmamış verilerden ilgili bilgilerin çıkarılması süreci büyük önem kazanacaktır. Bu nedenle, Veri Madenciliği (Data Mining)teriminin(term –) doğru anlaşılması, süreçleri ve uygulaması, bu moda kelimeye bütünsel bir yaklaşım geliştirmemize yardımcı olabilir.
Veri Madenciliği Temelleri(Data Mining Basics) ve Teknikleri
Verilerde Bilgi Keşfi(Knowledge Discovery in Data) ( KDD ) olarak da bilinen veri madenciliği, basit analizin ötesine geçen kalıpları ve eğilimleri ortaya çıkarmak için büyük veri depolarını aramakla ilgilidir. Ancak bu, tek aşamalı bir çözüm değil, çok aşamalı bir süreçtir ve çeşitli aşamalarda tamamlanır. Bunlar şunları içerir:
1] Veri Toplama ve Hazırlama
Veri toplama ve uygun organizasyonu ile başlar. Bu, veri madenciliği yoluyla keşfedilebilecek bilgileri bulma şansını önemli ölçüde artırmaya yardımcı olur.
2] Model Oluşturma ve Değerlendirme
Veri madenciliği sürecindeki(mining process) ikinci adım , çeşitli modelleme tekniklerinin uygulanmasıdır. Bunlar parametreleri optimum değerlere kalibre etmek için kullanılır. Kullanılan teknikler, büyük ölçüde, bir dizi kurumsal ihtiyacı ele almak ve bir karara varmak için gereken analitik yeteneklere bağlıdır.
Bazı veri madenciliği tekniklerini kısaca inceleyelim. Çoğu kuruluşun, iş gereksinimlerini karşılayan uygun bir süreç oluşturmak için iki veya daha fazla veri madenciliği tekniğini birleştirdiği bulunmuştur.
Okuyun(Read) : Büyük Veri Nedir?
Veri Madenciliği Teknikleri
- İlişkilendirme – (Association – )İlişkilendirme(Association) , yaygın olarak bilinen veri madenciliği tekniklerinden biridir. Bunun altında, aynı işlemdeki öğeler arasındaki ilişkiye dayalı olarak bir modelin şifresi çözülür. Bu nedenle (Hence)ilişki tekniği(relation technique) olarak da bilinir . Büyük marka perakendeciler, müşterilerin satın alma alışkanlıklarını/tercihlerini araştırmak için bu tekniğe güvenirler. Örneğin, perakendeciler insanların satın alma alışkanlıklarını takip ederken, bir müşterinin çikolata aldığında her zaman krema aldığını belirleyebilir ve bu nedenle bir sonraki çikolata satın aldıklarında krema da almak isteyebileceklerini önerebilirler.
- Sınıflandırma(Classification) - Bu veri madenciliği tekniği , (data mining technique)makine öğrenimine dayanması ve (machine learning)Doğrusal programlama(Linear programming) , Karar(Decision) ağaçları, Sinir ağı(Neural network) gibi matematiksel teknikleri kullanması bakımından yukarıdakilerden farklıdır . Sınıflandırmada şirketler, veri öğelerini gruplara ayırmayı öğrenebilen yazılımlar oluşturmaya çalışırlar. Örneğin, bir şirket, uygulamada “işten ayrılmayı teklif eden çalışanların tüm kayıtları göz önüne alındığında, gelecekte şirketten ayrılma olasılığı olan kişi sayısını tahmin eden” bir sınıflandırma tanımlayabilir. Böyle bir senaryoda şirket, çalışanların kayıtlarını “git” ve “kal” olmak üzere iki gruba ayırabilir. Daha sonra verilerini kullanabilir(mining software)çalışanları daha önce oluşturulmuş ayrı gruplara ayırmak için madencilik yazılımı .
- Kümeleme(Clustering) – Benzer özelliklere sahip farklı(Different) nesneler otomasyon yoluyla tek bir kümede gruplandırılır. Bu tür birçok küme, sınıflar olarak oluşturulur ve nesneler (benzer özelliklere sahip) buna göre yerleştirilir. Bunu daha iyi anlamak için kütüphanede kitap yönetimi(book management) örneğini ele alalım . Bir kütüphanede, geniş kitap koleksiyonu tamamen kataloglanmıştır. Aynı türden öğeler birlikte listelenir. Bu, ilgilendiğimiz bir kitabı bulmamızı kolaylaştırır. Benzer şekilde, kümeleme tekniğini(clustering technique) kullanarak, bazı benzerlikleri olan kitapları bir kümede tutabilir ve buna uygun bir isim verebiliriz. Bu nedenle, bir okuyucu ilgili bir kitap almak istiyorsa(book relevant)kendi yararına, tüm kütüphaneyi aramak yerine sadece o rafa gitmesi gerekiyor. Böylece, kümeleme tekniği(clustering technique) sınıfları tanımlar ve nesneleri her sınıfa koyarken, sınıflandırma tekniklerinde nesneler önceden tanımlanmış sınıflara atanır.
- Tahmin(Prediction) – Tahmin, genellikle diğer veri madenciliği teknikleri(data mining technique) ile birlikte kullanılan bir veri(data mining technique) madenciliği tekniğidir . Eğilimleri, sınıflandırmayı, örüntü eşleştirmeyi(pattern matching) ve ilişkiyi analiz etmeyi içerir. Geçmiş olayları veya örnekleri uygun bir sırayla(sequence one) analiz ederek , gelecekteki bir olayı güvenle tahmin edebilirsiniz. Örneğin, satış bağımsız bir değişken olarak ve kâr(variable and profit) , satışa bağlı bir değişken olarak seçilirse, satışta gelecekteki karı tahmin etmek için tahmin analizi tekniği kullanılabilir. (prediction analysis technique)Daha sonra, tarihsel satış ve kar verilerine(sale and profit data) dayanarak , şu amaçlar için kullanılan uygun bir regresyon eğrisi çizilebilir .(regression curve)kâr tahmini(profit prediction) .
- Karar ağaçları(Decision trees) – Karar ağacında(decision tree) , birden çok yanıtı olan basit bir soruyla başlıyoruz. Her cevap, kategorize edilebilmesi veya her bir cevaba dayalı olarak bir tahminin yapılabilmesi için verileri sınıflandırmaya veya tanımlamaya yardımcı olacak başka bir soruya götürür. Örneğin, kriket ODI oynayıp oynamayacağımızı belirlemek için aşağıdaki karar ağacını(decision tree) kullanırız : Veri Madenciliği Karar Ağacı : (Data Mining Decision Tree)Kök düğümden(root node) başlayarak , eğer hava durumu(weather forecast) yağmuru o zaman tahmin ederse, o gün için maçtan kaçınmalıyız. Alternatif olarak, hava tahmini(weather forecast) açıksa , maçı oynamalıyız.
Veri Madenciliği , iletişim, (Data Mining)Sigorta(Insurance) , Eğitim(Education) , İmalat(Manufacturing) , Bankacılık ve Perakende(Banking and Retail) gibi çeşitli endüstri ve disiplinlerdeki analitik çabalarının merkezinde yer alır . Bu nedenle, farklı teknikleri uygulamadan önce bu konuda doğru bilgilere sahip olmak önemlidir.
Related posts
26 En İyi Veri Madenciliği Yazılımı
Automatic Data Type feature Excel'te Nasıl Kullanılır?
BitLocker Setup BCD (Boot Configuration Data) mağazasını ihraç edilemedi
Windows 10 üzerinde Data Usage Limit nasıl yönetilir?
Registry File'u alınamaz. Tüm Data, kayıt defterine yazılmış değil
Samsung Data Migration% 0,% 99 veya% 100 sıkışmış
Data Analytics nedir ve ne için kullanılır?
Microsoft Personal Data Dashboard, verilerinizin nasıl kullanıldığına karar vermenize izin verir
CD/DVD Data Recovery software CD DVD dan Data kurtarmak için
Windows 10 için en iyi 10 meslek Backup and Data recovery software
Microarchitectural Data Sampling (MDS) güvenlik açığı açıklandı
PCmover Express - Migrate Data Windows 7'den Windows 10'e ücretsiz
Best Free Online Data Visualization Tools
Fix Unallocated Hard Drive Windows 10 yılında Data kaybetmeden
Windows PC için Renee Becca Data Backup Software
Reliability Monitor Windows 10 için Reliability Monitor için Disable Data Collection Enable
Burn, Windows 10'da grileşmiş diske; DVD'i yakamıyorum
Big Data Consumption. Big Data'un kullanımları nelerdir?
Data and Information arasındaki fark nedir
Site Data için Chrome or Edge'de bulunan Site Data'ü temizleyin. Developer Tools'ü kullanma