Web'den Veri Kopyalamak için Excel'i Bir Araç Olarak Kullanın

Web kazıma(Web scraping) , otomatik bir yöntem kullanarak bir web sitesinden veri, bilgi veya görüntü çıkarma eylemidir. Tam otomatikte kopyala yapıştır(copy and paste) gibi düşünün .(Think)

İstediğimiz web sitelerine gitmek için bir uygulama yazar veya kullanırız ve bu web sitelerinden istediğimiz belirli şeylerin bir kopyasını alırız. Tüm bir web sitesini indirmekten çok daha kesindir.

Herhangi bir araç gibi, web kazıma da iyi veya kötü için kullanılabilir. Web sitelerini kazımanın daha iyi nedenlerinden bazıları, içeriğine, fiyat karşılaştırmalı alışverişe veya (price comparison shopping)borsa bilgilerini(stock market information) izlemeye dayalı olarak bir arama motorunda(search engine) sıralamak olabilir . Hatta bir tür araştırma aracı(research tool) olarak bile kullanabilirsiniz .

Excel ile Web Sitelerini Nasıl Kazıyabilirim ?

İster inanın ister inanmayın, Excel , en azından (Excel)Excel 2003'ten(Excel 2003) bu yana, uzun süredir web sitelerinden veri çıkarma yeteneğine sahiptir . Web kazıma, işi yapmak için bir elektronik tablo programı(spreadsheet program) kullanmayı düşünmek bir yana, çoğu insanın düşünmediği bir şeydir. (t think)Ama şaşırtıcı derecede kolay ve güçlü. Microsoft Office klavye(Microsoft Office keyboard) kısayollarını bir araya getirerek nasıl yapıldığını öğrenelim .

Kazımak İstediğiniz Siteleri Bulun

Yapacağımız ilk şey, bilgi almak istediğimiz belirli web sayfalarını bulmak. Kaynağa(source and search) gidelim ve https://support.office.com/ arama yapalım . "Sık kullanılan kısayollar" arama terimini(search term) kullanacağız . Outlook , Excel , Word vb. gibi belirli bir uygulamanın adını kullanarak daha belirgin hale getirebiliriz . Kolayca geri dönebilmemiz için sonuçlar sayfasını yer imlerine eklemek iyi bir fikir olabilir.

(Click)" Windows için Excel'de(Excel) klavye kısayolları" arama sonucunu(search result) tıklayın . Bu sayfada, Excel sürümlerinin listesini bulun ve Yeni Sürümler'e(Newer Versions) tıklayın . Şimdi en yenisi ve en büyüğü ile çalışıyoruz.

Arama sonuçları sayfamıza geri dönebilir ve diğer tüm Office uygulamalarının(Office apps) sonuçlarını kendi sekmelerinde açabilir ve yer imlerine ekleyebiliriz. Bu egzersiz için bile iyi bir fikir. Çoğu insanın Office(Office) kısayollarını toplamayı bırakacağı yer burasıdır , ancak bizim değil. Onları Excel'e(Excel) koyacağız, böylece istediğimiz her şeyi onlarla istediğimiz zaman yapabiliriz.

Excel'i açın ve Scrape

Excel'i(Excel) açın ve yeni bir çalışma kitabı başlatın. Çalışma kitabını Office Kısayolları(Office Shortcuts) olarak kaydedin . OneDrive'ınız varsa, Otomatik Kaydet(AutoSave ) özelliğinin çalışması için oraya kaydedin .

Çalışma kitabı kaydedildikten sonra Veri(Data) sekmesine tıklayın.

Veri sekmesinin(Data tab) şeridinde, Web'den(From Web) öğesine tıklayın .

Web'den(From Web ) sihirbaz penceresi açılacaktır . Burası, verileri sıyırmak istediğimiz web sitesinin web adresini veya URL'sini(web address or URL) koyduğumuz yerdir . Web tarayıcınıza geçin ve URL'yi kopyalayın(copy) .

URL'yi Web'den sihirbazının (From Web wizard)URL alanına yapıştırın . Bunu Temel(Basic) veya Gelişmiş(Advanced) modda kullanmayı seçebiliriz. Gelişmiş mod(Advanced mode) , web sitesindeki verilere nasıl erişileceği konusunda bize çok daha fazla seçenek sunar. Bu alıştırma için sadece Temel moda ihtiyacımız var. Tamam'ı (OK)tıklayın(Click) .

Excel şimdi web sitesine bağlanmayı deneyecek. Bu bir kaç saniye alabilir. Varsa bir ilerleme penceresi(progress window) göreceğiz .

Gezgin(Navigator) penceresi açılacak ve soldaki web sitesindeki tabloların bir listesini göreceğiz. Birini seçtiğimizde, sağda bir tablo önizlemesi göreceğiz. Sık kullanılan kısayollar(Frequently used shortcuts ) tablosunu seçelim .

İstediğimiz tablo için etrafa bakmamız gerekirse, gerçek web sitesini görmek için Web Görünümü(Web View) sekmesine tıklayabiliriz . Bulduğumuzda, üzerine tıklayabiliriz ve içe aktarma için seçilecektir.

Şimdi bu pencerenin alt kısmındaki Yükle butonuna tıklıyoruz. (Load)Seçebileceğimiz, daha karmaşık ve ilk kazımamızı yapmanın kapsamı dışında olan başka seçenekler de var. Sadece orada olduklarının farkında ol. Excel'in web kazıma yetenekleri çok güçlüdür.

Web tablosu(web table) birkaç saniye sonra Excel'e(Excel) yüklenecektir . Aşağıdaki resimde 1 numaranın olduğu soldaki verileri göreceğiz . 2 Numara , verileri web sitesinden almak için kullanılan Sorguyu(Query) vurgular . Bir çalışma kitabında birden fazla sorgumuz olduğunda, kullanmamız gerekeni seçtiğimiz yer burasıdır.

(Notice)Verilerin elektronik tabloya bir Excel tablosu olarak geldiğine dikkat edin . Verileri filtreleyebilmemiz veya sıralayabilmemiz için zaten ayarlanmıştır.

Outlook , Word , Access , PowerPoint ve diğer Office uygulamaları için istediğimiz (Office app)Office kısayollarına sahip diğer tüm web sayfaları için bu işlemi tekrarlayabiliriz .

Excel'de Hurdaya (Excel)Çıkan Verileri Güncel(Scraped Data Current) Tutma

Size bir bonus olarak, Excel'de(Excel) kazınmış verilerimizi nasıl güncel tutacağımızı öğreneceğiz . Bu, Excel'in(Excel) veri kazıma için ne kadar güçlü olduğunu göstermenin harika bir yoludur . Bununla bile, yalnızca Excel'in(Excel) yapabileceği en temel kazımayı yapıyoruz.

Bu örnek için https://www.cnbc.com/stocks/hisse senedi bilgisi(stock information) web sayfası kullanalım .

Daha önce yaptıklarımızı gözden geçirin ve yeni URL'yi (URL)adres çubuğundan(address bar) kopyalayıp yapıştırın(copy and paste) .

Gezgin penceresine gidecek(Navigator window) ve mevcut tabloları göreceksiniz . Başlıca ABD Hisse Senedi Endekslerini(Major U.S. Stock Indices) seçelim .

Veriler kazındıktan sonra aşağıdaki elektronik tabloyu göreceğiz.

Sağ tarafta Major US Stock Indexes(Major U.S. Stock Indexes) sorgusunu görüyoruz . Vurgulanması için bunu seçin . (Select)Tablo Araçları(Table Tools) sekmesinde ve Tasarım(Design) alanında olduğumuzdan emin olun . (Make)Ardından Yenile(Refresh) altındaki aşağı oka tıklayın . Ardından Bağlantı Özellikleri'ne(Connection Properties) tıklayın .

Sorgu Özellikleri(Query Properties ) penceresinde Kullanım sekmesi altında bu(Usage) bilgilerin nasıl yenileneceğini kontrol edebiliriz. Çalışma kitabını bir sonraki sefer açtığımızda yenilemek veya yenilemek için veya arka planda yenilemek için veya bunların herhangi bir kombinasyonu için belirli bir süre ayarlayabiliriz. İhtiyacımız olanı seçtikten sonra , pencereyi kapatmak ve devam etmek için Tamam'a tıklayın.(OK)

Bu kadar! Artık hisse senedi fiyatlarını, spor skorlarını veya sık sık değişen diğer verileri bir Excel elektronik tablosundan(Excel spreadsheet) izleyebilirsiniz . Excel denklemleri ve işlevleri konusunda iyiyseniz , verilerle neredeyse istediğiniz her şeyi yapabilirsiniz.

Belki hisse senedi trendlerini belirlemeye çalışın, işyerinde bir fantezi spor havuzu çalıştırın ya da belki sadece hava durumunu takip edin. Kim bilir? Hayal gücünüz ve internette(Internet) mevcut olan veriler tek sınırdır.



About the author

10 yılı aşkın deneyime sahip bir bilgisayar uzmanıyım. Boş zamanlarımda, bir ofis masasında yardım etmeyi ve çocuklara interneti nasıl kullanacaklarını öğretmeyi severim. Becerilerim pek çok şeyi içeriyor ama en önemlisi, insanların sorunları çözmelerine nasıl yardım edeceğimi biliyorum. Acil bir konuda size yardımcı olabilecek birine ihtiyacınız varsa veya sadece bazı temel ipuçları istiyorsanız, lütfen bana ulaşın!



Related posts