PDF belgelerinden Tablolar nasıl çıkarılır

Bu makale size PDF belgelerinden tabloların nasıl çıkarılacağını(extract tables from PDF documents) gösterecektir . Ayrı ayrı kullanmak istediğiniz birden çok tablo içeren birçok PDF dosyanız olabilir. (PDF)Bu tabloları kopyalayıp(Copying) yapıştırmak, beklenen çıktıyı vermeyebileceğinden iyi bir seçenek değildir, bu nedenle bir PDF dosyasından tabloları çıkarabilecek ve bu tabloları ayrı dosyalar olarak kaydedebilecek başka basit seçeneklere ihtiyacınız vardır.

Bu PDF tablo çıkarma araçlarının çoğu, (PDF table extractor tools)PDF tablosu tarandığında yardımcı olamaz . Böyle bir durumda, önce PDF'yi aranabilir hale getirmeli(make the PDF searchable)  ve ardından bu seçenekleri denemelisiniz.

PDF belgelerinden Tabloları Çıkarın

Bu yazıda, bir PDF(PDF) dosyasından tabloları çıkarmak için 2 ücretsiz çevrimiçi hizmet ve 3 ücretsiz yazılım ekledik :

  1. PDF'den XLS'ye
  2. PDFtoExcel.com
  3. tablo
  4. ByteScout PDF Çok Amaçlı Aracı
  5. Sejda PDF Masaüstü.

1] PDF'den XLS'ye

PDF'den XLS'ye hizmet

PDF'den (PDF)XLS'ye , (XLS)PDF'den(PDF) tablo çıkarmak için en iyi seçeneklerden biridir . Onu kullanışlı kılan iki özelliği vardır. 20 PDF belgesinden tabloları bir araya getirebilirsiniz . Ayrıca, PDF tablo çıkarma işlemi otomatiktir. Çıktıyı bir XLSX dosyası olarak oluşturur. Bir PDF'de(PDF) birden fazla tablo varsa, her tablo XLSX çıktı dosyasının farklı sayfalarında ayrı olarak depolanır.

(Open the homepage)Bu hizmetin ana sayfasını açın . Bundan sonra, PDF dosyalarını sürükleyip bırakın veya DOSYA YÜKLE(UPLOAD FILES) düğmesini kullanın. Yüklenen her PDF , otomatik olarak XLSX formatındaki dosyaya dönüştürülür. Çıktı dosyaları hazır olduğunda, bunları tek tek indirebilir veya tüm çıktı dosyalarını içerecek bir ZIP dosyası indirebilirsiniz.(ZIP)

2] PDFtoExcel.com

PDF belgelerinden Tabloları Çıkarın

PDFtoExcel.com hizmeti tek seferde bir (PDFtoExcel.com)PDF'den(PDF) tabloları çıkarabilir ancak PDF yüklemek için birden çok platformu destekler . PDF yüklemek için (PDF)OneDrive , masaüstü(desktop) , Google Drive ve Dropbox platformlarını destekler . Ayrıca, dönüştürme işlemi otomatiktir.

Bu hizmet ana sayfası burada(here) . Orada, PDF(PDF) eklemek için bir yükleme seçeneği seçin . Bundan sonra, PDF'yi(PDF) otomatik olarak yükler ve Excel ( XLSX ) dosyasına dönüştürür. Çıktı hazır olduğunda, PDF(PDF) tablolarını içeren çıktı dosyasını kaydetmek için indirme bağlantısını alacaksınız .

Not: Bu hizmet, taranan (Note: )PDF dosyalarından tabloları da çıkarabileceğini söylese de, benim için işe yaramadı. Yine de taranmış PDF için deneyebilirsiniz .

3] Tablo

Tabula PDF çıkarma yazılımı

Tabula , bir (Tabula)PDF'de(PDF) bulunan tabloları otomatik olarak algılayabilen ve ardından bu tabloları TSV , JSON veya CSV dosyası olarak kaydetmenize izin veren güçlü bir yazılımdır. Her PDF tablosu için ayrı (PDF)CSV dosyaları kaydetme veya tüm tabloları tek bir CSV dosyasına kaydetme seçeneğini belirleyebilirsiniz .

Bu açık kaynaklı(open-source) PDF tablo çıkarıcıyı indirmek için burayı tıklayın(click here) . Ayrıca Java'nın(requires Java) başarılı bir şekilde çalıştırılması ve kullanılması gerekir.

İndirdiğiniz ZIP(ZIP) dosyasını çıkartın ve tabula.exe dosyasını çalıştırın. Varsayılan tarayıcınızda bir sayfa açacaktır. Sayfa açılmadıysa, tarayıcınıza http://localhost:8080 ekleyin ve Enter'a(Enter) basın .

Şimdi PDF(PDF) eklemek için Gözat(Browse) seçeneğini kullanabileceğiniz arayüzünü göreceksiniz . Bundan sonra, İçe Aktar(Import) düğmesine basın. PDF eklendiğinde , arayüzünde PDF sayfalarını görebilirsiniz .

Tabloları Otomatik Algıla(Autodetect Tables) düğmesini kullanın , bu PDF'de(PDF) bulunan tüm tabloları otomatik olarak vurgulayacaktır. Belirli bir tabloyu seçerek bir tabloyu manuel olarak da vurgulayabilirsiniz. İsterseniz, seçtiğiniz tabloları da kaldırabilirsiniz(remove selected tables) .

Bu, yalnızca istediğiniz tabloları kaydetmenize yardımcı olacaktır. PDF tabloları vurgulandığında, Önizleme ve Çıkarılan Verileri Dışa Aktar(Preview & Export Extracted Data) düğmesine tıklayın.

Son olarak, bir çıktı formatı seçmek için üst kısımda bulunan açılır menüyü kullanın ve Dışa Aktar(Export) düğmesine basın. Bu, PDF tablolarını sizin tarafınızdan seçilen çıktı formatı dosyasına kaydeder.

4] ByteScout PDF Çok Amaçlı Aracı

ByteScout PDF Multitool- pdf ekleyin ve tabloları tespit edin

Adından da anlaşılacağı gibi, bu yazılım birden fazla araçla birlikte gelir. PDF'yi çok sayfalı TIFF'e dönüştürme(convert PDF to multipage TIFF) , PDF belgesini döndürme(rotate PDF document) , PDF'yi aranamaz hale getirme(make PDF unsearchable) , PDF'yi optimize(optimize PDF) etme , PDF'ye resim ekleme(add an image to PDF) ve daha fazlası gibi araçlara sahiptir . Oldukça harika olan PDF(PDF) tablo dedektörü özelliği de var. Bu aracın avantajı, taranan PDF'den tabloları da çıkarabilmenizdir(extract tables from scanned PDF) . Birden çok sayfadaki tabloları algılayabilir ve ardından bu tabloları CSV , XLS , XML , TXT veya JSON biçiminde dosya olarak ayıklayabilirsiniz. Ayıklamadan önce, bir sayfa aralığı(page range) ayarlamanıza da izin verir.tabloları yalnızca belirtilen sayfalardan çıkarmak için.

Bu yazılımı buradan(here) alabilirsiniz . Yalnızca ticari olmayan kullanım için ücretsizdir(free for non-commercial use) . Kurulumdan sonra bu yazılımı çalıştırın ve PDF eklemek için Belgeyi Aç(Open Document) seçeneğini kullanın . Bundan sonra, yukarıdaki resimde vurgulandığı gibi Tabloları algıla aracına tıklayın. (Detect tables)Bu araç, Veri Çıkarma(Data Extraction) kategorisi altında bulunur.

Tabloları algılamak için koşulları ayarlayabileceğiniz bir kutu açacaktır. Örneğin, minimum sayıda sütun, satır, tablolar arasında minimum satır sonu ayarlayabilir, tablo algılama modunu kenarlıklı veya kenarlıksız tabloya vb. ayarlayabilirsiniz. Seçenekleri kullanın veya varsayılan ayarları koruyun.

Bundan sonra, o kutudaki Sonraki tabloyu algıla düğmesine basın. (Detect next table)Geçerli sayfada bir tablo belirleyecek ve seçecektir. Bu şekilde başka bir sayfaya geçebilir ve daha fazla tablo tespit edebilirsiniz.

tabloları algıla ve seçilen çıktıyla pdf tablolarını kaydet

İşiniz bittiğinde, Çıkarmaya devam et(Proceed to extraction) düğmesini kullanın ve çıktı biçimini seçin. Son olarak, mevcut sayfadaki tabloları kaydetmek veya bir sayfa aralığı tanımlamak için seçenekleri kullanabilir ve çıktıyı kaydedebilirsiniz.

Araç tatmin edici bir çıktı verir. Ancak bazen PDF'deki(PDF) diğer içerikleri algılayabilir ve birden çok sayfadan tabloları çıkaramayabilir. Bu durumda tabloları tek tek alıp kaydetmek için kullanmalısınız.

5] Sejda PDF Masaüstü

PDF'den excel'e dönüştürücülü Sejda PDF Masaüstü

Sejda PDF Desktop aynı zamanda çok amaçlı bir yazılımdır. PDF'yi optimize edebilir veya sıkıştırabilir, PDF'ye(compress PDF) filigran ekleyebilir, PDF'deki kısıtlamaları kaldırabilir , (remove restrictions from PDF)PDF belgesini düzenleyebilir , vb. Ancak, ücretsiz planının sınırlamaları vardır. Ücretsiz planda günde sadece 3 görev yapılabilir. Ayrıca, PDF boyut sınırı 50 MB veya 10 sayfadır(10 pages) .

PDF tablolarını çıkarmak için PDF'den Excel'e(PDF to Excel) dönüştürme aracını kullanabilirsiniz . PDF sayfalarındaki tabloları otomatik olarak algılar ve bu tabloları XLSX veya CSV olarak kaydetmenizi sağlar .

İndirme bağlantısı burada(here) . Kurulumdan sonra , ana arayüzünden PDF'den(PDF) Excel'e aracını kullanın . (Excel)Bu aracı seçtikten sonra PDF dosyalarını seç(Choose PDF files) düğmesini kullanın. Ücretsiz plana yalnızca bir PDF eklenebilir.

PDF eklendiğinde, PDF'yi CSV'ye(Convert PDF to CSV) Dönüştür ve PDF'yi Excel'e Dönüştür(Convert PDF to Excel) düğmeleri sağlayacaktır. Bir düğme kullanın ve ardından çıktıyı PC'nizde istediğiniz konuma kaydedebilirsiniz.

pdf tablosunu excel veya csv'ye dönüştür

PDF tablo algılama aracı iyidir . Tabloları manuel olarak algılamanız gerekmez. Yine de bazen diğer metin içeriğini bir PDF(PDF) tablosu olarak içerebilir ve çıktıda saklayabilir. Ama genel sonuçlar iyi.

Bu kadar.

Bunlar, PDF'den(PDF) tabloları çıkarmak için bazı iyi araçlardır . Tabula yazılımı diğer araçlardan daha etkilidir. Yine de tüm araçları deneyebilir ve hangisinin yardımcı olduğunu kontrol edebilirsiniz.

Benzer okumalar:(Similar reads:)



About the author

Excel ve PowerPoint dahil olmak üzere Microsoft Office yazılımlarıyla çalışma deneyimine sahip bir bilgisayar uzmanıyım. Ayrıca Google'a ait bir tarayıcı olan Chrome ile de deneyimim var. Becerilerim arasında mükemmel yazılı ve sözlü iletişim, problem çözme ve eleştirel düşünme yer alır.



Related posts