PDF belgelerinden Tablolar nasıl çıkarılır
Bu makale size PDF belgelerinden tabloların nasıl çıkarılacağını(extract tables from PDF documents) gösterecektir . Ayrı ayrı kullanmak istediğiniz birden çok tablo içeren birçok PDF dosyanız olabilir. (PDF)Bu tabloları kopyalayıp(Copying) yapıştırmak, beklenen çıktıyı vermeyebileceğinden iyi bir seçenek değildir, bu nedenle bir PDF dosyasından tabloları çıkarabilecek ve bu tabloları ayrı dosyalar olarak kaydedebilecek başka basit seçeneklere ihtiyacınız vardır.
Bu PDF tablo çıkarma araçlarının çoğu, (PDF table extractor tools)PDF tablosu tarandığında yardımcı olamaz . Böyle bir durumda, önce PDF'yi aranabilir hale getirmeli(make the PDF searchable) ve ardından bu seçenekleri denemelisiniz.
PDF belgelerinden Tabloları Çıkarın
Bu yazıda, bir PDF(PDF) dosyasından tabloları çıkarmak için 2 ücretsiz çevrimiçi hizmet ve 3 ücretsiz yazılım ekledik :
- PDF'den XLS'ye
- PDFtoExcel.com
- tablo
- ByteScout PDF Çok Amaçlı Aracı
- Sejda PDF Masaüstü.
1] PDF'den XLS'ye
PDF'den (PDF)XLS'ye , (XLS)PDF'den(PDF) tablo çıkarmak için en iyi seçeneklerden biridir . Onu kullanışlı kılan iki özelliği vardır. 20 PDF belgesinden tabloları bir araya getirebilirsiniz . Ayrıca, PDF tablo çıkarma işlemi otomatiktir. Çıktıyı bir XLSX dosyası olarak oluşturur. Bir PDF'de(PDF) birden fazla tablo varsa, her tablo XLSX çıktı dosyasının farklı sayfalarında ayrı olarak depolanır.
(Open the homepage)Bu hizmetin ana sayfasını açın . Bundan sonra, PDF dosyalarını sürükleyip bırakın veya DOSYA YÜKLE(UPLOAD FILES) düğmesini kullanın. Yüklenen her PDF , otomatik olarak XLSX formatındaki dosyaya dönüştürülür. Çıktı dosyaları hazır olduğunda, bunları tek tek indirebilir veya tüm çıktı dosyalarını içerecek bir ZIP dosyası indirebilirsiniz.(ZIP)
2] PDFtoExcel.com
PDFtoExcel.com hizmeti tek seferde bir (PDFtoExcel.com)PDF'den(PDF) tabloları çıkarabilir ancak PDF yüklemek için birden çok platformu destekler . PDF yüklemek için (PDF)OneDrive , masaüstü(desktop) , Google Drive ve Dropbox platformlarını destekler . Ayrıca, dönüştürme işlemi otomatiktir.
Bu hizmet ana sayfası burada(here) . Orada, PDF(PDF) eklemek için bir yükleme seçeneği seçin . Bundan sonra, PDF'yi(PDF) otomatik olarak yükler ve Excel ( XLSX ) dosyasına dönüştürür. Çıktı hazır olduğunda, PDF(PDF) tablolarını içeren çıktı dosyasını kaydetmek için indirme bağlantısını alacaksınız .
Not: Bu hizmet, taranan (Note: )PDF dosyalarından tabloları da çıkarabileceğini söylese de, benim için işe yaramadı. Yine de taranmış PDF için deneyebilirsiniz .
3] Tablo
Tabula , bir (Tabula)PDF'de(PDF) bulunan tabloları otomatik olarak algılayabilen ve ardından bu tabloları TSV , JSON veya CSV dosyası olarak kaydetmenize izin veren güçlü bir yazılımdır. Her PDF tablosu için ayrı (PDF)CSV dosyaları kaydetme veya tüm tabloları tek bir CSV dosyasına kaydetme seçeneğini belirleyebilirsiniz .
Bu açık kaynaklı(open-source) PDF tablo çıkarıcıyı indirmek için burayı tıklayın(click here) . Ayrıca Java'nın(requires Java) başarılı bir şekilde çalıştırılması ve kullanılması gerekir.
İndirdiğiniz ZIP(ZIP) dosyasını çıkartın ve tabula.exe dosyasını çalıştırın. Varsayılan tarayıcınızda bir sayfa açacaktır. Sayfa açılmadıysa, tarayıcınıza http://localhost:8080 ekleyin ve Enter'a(Enter) basın .
Şimdi PDF(PDF) eklemek için Gözat(Browse) seçeneğini kullanabileceğiniz arayüzünü göreceksiniz . Bundan sonra, İçe Aktar(Import) düğmesine basın. PDF eklendiğinde , arayüzünde PDF sayfalarını görebilirsiniz .
Tabloları Otomatik Algıla(Autodetect Tables) düğmesini kullanın , bu PDF'de(PDF) bulunan tüm tabloları otomatik olarak vurgulayacaktır. Belirli bir tabloyu seçerek bir tabloyu manuel olarak da vurgulayabilirsiniz. İsterseniz, seçtiğiniz tabloları da kaldırabilirsiniz(remove selected tables) .
Bu, yalnızca istediğiniz tabloları kaydetmenize yardımcı olacaktır. PDF tabloları vurgulandığında, Önizleme ve Çıkarılan Verileri Dışa Aktar(Preview & Export Extracted Data) düğmesine tıklayın.
Son olarak, bir çıktı formatı seçmek için üst kısımda bulunan açılır menüyü kullanın ve Dışa Aktar(Export) düğmesine basın. Bu, PDF tablolarını sizin tarafınızdan seçilen çıktı formatı dosyasına kaydeder.
4] ByteScout PDF Çok Amaçlı Aracı
Adından da anlaşılacağı gibi, bu yazılım birden fazla araçla birlikte gelir. PDF'yi çok sayfalı TIFF'e dönüştürme(convert PDF to multipage TIFF) , PDF belgesini döndürme(rotate PDF document) , PDF'yi aranamaz hale getirme(make PDF unsearchable) , PDF'yi optimize(optimize PDF) etme , PDF'ye resim ekleme(add an image to PDF) ve daha fazlası gibi araçlara sahiptir . Oldukça harika olan PDF(PDF) tablo dedektörü özelliği de var. Bu aracın avantajı, taranan PDF'den tabloları da çıkarabilmenizdir(extract tables from scanned PDF) . Birden çok sayfadaki tabloları algılayabilir ve ardından bu tabloları CSV , XLS , XML , TXT veya JSON biçiminde dosya olarak ayıklayabilirsiniz. Ayıklamadan önce, bir sayfa aralığı(page range) ayarlamanıza da izin verir.tabloları yalnızca belirtilen sayfalardan çıkarmak için.
Bu yazılımı buradan(here) alabilirsiniz . Yalnızca ticari olmayan kullanım için ücretsizdir(free for non-commercial use) . Kurulumdan sonra bu yazılımı çalıştırın ve PDF eklemek için Belgeyi Aç(Open Document) seçeneğini kullanın . Bundan sonra, yukarıdaki resimde vurgulandığı gibi Tabloları algıla aracına tıklayın. (Detect tables)Bu araç, Veri Çıkarma(Data Extraction) kategorisi altında bulunur.
Tabloları algılamak için koşulları ayarlayabileceğiniz bir kutu açacaktır. Örneğin, minimum sayıda sütun, satır, tablolar arasında minimum satır sonu ayarlayabilir, tablo algılama modunu kenarlıklı veya kenarlıksız tabloya vb. ayarlayabilirsiniz. Seçenekleri kullanın veya varsayılan ayarları koruyun.
Bundan sonra, o kutudaki Sonraki tabloyu algıla düğmesine basın. (Detect next table)Geçerli sayfada bir tablo belirleyecek ve seçecektir. Bu şekilde başka bir sayfaya geçebilir ve daha fazla tablo tespit edebilirsiniz.
İşiniz bittiğinde, Çıkarmaya devam et(Proceed to extraction) düğmesini kullanın ve çıktı biçimini seçin. Son olarak, mevcut sayfadaki tabloları kaydetmek veya bir sayfa aralığı tanımlamak için seçenekleri kullanabilir ve çıktıyı kaydedebilirsiniz.
Araç tatmin edici bir çıktı verir. Ancak bazen PDF'deki(PDF) diğer içerikleri algılayabilir ve birden çok sayfadan tabloları çıkaramayabilir. Bu durumda tabloları tek tek alıp kaydetmek için kullanmalısınız.
5] Sejda PDF Masaüstü
Sejda PDF Desktop aynı zamanda çok amaçlı bir yazılımdır. PDF'yi optimize edebilir veya sıkıştırabilir, PDF'ye(compress PDF) filigran ekleyebilir, PDF'deki kısıtlamaları kaldırabilir , (remove restrictions from PDF)PDF belgesini düzenleyebilir , vb. Ancak, ücretsiz planının sınırlamaları vardır. Ücretsiz planda günde sadece 3 görev yapılabilir. Ayrıca, PDF boyut sınırı 50 MB veya 10 sayfadır(10 pages) .
PDF tablolarını çıkarmak için PDF'den Excel'e(PDF to Excel) dönüştürme aracını kullanabilirsiniz . PDF sayfalarındaki tabloları otomatik olarak algılar ve bu tabloları XLSX veya CSV olarak kaydetmenizi sağlar .
İndirme bağlantısı burada(here) . Kurulumdan sonra , ana arayüzünden PDF'den(PDF) Excel'e aracını kullanın . (Excel)Bu aracı seçtikten sonra PDF dosyalarını seç(Choose PDF files) düğmesini kullanın. Ücretsiz plana yalnızca bir PDF eklenebilir.
PDF eklendiğinde, PDF'yi CSV'ye(Convert PDF to CSV) Dönüştür ve PDF'yi Excel'e Dönüştür(Convert PDF to Excel) düğmeleri sağlayacaktır. Bir düğme kullanın ve ardından çıktıyı PC'nizde istediğiniz konuma kaydedebilirsiniz.
PDF tablo algılama aracı iyidir . Tabloları manuel olarak algılamanız gerekmez. Yine de bazen diğer metin içeriğini bir PDF(PDF) tablosu olarak içerebilir ve çıktıda saklayabilir. Ama genel sonuçlar iyi.
Bu kadar.
Bunlar, PDF'den(PDF) tabloları çıkarmak için bazı iyi araçlardır . Tabula yazılımı diğer araçlardan daha etkilidir. Yine de tüm araçları deneyebilir ve hangisinin yardımcı olduğunu kontrol edebilirsiniz.
Benzer okumalar:(Similar reads:)
- PDF'den ekleri çıkarın(Extract attachments from PDF)
- Vurgulanan metni PDF'den çıkarın(Extract highlighted text from PDF) .
Related posts
Document Converter: Convert DOC, PDF, DOCX, RTF, TXT, HTML Dosyaları
Bir PPS file nedir? Nasıl Windows 11/10 yılında PDF için PPS dönüştürmek için?
düzenlerken veya Windows 10 dosyayı kaydederken PDF text kaybolur
Best Free PDF Editor Online Tools bu bulut tabanlıdır
PDF dosyalarını düzenlemek için ücretsiz PDF Editor Online Tool - PDF Yeah
Windows 10'de PDF file boyutunu azaltmak için ücretsiz PDF Compressor
Nasıl Highlight Text için Microsoft Edge browser içinde PDF belgelerde
Özü ve Windows 11/10 içinde Save PDF Metadata nasıl
Convert Word, PowerPoint, Excel Documents PDF içine Google Docs
Google Drive kullanarak PDF online için Excel file dönüştürmek için nasıl
Tek PDF file'lerde birden fazla PDF file'ler nasıl birleştirilir?
Redact PDF ücretsiz PDF redaction software and services kullanarak
Documents, bir tarayıcı kullanarak Google Docs ile PDF'ye nasıl dönüştürülür?
PDF Text File olarak Highlighted Text nasıl ayıklanır?
Convert PDF'ü PPT'e (PowerPoint), bu ücretsiz software & online tools'leri kullanarak
Optimize, Windows 10'de PDF File size'yi sıkıştırın ve azaltın
Encrypt PDF file Windows PC için PDF Page Lock kullanarak
Remove PDF Restrictions Ücretsiz software or online tools kullanma
LightPDF tüm PDF ihtiyaçları için kapsamlı bir çevrimiçi PDF Editor tool olduğunu
Drag and Drop Windows 10 ile Text PDF dönüştürmek nasıl