5 Ücretsiz Çevrimiçi OCR Hizmeti Test Edildi ve İncelendi

Metne dönüştürmek istediğiniz bir PDF belgeniz veya resminiz mi var? (PDF document)Son zamanlarda, biri bana postayla düzenlemem ve düzeltmelerle geri göndermem gereken bir belge gönderdi. Kişi dijital bir kopya bulamadı, bu yüzden tüm bu metni dijital formata dönüştürmekle görevlendirildim.

Her şeyi tekrar yazmak için saatler harcamam mümkün değildi, bu yüzden belgenin güzel, yüksek kaliteli bir resmini çektim ve sonra hangisinin bana en iyisini vereceğini görmek için bir sürü çevrimiçi OCR hizmetini karıştırdım. Sonuçlar.

Bu yazıda, OCR(OCR) için ücretsiz olan birkaç favori sitemden bahsedeceğim. Bu sitelerin çoğunun temel bir ücretsiz hizmet sunduğunu ve daha büyük resimler, çok sayfalı PDF(PDF) belgeleri, farklı giriş dilleri vb. gibi ekstra özellikler istiyorsanız ücretli seçeneklere sahip olduğunu belirtmekte fayda var .

Ayrıca, bu hizmetlerin çoğunun orijinal belgenizin biçimlendirmesiyle eşleşemeyeceğini önceden bilmekte fayda var. Bunlar esas olarak metin çıkarmak içindir ve hepsi bu kadar. Her şeyin belirli bir düzende veya biçimde olmasına ihtiyacınız varsa, tüm metni (layout or format)OCR'den aldıktan(OCR) sonra bunu manuel olarak yapmanız gerekir .

Ayrıca, metni almak için en iyi sonuçlar 200 ila 400 DPI çözünürlüğe(DPI resolution) sahip belgelerden gelecektir . Düşük bir DPI resminiz(DPI image) varsa , sonuçlar o kadar iyi olmayacaktır.

Son olarak, test ettiğim ancak çalışmayan(t work) birçok site vardı . Google'da ücretsiz çevrimiçi OCR kullanıyorsanız(OCR) , bir grup site görürsünüz, ancak ilk 10 sonuçtaki sitelerin birçoğu dönüştürmeyi tamamlamadı bile. Bazıları zaman aşımına uğrar, bazıları hata verir ve bazıları “dönüştürme” sayfasında takılıp kalır, bu yüzden o sitelerden bahsetmeye bile tenezzül etmedim.

Her site için çıktının ne kadar iyi olacağını görmek için iki belgeyi test ettim. Testlerim için, her iki belgenin de fotoğrafını çekmek için iPhone 5S'imi(iPhone 5S) kullandım ve ardından dönüştürme için doğrudan web sitelerine yükledim.

Testim için kullandığım resimlerin nasıl göründüğünü görmek isterseniz, onları buraya ekledim: Test1 ve Test2 . Bunların telefondan alınan görüntülerin tam çözünürlüklü sürümleri olmadığını unutmayın. Sitelere yüklerken tam çözünürlüklü görseli kullandım.(resolution image)

ÇevrimiçiOCR

OnlineOCR.net , testimde çok iyi sonuçlar veren temiz ve basit bir site. Bu konuda sevdiğim en önemli şey, genellikle bu tür niş hizmet(niche service) sitelerinde olduğu gibi, her yerde tonlarca reklam olmamasıdır.

ücretsiz çevrimiçi ocr

Başlamak için dosyanızı seçin ve yüklenmesi bitene kadar bekleyin . (file and wait till)Bu site için maksimum yükleme boyutu 100 MB'dir. Ücretsiz bir hesaba kaydolursanız, daha büyük yükleme boyutu, çok sayfalı PDF'ler(PDFs) , farklı giriş dilleri, saatte daha fazla dönüşüm vb. gibi birkaç ekstra özellik elde edersiniz.

Ardından, giriş dilinizi(input language) seçin ve ardından çıkış biçimini(output format) seçin . Word , Excel veya Düz Metin(Plain Text) arasından seçim yapabilirsiniz . Dönüştür (Convert)düğmesini(Click) tıkladığınızda , indirme bağlantısıyla(download link) birlikte bir kutuda altta görüntülenen metni göreceksiniz .

ocr çıkışı

Tek istediğiniz metinse , kutudan kopyalayıp yapıştırmanız yeterlidir. (copy and paste)Ancak, orijinal belgenin düzenini koruma konusunda şaşırtıcı derecede harika bir iş çıkardığı için Word belgesini(Word document) indirmenizi öneririm .

Örneğin, ikinci testim için Word belgesini(Word document) açtığımda, belgenin tıpkı resimdeki gibi üç sütunlu bir tablo içerdiğini görünce şaşırdım.

çevrimiçi ocr çıkışı

Tüm siteler arasında, bu açık ara en iyisiydi. Çok fazla dönüşüm yapmanız gerekiyorsa, kaydolmaya kesinlikle değer.

Eksiksiz olması için, sonuçları kendiniz görebilmeniz için her hizmet tarafından oluşturulan çıktı dosyalarına da bağlantı vereceğim. İşte OnlineOCR'ın(OnlineOCR) sonuçları : Test1 Doc ve Test2 Doc(Test1 Doc and Test2 Doc) .

Bu Word belgelerini bilgisayarınızda açarken, (Word)Word'de(Word) bunun İnternet'ten geldiğini ve düzenlemenin(Internet and editing) devre dışı bırakıldığını belirten bir mesaj alacağınızı unutmayın . Bu tamamen sorun değil çünkü Word (Word doesn)internetten(Internet) gelen belgelere güvenmez ve sadece belgeyi görüntülemek istiyorsanız düzenlemeyi etkinleştirmeniz gerekmez.

i2OCR

Oldukça iyi sonuçlar veren bir diğer site ise i2OCR oldu . İşlem çok benzer: dilinizi, dosyanızı seçin ve ardından Metin Çıkart'a(Extract Text) basın .

i2ocr

Bu site biraz daha uzun sürdüğü için burada bir iki dakika beklemeniz gerekecek. Ayrıca 2. Adımda(Step 2) , resminizin önizlemede sağ tarafının yukarıya baktığından emin olun, aksi takdirde çıktı olarak bir sürü anlamsız ifade alırsınız. Bazı nedenlerden dolayı, iPhone'umdaki görüntüler bilgisayarımda portre modunda(portrait mode) , ancak bu siteye yüklediğimde yatay olarak gösteriliyordu.

i2ocr çıktısı

Resmi bir fotoğraf düzenleme uygulamasında manuel olarak açmam, 90 derece döndürmem, sonra tekrar portreye döndürmem ve sonra tekrar kaydetmem gerekiyordu. Tamamlandığında , aşağı kaydırın ve size bir (Once)indirme düğmesiyle(download button) birlikte metnin bir önizlemesini gösterecektir .

Bu site, ilk testin çıktısıyla oldukça iyi sonuç verdi, ancak sütun düzenine(column layout) sahip ikinci testte o kadar iyi sonuç vermedi . İşte i2OCR'ın sonuçları: Test1 Doc ve Test2 Doc(Test1 Doc and Test2 Doc) .

ücretsizOCR

Free-OCR.com resimlerinizi alır ve bunları düz metne(plain text) dönüştürür . Word formatına(Word format) aktarma seçeneği yoktur . Dosyanızı seçin, bir dil seçin ve ardından Başlat'a(Start) tıklayın .

Site hızlıdır ve çıktıyı oldukça hızlı bir şekilde alırsınız. Metin dosyasını(text file) bilgisayarınıza indirmek için bağlantıya tıklamanız yeterlidir .(Just click)

freeocr

Aşağıda belirtilen NewOCR'da(NewOCR) olduğu gibi, bu site belgedeki tüm T'leri büyük harf kullanır. Bunu neden yaptığı hakkında hiçbir fikrim yok, ancak garip bir nedenle bu site ve NewOCR(site and NewOCR) bunu yaptı. Bunu değiştirmek çok önemli değil, ama gerçekten yapmak zorunda kalmamanız gereken sıkıcı bir süreç.

İşte FreeOCR'ın(FreeOCR) sonuçları : Test1 Doc ve Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader Çevrimiçi

FineReader Online'ı(FineReader Online) kullanabilmek için , size 10 sayfaya kadar OCR'ye(OCR) 15 günlük ücretsiz deneme hakkı veren bir hesaba kaydolmanız gerekir . Birkaç sayfa için yalnızca bir kerelik OCR yapmanız gerekiyorsa , bu hizmeti kullanabilirsiniz. Kaydolduktan sonra onay e-postasındaki (confirmation email)doğrulama bağlantısını(verify link) tıkladığınızdan emin olun(Make) .

ince okuyucu çevrimiçi

En(Upload) üstteki Tanı'ya(Recognize) tıklayın ve ardından dosyanızı seçmek için Yükle'ye tıklayın. Dilinizi, çıktı biçimini seçin ve ardından alttaki Tanı'ya tıklayın. (Recognize)Bu sitenin temiz bir arayüzü var ve reklam da yok.

Testlerimde, bu site ilk test belgesindeki(test document) metni alabildi , ancak Word(Word doc) belgesini açtığımda kesinlikle çok büyüktü , bu yüzden tekrar yaptım ve çıktı formatı(output format) olarak Düz Metin'i(Plain Text) seçtim .

Sütunlarla yapılan ikinci test için Word belgesi(Word document) boştu ve metni bile bulamadım. Orada ne olduğundan emin değilim, ama basit paragraflardan başka bir şeyle başa çıkamıyor gibi görünüyor. İşte FineReader'ın(FineReader) sonuçları : Test1 Belge ve Test2 Belge.

YeniOCR

Bir sonraki site, NewOCR.com iyiydi(NewOCR.com) , ancak neredeyse ilk site kadar iyi değildi. İlk olarak, reklamları var, ama neyse ki bir ton değil. Önce dosyanızı seçin ve ardından Önizleme(Preview) düğmesini tıklayın.

fotoğraf yükleniyor

Ardından görüntüyü döndürebilir ve metin için taramak istediğiniz alanı ayarlayabilirsiniz. Bu, tarayıcı takılı bir bilgisayarda tarama işleminin nasıl çalıştığına çok benzer.(scanning process)

ocr resmi

Belgede birden fazla sütun varsa, Sayfa düzeni analizi( Page layout analysis) düğmesini kontrol edebilirsiniz; metni sütunlara bölmeye çalışacaktır. OCR düğmesini (OCR button)tıklayın(Click) , tamamlanması için birkaç saniye bekleyin ve ardından sayfa yenilendiğinde aşağıya doğru kaydırın.

İlk testte, tüm metni doğru bir şekilde aldı, ancak nedense belgedeki her T harfini büyük harfle yazdı! Bunu neden yaptığı hakkında hiçbir fikrim yoktu, ama yaptı. Sayfa analizinin(page analysis) etkin olduğu ikinci testte metnin çoğunu aldı, ancak düzen tamamen kapalıydı.

İşte NewOCR'ın(NewOCR) sonuçları : Test1 Doc ve Test2 Doc.

Çözüm

Gördüğünüz gibi, ücretsiz ne yazık ki çoğu zaman size gerçekten çok iyi sonuçlar vermiyor. Bahsedilen ilk site açık ara en iyisidir çünkü tüm metni tanımakta harika bir iş çıkarmakla kalmamış, aynı zamanda orijinal belgenin biçimini de korumayı başarmıştır.

Yine de sadece metne ihtiyacınız varsa, yukarıdaki web sitelerinin çoğu bunu sizin için yapabilmelidir. Herhangi bir sorunuz varsa, yorum yapmaktan çekinmeyin. Eğlence!



About the author

Merhaba potansiyel işverenler! Alanında 7 yılı aşkın deneyime sahip son derece deneyimli bir yazılım mühendisiyim. Windows 7 uygulamalarını nasıl tasarlayıp geliştireceğimi biliyorum ve profilimde çok çeşitli Harika Web Siteleri önerileri var. Becerilerim ve deneyimlerim, iyi proje yönetimi becerilerine, programlama bilgisine ve web geliştirme deneyimine sahip yetenekli bir birey arayan herhangi bir şirket için bana mükemmel bir eşleşme sunuyor.



Related posts