Konuşma Tanıma: Güçlü ve Zayıf Yönleri Üzerine Sonradan Düşünceler

Dersleri yapmam istendiğinde uzun zamandır herhangi bir konuşma tanıma(speech recognition) kullanmadığımı itiraf etmeliyim . Konuşma tanımayı(speech recognition) en son denediğimde , Windows 98 de yeniyken yeni olan Dragon Dictate ile oldu. Bilgisayar yıllarında çok uzun zaman önce!

Bu konuyu ele aldığım için mutluydum çünkü konuşma tanımanın nasıl geliştiğini görmek çok ilgimi çekti. Ve oğlum, düzeldi mi! Bunun gibi basit, yerleşik bir uygulama bile "kutudan çıkar çıkmaz" inanılmaz derecede iyi bir iş çıkardı. Konuşma Tanıma(Speech Recognition) ile ilgili bu son yazıda , konuşma tanımanın(speech recognition) harikalarıyla yeniden tanışırken öğrendiklerimden ve buradan nereye gideceğimden bahsetmek istiyorum.

Henüz Star Trek için hazır değil

Eminim çoğumuz Starship Enterprise mürettebatının (Starship Enterprise)"Computer!" dediğini izledik. ve anında cevap almak. Henüz Yıldız Filosu bilgisayarlarımız yok, ancak (Starfleet)Windows Vista'dan(Windows Vista) başlayarak ve Windows 7'de(Windows 7) devam ederek , bizi dinleyecek ve onlara söylediklerimize yanıt verecek ve "Bu neydi?" diye yanıtlayacak bilgisayarlarımız var. ("What was that?")cevap olarak kabul edilir.

Konuşma tanıma

Konuşma Tanıma'yı(Speech Recognition) ilk kullanmaya çalıştığımda sorunlar yaşadım ve sorun giderme özellikle kolay değildi. Yardım dosyaları her zaman yeterince yardımcı olmuyor. Cevapları Microsoft'un (Microsoft)web sitesinde(web site) ve çeşitli çevrimiçi forumlarda çok fazla çalışmadan bulabildim . Bu şekilde, web kameramın (tam önümde, monitörümün üstünde ve konuşma tarzımla aynı doğrultuda) aktif bir mikrofonu olduğunu ve kafa karışıklığına neden olduğunu unuttuğumu öğrendim. Bunu bir kez düzelttiğimde, o andan itibaren oldukça düzgün bir seyir oldu.

Hatta bir dizi farklı aksanla konuşmayı denedim ( örneğin BBC British ve American redneck(BBC British and American redneck) ) ve standart Amerikan telaffuzunda farklılıklara izin vererek oldukça iyi bir tanınma elde edebildim. Elbette, "Friends, Romans, countrymen, lend me your ears!"Helen Mirren ve Jeff Foxworthy(Helen Mirren and Jeff Foxworthy) hakkında en iyi izlenimlerimi yaparken, tamamen doğru sonuçlar elde etmek için beni çok güldürdü.

Dil tanıma

Konuşma Tanıma farklı dillerle kullanılabilir ve sınırlı, (Speech Recognition)Amerikan(American) aksanım, İspanyolca(Spanish) , Almanca ve Fransızca(German and French) ile deneyebileceğimi düşündüm , ancak işletim sisteminiz(operating system) de o dilde değilse ne yazık ki diğer dilleri kullanamazsınız . Microsoft'tan(Microsoft) başka bir dil paketi(language pack) yükleyerek işletim sisteminizin(operating system) dilini değiştirebilirsiniz , ancak bunu yalnızca Windows 7 Ultimate veya Windows 7 Enterprise kullanıyorsanız yapabilirsiniz.

Konuşma tanıma

Konuşma Tanıma(Speech Recognition) ABD İngilizcesi(US English) , İngiltere İngilizcesi(UK English) , Fransızca(French) , İspanyolca(Spanish) , Almanca(German) , Japonca(Japanese) , Geleneksel Çince ve Basitleştirilmiş Çince(Traditional Chinese and Simplified Chinese) için mevcuttur ve bu dillerin Windows 7 sürümlerinde (tüm sürümler) bulunur. Bunu deneyemediğim için üzgünüm. Windows 8 ile ne olacağı hakkında hiçbir fikrim yok , ancak diğer dil paketlerini yükleme yeteneğinin Windows 7 Professional ve üzeri Windows 8 eşdeğerlerine iyi bir ek olacağını düşünüyorum .

Ne işe yarar

Bahsettiğim gibi, Konuşma Tanıma diğer (Speech Recognition)Microsoft yazılımlarıyla(Microsoft software) en iyi şekilde çalışacak şekilde tasarlanmıştır . Microsoft ürünlerini denediğim sürece çok başarılı oldum (her ne kadar tahmin edilebileceği gibi Microsoft Office Excel'i(Microsoft Office Excel) kullanmak hem sınırlı hem de karmaşıktı). Diğer yazılımlarla vuruldu veya kaçırıldı. Google Chrome tarayıcısını (kesinlikle (Google Chrome)Internet Explorer kadar iyi değil ) ve şu anda oldukça eski bir yazılım olan (antique software)Eudora e-posta programımı oldukça iyi kullanabilirdim . Neler yapabileceğinizi görmek için en sevdiğiniz yazılımı denemeye değer. "Sayıları göster" komutu, özellikle öğelerin ve komutların seçilmesinde yardımcı oldu.

Ayrıca, tanıma doğruluğunun belirgin şekilde iyileşmesinin çok uzun sürmediğini de buldum. Eğitim alıştırmalarını iki kez yaptım ve sonrasında tanıma neredeyse % correct . Yazılımın ayak uydurması için biraz daha hızlı konuşabildim ve daha az duraklama yaptım. Sesimin ekranda kelimelere dönüşmesini izlemekten gerçekten keyif aldım. Konuşma tanıma yazılımıyla(speech recognition software) ilgili ilk deneyimlerim bu kadar hoş değildi.

Konuşma tanıma

Ne iyi çalışmıyor

Bahsettiğim gibi, bazı yazılımlar Speech Recognition ile uyumlu değildir . Adobe Reader'ı(Adobe Reader) veya TweetDeck'in (TweetDeck)Adobe AIR sürümünü bile açamadım . Google Dokümanlar'ı(Google Docs) denemek için Internet Explorer ile Google hesabımda(Google account) oturum açamadığımı fark ettim - şifremi konuşmanın veya hecelemenin hiçbir yolu yok gibi görünüyordu. Bunun bir güvenlik sorunu(security issue) olduğundan şüpheleniyorum , parolaların başka birinin duyabileceği yerlerde yüksek sesle konuşulmasına izin vermiyor, ancak bu can sıkıcıydı.

İTunes'u(iTunes) açıp çalacak bir şarkı seçebilirdim, ancak çalmasını sağlayamadım. Scrivener'ı(Scrivener) (seçtiğim kelime işlemcim) açabilirdim , ancak "Sayıları göster"("Show numbers") , kullanmak istediğim hiçbir şeyin üzerine sayıları bindirmedi. En sevdiğim yazılımla gerçekten kapsamlı bir deney yapmadım - bunlar denediklerimden sadece birkaçı. Konuşma Tanıma'yı(Speech Recognition) kullanmak isteyen herkesin , uyumlu olacağından emin olmak için kullanmak istediği programları test etmesi faydalı olacaktır.

Daha fazla bağlantı ve kaynak

Önceki makaleleri henüz görmediyseniz, onları burada bulabilirsiniz:

  • Konuşma Tanıma(Speech Recognition) ile Çalışma : Kurulum ve Yapılandırma(Setup and Configuration)
  • Konuşma Tanıma(Speech Recognition) ile Çalışma : Komutlar, Metni Dikte Etme ve(Dictating Text & Browsing) Web'de Gezinme(Web)
  • Yaygın Konuşma Tanıma Sorunlarını(Common Speech Recognition Problems) Giderme

İşin garibi, bir Google veya Bing aramasından(Google or Bing search) bir bağlantıya tıklamadan Microsoft Answers web sitesinde(web site) Konuşma Tanıma(Speech Recognition) hakkında herhangi bir bilgi bulmak neredeyse imkansız . Forumlarda bununla ilgili birkaç soru olmasına rağmen arama kutusuna(search box) " Konuşma Tanıma" yazarak("Speech Recognition") hiçbir yanıt alamadım . Windows web sitesinden Konuşma Tanıma(Speech Recognition) yardımı almak için bu bağlantıyı kullanın : Konuşma Tanıma arama sonuçları(Speech Recognition search results) .

İşte Microsoft'ta (Microsoft)konuşma tanımanın(speech recognition) geçmişinden bahseden kısa bir Wikipedia makalesi(Wikipedia article) : Windows Konuşma Tanıma(Windows Speech Recognition) .

İşte yazarın Konuşma Tanıma(Speech Recognition) ile Dragon Naturally Speaking : Dragon NaturallySpeaking Versus Windows 7 Voice Recognition'ı(Dragon NaturallySpeaking Versus Windows 7 Voice Recognition) karşılaştırma konusundaki düşüncelerini veren bir blog girişi(blog entry) .

Sarmalamak

Konuşma Tanıma(Speech Recognition) ile çalışmaktan ve zaman içinde yapılan iyileştirmelere hayret etmekten gerçekten keyif aldım . Özellikle Microsoft ürünleri ile gündelik günlük kullanım(everyday use) için kesinlikle yeterince iyi olurdu .

Konuşma Tanıma'yı(Speech Recognition) kullanmaya devam edecek miyim ? Evet, yapabildiğim zaman. Bu noktada daha sofistike bir şeye ihtiyacım yok. Onu eğitmek ve doğru kullanmak için kendimi eğitmek için harcadığım zamana değdi.



About the author

Ben profesyonel bir yorumcu ve üretkenlik arttırıcıyım. İnternette video oyunları oynayarak, yeni şeyler keşfetmeyi ve teknoloji ihtiyaçları konusunda insanlara yardım ederek vakit geçirmeyi seviyorum. Xbox ile biraz deneyimim var ve 2009'dan beri müşterilerin sistemlerini güvende tutmalarına yardımcı oluyorum.



Related posts