• optical character recognition.. scan edilmi$ bir image'in neural network benzeri bir sistemle text'e donu$turulmesi..
  • abby fine reader , docscan ve readiris en kullanisli olanlaridir. ozellikle kitap veya dergilerden alintilar yapmasi gereken insanlar icin olmazsa olmazlardir.
  • ey çevirmen. bu öyle bir icattır ki, sana hard copy olarak gelen ve nşa'da çeviri için harcayacağın zamanı en iyimser tahminle 1,5 katına çıkaracak olan projelerini, tarayıcın filan yoksa bile dijital fotoğraf makinanla çeker, jpegleri de acrobat 9 veya 10 professional'a sürükler ve metne dönüştürebilirsin. sonra da word dokümanına dönüştürür, atraksiyondan atraksiyona koşarsın.

    not: fotoğraf çekerken sallamamaya dikkat et.
  • tez yazilir kavraminin tarih olmasi
  • metin okuma programıyla birlikte kullanıldığında görme engellilerin hayatını birçok yönden çok kolaylaştıran bir icattır.
  • ocr yazılımlarının karakter tanımlaması icin temel olarak üc yöntem vardir.

    - matrix matching (matris esleme): bu yöntemde ocr yazilimi, karsilasmasi muhtemel tum karakterlerin goruntusunu iceriginde tutar. sonra taranmis dokumandaki karakterler ile icerigini karsilastirir ve olayi hizli bir sekilde tamamlar.

    - feature analysis (icerik analizi): bu yontemdeyse yazilim karakterlerin goruntusunu degil, tanimlarini aklinda tutar. yani karakteri tanimak icin bir cok ozelligine bakar: kac tane duz cizgi var, bunlarin kaci dikey kaci yatay, yuvarlak koselerin konumlari neler, karakterde delikler var mi vesaire gibi. tanimlama kriterleri böyle her karakter icin alisıldik olunca, genel kuralina uygun yazilmis hemen her karakterin taninmasi mumkun hale gelir. bu durumda karakterin sekli genel karakter kurallarina uydugu surece karakter tanimlama icin fontlarin onemi yoktur.

    - self-assertion (ozgun tanimlama): bu da yukaridaki iki yöntemin birlesmesidir. once dokuman icerik analizi yontemiyle taranarak genel bir tablo olusturulur ve bu sayede kesinligi yuksek karakterler bir kenara ayrilarak bunlardan bir matris olusturulur. daha sonra bu kez emin olmayan karakterler, bu yeni elde edilen matristeki karakter tablolariyla karsilastirilarak "benzetilmeye" calisilir. yani sistem once icerik analiziyle kesinlikle a olduguna emin oldugu bir a yakalayarak bunun fotografini ceker. daha sonra da bu a harfinin goruntusunu a oldugundan emin olamadigi, fakat a'ya benzedigini dusüundugu karakterlerle karsilastirip ortak noktalarina bakarak gercekten a olup olmadigina karar verir.

    (bkz: http://www.pcmagazine.com.tr/…i/nisan2001/kapak.htm)
  • olurda ocr ile scanleyip final icin calisicaginiz textleriniz varsa altlarini kalem ile cizmeyin lakin ocr sapitabilir, uzulursunuz sonra. ben yedim siz yemeyin
  • ücretsiz, türkçeyyi tanıyan basit bir program arıyorsanız: (bkz: #64634669)
  • resim formatındaki yani imleç ile seçip kopyalayamadığınız yazıyı text'e dönüştürme işlemidir. yazıyı text'e çevirirken aklınıza gelen her formatta kaydedebilirsiniz elinizdeki dosyaları. tez yazdığım zamanlarda inanılmaz kolaylık sağlamıştı bana. en az 1 hafta kazandım sayesinde. neyse ocr için kullanabileceğiniz öne çıkan yazılımlar (readiris, finereader, able2extract) dışındakileri kullanarak vakit kaybetmemenizi öneririm.

    readiris ve finereader'in kendilerine has özellikleri olduğu için şu daha iyidir diyemem. çevirme kaliteleri birbirine yakın. arayüzleri olsun, hızları olsun kullanılabilirlik bakımından gayet başarılılar. ama able2extract performans olarak bu ikisinin baya bi altında kalıyor.

    her neyse daha da iyi anlayabilmeniz için sizi şöyle alayım.
    deneme yaptığım dosya
    readiris performansı
    finereader performansı
    able2extract performansı

    bir de bunların yanında project naptha var google chrome eklentisi. tabi bu eklenti, yazılımlar kadar başarılı değil. hatta bazen insanı çileden çıkartıyor. ama yine de iş görür.

    edit: linkler düzeltildi.
hesabın var mı? giriş yap