ocr

optical character recognition.. scan edilmi$ bir image'in neural network benzeri bir sistemle text'e donu$turulmesi..

ssg

16.01.2000 23:05
abby fine reader , docscan ve readiris en kullanisli olanlaridir. ozellikle kitap veya dergilerden alintilar yapmasi gereken insanlar icin olmazsa olmazlardir.

emresumer

20.05.2004 08:40
ey çevirmen. bu öyle bir icattır ki, sana hard copy olarak gelen ve nşa'da çeviri için harcayacağın zamanı en iyimser tahminle 1,5 katına çıkaracak olan projelerini, tarayıcın filan yoksa bile dijital fotoğraf makinanla çeker, jpegleri de acrobat 9 veya 10 professional'a sürükler ve metne dönüştürebilirsin. sonra da word dokümanına dönüştürür, atraksiyondan atraksiyona koşarsın.

not: fotoğraf çekerken sallamamaya dikkat et.

jamsession

27.07.2010 13:44 ~ 13:52
tez yazilir kavraminin tarih olmasi

usul dune

21.09.2006 03:08

metin okuma programıyla birlikte kullanıldığında görme engellilerin hayatını birçok yönden çok kolaylaştıran bir icattır.

matarama su ko

17.10.2004 10:38
http://www.newocr.com/

bleifrei

13.11.2012 14:09
ocr yazılımlarının karakter tanımlaması icin temel olarak üc yöntem vardir.

- matrix matching (matris esleme): bu yöntemde ocr yazilimi, karsilasmasi muhtemel tum karakterlerin goruntusunu iceriginde tutar. sonra taranmis dokumandaki karakterler ile icerigini karsilastirir ve olayi hizli bir sekilde tamamlar.

- feature analysis (icerik analizi): bu yontemdeyse yazilim karakterlerin goruntusunu degil, tanimlarini aklinda tutar. yani karakteri tanimak icin bir cok ozelligine bakar: kac tane duz cizgi var, bunlarin kaci dikey kaci yatay, yuvarlak koselerin konumlari neler, karakterde delikler var mi vesaire gibi. tanimlama kriterleri böyle her karakter icin alisıldik olunca, genel kuralina uygun yazilmis hemen her karakterin taninmasi mumkun hale gelir. bu durumda karakterin sekli genel karakter kurallarina uydugu surece karakter tanimlama icin fontlarin onemi yoktur.

- self-assertion (ozgun tanimlama): bu da yukaridaki iki yöntemin birlesmesidir. once dokuman icerik analizi yontemiyle taranarak genel bir tablo olusturulur ve bu sayede kesinligi yuksek karakterler bir kenara ayrilarak bunlardan bir matris olusturulur. daha sonra bu kez emin olmayan karakterler, bu yeni elde edilen matristeki karakter tablolariyla karsilastirilarak "benzetilmeye" calisilir. yani sistem once icerik analiziyle kesinlikle a olduguna emin oldugu bir a yakalayarak bunun fotografini ceker. daha sonra da bu a harfinin goruntusunu a oldugundan emin olamadigi, fakat a'ya benzedigini dusüundugu karakterlerle karsilastirip ortak noktalarina bakarak gercekten a olup olmadigina karar verir.

(bkz: http://www.pcmagazine.com.tr/…i/nisan2001/kapak.htm)

bumerang

15.11.2001 10:06
olurda ocr ile scanleyip final icin calisicaginiz textleriniz varsa altlarini kalem ile cizmeyin lakin ocr sapitabilir, uzulursunuz sonra. ben yedim siz yemeyin

nitro

07.06.2004 22:33
ücretsiz, türkçeyyi tanıyan basit bir program arıyorsanız: (bkz: #64634669)

aegeus

11.12.2016 16:29
resim formatındaki yani imleç ile seçip kopyalayamadığınız yazıyı text'e dönüştürme işlemidir. yazıyı text'e çevirirken aklınıza gelen her formatta kaydedebilirsiniz elinizdeki dosyaları. tez yazdığım zamanlarda inanılmaz kolaylık sağlamıştı bana. en az 1 hafta kazandım sayesinde. neyse ocr için kullanabileceğiniz öne çıkan yazılımlar (readiris, finereader, able2extract) dışındakileri kullanarak vakit kaybetmemenizi öneririm.

readiris ve finereader'in kendilerine has özellikleri olduğu için şu daha iyidir diyemem. çevirme kaliteleri birbirine yakın. arayüzleri olsun, hızları olsun kullanılabilirlik bakımından gayet başarılılar. ama able2extract performans olarak bu ikisinin baya bi altında kalıyor.

her neyse daha da iyi anlayabilmeniz için sizi şöyle alayım.
deneme yaptığım dosya
readiris performansı
finereader performansı
able2extract performansı

bir de bunların yanında project naptha var google chrome eklentisi. tabi bu eklenti, yazılımlar kadar başarılı değil. hatta bazen insanı çileden çıkartıyor. ama yine de iş görür.

edit: linkler düzeltildi.

mandalyat

31.01.2016 00:16 ~ 18.12.2021 18:20