Eazin d9a464bc9c 20250205 4 kuukautta sitten
..
script d9a464bc9c 20250205 4 kuukautta sitten
.gitmodules d9a464bc9c 20250205 4 kuukautta sitten
LICENSE d9a464bc9c 20250205 4 kuukautta sitten
README.md d9a464bc9c 20250205 4 kuukautta sitten
afr.traineddata d9a464bc9c 20250205 4 kuukautta sitten
amh.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ara.traineddata d9a464bc9c 20250205 4 kuukautta sitten
asm.traineddata d9a464bc9c 20250205 4 kuukautta sitten
aze.traineddata d9a464bc9c 20250205 4 kuukautta sitten
aze_cyrl.traineddata d9a464bc9c 20250205 4 kuukautta sitten
bel.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ben.traineddata d9a464bc9c 20250205 4 kuukautta sitten
bod.traineddata d9a464bc9c 20250205 4 kuukautta sitten
bos.traineddata d9a464bc9c 20250205 4 kuukautta sitten
bre.traineddata d9a464bc9c 20250205 4 kuukautta sitten
bul.traineddata d9a464bc9c 20250205 4 kuukautta sitten
cat.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ceb.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ces.traineddata d9a464bc9c 20250205 4 kuukautta sitten
chi_sim.traineddata d9a464bc9c 20250205 4 kuukautta sitten
chi_sim_vert.traineddata d9a464bc9c 20250205 4 kuukautta sitten
chi_tra.traineddata d9a464bc9c 20250205 4 kuukautta sitten
chi_tra_vert.traineddata d9a464bc9c 20250205 4 kuukautta sitten
chr.traineddata d9a464bc9c 20250205 4 kuukautta sitten
configs d9a464bc9c 20250205 4 kuukautta sitten
cos.traineddata d9a464bc9c 20250205 4 kuukautta sitten
cym.traineddata d9a464bc9c 20250205 4 kuukautta sitten
dan.traineddata d9a464bc9c 20250205 4 kuukautta sitten
dan_frak.traineddata d9a464bc9c 20250205 4 kuukautta sitten
deu.traineddata d9a464bc9c 20250205 4 kuukautta sitten
deu_frak.traineddata d9a464bc9c 20250205 4 kuukautta sitten
deu_latf.traineddata d9a464bc9c 20250205 4 kuukautta sitten
div.traineddata d9a464bc9c 20250205 4 kuukautta sitten
dzo.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ell.traineddata d9a464bc9c 20250205 4 kuukautta sitten
eng.traineddata d9a464bc9c 20250205 4 kuukautta sitten
enm.traineddata d9a464bc9c 20250205 4 kuukautta sitten
epo.traineddata d9a464bc9c 20250205 4 kuukautta sitten
equ.traineddata d9a464bc9c 20250205 4 kuukautta sitten
est.traineddata d9a464bc9c 20250205 4 kuukautta sitten
eus.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fao.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fas.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fil.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fin.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fra.traineddata d9a464bc9c 20250205 4 kuukautta sitten
frm.traineddata d9a464bc9c 20250205 4 kuukautta sitten
fry.traineddata d9a464bc9c 20250205 4 kuukautta sitten
gla.traineddata d9a464bc9c 20250205 4 kuukautta sitten
gle.traineddata d9a464bc9c 20250205 4 kuukautta sitten
glg.traineddata d9a464bc9c 20250205 4 kuukautta sitten
grc.traineddata d9a464bc9c 20250205 4 kuukautta sitten
guj.traineddata d9a464bc9c 20250205 4 kuukautta sitten
hat.traineddata d9a464bc9c 20250205 4 kuukautta sitten
heb.traineddata d9a464bc9c 20250205 4 kuukautta sitten
hin.traineddata d9a464bc9c 20250205 4 kuukautta sitten
hrv.traineddata d9a464bc9c 20250205 4 kuukautta sitten
hun.traineddata d9a464bc9c 20250205 4 kuukautta sitten
hye.traineddata d9a464bc9c 20250205 4 kuukautta sitten
iku.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ind.traineddata d9a464bc9c 20250205 4 kuukautta sitten
isl.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ita.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ita_old.traineddata d9a464bc9c 20250205 4 kuukautta sitten
jav.traineddata d9a464bc9c 20250205 4 kuukautta sitten
jpn.traineddata d9a464bc9c 20250205 4 kuukautta sitten
jpn_vert.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kan.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kat.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kat_old.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kaz.traineddata d9a464bc9c 20250205 4 kuukautta sitten
khm.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kir.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kmr.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kor.traineddata d9a464bc9c 20250205 4 kuukautta sitten
kor_vert.traineddata d9a464bc9c 20250205 4 kuukautta sitten
lao.traineddata d9a464bc9c 20250205 4 kuukautta sitten
lat.traineddata d9a464bc9c 20250205 4 kuukautta sitten
lav.traineddata d9a464bc9c 20250205 4 kuukautta sitten
lit.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ltz.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mal.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mar.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mkd.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mlt.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mon.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mri.traineddata d9a464bc9c 20250205 4 kuukautta sitten
msa.traineddata d9a464bc9c 20250205 4 kuukautta sitten
mya.traineddata d9a464bc9c 20250205 4 kuukautta sitten
nep.traineddata d9a464bc9c 20250205 4 kuukautta sitten
nld.traineddata d9a464bc9c 20250205 4 kuukautta sitten
nor.traineddata d9a464bc9c 20250205 4 kuukautta sitten
oci.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ori.traineddata d9a464bc9c 20250205 4 kuukautta sitten
osd.traineddata d9a464bc9c 20250205 4 kuukautta sitten
pan.traineddata d9a464bc9c 20250205 4 kuukautta sitten
pdf.ttf d9a464bc9c 20250205 4 kuukautta sitten
pol.traineddata d9a464bc9c 20250205 4 kuukautta sitten
por.traineddata d9a464bc9c 20250205 4 kuukautta sitten
pus.traineddata d9a464bc9c 20250205 4 kuukautta sitten
que.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ron.traineddata d9a464bc9c 20250205 4 kuukautta sitten
rus.traineddata d9a464bc9c 20250205 4 kuukautta sitten
san.traineddata d9a464bc9c 20250205 4 kuukautta sitten
sin.traineddata d9a464bc9c 20250205 4 kuukautta sitten
slk.traineddata d9a464bc9c 20250205 4 kuukautta sitten
slk_frak.traineddata d9a464bc9c 20250205 4 kuukautta sitten
slv.traineddata d9a464bc9c 20250205 4 kuukautta sitten
snd.traineddata d9a464bc9c 20250205 4 kuukautta sitten
spa.traineddata d9a464bc9c 20250205 4 kuukautta sitten
spa_old.traineddata d9a464bc9c 20250205 4 kuukautta sitten
sqi.traineddata d9a464bc9c 20250205 4 kuukautta sitten
srp.traineddata d9a464bc9c 20250205 4 kuukautta sitten
srp_latn.traineddata d9a464bc9c 20250205 4 kuukautta sitten
sun.traineddata d9a464bc9c 20250205 4 kuukautta sitten
swa.traineddata d9a464bc9c 20250205 4 kuukautta sitten
swe.traineddata d9a464bc9c 20250205 4 kuukautta sitten
syr.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tam.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tat.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tel.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tgk.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tgl.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tha.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tir.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ton.traineddata d9a464bc9c 20250205 4 kuukautta sitten
tur.traineddata d9a464bc9c 20250205 4 kuukautta sitten
uig.traineddata d9a464bc9c 20250205 4 kuukautta sitten
ukr.traineddata d9a464bc9c 20250205 4 kuukautta sitten
urd.traineddata d9a464bc9c 20250205 4 kuukautta sitten
uzb.traineddata d9a464bc9c 20250205 4 kuukautta sitten
uzb_cyrl.traineddata d9a464bc9c 20250205 4 kuukautta sitten
vie.traineddata d9a464bc9c 20250205 4 kuukautta sitten
yid.traineddata d9a464bc9c 20250205 4 kuukautta sitten
yor.traineddata d9a464bc9c 20250205 4 kuukautta sitten

README.md

tessdata

These language data files only work with Tesseract 4.0.0 and newer versions. They are based on the sources in tesseract-ocr/langdata on GitHub. (still to be updated for 4.0.0 - 20180322)

These have models for legacy tesseract engine (--oem 0) as well as the new LSTM neural net based engine (--oem 1).

The LSTM models (--oem 1) in these files have been updated to the integerized versions of tessdata_best on GitHub. So, they should be faster but probably a little less accurate than tessdata_best.

tessdata_fast on GitHub provides an alternate set of integerized LSTM models which have been built with a smaller network. tessdata_fast files are the ones packaged for Debian and Ubuntu.

The legacy tesseract models (--oem 0) have been removed for Indic and Arabic script language files.

tessdata for 3.04 or 3.05

Get language data files for Tesseract 3.04 or 3.05 from the 3.04 tree.

More information and a complete list of all languages is available in the Tesseract wiki.

All data in the repository are licensed under the Apache-2.0 License, see file LICENSE.