|
4 kuukautta sitten | |
---|---|---|
.. | ||
script | 4 kuukautta sitten | |
.gitmodules | 4 kuukautta sitten | |
LICENSE | 4 kuukautta sitten | |
README.md | 4 kuukautta sitten | |
afr.traineddata | 4 kuukautta sitten | |
amh.traineddata | 4 kuukautta sitten | |
ara.traineddata | 4 kuukautta sitten | |
asm.traineddata | 4 kuukautta sitten | |
aze.traineddata | 4 kuukautta sitten | |
aze_cyrl.traineddata | 4 kuukautta sitten | |
bel.traineddata | 4 kuukautta sitten | |
ben.traineddata | 4 kuukautta sitten | |
bod.traineddata | 4 kuukautta sitten | |
bos.traineddata | 4 kuukautta sitten | |
bre.traineddata | 4 kuukautta sitten | |
bul.traineddata | 4 kuukautta sitten | |
cat.traineddata | 4 kuukautta sitten | |
ceb.traineddata | 4 kuukautta sitten | |
ces.traineddata | 4 kuukautta sitten | |
chi_sim.traineddata | 4 kuukautta sitten | |
chi_sim_vert.traineddata | 4 kuukautta sitten | |
chi_tra.traineddata | 4 kuukautta sitten | |
chi_tra_vert.traineddata | 4 kuukautta sitten | |
chr.traineddata | 4 kuukautta sitten | |
configs | 4 kuukautta sitten | |
cos.traineddata | 4 kuukautta sitten | |
cym.traineddata | 4 kuukautta sitten | |
dan.traineddata | 4 kuukautta sitten | |
dan_frak.traineddata | 4 kuukautta sitten | |
deu.traineddata | 4 kuukautta sitten | |
deu_frak.traineddata | 4 kuukautta sitten | |
deu_latf.traineddata | 4 kuukautta sitten | |
div.traineddata | 4 kuukautta sitten | |
dzo.traineddata | 4 kuukautta sitten | |
ell.traineddata | 4 kuukautta sitten | |
eng.traineddata | 4 kuukautta sitten | |
enm.traineddata | 4 kuukautta sitten | |
epo.traineddata | 4 kuukautta sitten | |
equ.traineddata | 4 kuukautta sitten | |
est.traineddata | 4 kuukautta sitten | |
eus.traineddata | 4 kuukautta sitten | |
fao.traineddata | 4 kuukautta sitten | |
fas.traineddata | 4 kuukautta sitten | |
fil.traineddata | 4 kuukautta sitten | |
fin.traineddata | 4 kuukautta sitten | |
fra.traineddata | 4 kuukautta sitten | |
frm.traineddata | 4 kuukautta sitten | |
fry.traineddata | 4 kuukautta sitten | |
gla.traineddata | 4 kuukautta sitten | |
gle.traineddata | 4 kuukautta sitten | |
glg.traineddata | 4 kuukautta sitten | |
grc.traineddata | 4 kuukautta sitten | |
guj.traineddata | 4 kuukautta sitten | |
hat.traineddata | 4 kuukautta sitten | |
heb.traineddata | 4 kuukautta sitten | |
hin.traineddata | 4 kuukautta sitten | |
hrv.traineddata | 4 kuukautta sitten | |
hun.traineddata | 4 kuukautta sitten | |
hye.traineddata | 4 kuukautta sitten | |
iku.traineddata | 4 kuukautta sitten | |
ind.traineddata | 4 kuukautta sitten | |
isl.traineddata | 4 kuukautta sitten | |
ita.traineddata | 4 kuukautta sitten | |
ita_old.traineddata | 4 kuukautta sitten | |
jav.traineddata | 4 kuukautta sitten | |
jpn.traineddata | 4 kuukautta sitten | |
jpn_vert.traineddata | 4 kuukautta sitten | |
kan.traineddata | 4 kuukautta sitten | |
kat.traineddata | 4 kuukautta sitten | |
kat_old.traineddata | 4 kuukautta sitten | |
kaz.traineddata | 4 kuukautta sitten | |
khm.traineddata | 4 kuukautta sitten | |
kir.traineddata | 4 kuukautta sitten | |
kmr.traineddata | 4 kuukautta sitten | |
kor.traineddata | 4 kuukautta sitten | |
kor_vert.traineddata | 4 kuukautta sitten | |
lao.traineddata | 4 kuukautta sitten | |
lat.traineddata | 4 kuukautta sitten | |
lav.traineddata | 4 kuukautta sitten | |
lit.traineddata | 4 kuukautta sitten | |
ltz.traineddata | 4 kuukautta sitten | |
mal.traineddata | 4 kuukautta sitten | |
mar.traineddata | 4 kuukautta sitten | |
mkd.traineddata | 4 kuukautta sitten | |
mlt.traineddata | 4 kuukautta sitten | |
mon.traineddata | 4 kuukautta sitten | |
mri.traineddata | 4 kuukautta sitten | |
msa.traineddata | 4 kuukautta sitten | |
mya.traineddata | 4 kuukautta sitten | |
nep.traineddata | 4 kuukautta sitten | |
nld.traineddata | 4 kuukautta sitten | |
nor.traineddata | 4 kuukautta sitten | |
oci.traineddata | 4 kuukautta sitten | |
ori.traineddata | 4 kuukautta sitten | |
osd.traineddata | 4 kuukautta sitten | |
pan.traineddata | 4 kuukautta sitten | |
pdf.ttf | 4 kuukautta sitten | |
pol.traineddata | 4 kuukautta sitten | |
por.traineddata | 4 kuukautta sitten | |
pus.traineddata | 4 kuukautta sitten | |
que.traineddata | 4 kuukautta sitten | |
ron.traineddata | 4 kuukautta sitten | |
rus.traineddata | 4 kuukautta sitten | |
san.traineddata | 4 kuukautta sitten | |
sin.traineddata | 4 kuukautta sitten | |
slk.traineddata | 4 kuukautta sitten | |
slk_frak.traineddata | 4 kuukautta sitten | |
slv.traineddata | 4 kuukautta sitten | |
snd.traineddata | 4 kuukautta sitten | |
spa.traineddata | 4 kuukautta sitten | |
spa_old.traineddata | 4 kuukautta sitten | |
sqi.traineddata | 4 kuukautta sitten | |
srp.traineddata | 4 kuukautta sitten | |
srp_latn.traineddata | 4 kuukautta sitten | |
sun.traineddata | 4 kuukautta sitten | |
swa.traineddata | 4 kuukautta sitten | |
swe.traineddata | 4 kuukautta sitten | |
syr.traineddata | 4 kuukautta sitten | |
tam.traineddata | 4 kuukautta sitten | |
tat.traineddata | 4 kuukautta sitten | |
tel.traineddata | 4 kuukautta sitten | |
tgk.traineddata | 4 kuukautta sitten | |
tgl.traineddata | 4 kuukautta sitten | |
tha.traineddata | 4 kuukautta sitten | |
tir.traineddata | 4 kuukautta sitten | |
ton.traineddata | 4 kuukautta sitten | |
tur.traineddata | 4 kuukautta sitten | |
uig.traineddata | 4 kuukautta sitten | |
ukr.traineddata | 4 kuukautta sitten | |
urd.traineddata | 4 kuukautta sitten | |
uzb.traineddata | 4 kuukautta sitten | |
uzb_cyrl.traineddata | 4 kuukautta sitten | |
vie.traineddata | 4 kuukautta sitten | |
yid.traineddata | 4 kuukautta sitten | |
yor.traineddata | 4 kuukautta sitten |
These language data files only work with Tesseract 4.0.0 and newer versions. They are based on the sources in tesseract-ocr/langdata on GitHub. (still to be updated for 4.0.0 - 20180322)
These have models for legacy tesseract engine (--oem 0) as well as the new LSTM neural net based engine (--oem 1).
The LSTM models (--oem 1) in these files have been updated to the integerized versions of tessdata_best on GitHub. So, they should be faster but probably a little less accurate than tessdata_best.
tessdata_fast on GitHub provides an alternate set of integerized LSTM models which have been built with a smaller network. tessdata_fast files are the ones packaged for Debian and Ubuntu.
The legacy tesseract models (--oem 0) have been removed for Indic and Arabic script language files.
Get language data files for Tesseract 3.04 or 3.05 from the 3.04 tree.
More information and a complete list of all languages is available in the Tesseract wiki.
All data in the repository are licensed under the Apache-2.0 License, see file LICENSE.