OCR: Aithint Optúil Carachtar

Aithint Optúil Carachtar don aistriúchán.

Seasann OCR d’aithint optúil carachtar. Úsáidtear bogearraí OCR chun comhaid amhail PDFanna nó facsanna a thiontú go doiciméid ineagarthóireachta mar Microsoft Word. Déantar é sin sula gcuirtear faoi obair aistriúcháin.

Is féidir OCR a úsáid freisin chun doiciméad a athchruthú nuair atá na bunleaganacha caillte agat.

Tiontú

Cén fáth a bhfuil gá dúinn comhaid a thiontú?

Ní comhaid ineagarthóireachta iad comhaid PDF. Ní hiad na bunchomhaid fhoinseacha iad. Mura féidir linn an comhad a eagrú, ní féidir linn é a aistriú. Mar sin, ní mór dúinn iad a thiontú i bhformaid atáimid in ann a chur in eagar agus mionathruithe a dhéanamh air. Is féidir an próiseas seo a dhéanamh le OCR. Ceadaíonn bogearraí OCR comhaid PDF a thiontú go comhaid Microsoft Word chun iad a aistriú. Is féidir leis facsanna a thiontú go formáidí ineagarthóireachta freisin.

What is OCR?

An Próiseas Aistriúcháin

Sula dtosaíonn an t-aistriúchán ní mór dúinn an comhad a thiontú, lena n-áirítear an leagan amach, ag baint úsáid as bogearraí Foilsitheoireachta Deisce (DTP) agus bogearraí OCR. Go bunúsach, déanaimid do chomhad a athchruthú in Microsoft Word – an leagan amach, téacs, grafaicí etc. Déanaimid athbhreithniú ansin ar an doiciméad chun aon earráidí abairte nó earráidí deighleáin a cheartú, chun a chinntiú go mbeidh an doiciméad aistrithe foirfe duit. Tá go leor oibre i gceist leis an bpróiseas seo. Nuair atá sé críochnaithe, déanann sé an próiseas aistriúcháin i bhfad níos éasca don aistritheoir.

Cad iad na bealaí éagsúla le comhad a thiontú?

Ag brath ar an gcaoi ar cuireadh an PDF ar fáil, mura bhfuil sa doiciméad ach téacs is féidir a roghnú, is féidir an téacs a chóipeáil agus a ghreamú isteach i ndoiciméad Word. Tá gnéithe slándála ag roinnt PDFanna a chuireann cosc ar chóipeáil agus ar ghreamú.

Más doiciméad scanta é an PDF nó mura féidir an téacs a roghnú, bíonn gá le bogearraí OCR a úsáid. Déanann an uirlis OCR scanadh ar gach carachtar mar íomhá agus déanann sé iarracht é a thiontú ina charachtar ineagarthóireachta in Microsoft Word. Tá sé thart ar 95% cruinn agus déantar jab iontach leis. An pháirt is deacra ná an leagan amach a choinneáil.

Cén fáth go bhfuil sé níos fearr OCR a sheachaint?

Costas agus am an dá phrómhchúis le OCR a sheachaint. Tógann sé am comhad PDF a thiontú; beidh tionchar aige ar do sceideal seachadta. Mar gheall ar an obair bhreise atá ag baint le doiciméid a thiontú agus a sheiceáil, bíonn orainn costais thiontaithe a ghearradh chun an obair seo a dhéanamh.

Cúis eile ná Cáilíocht; laghdaíonn an próiseas tiontaithe an caighdeán a bheidh ar do chuid doiciméad críochnaithe. Is féidir le híomhánna díghrádú beagán ag brath ar na taifigh a úsáidtear. Cuirimid caighdeán iontach ar fáil ach is annamh a bhímid in ann an caighdeán céanna atá ag an mbundoiciméad a bhaint amach le OCR. Is fearr i gcónaí oibriú leis na bunchomhaid fhoinseacha chun an caighdeán is airde a fháil ar an aschur.