Tesseract.js bringer bilde OCR-oversettelse til nettlesere

OCR-oversettelsen er fortsatt ikke perfekt, men den har forbedret seg dramatisk de siste årene. Forresten er Tesseract oversettelsesmotor for tiden åpen hentet i C++.

Selv om dette er et utrolig bibliotek, er det imidlertid begrenset til programvare. Heldigvis gjorde noen en Tesseract-port til JavaScript som heter Tesseract.js. Den støtter opptil 60 språk og mens det absolutt ikke er perfekt, gjør det jobben bra.

Installasjon og oppsett er en bris hvor du kan målrett et bildeelement på siden og kjør Tesseract.recognize () funksjon. Dette kan ta alle typer bilder, og det blir automatisk komprimere og oversette rett i nettleseren.

Du kan bli mye mer komplisert, men skjønnheten er hvordan du kan kjøre OCR med en enkelt linje med kode.

Ta en titt på Tesseract.js destinasjonsside hvis du vil se en live demo. Dette fungerer rett i nettleseren hvor du kan dra og slipp et skannet bilde av tekst for å få en automatisk OCR-oversettelse.

Du kan også laste ned dette eksemplet lokalt via GitHub-siden, eller du kan bygge din egen app ved å inkludere Tesseract.js-skriptet rett fra en CDN.

Det enkleste kodeeksemplet ser ut som følgende hvor myImage er en direkte referanse til et HTML-bildeelement:

 Tesseract.recognize (myImage) .then (funksjon (resultat) console.log (result));

Uansett er dette biblioteket så nyttig å komme seg med OCR på nettet. Det er langt fra perfekt, men det er også det beste ressurs for webutviklere som vil ha dynamisk OCR-funksjonalitet på siden.

For å lære mer, besøk Tesseract.js GitHub-siden der du kan sjekke ut en live demo og bla gjennom online dokumentasjonen.