korisni članci

Kako mogu stvoriti arhivu PDF-ova koja se može pretraživati?

U ovotjednom stupcu tehničkih savjeta na Goldavelez.com - nastavite postavljati pitanja, narode! - pomažemo čitatelju koji ima previše važnih radova koji trebaju učiniti čarobni prijelaz u digitalno područje. Barem, to zvuči mnogo uzbudljivije od „Optičkog prepoznavanja znakova“, koji se zapravo ne odvaja od jezika.

Čitatelj Goldavelez.com Phil piše:

Hvala na lijepim riječima, Phil! Sretna sam što mogu pomoći - ne zbog laskanja, nego zato što je vaše pitanje vjerojatno puno čitatelja (uključujući i mene). Imam čitav gomilu stvari koje bih volio premjestiti iz fizičkog u digitalni, tako da mogu Marie Kondo originalne dokumente i fotografije izgubiti u zaborav. Gomile papira ne donose mi radost.

Imate nekoliko opcija koje možete isprobati. Počeo bih s očiglednim: Googleom. Pretpostavimo da stvarate PDF datoteke, prenesite svoje datoteke na Google pogon. Desnim klikom na bilo koji pojedinačni PDF, pokažite mišem iznad "Otvori sa" i odaberite "Google dokumenti." Google će pokušati pokrenuti neki OCR na vašem PDF-u, a rezultirajuću datoteku trebali biste moći spremiti kao dokument. Zatim možete pretražiti ovaj dokument (i sve ostale koje pretvorite) putem samog Diska.

Ipak, što više razmišljam o tome, ipak mi se rješenje čini pomalo nelegantnim s obzirom na to koliko datoteka morate raditi. Umjesto toga, možda bih mogao isprobati dio softvera poput TesseractStudio.Net - ili samo Tesseract OCR, ako se ne bojite naredbenog retka. Ovo biste trebali moći koristiti za stvaranje OCR podataka iz datoteka, a zatim ih možete izravno pretraživati ​​putem Windows-a ili macOS-a. OCRmyPDF je druga opcija koja je slična Tesseract OCR-u, ali opet, igrat ćete se upisanim naredbama za primjenu OCR-a na vaše datoteke. Ne postoji GUI niti postoji (izravna) Windows podrška.

Tu je i Paperwork, alat za katalogiziranje otvorenog koda dokumenata koji dolazi s ugrađenim OCR-om, što bih definitivno uzeo u obzir s obzirom na to da je dizajniran kao sve-u-jednom komad softvera za arhiviranje, razvrstavanje i pretraživanje dokumenata. Zvuči kao da može biti upravo ono što tražite.

Nisam koristio PDF-XChange Viewer, ali drugi su ga preporučili kao opciju. Besplatna verzija ubacuje vodene žigove u vaše PDF datoteke, ali može stvoriti PDF datoteke iz slika i, ako sam u pravu, dodati OCR ovim postojećim PDF datotekama. Vrijedno je istražiti, čak i ako nije idealno (besplatno) rješenje. Slično tome, FreeOCR može snimiti vaše slike ili PDF datoteke, primijeniti OCR i rezultate izvesti u obliku tekstualnih datoteka ili Word dokumenata. Ako vam ne smeta pretraživanje na taj način po arhivima, to je opcija.

Što se tiče plaćenih rješenja, tu su uvijek Adobe Acrobat Pro ili Foxit PhantomPDF . Oboje će vam omogućiti dodavanje OCR-a u PDF datoteke, a vi biste trebali moći obraditi sve svoje dokumente kao veliku seriju (ili stvoriti skriptu koja to čini s vrijednošću sadržaja mapa). Ovo bi vam se moglo dogoditi tijekom besplatnih suđenja aplikacija, ako one ne ograničavaju svoje OCR mogućnosti. Vidio sam i da drugi s vašim posebnim problemom postižu uspjeh pomoću aplikacije poput PDF OCR, što bi mogla biti jeftinija alternativa.

To je sve što mogu pomisliti s vrha glave (i uz malo istraživanja). Nadamo se da jedno od tih rješenja djeluje za vas - a da vas ne košta malo bogatstva. Pišite mi i javite mi koja vam aplikacija najbolje radi!

Tech 911 Imate li tehničko pitanje koje vas drži noću? Voljeli bismo odgovoriti na to! Pošaljite e s "Tech 911" u naslovnoj liniji.