oudhollands scannen en tekstherkenning (OCR)

Plaats reactie
houtworm

oudhollands scannen en tekstherkenning (OCR)

Bericht door houtworm »

Ik heb geprobeerd om tekst te scannen en met een ocr programma om te zetten naar een tekstbestand maar dat programma bakt er niets van.
Nu heb ik ook een programma gevonden dat je kunt trainen maar de kwaliteit van het drukwerk is niet goed genoeg volgens mij want er wordt nog te veel niet herkend.
Heeft iemand hier ervaring mee? Is het te doen? Of kan ik beter de tekst gewoon overtypen.
Ik werk normaal gesproken met linux. Scannen doe ik met Xsane en Gocr als ocr programma, dat het best wel aardig doet verder.
Het leek me toch wel leuk om een paar boeken beschikbaar te kunnen stellen.
Lecram

Bericht door Lecram »

Ja, moet natuurlijk niet met Linux proberen te scannen. Probeer eens die perfect werkende software van Microsoft, die heet Windows. Er zal een wereld voor je opengaan.
:eur:eur:bo:P
houtworm

Bericht door houtworm »

Oorspronkelijk gepost door Lecram
Ja, moet natuurlijk niet met Linux proberen te scannen. Probeer eens die perfect werkende software van Microsoft, die heet Windows. Er zal een wereld voor je opengaan.
:eur:eur:bo:P
Die wereld wil voor mij niet open gaan.
Ik heb net die super software van ome bill geprobeerd maar die bakt er nog minder van dan mijn linux software waaraan ik al een aantal gotische letters heb geleerd.
Je weet toch wel wat oud hollandse letters zijn? Het gaat om een boek uit 1777 en het drukwerk is niet zo perfekt.
Maar als je mij software kunt noemen dat zulke tekst goed kan omzetten dan wil ik dat wel proberen.


--Kees
Jelle

Bericht door Jelle »

Kees, Ik werk zelf met het programma "Omnipage" maar dat is een versie geschikt voor Macintosh, maar volgens mij ook te verkrijgen onder Linux en Windows.
Het werkt bij mij in elk geval goed. Volgens mij zijn er ook oud hollandse letterfonten te koop en het zou dan dus jou oud hollandse tekstenmoeten kunnen scannen.
Bij redelijk goede tekst zet het programma toch wel 95% goed om, maar als het erg slecht wordt kan je beter zelf helemaal overtypen want dan kost het corrigeren meer tijd.
Succes ermee.
WSO
Berichten: 607
Lid geworden op: 11 jun 2002, 16:02

Bericht door WSO »

Omnipage vraagt steeds wat er staat als hij het niet begrijpt en zo kun je hem steeds meer laten leren.
Wil je het 'vertalen' uit Gotisch in Romeins schrift? Zal ik ook eens proberen.
Lecram

Bericht door Lecram »

Overigens gebruik ik zelf ook Omnipage, naar volle tevredenheid. Ook geschikt om PDF naar Word om te zetten enzo.

http://www.scansoft.com/omnipage/

[Aangepast op 31/7/03 door Lecram]
houtworm

Bericht door houtworm »

Oorspronkelijk gepost door Jelle
Kees, Ik werk zelf met het programma "Omnipage"
Bij mijn scanner zat ook software en de kreet 'omnipage' klinkt me wel bekend in de oren. Misschien zit het er ook wel bij :-)
maar als het erg slecht wordt kan je beter zelf helemaal overtypen want dan kost het corrigeren meer tijd.
Ja ik denk dat het daarop neerkomt. Veel letters lijken zo op elkaar, 'v' 'd' 'b' en ze 'z' die soms weer een 's' moet zijn enz., zo blijf je verbeteren. Ik denk dat overtypen het snelst werkt, dan leer ik er zelf ook nog wat van :-)
Succes ermee.
bedankt!


--Kees
Plaats reactie