Faglitteratur, overført til iPod

Jeg har haft lejlighed til at nørde med et hobby-projekt – at få tekster på papir eller PDF læst op på min iPod. Jeg har efterhånden en hel samling af produkter og fremgangsmåder så jeg tænkte jeg ville dele det her. Ikke fordi det er nemt men måske netop fordi nu har jeg da i det mindste fundet ud af det.

For det første er mit materiale meget forskelligt. Det kan være en fysisk fagbog, en indskannet PDF eller en PDF genereret med tekst indhold. Her handler det om at få teksten ud, så den sidste situation er klart den nemmeste. I de to andre…

En fysisk bog skal skannes ind. Nogen skannere ender med at lave en PDF men jeg sidder med en ældre der bare kan give mig et billede. Ikke noget problem – jeg skærer det lige til og roterer så det passer, hvorefter jeg gemmer hver side som et billede.

Så bruger jeg imagemagick (gratis, open source) og skriver

convert *.jpg document.pdf

Nu har jeg så en indskannet PDF som jeg straks tager over i BRISS (gratis, open source). Jeg har nævnt BRISS før og selvom jeg ikke her bruger det for dets stærkeste feature, så er det eminent til at klippe spalter og billedtekster ud så de kommer i rigtig rækkefølge. Til sidst får jeg en PDF med en side per udklippet element.

Denne PDF skal jeg så have forbi et OCR program, hvor jeg har valgt tesseract (gratis, open source). Det kan man sikkert få på mange måder, og jeg har installeret det gennem pakken FreeOCR, der er en fin lille grænseflade til tesseract. Men i stedet for FreeOCR har jeg et lille script der, igen via imagemagick, tager en side (= et udklippet element, f.eks. en billedtekst eller en spalte) ad gangen fra PDF dokumentet, gemmer det som et billede og kører det igennem tesseract.

Jeg vil ikke gengive scriptet her men jeg bruger f.eks.

identify -format %n "FILENAME"      // returnerer antal 
                                    // sider i dokumentet

convert -density 300 "FILENAME[SIDENR]" "TEMP.PNG"
                                    // gemmer en side som
                                    // billede

tesseract "TEMP.PNG" "TEMP.TXT"     // udfører OCR på
                                    // billedet

(jeg har selvfølgelig sørget for at jeg kan køre flere på samme tid uden at det giver problemer – kodeeksemplerne er bare eksempler)

Til sidst får jeg et tekstdokument, som jeg så, desværre, manuelt skal gennemgå for evt. OCR fejl. Jeg bruger bare Notepad++ (gratis, open source). Det tager desværre lidt tid ved nogle dokumenter, afhængigt af indskanningskvaliteten og konkrete udfordringer med materialet – formler er f.eks. aldrig godt.

Så holder de gratis glæder til gengæld, i hvert fald om nogle dage. For det bedste program til at læse teksterne er efter min mening Ivona (ikke gratis, proprietært) og det har kun gratis at bruge til privat brug i 30 dage. Efter den tid må jeg finde et alternativ, men Ivona er eminent. Der er i øvrigt både engelske, amerikanske og danske stemmer,  udover naturligvis en mængde andre.

Ivona generer MP3 filer (eller Ogg) og nu vil jeg jo gerne have dem over på min iPod. Så tilbage til de gratis glæder med Chapter and Verse (gratis, proprietært) hvor jeg hurtigt kan få samlet MP3 filerne og konverteret dem til M4B, der er Apple’s foretrukne format til lydbøger. Chapter and Verse bruger iTunes (“gratis”, proprietært, horribelt) i baggrunden men det er prisen hvis man vil encode lydfiler efter MPEG-4 part 14 uden at betale.

Til sidst skal jeg også bruge iTunes til at overføre lydfilen til min iPod men det vil jeg helst ikke tale om.

Kort sagt, som nørd har man altid noget at lave.

Dette indlæg blev udgivet i Udvikling og tagget , , , , , , , , , , . Bogmærk permalinket.

Et svar til Faglitteratur, overført til iPod

  1. Pingback: Programmeringsnoter | Hennings blog

Skriv et svar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out / Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out / Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out / Skift )

Google+ photo

Du kommenterer med din Google+ konto. Log Out / Skift )

Connecting to %s