Stránka 1 z 1

Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: úte kvě 19, 2015 10:14 pm
od cuting
Rád bych si převedl do elektronické podoby doma svépomocí 3 knížky , které už nikdy nekoupím. Jasně, existuje x firem a lidí, kteří se tím živí ale mě nejde o obživu jejich ani svou , jen bych si rád převedl do elektronické podoby tyto knížky sám.
Jaké máte kdo zkušenosti s touto prací ? Ano, potřebuji scaner., ten mám. Ale jaký další software PRO MAC budu pro následný převod z obrázků do textové podoby potřebovat ? A jak to nakonec dostat do finální podoby ? Můžete někdo poradit , jak na to ? Myslím, že to bude zajímavé nejenom pro mne . Díky.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 6:58 am
od Clon
Popravde - zkusenosti nemam. Ale predpokladal bych nejaky program typu Abby FineReader

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 7:04 am
od Anndy
Môžeš to urobiť aj úplne "tupo" a amatérsky. T.J. dnes bežný software scanneru ponuka skenovanie s rozpoznaním textu (ocr). Čiže naskenujes priamo do wordu / Pages. Tam to celé následne upravíš a opravíš k čo najviac podobe originálu. A potom napr. cez free sw calibre prevedieš do finálneho elektronického formátu.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 7:25 am
od ls8
Zkušenosti mám, skenuju si knížky. Po naskenování nejméně na 300DPI v aplikaci Image Capture (součást OSX) používám na OCR aplikaci ABBYY FineReader Express 8, několik let starou verzi, kterou jsem před časem koupil v nějaké akci. Úspěšnost rozpoznání českého textu je vynijající, o slova rozdělená na dva řádky umí správně složit dohromady, má integrovaný slovník, takže umí česká slova doopravit podle slovníku. Formátování je ale nepoužitelné. Používám převod do RTF, pak z toho komplet odstraním formátování (paste do Fraise a copy zpět do clipboardu). Takto neformátovaný text pak vložím do Pages a tam ručně opravím formátování tak, aby co nejvíc odpovídalo originálu. Ze stylů používám jen "Heading" pro názvy kapitol, zbytek mám jako "Body". Nakonec v Pages vložím (na začátek souboru hned za obal) Table of Contents, zapnu jen zobrazení "Heading" a vyexportuju přímo jako ePub. Převod z ePub do MOBI (Kindle) řeším v Calibre. S jednou knížkou si hraju i několik dnů, ale výsledek je většinou OK.

Asi to jde i sofistikovaněji, třeba v iBook Author?

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 8:23 am
od cuting
Díky. Zkusím oba postupy. Snad to zvládnu. :) Ten iBook Author je pro tvorbu knížek, je koukám i v češtině, ale nejsem si jistý, jestli umí převádět a formátovat na OCR nascanované stránky textu.... S tím zkušenosti nemáš ?

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 8:42 am
od ls8
Ne, OCR musíš udělat stejně samostatně, jen ti to pomůže text lépe formátovat, aby z toho vznikl hezký eBook.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 9:24 am
od Anndy
Ano zabudol som, ze pages vie priamo ebook exportovat. A ak by sa ti nechcelo ocr soft riesit, bezne skenovacie softy (dodavane ku skeneru) to dokazu tiez, aspon tie od HP. Mozno spravia viac chyb, ale aj tak to musis cele prejst.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 9:49 am
od cuting
Takže jestli dobře rozumím - naskanovat to přímo s OCR , jestli to muj scaner umí, to se musím podívat, pak v Pages projít stránku po stránce, opravit chyby a formátování a nakonec vyexportovat např. v epub ?
To bude docela "zábava" . Jedna z tech knižek má 340 stránek a další dvě po 300... :) Ale nakonec, lepší, než se dohadovat s manželkou o kytkách na terase... :)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 10:09 am
od Anndy
Ja len dodam, ze obvykle pri softoch skenovacich si mozes vybrat rozne parametre. Jednym z nich je aj moznost OCR (teda rozpoznanie textu) a dalsim je format suboru + samozrejme este aj ine parametre. Niektore vedia len debilny office wordovsky .docx format, ine vedia priamo .rtf (rich text format) alebo prinajhorsom .txt. Cize ak sa da, je ideal (ako pise ls8) vybrat ocr a ulozit do rtf.
Nasledne to rtf otvorit v pages/word (co ti je lepsie) a opravit chyby. Lebo co mam skusenost so scan. softami, tak 100% to nikdy nie je. Ine drahe softy priamo na ocr, nepoznam, takze neviem povedat, ci sa oplati investovat. Tak isto, ak to das ocr, tak ak kniha obsahuje obrazky, tie tam nebudu. Musis zvlast ako obrazok nascanovat a potom vlozit do uz opraveneho a naformatovaneho textu.
Ak to uz mas vsetko upravene naformatovane, tak potom uz len prevod do pozadoavaneho formatu. Ak si to robil v pages, mozes to priamo exportovat, ak vo worde, tak bud import do pages a odtial export do epub, ale neodporucam. Pages rozhodi formatovanie, cize by si musel znova upravovat. Potom radsej si stiahni calibre soft (http://calibre-ebook.com) a cez ten to preved.

Najhorsia vec je to, ze sa podla mna nevyhnes "precitaniu" a oprave celej knihy. Oprava pravopisu by ti mohla pomoct. Avsak netusim, ci existuje ine riesenie - cisto automatizovane. Asi ano, ale bezny soft to robit nebude. Toto, co vsetko, co sme ti napisali je defacto full free a legalne :)

cize navod v skrate:
1. scan priamo OCR do rtf
2. scan obrazkov zvlast (ak sa vyskytuju a chces ich)
3. tento subor rtf otvorit v pages a opravit chyby a urobit formatovanie podla originalu. Plus vlozit obrazky
4. pohrat sa s obsahom (resp. pri formatovani to robit tak, aby ti pages obsah vygenerovali - ak to zvladaju, neviem, nepoznam tak dobre)
5. export do *.epub

snad som nezabudol na nic :)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 2:35 pm
od cuting
Děkuji, takto si představuji dobrou radu - krok za krokem. Zitra jdu na to. Ještě jednou díky.:)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 4:13 pm
od Anndy
Tak snad som sa nepomylil - nikdy som to nerobil takto v celku, len ciastocne veci robil, ale z logiky veci by to malo ist. Mozno zo skusenosti so scanovanim by som ti poradil - scanuj to po castiach. Neviem aky mas scanner, ale moja skusenost hovori, ze chciet naraz skenovat niekolko desiatok, toboz stoviek stran (a nasledne rozpoznat text) takmer vzdy skonci vytuhnutim niecoho a stratou prace. Lebo vysledny text si lahucko poskladas do jedneho suboru neskor. Ale toto je skusnost s windows a hp scannermi a ich softom. Na macu nemam tuto skusenost, ktora moze byt lepsia :D.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: stř kvě 20, 2015 5:59 pm
od ls8
Tak s počtem stránek opravdu není problém, jen se mi osvědčilo skenovat zvlášť všechny sudé s zvlášť všechny liché stránky, rychleji se tak s knížkou manipuluje. Případné přejmenovávání jednotlivých naskenovaných souborů (aby se správně srovnaly sudé a liché) řeším v "Better Finder Rename".

P.S. Na webu ABBYY je ke stažení 30denní demo FineReaderu Pro 12. Proti Express verze 8, kterou používám, má nějaké funkce navíc, přesnost OCR se zdá zhruba stejná.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: čtv kvě 21, 2015 7:03 pm
od cuting
No. Takže jsem hned narazil. Starý scaner od HP OCR neumí a nový scaner od Samsungu, který je součástí trojkombinace , také ne. Takže jsem koukal po softech na OCR , ale žádná láce to není. Navíc, zdaleka ne všechny umí češtinu.... nebude to tak lehké, jak jsem si myslel. :)
Ale objevil jsem jeden velmi zajímavý soft na OCR, který umí po doinstalování i češtinu a výsledný txt soubor z pdf je více, než dobrý. Na dvou zkušebních stránkách jsem našel pouhé dvě chyby a zachovává i odstavce. A je zdarma na App Store zde :
https://itunes.apple.com/us/app/pdf-ocr ... 2933?mt=12
Takže to snad zvládnu. Zítra začínám scanovat,
Productivity
04.02.2024 19:54
Velikost: 60 MB
Cena: US$ 0
Hodnoceni: 0
od 0 lidí
QR code
Web Lite Solutions Corp.
PDF OCR X Community Edition 3.0.37
PDF OCR X Community Edition is a simple drag-and-drop utility that converts your single-page PDFs and images into text documents or searchable PDF files. It uses advanced OCR (optical character recognition) technology to extract the text of the PDF even if that text is contained in an image. This is particularly useful for dealing with PDFs that were created via a Scan-to-PDF function in a scanner or photo copier.

The Community Edition supports single-page PDFs and Images. For multi-page PDFs and batch conversion features, you can upgrade to the Enterprise Edition.

Includes support for over 60 languages including English, German, Spanish, French, Chinese, Japanese, and many others.
VÍCE O APLIKACI
Powered by iPhone.cz

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: čtv kvě 21, 2015 9:34 pm
od Anndy
Ja len drobnosť. Ocr je softwarová záležitosť. A skúsil si pozrieť aktuálne drivery a soft od hp k tomu skeneru? Samsung tiež nemá na to soft? Sa mi nechce veriť.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: čtv kvě 21, 2015 10:09 pm
od cuting
Upřimně, až tolik jsem to nezkoumal, ten HP je prastarý vytažený z pod skříně a ten Samsung jsem, jako scaner použil asi 2x a v předvolbách a nastavení není o OCR ani zmínka. Ale nevadí. Ten soft, co jsem stáhnul je velmi jednoduchý a překvapivě dobrý. Co se mi na něm libí, je čeština, kterou nabízí k doinstalaci a chyb v txt dělá minimum. A rozdíl mezi free a placenou versí je jen v tom, že free neumožňuje udělat více stran najednou - multi, ale jednu po druhé. Ale pracuje poměrně rychle - stránku za cca 5 vteřin, včetně diaktriky i zachování odstavců.
Jak jsou na tom s češtinou OCR v ovladačích scanerů netuším, dodnes jsem ani nevěděl, co to je.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 11:10 am
od Anndy
Jasne. Ja mam len so skenermi skusenost z prostredia windows. A tam sucastou CD, alebo dnes uz na webe vyrobcu, su jednak drivery a za dalsie soft skenovaci, ktory uz minimalne 10r ponuka rozne rezimy skenovania vratane OCR. Cize bezne si volim typ vysledneho subor, jeho parametre, velkost, hlbku, rozlisenie, farby, rozmery, a milion dalsich veci, aby som z toho skeneru dostal to, co potrebujem.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 12:35 pm
od cuting
No, tak jsem převedl úspěšně nascanovane stranky do txt. Otevřel jsem je v Pages, tváří se moc pěkně, bez větších problémů, včetně správných odstavců , ale ouha. Zkusil jsem jednu stránku vyexportovat de epub, ale z jedné stránky mi to udělalo stránky dvě. Což není dobře, protože ta originální stránka zachovává vzhled i odstavce originálu. Takže asi mi nezbyde, než každou z 284 stráneik otevřít a upravovat velikost.....
Navíc netuším, jak z toho udělat knížku, jak ty stránky, třeba i složitě a dlouhodobě upravené "svázat" do podoby knihy. Existuje na to nějaký slušný program, do kterého naházím stránky v txt a ten mi z nich udělá hotovou "svázanou" knížku ? Našel jsem nějaký program eCub , ale neorientuji se v něm, a to ani maličko... Koukám, že udělat eknížku není nic snadného :)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 12:53 pm
od ls8
eBook narozdíl od PDF nebude mít nikdy stejné stránkování jako původní kniha. Je tedy naprosto normální, když je jedna stránka původní knihy v eBooku zobrazena třeba na dvě stránky (nebo naopak). Už proto, že text je přizpůsobený displeji žařízení, na kterém to čteš - tedy mobil, Kindle, tablet nebo počítač. V každém zařízení to bude zobrazené jinak i v závislosti na velikosti a fontu písma, které si každý čtenář může nastavit podle svých požadavků.

Pokud máš v Pages hotovou knížku a sedí ti i stránkování, které nutně chceš zachovat, neexportuj to jako ePub ale jako PDF.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 1:27 pm
od cuting
Hm, dobrá rada nad zlato.... Takže to jsem mohl nechat ty původní nascanované pdf a nemusel jsem to dlouze převádět do txt.... :) A jak v Pages udělám tu knížku ? Možná hloupá otázka, ale nikdy jsem to nedělal a žádná šablona na knížku nikde není. Představoval jsem si to nějak tak, že otevřu nějakou šablonu v nějakém programu, ve které umístím jednotlivé stránky , které mám v txt na jednotlivé stránky, jsou i číslované, a výsledek pak prostě vyexportuju , jako epub. Jsem hodně najivní ?

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 2:23 pm
od Anndy
Ale pdf je velmi zle citatelne z dovodu neskalovatelnosti.
Tvoja predstava je takmer rovnaka skutocnosti az na jednu vec. A to, ze kazde zariadenie, kde sa cita el. knizka ma iny tvar, uzivatel si ma moznost zmenit velkost/rez/font/upravu - pisma a tym padom jedna stranka na danom zariadeni je vzdy original a mas nekonecne mnozstvo variantov. Cize musis v predstave upustit, ze ak ma kniha v reale 100 stran, ze tolko bude mat aj na zariadeni (mimo pdf - tam to ale na malych moze byt necitatelne). Napr. rovnaka kniha v el. forme v ipade bude mat napr 120stranok, ale na mobile kludne 150. Ale akonahle zmenim velkost pisma, ci velkost riadkovania, etc.. tak sa mi zmeni pocet zobrazitelnych pismen na stranu, cize sa automaticky zmeni aj pocet stranok v danom zariadeni.
Cize vlastne mas problem v tom, ze chces aby elektronicka kniha vyzerala ako v reale. To je vsak nemozne, ak chces zachovat vsetky vyhody toho, ze je elektronicka - t.j. zvacsvovanie pisma, etc... Cize mas dve moznosti:
1. dat to do pdf, ako ti pisal ls8, stratis ale takmer vsetky vymozenosti el. knihy.
2. vykaslat na identicky vzhlad, lebo to nejde (ako chces precitat rovnake mnoztov pismen na 5" mobile a a realnej A4 knihe?) a urobit to nasledovne:

Nascanoval by som vsetko do txt alebo rtf.
Otvoril to v Pages, opravil chyby.
Potom by som to formatoval tak, ze cely text bude jednoliaty s tymto podminekami:
Kapitolu, ak ma nazov, by som vzdy oddelil na dalsiu stran a nazov by som urobil inou velkostou (pripadne fontom, pouzil by som mozno aj prednastavene nieco). Odstavce, tabulatory nechal podla originalu.
Absolutne by som vyhodil nejaku konstatnu hlavicku, ci paticku, tak isto aj cislovanie stran. Toto ti obstara samotne zariadenie na ktorom to budes citat, prezerat. Ak chces obrazky, tie by som tam tiez vlozil. Resp. aspon by som nascanoval uvodnu obalku, ako obrazok a to pri exporte do epub nahral ako obal knihy.
Takto upravenu knihu by som vyexportoval do epub. Samotny pages ma aj nejake volby pri tomto exporte. Ak by ti netacili, stihani si ten soft calibre (je free) natiahni si rtf a daj exportovat do epub, ci ine formaty. A tento soft ma viacej moznosti nastavenia exportu.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 3:52 pm
od cuting
Díky za obsáhlé vysvětlení. Vidím, že to je nad moje schopnosti chápání.
V Pages otevřu jen jednu ze stovek stránek, ne všechny najednou v jednom souboru, abych to mohl upravit a doladit. Takže tam je první zádrhel. Koukal jsem na aplikaci calibre, ale i když je v češtině, tak se v ní vůbec neorientuju. Jak vytvořit ze stovek txt stránek knihu , jak fonty, stránky atd. a vyexportovat do do epub?
Koukal jsem i na app od apple iBook Author, i ta je v češtině. Ta má dokonce i nějaké šablony, do kterých je možné umístit txt stránky , jednu po druhé, ale zase nemá žádný export do epub. Jen do iBook store. Zkrátka v té kompletaci - vazbě a finalizaci nascanovaných stránek , které jsem převedl do txt a otevřené v Pages vypadaji velmi dobře, v tom se ztrácím . To není nikde žádný soft, kde si otevřu nějakou šablonu, naházím do něj jednotlivé stránky, upravím třeba názvy kapitol apod a ve finále to vyexportuju, jako svázaný celek - knihu ven ? Této představě se přibližuje iBook Author, ale ten nemá export do ePub. A nebo jsem slepý a nebo úplně tupý...:) Nevylučuji...:)

EDIT: Takže jediná cesta , kterou vidím, je otevřít jednu - první stránku v Pages a pak do ní ručně jednu po druhé přidávat další stránky. Oddělit kapitoly, jak píšeš, názvy kapitol extra na stránku a takto až do konce. Naštěstí v těch knížkách nejsou obrázky. Jak dát obrázek na "obal", to naštěstí řešit nemusím, to ani netuším.... Pak to ve výsledku vypadá jakžtakž slušně. Je to epub v docela pěkné podobě. Ale bude to "zábava na celou sobotu a nebo víkend.:)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 5:09 pm
od Anndy
Ano vidis, to mi uniklo. Idealne je mat cely text v jednom subore. LS8 by ti myslim aj poradil, ako nejakym skriptom, alebo v automatore spojit x txt suborov do jedneho. Ja by som musel cely vikned studovat, ale urcite to ide.

Obalku ako prednu stranu pridas v calibre. Ale mozno v pages tiez - tam treba urobit len to, ze obrazok musi byt vlozeny ako prva strana dokumentu, toho textoveho.
V calibre je to jednoduche:
1. otvoris calibre
2. kliknes vlavo pridat knihy
3. vyberies subor txt (jeden suboru upraveny naformatovany). On sa ti zobrazi v strede.
4. kliknes na neho (ako na cely riadok, resp. ak bude jediny, ostane hned vybrany) a potom ides do menu (velke tlacitko sipky) "konvertovat knihy" -> "konvertovat individualne"
5. otvori sa ti okineko velke. vlavo je zvisle "menu" (metadata, vzhlad....) Vlavo hore je tlacitko s rolovacim menu, kde bude zdrojovy format suboru (txt) vpravo najdes tlacitko vvystupny format - vyberies "epub"
6. Kliknes na menu vlavo "metadata" a vyplnis autora, nazov, atd... Plus tam bude "zmenit/pridat obalku" a moznost vybrat kliknutim cestu k obrazku tej obalky - vyber
7. mas tam moznost v menu "vzhlad" prisposobit knihu (ja sa nikdy nehrabem do toho, ale ak chces experimentovat, mas oznost), v menu nastavenie strany mozes vybrat preddefinovane zariadenie na ktore to ma byt primarne optimalizovane (ipad, iphone, kindle...) ale ani toto nemusis robit
8. dalej kliknes na "vysstup epub" a zase mozes riest nejake veci (ale nemusis nic, staci standard nastavenie)
Nakoniec mas vpravo dolu tlacitko O.K. a na to ked kliknes zacne prebiehat konverzia.

Vysledok ti oznami program a knihu najdes aj s metadatami ulozenu v kniznici calibre (standardne na osx .../username/calibre Libraray/autor_knihy/nazov_knihy/samota_kniha.epub)
A tu jednu knihu mozes previest do roznych formatov - epub, mobi, .... a vsetky budu ulozene v tej calibre kniznici v jednom adresari/zlozke.

Snad je to jasnejsie :)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 6:33 pm
od cuting
Na spojení více txt souborů do jednoho jsem našel toto :
http://blog.thelettercase.com/automator ... s-into-one
Díky za postup v Calibre :)

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 7:22 pm
od ls8
Na tohle s Automatorem, to je jak s kanónem na vrabce :) Pokud máš ty textové soubory nějak očíslované za sebou, stačí v terminálu

cat *.txt > vysledek.txt

Ale je ti jasné, že pokud budeš exportovat rovnou z txt, nebude to mít žádné formátování, žádné kapitoly atd., o obrázcích nemluvě? Pokud chceš, aby výsledný eBook měl nějakou formu, tedy včetně nadpisů, částí textů, které jsou v původní knížce jiným fontem - typicky kurzívou nebo tučně, nadpisy apod., názvy kapitol a vygenerovaný obsah (Table of Contents - ToC), obrázky, tiráž atd., to se všechno musí udělat ručně, v případě zájmu pošlu pro inspiraci nějakou svojí takto zpracovanou knížku.

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 8:26 pm
od cuting
Mám soubory txt převedene z nascanovaných pdf, které mají zachované i odstavce a diaktriku. Když je načtu v Pages, tak tyto odstavce a diaktriku Pages zachová a vypadá to velmi dobře. V Pages si pak mohu názvy kapitol a fonty upravit. Jde mi o to dostat ty txt soubory do Pages najednou. Nyní mám stovky jednotlivých txt. To sloučení do jednoho txt ty odstavce rozbije ?

Re: Digitalizace knihy v mac - jak na to ?

PříspěvekNapsal: pát kvě 22, 2015 9:44 pm
od ls8
Ne, to ne, pokud ti to stačí, jak to máš, bude to OK.