Ktorý formát elektronickej knihy je lepší? Čo je lepšie fb2 alebo epub? Fb2 porovnanie epub

ePUB je jedným z najpopulárnejších formátov elektronických kníh na svete. V skutočnosti je na Západe jeho jedinou vážnou konkurenciou MOBI (proprietárny formát Amazonu, viac nabudúce). V Rusku a ďalších krajinách postsovietskeho priestoru je Fb2 tiež populárny (hovorím o tom). Ale aj v obrovských priestoroch našej bývalej veľkej domoviny si formát ePUB získava čoraz väčšiu obľubu, najmä na pozadí nedostatku aktualizácií Fb2 a posilňovania boja proti pirátstvu. Preto je tu niekoľko zaujímavých a užitočných podrobností o formáte ePUB.

Čo je ePUB?

ePUB je formát pre elektronické verzie kníh. Názov pochádza z anglickej frázy „ e elektronické krčma lication a správna ruská výslovnosť je „ipab“ (žiadne „epub“!). Kniha ePUB je vlastne archív obsahujúci niekoľko priečinkov. V jednom je text knihy, v ďalšom popis (meno autora, názov, vydavateľ, jazyk, identifikačné číslo a pod.), v treťom obrázky, vo štvrtom služobné informácie. .. Čítací program toto všetko zhromažďuje a dáva čitateľovi výsledok vo formátovanom texte s ilustráciami, vzorcami atď. Formát je otvorený – ktokoľvek ho môže upraviť. ePUB je formát s „plávajúcim rozložením“. To znamená, že čítačka môže široko meniť parametre zobrazenia, ako je font a medzery, a text sa automaticky prispôsobí požadovanej veľkosti obrazovky. Vyvinuté a udržiavané Medzinárodným fórom digitálneho publikovania (IDPF), predovšetkým spoločnosťou Adobe.

História formátu ePUB

Predchodcom ePUB bol OEB (Open eBook Publication), ktorý vyvinula tá istá organizácia už v roku 1999. Na jeho základe vznikol v roku 2007 moderný ePUB. Formát rýchlo získal popularitu na Západe. Dôvodom bolo jednak pohodlie pre koncového používateľa a jednak možnosť vložiť do súborov takzvanú DRM ochranu, ktorá umožňuje obmedziť rozsah zariadení, na ktorých je možné knihu čítať. Do roku 2010 formát ePUB Väčšina obchodov s elektronickými knihami prešla. Štandardom na ukladanie kníh ju urobila najväčšia knižnica Gutenberg.com. Od uvedenia iPadu je ePUB formátom, ktorý podporujú proprietárne aplikácie Apple – iBooks, Pages, iAutor. Od roku 2009 existuje rozšírenie pre Firefox, ktoré umožňuje čítať knihy tohto formátu priamo v prehliadači. Podobné riešenie je dostupné aj pre Chrome. Od roku 2012 spoločnosť Sony urobila z ePUB hlavný formát pre svoje zariadenia a opustila proprietárny LRF. Od roku 2010 sú ekonomické správy americkej vlády zverejňované v tomto formáte. V októbri 2011 bola predstavená aktuálna verzia formátu – 3.0, v ktorej boli konečne implementované poznámky pod čiarou.

Výhody a nevýhody formátu

Ak hovoríme o výhodách a nevýhodách, potom záleží na tom, s čím porovnávate. Ak používate také „počítačové“ formáty ako txt, rtf a doc, získate nepretržité výhody. Ani txt, ani rtf nepodporujú obsahy a nemajú žiadne alebo len veľmi obmedzené formátovanie. Doc je veľmi „ťažký“ formát pre programy na čítanie, vytvorený špeciálne pre Microsoft Word. Žiadny z týchto formátov nepodporuje „metadáta“. V porovnaní s PDF je takéto porovnanie úplne nesprávne, pretože ide o formáty na rôzne účely. Napriek možnosti vkladať do textu obrázky a vzorce, ePUB nie je vhodný pre knihy bohaté na tieto prvky – predovšetkým učebnice a odbornú literatúru. Preložiť takúto literatúru do ePUB je dosť náročná úloha. A tu prichádza na pomoc PDF. Na druhej strane, PDF je formát s pevným rozložením, ktorý sa neprispôsobuje veľkosti obrazovky. Predtým bolo čítanie PDF dokumentov na obrazovkách menších ako 9“ úplne problematické – zobrazovala sa len časť stránky. Teraz existuje špeciálny formát, takzvaný PDF6, ale ani ten problém nerieši.

Najrelevantnejšie porovnanie však bude s populárnymi konkurentmi - Fb2 a MOBI. S tým druhým nie je pre bežného čitateľa prakticky žiadny rozdiel. V porovnaní s Fb2 je ePUB „pokročilejší“ formát, má viac možností. Podporuje napríklad vzorce a niektoré ďalšie prvky formátovania, ktoré nie sú dostupné pre Fb2. Pre vydavateľov a predajcov elektronických kníh je dôležitou výhodou ePUB možnosť zabudovať do súboru ochranu DRM. Ale na čítanie obyčajnej beletristickej knihy sa nedá povedať, že ePUB je niečo radikálne lepšie v porovnaní s Fb2.

V každom prípade teraz existuje veľké množstvo konvertorových programov, ktoré vám umožňujú preniesť potrebnú knihu z jedného formátu do druhého. Preto debata o tom, či je ePUB lepší alebo horší ako ktorýkoľvek iný formát, do značnej miery stratila na aktuálnosti.


Elektronické knihy (čítačky, čítačky) sa už dávno stali bežnými zariadeniami pre široké spektrum používateľov. Ich výhody: dostupnosť obsahu (potrebnú knihu si stiahnete z internetu v priebehu niekoľkých minút), E-ink obrazovka, ktorá nepoškodí váš zrak, možnosť mať v čítačke zbierku tisícov kníh, dlhá práca na jedno nabitie, nastavenie typu a veľkosti písma. Nie je to tak dávno, čo sa objavili elektronické knihy s podsvietenými obrazovkami – umožňujú vám čítať v úplnej tme. Vo všeobecnosti môžu byť výhody čítačiek uvedené veľmi dlho.

Pri zoznamovaní sa s elektronickými čítačkami však majú používatelia často jeden problém. Ľudia, ktorí sa rozhodnú kúpiť si čítačku prvýkrát, keď čelia pojmu „formáty elektronických kníh“, často nerozumejú, o čom hovoríme. Problém je aktuálny najmä pre začiatočníkov, ktorým skratky „FB2“, „EPUB“ alebo „MOBI“ nehovoria absolútne nič.

Takzvané formáty sú rôzne typy elektronických textových súborov, ktoré jeden alebo druhý podporuje (prehráva). Internetové elektronické knižnice často ponúkajú veľkú sadu typov súborov: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT a ďalšie. Výber je široký a to predstavuje určité výzvy pre začiatočníkov. Popíšeme si hlavné formáty e-kníh, povieme si, ako sa od seba líšia, ktoré čítačky sú podporované a aký formát je lepšie zvoliť, ak máte multiformátovú čítačku, ktorá číta všetky formáty.

Rôzne formáty

1. FB2 (FictionBook)- formát elektronickej knihy, ktorý vytvorila skupina ruských vývojárov. Knihy v tomto type súboru majú štruktúrovaný vzhľad (to znamená, že obsahujú členenie podľa kapitol, obsahu, ilustrácií, obálky). Tento štandard navyše uchováva informácie o súbore (tzv. tagy: autor, názov, žáner), ktoré číta čítačka a umožňuje používateľovi pohodlne triediť súbory na zariadení. Tento typ súboru zaberá málo miesta, dá sa archivovať a tiež sa dá ľahko konvertovať do iných formátov. Medzi vlastnosti: vzhľadom na skutočnosť, že formát bol pôvodne vyvinutý pre cyriliku, texty v ruštine vo FB2 majú slovné spojovníky.

Formát bol pôvodne navrhnutý pre ruských používateľov av zahraničí sa prakticky nepoužíva. Preto FB2 nepodporujú svetoví populárni výrobcovia elektronických čítačiek – Amazon a Barnes & Noble. Ale toto je hlavný formát súboru pre elektronické čítačky populárne v Rusku od Pocketbook, Onyx a Wexler. Čítačky Sony teraz navyše podporujú FB2 – po vstupe na ruský trh spoločnosť vyvinula oficiálny firmvér pre čítačku, ktorý vám umožňuje čítať knihy vo FB2.

2. EPUB (elektronická publikácia)- svetovo najpopulárnejší elektronický formát pre čitateľov. Pracujú s ním čitatelia Barnes & Noble a Sony. Z hľadiska štruktúry rozloženia tento typ súboru pripomína archivovanú webovú stránku obsahujúcu text, grafiku, vložené písma a ilustrácie.

Formát EPUB podporujú okrem západných značiek aj modely od výrobcov zameraných na ruský trh (Pocketbook, Onyx, Wexler) vzhľadom na rýchly rast obľuby u nás. Okrem toho tento štandard elektronických kníh používajú iPhone a . Čítačka iBooks od Apple podporuje EPUB.

3. MOBI- formát čítačiek elektronických kníh. Získavanie popularity v ruských online knižniciach, keď sa Kindle stáva v Rusku populárnejším. Ostatní čitatelia podporujú tento formát „na ukážku“. MOBI je podobnými vlastnosťami ako EPUB. Amazon nedávno predstavil ďalší elektronický textový formát, Kindle Format 8 alebo KF8 (vyznačuje sa bohatším formátovaním), s objasnením, že nové a staré čítačky Amazonu budú naďalej podporovať MOBI.

4. TXT- formát jednoduchých textových dokumentov. Text môžete previesť z iného formátu do TXT jednoduchou akciou kopírovania a vkladania. Napriek tomu, že tento typ súboru podporujú takmer všetky elektronické čítačky a zaberá veľmi málo miesta v pamäti, neodporúčali by sme v ňom čítať knihy na elektronických čítačkách. TXT nemá formátovanie, označenie, delenie slov a zarovnanie. Je vhodný na krátke textové poznámky, nie však na plnohodnotné e-knihy.

5. PDF (Portable Document Format)- formát elektronického dokumentu vytvorený spoločnosťou Adobe Systems. Nepohodlné na použitie na čítačkách z niekoľkých dôvodov. Po prvé, súbory v tomto formáte sú veľmi objemné, pretože sú navrhnuté pre výkon počítača a na elektronických čítačkách sa otvárajú dosť pomaly. Po druhé, ak súbor nie je špeciálne navrhnutý pre obrazovku 6-palcovej čítačky, ktorá má formát podobný hárku papiera A6, potom si na ňom prečítate PDF formátu A4 (a väčšina súborov PDF je prezentovaná presne vo veľkosti štandardný hárok papiera) bude veľmi ťažké. V PDF môžete zväčšiť iba mierku, ale nie veľkosť písma, čo znamená, že na obrazovku sa zmestí len určitá časť strany. Stránky budete musieť čítať po častiach, a to je veľmi nepohodlné.

Na čítanie sú vhodné súbory PDF, ktorých veľkosť obrazovky umožňuje reprodukovať stranu v dostatočne veľkej mierke na pohodlné čítanie.

6. DJVU- formát určený na ukladanie naskenovaných dokumentov - kníh, článkov, rukopisov. Kniha v DJVU je vlastne zbierka naskenovaných strán. Z hľadiska komfortu čítania na 6-palcových čítačkách je všetko podobné ako v prípade PDF. Nezväčšíte veľkosť písma, iba mierku. Pri približovaní sa stránka predĺži za obrazovku a na čítanie budete musieť neustále posúvať oblasť zväčšeného textu - o pohodlnom čítaní netreba hovoriť. Na čítanie DJVU si vyberte čítačky s 9-palcovou obrazovkou. Avšak aj na 9-palcových čítačkách závisí možnosť pohodlného čítania DJVU od toho, ako dobre je kniha prezentovaná v tomto formáte naskenovaná.

7. LRF- predtým proprietárny formát čítačiek Sony. Na nových modeloch (počnúc PRS-T1) sa už nepoužíva, keďže ustúpil EPUB. Veľmi zle sa konvertuje na iné typy súborov. Napriek tomu, že je stále zastúpený v niektorých knižniciach, jeho používanie sa odporúča výhradne majiteľom starších modelov Sony.

8. RTF (formát RTF)- formát na ukladanie textových dokumentov. Patrí do kategórie „počítač“, nie „kniha“. Čítanie v RTF na čítačkách nie je príliš pohodlné - ide o veľké súbory a rýchlosť čítačky je rádovo znížená.

9. DOC(a DOCX) - Textové dokumenty balíka Microsoft Office. Tieto formáty podporuje pomerne veľa čítačiek, ale špeciálne na čítanie dokumentov, nie kníh. Veľké súbory v tomto formáte môžu byť veľké a ťažko sa s nimi pracuje na čítačkách. Viacstranové knihy v DOC je lepšie previesť na FB2 alebo EPUB.

Uviedli sme hlavné formáty e-kníh. Nebudeme zvažovať úplne exotické typy súborov, ktoré sa niekedy nachádzajú na internete, ale skôr sa rozhodneme, ktorý z vyššie uvedených formátov je najvhodnejší na čítanie kníh na elektronických čítačkách.

Aký formát elektronickej knihy si vybrať

Ak máte elektronickú čítačku, ktorá podporuje všetky formáty, môžete si vybrať konkrétny typ súboru na základe viacerých faktorov. Povedzme, že si kúpite svoju prvú e-knihu a nemáte vopred vyzbieranú zbierku kníh, napríklad na FB2. V takom prípade vyberte formát súboru, ktorý vaša čítačka najlepšie reprodukuje. Tradičné „knižné“ formáty EPUB alebo FB2 sú pre čitateľa (a pre používateľa) vhodnejšie a pohodlnejšie ako „počítačové“ PDF, TXT, DOC, DOCX a RTF.

V prípade 9-palcových čítačiek a pri potrebe čítania DJVU a PDF pri zachovaní všetkých ostatných podmienok vám odporúčame uprednostniť to druhé, pretože PDF je modernejší formát a knihy v DJVU sú často nekvalitné. .

Z hľadiska jednoduchosti používania sú výhody „knižných“ formátov zrejmé: EPUB, FB2 alebo MOBI vyzerajú v ponuke vašej čítačky vizuálne lepšie (zobrazujú sa obaly kníh), pohodlnejšie sa triedia (existujú tagy: autor, názov, žáner), zaberajú oveľa menej miesta v pamäti a rýchlosť čítačky pri takýchto formátoch bude výrazne vyššia.

Potrebujete podporu pre všetky formáty?

Podľa nás nie je vôbec potrebné vyberať si všeformátovú čítačku. Mnoho používateľov, ktorí majú čítačky elektronických kníh, ktoré podporujú všetky formáty, sťahuje knihy v jednom alebo dvoch typoch súborov. Všetky elektronické čítačky (vrátane multiformátových), tak či onak, majú hlavný formát a v konečnom dôsledku ich nevymeníte za iné. Pre Pocketbook, Onyx a Wexler sú hlavné formáty FB2 alebo EPUB, pre Barnes & Noble () a Sony - EPUB, pre Kindle - MOBI.

V prípade čítačiek Amazon a Barnes & Noble, ak je kniha, ktorú potrebujete, vo formáte, ktorý tieto čítačky nepodporujú, môžete použiť konvertor (napríklad Calibre). Toto je program, ktorý je nainštalovaný na vašom počítači a umožňuje vám previesť rovnaký FB2 na MOBI alebo EPUB v priebehu niekoľkých minút.

Čítanie kníh v natívnom formáte čítačky je lepšie ako používanie ďalších programov nainštalovaných v čítačke. Naša rada: venujte pár minút prevodu knihy napríklad z RTF do EPUB pomocou konvertora Calibre. Je to pohodlnejšie ako čítanie „v origináli“ pomocou dodatočne nainštalovaného programu (na Sony PRS-T1 alebo Kindle) alebo pomalšie fungovanie zariadenia (napríklad na čítačkách Pocketbook).

Pamätajte, že hlavnou vecou je jednoduchosť používania e-knihy, a nie počet formátov uvedený v jej parametroch.

Užívať si čítanie!

2015-03-11 | Nezaradené do kategórie

Človek, ktorý miluje knihy, sa snaží čítať kdekoľvek a všade. Preto je čítanie z elektronických čítačiek alebo mobilných telefónov v posledných rokoch také populárne. Samozrejme, o slastiach z vône novej papierovej knihy, o príjemných chvíľach v kníhkupectve, pri výbere prírastkov do vašej knižnice sa môžeme rozprávať koľko chceme, no faktom zostáva, že v každodennom zhone čítanie elektronických kníh je jednoduchšie ako nosenie zvyčajných papierových zväzkov. Ak píšete a chcete, aby sa vaša práca stala pohodlnou a prístupnou čitateľom, nestačí uverejňovať texty na otvorených zdrojoch, bolo by pekné k nim pripojiť aj verzie súborov, aby si ľudia mohli stiahnuť váš výtvor a vo svojom voľnom čase ho hodnotiť .

Bez ohľadu na to, či ste čitateľ, zapisovateľ alebo dvojica v jednom, pri sťahovaní alebo nahrávaní textov so súbormi sa môžete stretnúť s tým, že váš telefón alebo čítačka nepodporuje tento formát (alebo sa vaši čitatelia sťažujú, že súbory, ktoré dokážu nečítajte tento formát). Aby ste pochopili, prečo sa to deje, napísali sme pre vás krátke vysvetlenie o tom, aké typy formátov elektronických kníh existujú, ako sa líšia a aké sú výhody a nevýhody každého z nich.

Typy formátov:

Najprv je potrebné poznamenať, že najbežnejšie formáty elektronických kníh sú: FB2, EPUB, MOBI, PDF, RTF, TXT, DOC/DOCX a DjVu. Prirodzene, keď sa nezasvätený človek stretne s takouto rozmanitosťou, je ťažké zistiť, čo je čo a aký formát zvoliť na čítanie alebo konverziu vašich súborov.

Microsoft Windows, ale, bohužiaľ, DOC/DOCX väčšina čítačiek nepodporuje a nemusia sa vždy otvárať na mobilných telefónoch a čítanie kníh v TXT je veľmi, veľmi nepohodlné.

Povedzme si však všetko v poriadku:

FB2 (FictionBook)

Výhody: Jeden z najbežnejších formátov v rusky hovoriacom segmente internetu. Je vhodné štruktúrovať veľký dokument, rozdeliť ho na kapitoly atď. Súbory FB2 zaberajú málo miesta a ľahko sa konvertujú do iných formátov.

Nevýhody: FB2 je formát vyvinutý v Rusku. Väčšina čitateľov ho nepodporuje a je celosvetovo neznámy. Otvára sa iba na zariadeniach s ruským firmvérom a je cudzí značkovým čítačkám, ktoré vedú po celom svete: Sony, Amazon Kindle, Barnes&Noble, Kobo atď. Áno, môžete sa staviť, že sa otvára na Sony FB2, ale oficiálny firmvér, ktorý umožňuje na otvorenie tohto formátu na čítačkách Sony, bol publikovaný len pred niekoľkými rokmi a nie je nainštalovaný na všetkých modeloch. Ak hovoríme o predaji vašich diel na Amazone alebo iTunes, odpoveď je jasná – FB2 nie je vhodný pre medzinárodné platformy.

PDF (Adobe Portable Document Format) a DjVu (vyslovuje sa „deja vu“) – nebudeme ich posudzovať samostatne a spojíme ich do jedného bodu.

Výhody: Oba formáty sa používajú na ukladanie naskenovaných kníh. PDF môže vytvárať veľmi farebné súbory. DjVu jednoducho komprimuje súbory celkom dobre, vďaka čomu majú nižšiu hmotnosť.

Nevýhody: Súbory PDF sú veľmi objemné. Ak hovoríme o skenovaní, potom je v každom prípade naskenované knihy nepohodlné na čítanie z obrazovky, pretože ich kvalita ponecháva veľa požiadaviek, bez ohľadu na to, či je skenovanie zverejnené vo formáte PDF alebo DjVu.

Výhody: TXT sa otvára na akejkoľvek čítačke. DOC/DOCX sú dobre známe formáty Microsoft Word.

Nevýhody: Čítanie kníh v TXT je strašne nepohodlné, keďže mu chýba formátovanie textu (zarovnanie na šírku, zalamovanie odsekov, rozdelenie na kapitoly atď.). DOC/DOCX podporuje veľmi malý počet čítacích zariadení.

RTF (formát RTF)

Výhody: Pohodlný a kompaktný formát na ukladanie textových súborov.

Nevýhody: Je extrémne zriedka podporovaný čítačkami a mobilnými telefónmi, tabletmi atď.

Výhody: LRF je špeciálny formát elektronickej knihy od Sony. Formát knihy MOBI pre Amazon Kindle.

Nevýhody: V súčasnosti Sony podporuje aj populárnejší formát elektronických kníh – EPUB.

EPUB (elektronické publikovanie)

Výhody: EPUB je najrozšírenejší formát elektronickej knihy na svete. Nemá problémy s rozpoznávaním a umožňuje vytvárať dobre štruktúrovaný text s ilustráciami. Tento formát je už archívom sám o sebe, a preto je kompaktný a nevyžaduje ďalšie archivátory.

Ako vidíte, každý z vyššie uvedených formátov má svoje výhody a nevýhody. Napríklad, samozrejme, „najčitateľnejším“ formátom pre e-knihy bude TXT, ale čítanie kníh v tomto formáte je prakticky výsmech vašich očí. Takýto text sa nedá štruktúrovať, chýbajú mu odseky, kapitoly, nemožno vkladať ilustrácie a pod.

Najbežnejším a najpohodlnejším formátom na čítanie elektronických kníh je EPUB. Ak sa však bavíme o forme, v akej by mal autor svoje dielo zavesiť na internet, najracionálnejším riešením by bolo uverejniť ho vo viacerých formátoch naraz. Napríklad: EPUB (čitateľné všade okrem Amazon Kindle) + MOBI (čitateľné iba na Amazon Kindle) + DOC/DOCX (pre tých, ktorí sú zvyknutí čítať z počítačov a notebookov). Ako bonus môžete samozrejme uverejniť text vo formáte FB2, na ktorý je rusky hovoriace publikum tak zvyknuté, nie všetky zariadenia však otvoria súbor v tomto formáte.

A samozrejme, na záver tohto článku a ako reklamu by sme vás chceli informovať, že v CIS sa nedávno spustil nový internetový systém Booqla, ktorý je určený na pohodlnú a, pozor, bezplatnú konverziu rukopisov do EPUB a MOBI formáty. Stránka ponúka používateľom z celého sveta konverziu ich rukopisov do elektronickej podoby a poskytuje pomoc pri predaji elektronických kníh, no pre rusky hovoriace publikum bude dostupná len bezplatná konverzia rukopisov.

Jednoduchosť a pohodlnosť služby Booqla môžete sami zhodnotiť registráciou na

Stručne o hlavnej veci
Ak chcete získať dobrú predstavu o epub, predstavte si, že ste uložili webovú stránku (ako je táto) na disk spolu s grafikou a štýlmi, ktoré sú na nej použité. Pre všetky moderné prehliadače je to štandardná funkcia, napríklad vo FireFoxe sa to robí cez menu „Súbor → Uložiť ako → Celá webová stránka“. Môžete uložiť nielen jednu, ale niekoľko strán vedľa seba. Potom vedľa svojich stránok umiestnite dva servisné XML súbory. Jeden je jednoducho štítok „toto je epub“ (container.xml), druhý obsahuje zoznam všetkých súborov - .html, .css, .jpg atď. (zvyčajne súbor content.opf).
Ostáva už len toto všetko vložiť do zip archívu a zmeniť jeho príponu z .zip na .epub.
Všetky.
Kniha je hotová a už viete, čo je epub. Toto nie je vtip ani preháňanie – epub je len zazipovaný html. Nie viac nie menej.

O formáte podrobne
Umiestnenie obsahu do archívu epub

Ako sme už zistili, epub je zip archív s niekoľkými súbormi. Keď archivujete súbory pomocou ZIP archivátora a k archívu pripojíte súbor XML container.xml, vytvoríte súbor vo formáte „Open Container“ v próze. Napriek vražedne honosnému názvu tejto udalosti (IDPF mal vedieť, že existuje norma ISO OPC a nie znovu vynájsť koleso), je celkom možné dať IDPF palec hore za „Open Container Format“ (OCF) (budeme zistite prečo nižšie).
Okrem súboru container.xml (musí byť v META-INF) epub nevyhnutne obsahuje ďalší súbor služby, ktorý uvádza všetky ostatné súbory nachádzajúce sa v archíve a označuje ich typ, zvyčajne nazývaný content.opf.
Pre znalého človeka celý dizajn veľmi pripomína java balíčky vo všeobecnosti a OpenDocument zvlášť. IDPF sa skutočne snaží spojiť s OpenDocument. Nie je celkom jasné, čo nám bránilo začať s OD klonom, pretože OpenDocument je o dva roky starší ako OCF, ale bicykle sú zjavne nevyhnutnou partiou amatérov, ktorí sa neobťažovali čítať dokumenty včas. Takže xpointer IDPF je tiež zjavne pevne určený na to, aby bol znovu vynájdený v rámci EPUB3. Verzie do 5 prídu na to, že pre odkazy použijú štandardizovaný formát w3c a budú hľadať aj spôsoby, ako ich kombinovať.

Aké údaje sú uložené v súbore epub
epub zvyčajne obsahuje nasledujúce informácie:

  • Metadáta: názov, jazyk, autori atď.
  • Navigačné nástroje: poradie stránkovania pre súbory xhtml a „obsah mapy stránok“
  • Samotný text je vo forme niekoľkých xhtml súborov, ktoré môžu používať štýly css, obrázky vo formáte jpg, gif a png, ako aj vektorovú grafiku a písma svg. Najnovšia verzia epub deklaruje podporu pre MathML.
  • Okrem toho môže súbor epub obsahovať množstvo ďalších vysoko špecializovaných súborov so značkami, verziu knihy vo formáte PDF na tlač atď. exotické veci, ktoré sa v skutočnosti nepoužívajú, nie sú podporované čítačkami elektronických kníh a nezaujímajú ich priemerný čitateľ.
Meta informácie v epub
Minimálne meta informácie pre súbor epub zahŕňajú názov, ID dokumentu a jazyk. Okrem toho môžete uviesť autorov, prekladateľov a ďalších účastníkov tvorby knihy, dátum vydania/napísania, tému knihy (vo voľnej forme), textový popis a informácie o vydavateľovi.
Kľúčové metainformácie sú uložené v štandardnej schéme Doublin Core, mierne rozšírenej. Popisy autorov, predmetov a všetkých ostatných polí (okrem dátumov a jazyka) sú uvedené vo forme voľného textu, čo v skutočnosti vylučuje efektívnu automatickú katalogizáciu epub z rôznych zdrojov.

Navigačné pomôcky
epub, ako si pamätáme, môže obsahovať veľa html súborov. A bude tam veľa súborov. Nie preto, že to vyžaduje IDPF, ale preto, že čítačky epub padajú kvôli veľkým súborom a každý robí veľa malých. A aby „posúvanie“ známe čitateľovi fungovalo, tvorca súboru epub uvádza poradie, v ktorom by sa mali súbory prezentovať. “Pri otváraní zobrazujeme 3.html, keď si to čitateľ prelistuje až na koniec, otvoríme 1.html, potom 8.html. A súbor footnotes.html je pri priamom rolovaní nedostupný; čitateľ sa tam dostane cez poznámky pod čiarou,“ niečo také. Zvyčajne sa nachádza v súbore content.opf.
Ďalším prostriedkom navigácie v knihe je obsah. Ak je prítomný, zvyčajne je uložený v toc.ncx. Technicky je to viac analogické s funkciou „mapa stránok“ ako zvyčajný „obsah“. Obsah v papierovej knihe (alebo elektronickom dokumente) sleduje štruktúru textu, ale .ncx nesúvisí so všeobecným poradím fragmentov textu a môže im priamo odporovať. V skutočnosti sa však súbor zvyčajne používa ako obsah a je naformátovaný „normálne“, pričom sa opakuje poradie určené pre stránkovanie.
Vo všeobecnosti platí, že opakované ukladanie a prepisovanie rovnakých údajov rôznymi spôsobmi je ochrannou známkou epub. Metadáta sú uložené na štyroch miestach: v popise kontajnera OPF container.xml, v popise balíka epub content.opf, v súbore obsahu toc.ncx a v súboroch html (v meta tagoch). Obsah je popísaný trikrát – „mapa knihy“ z toc.ncx polemizuje s uvedením fragmentov v content.opf, ktorý z nich je dôležitejší a nadpisy h1-h6 v html sa na to všetko pozerajú a myslia na pomstu.

Text knihy
Samozrejme, epub obsahuje aj skutočné html súbory s textom knihy. V archíve sú uložené aj prvky použité v texte – grafika, štýly, skripty, fonty.
Žiadne významné „doplnky“ alebo „obmedzenia“ týkajúce sa html, css atď. epub sa nenastaví. Vezmeme moderný webový obsah, ktorý sa už ani nestal „dynamickým“, ale „plynulým“ (epub deklaruje podporu pre html5, ktorý vyzerá skôr ako OS ako značkovací jazyk; prehliadače ho stále v obmedzenej miere podporujú), uložíme na disk, archivovať – a voilá, e-kniha je hotová.
"Drahý, uložil som internet na disk, čo ďalej?"

Pozadie
Aby sme lepšie pochopili hlavnú silu a slabú stránku epub, vráťme sa o 12 rokov späť. V roku 2000, keď sa váš skromný sluha práve pripojil k elektronickému čítaniu (presnejšie povedané, zákerne ho naňho pripútala notoricky známa e-kniha), Moshkov Library, Aldebaran, Litportal a bohvie koľko ďalších malých knižníc. V zásade bolo dostupných dosť veľa textov. Hlavne vo forme HTML.
HTML už vtedy poskytovalo najširšie možnosti dizajnu. Vďaka tomu ľudia, ktorí texty pripravovali, niekedy vytvorili skutočné majstrovské diela layoutu. Stačí si spomenúť, že odseky v Moshkovovej knižnici boli (a teraz podľa mňa Moshkov horí rovnakým spôsobom) ozdobené zmesou značiek

A
Čitatelia v reálnom živote (iSilo, Microsoft Reader, Mobipocket, zariadenia REB atď.) však rozumeli len obmedzenému dialektu HTML a ešte obmedzenejšej podmnožine CSS.  Samozrejme, každý čitateľ postavil na formáte „rozšírenia“, ale nikto ho nenavrhol pre konkrétneho čitateľa. 
Nakoniec, po skombinovaní kreatívnych objavov tvorcov textu, inšpirovaných silou HTML + CSS a neobmedzených v rozlete ich fantázie, so skutočnými čitateľmi, bol výsledok na obrazovke používateľa spravidla nezmysel. Kniha bola nanajvýš nevkusná, ale čítala sa. V najhoršom prípade sa text vo všeobecnosti zmenil na kašu.
Mojou prvou odpoveďou na to bol ClearTXT, program, ktorý odstraňuje „kreativitu“ z textu. Rýchlo sa však ukázalo, že žiadna heuristická analýza nedokáže držať krok s predstavivosťou tvorcov html kníh. Nakoniec som aj tak musel viac-menej pracovať rukami.

Dialektové problémy neboli jediné. Programy na čítanie mali nielen individuálne „výrazové prostriedky“ a „jazykové preferencie“. Žiadna z nich nečíta HTML priamo (v tomto ohľade sa len málo zmenilo, mimochodom, navrhujem, aby ste sa zamysleli nad tým, prečo). Každý program používal svoj vlastný, zvyčajne proprietárny spôsob prípravy a balenia údajov. lit, rb, lrf, chm - každý tvorca čítačky a vývojár zariadení považoval za svoju povinnosť „vynájsť“ nový uzavretý „formát“ a svoje vlastné, osobné riešenie DRM. Nástroje na konverziu do tohto proprietárneho formátu boli často buď nedostupné, alebo boli vydané ako aplikácie a/alebo knižnice špecifické pre platformu s obmedzenou alebo žiadnou dokumentáciou.

Dva problémy v roku 2000, jeden problém v roku 2012
Takže v roku 2000 nám dve veci zabránili vziať ľubovoľný html a poskytnúť ho čitateľovi:

  1. Potreba používať ťažkopádne nástroje tretích strán na zabalenie HTML do čitateľného formátu
  2. Nekompatibilita čítačky s použitými značkami a štýlmi
epub ponúka riešenia pre oba problémy:
  1. Baliace prostriedky sú štandardizované a technologicky vyspelé – pomocou OCF, poznámkového bloku a zipsového archívu môžete dokonca ručne, za približne 20 minút, zostaviť veľmi zložitú knihu.
  2. Ako sme už videli, epub je kompatibilný so všetkými dialektmi, štýlmi a metódami označovania. Uložte z webu, archivujte a čítajte.
Zdalo by sa, že je všetko v poriadku.
A na obal na epub nie sú žiadne sťažnosti, okrem estetických. Používa sa riešenie, aj keď neštandardné a nie najúspešnejšie, ale je primerané úlohe a tiež jednoduché ako palica.
No ohľadom zobrazovania textu v čítačkách nás čakajú zlé správy. Samotný „formát“ je kompatibilný so všetkými druhmi HTML, áno. Bolo by také ľahké napísať štandardné „pozri. html špecifikácia“. Pokušenie bolo veľké a IDPF neodolal. Teraz však otvoríme náš „akýkoľvek“ kód HTML v „ľubovoľnej čítačke“ a...
A zisťujeme, že sme sa v porovnaní s rokom 2000 nepohli ani o kúsok. Tak ako na konci minulého storočia, každý konkrétny čitateľ rozumie len svojmu obmedzenému dialektu html+css. Podobne ako v minulom storočí je dialekt vo všeobecnosti nezdokumentovaný. Tak ako predtým, každý čitateľ zavádza svoje vlastné nekompatibilné rozšírenia na riešenie aj takých štandardných problémov, ako sú poznámky pod čiarou (poznámky pod čiarou epub hľadajte na Google, spôsoby vytvárania, okrem premeny poznámok pod čiarou na odkazy, sa líšia od úplne kyslých CSS po javascript) . Najjednoduchšie veci sú takmer nemožné robiť zložité veci buď nefungujú, alebo spôsobujú zlyhanie čítačky.

Tu je vaša domáca úloha: bez toho, aby ste sa pozerali na epub z litrov, vytvorte epub s prázdnym riadkom medzi dvoma odsekmi (text, prázdny riadok, opäť text, ako pred týmto odsekom), ktorý sa zobrazí rovnako v iBooks, ADE, Sony a Nook. Čínske čítačky zázrakov a iné exotické veci necháme bokom, aby úloha zostala realizovateľná. A nebudeme žiadať ani odôvodnenie alebo delenie slov pomocou poznámok pod čiarou. Len prázdny reťazec, tag na fb2. Čas uplynul.

Verdikt v prípade epub
Zjavnými výhodami formátu sú jednoduchosť a vyrobiteľnosť zipsového obalu a otvorenosť.
Za plus možno považovať aj jediné riešenie DRM. IDPF hanebne predstiera, že DRM v epub je otvorené a každý si môže vytvoriť svoje vlastné. Každý akosi verí. A jasne chápu, že epub existuje na 99% vďaka tomu, že Adobe preň podporuje DRM infraštruktúru. DRM je zlo, ale jedno DRM pre každého je menšie zlo ako DRM na obchod.
Áno, je hlúpe, keď sa archivovaný HTML s DRM, ktorý sa dá prelomiť za jednu minútu, prezentuje ako ktovie aká inovácia. Ale zips a iná štandardizácia nie sú nič iné ako pokrok.
Čo sa týka výhod, to je všetko.

Ale v oblasti vytvárania komplexných značiek nie je epub vôbec dobrý a v budúcnosti budú existovať iba nevýhody. Formát nedáva tvorcovi knihy žiadne záruky, čo na obrazovke uvidí koncový čitateľ, ani spoľahlivé prostriedky ovládania, ktoré nám umožnia odrezať aspoň očividne „nefungujúce“ možnosti, ani hotové riešenia štandardných úloh. Môj prvý súbor epub, ktorý práve prešiel overením, zlyhal pri dvoch z troch čítačiek, na ktorých som ho testoval (príliš veľké html – 2 MB a príliš veľa odkazov, ako som si neskôr nainštaloval). Tvorcovia dokumentov sú nútení buď ignorovať „funkcie“ jednotlivých čítačiek epub, alebo ponúkajú niekoľko súborov epub, aby si čitateľ mohol vziať súbor, ktorý je kompatibilný konkrétne s jeho zariadením. Nestálo to za to robiť rozruch kvôli takému koncu – aký má zmysel vyložiť html5 s vedomím, že sa bude čítať v IE3?

Čo môžeme očakávať od epub v budúcnosti?
Najpriaznivejším scenárom pre epub je vytlačenie malých vývojárov z výklenku čítacích programov niekoľkými veľkými hráčmi. Vyrobiť plne funkčný html5 parser so stránkovaním nie je aspoň o nič jednoduchšie ako vyrobiť moderný prehliadač a návratnosť je neporovnateľne menšia a nebudú tu žiadni náhodní ľudia. Ani Google, ani Microsoft, ani Opera však zatiaľ nevytvárajú nové enginy čítačky epub, aby mohla Adobe poriadne zarobiť peniaze na svoje zázračné DRM. A samotná Adobe celkom jasne ukázala svoj potenciál pre rozvoj čitateľov – ADE stále nemá podporu pre poznámky pod čiarou, ani normálnu typografiu, ani delenie slov.
Je teda oveľa pravdepodobnejšie, že o päť rokov sa okolo epub vytvorí akýsi „nepísaný IDPF“, neformálny súbor pravidiel rozloženia, fungujúce dizajnové riešenia, testované na popredných čitateľoch „hackov“ a „trikov“. Online komunita už vytvára „skutočný“ štandard epub, ktorý dopĺňa všetko odpúšťajúce „html5+css3+všetko_vy_chcete_viac“. Sú opísané skutočné riešenia skutočných problémov v skutočných čitateľoch. Potom sa tieto „triky“, ktoré sú de facto štandardom, stanú povinnými pre vývojárov nových elektronických čítačiek. Tí, ktorí sú v IT dostatočne dlho na to, aby mali čas prehltnúť dym z vojen prehliadačov a pracovať s IE4, NN4 a Opera 3, majú skvelú predstavu o tom, čo nás presne čaká – online komunita už prešla touto hrou a stále škytá na tejto prechádzke. Preto, keď vidím „tento súbor epub je optimalizovaný pre iBooks“, zažívam nielen deja vu, ale aj akútny dávivý reflex.

A pretože sa nás snažia posunúť „späť do 90. rokov“, dávam epub neúspešný. Nepotrebujeme hacky, ktoré sa v novej verzii softvéru stanú neúčinnými. Nepotrebujeme nepísané pravidlá, ktoré sa náhodne preberajú kúsok po kúsku. Nie sú potrebné právne chyby. Nie je potrebné „overenie testovaním“ pre všetkých čitateľov – „ukáže sa alebo neukáže“. Toto všetko sme prešli.
Potrebujeme spoľahlivú a užívateľsky príjemnú technológiu, jasný štandard a fungujúce kontroly kvality. A epub nám to, žiaľ, nemohol poskytnúť.

Čo čakať od epub je zbytočné
Medzi nedostatky epub patrí ešte jeden, ktorého sme sa zatiaľ nedotkli – zásadná nekompatibilita s inými formátmi. epub sa narodil ako monopolista. Extrahovanie údajov z epub a ich prevod do iného formátu, dokonca aj pre jednoduchý html, nie je ľahká úloha. Keď epub dospeje a zarastie hackmi pre zariadenia a zložitými riešeniami, ako sú poznámky pod čiarou pomocou CSS, extrahovať z neho čokoľvek bude takmer nemožná úloha. Bez ohľadu na formát, ktorý spoločnosť Adobe vyvinie, výsledkom je PDF - vstup je rubeľ a výstup je päť.
Stále však potrebujeme podporu pre rôzne (vrátane starých) čítačiek a zariadení. Potrebujeme plnú podporu pre alternatívne formáty, ktoré už pribrali (mobipocket na Kindle) a budú sa na trhu objavovať aj naďalej.

Okrem toho potrebujeme nástroje na katalogizáciu, výmenu citátov a poznámok a tak ďalej a tak ďalej, čo epub zatiaľ nesľubuje ani na deklaratívnej úrovni. Inými slovami, potrebujeme fb3, o čom bude ďalší článok.

Takmer všetci ľudia, ktorí ma žiadajú o radu pri výbere konkrétneho čítacieho zariadenia, sa pýtajú aj na formáty elektronických kníh – čo je lepšie a prečo. V tomto článku odpoviem na tieto otázky veľmi podrobne; Zvážim oba formáty na čítanie beletrie a formáty na čítanie technickej, vedeckej a náučnej literatúry.

Beletria

Na internete nájdete beletriu v týchto formátoch: TXT, RTF, FB2, EPUB, MOBI, DOC, PDF, DJVU. Hneď poviem, že je lepšie kupovať/sťahovať knihy EPUB, FB2 alebo MOBI. Práve tieto formáty sú najvhodnejšie na čítanie beletrie.

Formáty PDF a DJVU sú príliš ťažké a nepohodlné; Často je text v nich v skutočnosti obrázkom, to znamená, že môžete zmeniť iba mierku celej strany, ale nie veľkosť samotného písma. Na čítacích zariadeniach (čítačkách) sa knihy vo formáte PDF a DJVU niekedy nezobrazujú veľmi dobre: ​​písmená môžu byť veľmi malé; Text je nepohodlný na čítanie.

Formáty TXT a RTF takéto nevýhody nemajú, ale majú iné nevýhody: text v TXT sa nedá formátovať vôbec, to znamená, že nadpisy, epigrafy, úvodzovky nijako nevyniknú; Navyše TXT nepodporuje obaly, obrázky a tabuľky. Toto je veľmi slabý, jednoduchý formát. V RTF sú, samozrejme, bohatšie možnosti formátovania, ale existujú aj nevýhody: automaticky zhromažďovaný obsah a poznámky pod čiarou nie sú podporované. Okrem toho sú súbory RTF zvyčajne dosť veľké a niektoré čítacie zariadenia ich nie vždy zobrazujú správne.

Formát DOC (a jeho variant DOCX) je skvelý pre zložité dokumenty, ale nie je vhodný pre beletriu: je príliš objemný a zložitý; Dokumenty DOC sa na rôznych zariadeniach často zobrazujú odlišne.

Úplne inou záležitosťou sú tri špecializované formáty ušité špeciálne pre beletriu: EPUB, MOBI, FB2 (a jeho variant FB2.ZIP). Tieto formáty sú založené na takzvanom „plávajúcom rozložení“, ktoré vám umožňuje meniť veľkosť, typ písma, riadkovanie a šírku okrajov. Navyše tieto formáty podporujú obrázky, tabuľky, automaticky zostavený obsah, poznámky pod čiarou a mnoho ďalších vecí. Čítanie kníh vo FB2/FB2.ZIP, EPUB, MOBI je naozaj príjemné a pohodlné.

Samozrejme, medzi týmito formátmi sú určité rozdiely, no pre začiatočníkov nie sú podstatné. Hoci stojí za zmienku, že na ruskojazyčnom internete je najviac kníh vo FB2, v EPUB je ich už menej a v MOBI ešte menej.

Konečný výber formátu závisí aj od vášho čítacieho zariadenia: s niektorými formátmi môže fungovať lepšie a s inými horšie. Tu je potrebné experimentovať. Okrem toho existujú zariadenia, ktoré podporujú iba jeden z uvedených troch formátov. Napríklad Amazon Kindle číta iba MOBI a B&N Nook iba EPUB.

Môžete si prečítať viac o formáte FB2, o EPUB-, o MOBI-.

Vedecká, technická a náučná literatúra

Tu je všetko komplikovanejšie: tento druh literatúry sa zvyčajne distribuuje vo formátoch PDF, DJVU, DOC (DOCX), z ktorých každý, ako som už uviedol, má určité nevýhody. Niekedy to ešte komplikuje fakt, že niektoré knihy sú dostupné len v jednom formáte a niekedy len v jednej verzii.

Formát DOC v zásade nie je až taký zlý – v porovnaní s PDF/DJVU. Čítanie kníh na počítači je viac-menej pohodlné. Horšia situácia je s čítacími zariadeniami: niektoré čítačky ho zobrazujú takmer ako holý text, s vylúčením množstva ilustrácií, tabuliek, vzorcov atď. Iní to zobrazujú skôr ako obrázok: sú zobrazené dizajnové prvky, ale nemôžete zmeniť veľkosť písma a typ písma, čo sa niekedy na malej obrazovke zmení na katastrofu.

PDF. Existujú tri varianty tohto formátu: text, grafika („obrázok“) a grafika („obrázok“) s vrstvou OCR. Prvá možnosť je najvýhodnejšia: môže obsahovať všetky prvky formátovania a text zostáva škálovateľný. V prípade grafického PDF je text iba obrázkom, ktorý je možné zväčšiť iba celý; Veľkosť písma sa nedá zmeniť. Grafické súbory PDF sa preto veľmi ťažko čítajú na zariadeniach s malými obrazovkami.

Niekedy sa vrstva OCR aplikuje na grafické stránky PDF pomocou softvéru OCR. V knihe PDF s vrstvou OCR môžete vyhľadávať a používať slovník. Toto je dobrá možnosť. Ale opäť, nie všetky čítacie zariadenia „vidia“ túto vrstvu OCR. A to vám neumožňuje zväčšiť veľkosť písma. Preto sa vrstva OCR často ukáže ako zbytočná.

Formát DJVU sa vo všeobecnosti podobá grafickému PDF: zvyčajne ide len o súbor skenov alebo fotografií papierovej knihy. Kvalita týchto skenov/fotografií môže byť úplne hrozná, alebo môže byť celkom slušná. Niekedy sa vrstva OCR aplikuje na skeny/fotografie pomocou programu na rozpoznávanie textu. V knihe DJVU s vrstvou OCR môžete vyhľadávať a používať slovník. Toto je dobrá možnosť. Ale opäť nie všetky čítacie zariadenia „vidia“ túto vrstvu OCR a nedovolí vám zväčšiť veľkosť písma. Preto je OCR vrstva často prakticky zbytočná.

Aby som to zhrnul: najpreferovanejším formátom na čítanie vedeckej/technickej/náučnej literatúry je textové PDF, na druhé miesto by som dal DOC a na tretie grafické PDF a DJVU s OCR vrstvou. Na poslednom mieste sú obrázkové PDF a DJVU bez OCR vrstvy.

Dokumenty, tabuľky a prezentácie

Väčšina dokumentov, tabuliek a prezentácií je distribuovaná vo formátoch MS Office: DOC/DOCX, XLS/XLSX, PPT/PPTX. Tieto formáty sú veľmi funkčné, ale, bohužiaľ, dosť „nemotorné“ a veľmi „uzavreté“ (inými slovami, pre vývojárov tretích strán je dosť ťažké vytvoriť program na čítanie súborov v týchto formátoch). Preto ich niektoré zariadenia nepodporujú. Musíme previesť dokumenty do PDF.

Prevod dokumentu/tabuľky/prezentácie do PDF je veľmi jednoduchý: dokáže to každý slušný textový/tabuľkový editor. Okrem toho môžete použiť nejaký prevodník: nájdete ich zoznam.

Ak je dokument jednoduchý a hlavnou vecou v ňom je text, potom je lepšie ho previesť nie do PDF, ale do FB2 - takto sa bude čítať na čítačke s väčším pohodlím. Pozrite si zoznam relevantných prevodníkov.

Užívať si čítanie!



Súvisiace publikácie