Milline e-raamatu formaat on parem? Kumb on parem fb2 või epub? Fb2 epub võrdlus

ePUB on üks populaarsemaid e-raamatute vorminguid maailmas. Tegelikult on läänes selle ainus tõsine konkurents MOBI (Amazoni patenteeritud formaat, sellest järgmisel korral lähemalt). Venemaal ja teistes postsovetliku ruumi riikides on ka Fb2 populaarne (ma räägin sellest). Kuid isegi meie kunagise suure kodumaa avarustel kogub ePUB-i formaat aina enam populaarsust, eriti Fb2 uuenduste puudumise ja piraatlusvastase võitluse tugevnemise taustal. Seetõttu on siin mõned huvitavad ja kasulikud üksikasjad ePUB-vormingu kohta.

Mis on ePUB?

ePUB on raamatute elektrooniliste versioonide vorming. Nimi pärineb ingliskeelsest fraasist " e elektrooniline pubi likatsioon ja õige venekeelne hääldus on "ipab" (ei ole "epub"!). ePUB-raamat on tegelikult mitut kausta sisaldav arhiiv. Ühes on raamatu tekst, teises kirjeldus (autori nimi, pealkiri, kirjastaja, keel, tunnusnumber jne), kolmandas pildid, neljandas teenindusinfo. .. Lugemisprogramm kogub selle kõik kokku ja annab lugejale tulemuse vormindatud tekstina koos illustratsioonide, valemite jms. Formaat on avatud – igaüks saab seda muuta. ePUB on "ujuva paigutusega" formaat. See tähendab, et lugeja saab laialdaselt muuta kuvaparameetreid, nagu font ja vahed, ning tekst kohandub automaatselt soovitud ekraanisuurusega. Välja töötatud ja hooldatud International Digital Publishing Forum (IDPF) poolt, peamiselt Adobe poolt.

ePUB-vormingu ajalugu

ePUB-i eelkäija oli OEB (Open eBook Publication), mille töötas välja sama organisatsioon juba 1999. aastal. Selle põhjal loodi 2007. aastal kaasaegne ePUB. Formaat kogus läänes kiiresti populaarsust. Põhjusteks oli nii mugavus lõppkasutajale kui ka võimalus põimida failidesse nn DRM-kaitset, mis võimaldab piirata seadmete valikut, millel raamatut lugeda saab. Kuni 2010. aastani ePUB-vormingus Enamik e-raamatupoode on vahetanud. Suurim raamatukogu Gutenberg.com tegi selle raamatute hoidmise standardiks. Alates iPadi väljalaskmisest on ePUB olnud vorming, mida toetavad Apple'i patenteeritud rakendused – iBooks, Pages, iAutor. Alates 2009. aastast on Firefoxi jaoks olemas laiendus, mis võimaldab selles vormingus raamatuid otse brauseris lugeda. Sarnane lahendus on saadaval ka Chrome'i jaoks. Alates 2012. aastast on Sony muutnud ePUB-i oma seadmete põhivorminguks, loobudes patenteeritud LRF-ist. Alates 2010. aastast on USA valitsuse majandusaruandeid avaldatud sellisel kujul. 2011. aasta oktoobris esitleti vormingu praegust versiooni - 3.0, milles viimaks juurutati joonealused märkused.

Vormi eelised ja puudused

Kui me räägime eelistest ja puudustest, siis see sõltub sellest, millega võrrelda. Kui kasutate selliseid "arvuti" vorminguid nagu txt, rtf ja doc, saate pidevaid eeliseid. Ei txt ega rtf ei toeta sisukorda ning neil puudub või on väga piiratud vormindus. Doc on lugejaprogrammide jaoks väga raske vorming, mis on loodud spetsiaalselt Microsoft Wordi jaoks. Ükski neist vormingutest ei toeta metaandmeid. Kui võrrelda PDF-iga, on selline võrdlus täiesti vale, kuna need on erineva otstarbega vormingud. Vaatamata võimalusele põimida teksti pilte ja valemeid, ei sobi ePUB hästi nende elementide poolest rikaste raamatute jaoks – eelkõige õpikute ja erialakirjanduse jaoks. Sellise kirjanduse tõlkimine ePUB-i on üsna keeruline ülesanne. Ja siin tuleb appi PDF. Teisest küljest on PDF fikseeritud paigutusega formaat, mis ei kohandu ekraani suurusega. Varem oli PDF-dokumentide lugemine alla 9" ekraanidel täiesti problemaatiline – kuvati vaid osa lehest. Nüüd on olemas spetsiaalne formaat, nn PDF6, kuid ka see ei lahenda probleemi.

Kuid kõige asjakohasem võrdlus on populaarsete konkurentidega - Fb2 ja MOBI. Viimasega tavalugeja jaoks praktiliselt vahet pole. Võrreldes Fb2-ga on ePUB “arenenud” vorming, sellel on rohkem võimalusi. Näiteks toetab see valemeid ja mõnda muud vorminguelementi, mis pole Fb2 jaoks saadaval. Kirjastajate ja e-raamatute müüjate jaoks on ePUB-i oluliseks eeliseks võimalus ehitada faili DRM-kaitse. Aga tavalise ilukirjandusliku raamatu lugemiseks ei saa öelda, et ePUB on Fb2-ga võrreldes midagi kardinaalselt paremat.

Igal juhul on nüüd olemas suur hulk konverteriprogramme, mis võimaldavad teil vajaliku raamatu ühest vormingust teise üle kanda. Seetõttu on arutelu selle üle, kas ePUB on parem või halvem kui mis tahes muu vorming, suures osas oma aktuaalsuse kaotanud.


Elektroonilised raamatud (lugejad, lugejad) on pikka aega muutunud paljude kasutajate jaoks tavaliseks seadmeks. Nende eelised: juurdepääs sisule (vajaliku raamatu saate Internetist alla laadida mõne minutiga), E-tindi ekraan, mis ei kahjusta teie nägemist, võimalus hoida lugejas tuhandete raamatute kogu, pikk töö ühe laadimisega, fondi tüübi ja suuruse sätted. Mitte kaua aega tagasi ilmusid taustvalgustusega ekraanidega e-raamatud – need võimaldavad lugeda täielikus pimeduses. Üldiselt võib lugejate eeliseid loetleda väga pikalt.

E-lugeritega tutvudes on aga kasutajatel sageli üks probleem. Inimesed, kes otsustavad esimest korda lugeja osta, kui puutuvad kokku mõistega „elektroonilised raamatuvormingud”, ei saa sageli aru, millest me räägime. Probleem on eriti aktuaalne algajatele, kelle jaoks lühendid "FB2", "EPUB" või "MOBI" ei tähenda absoluutselt mitte midagi.

Niinimetatud vormingud on erinevat tüüpi elektroonilised tekstifailid, mida üks või teine ​​toetab (esitab). Interneti elektroonilised raamatukogud pakuvad sageli suurt hulka failitüüpe: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT ja teised. Valik on lai ja see seab algajatele teatud väljakutsed. Kirjeldame e-raamatute peamisi vorminguid, räägime, kuidas need üksteisest erinevad, milliseid lugejaid toetatakse ja millist vormingut on parem valida, kui teil on mitme vorminguga lugeja, mis loeb kõiki vorminguid.

Erinevad vormingud

1. FB2 (ilukirjandusraamat)- e-raamatu vorming, mille lõi Venemaa arendajate rühm. Seda tüüpi failidel on struktureeritud välimus (st need sisaldavad jaotust peatükkide, sisu, illustratsioonide, kaane järgi). Lisaks salvestab see standard faili kohta teavet (nn sildid: autor, pealkiri, žanr), mida lugeja loeb ja mis võimaldab kasutajal seadmes faile mugavalt sorteerida. Seda tüüpi failid võtavad vähe ruumi, neid saab arhiveerida ja neid on lihtne ka muudesse vormingutesse teisendada. Funktsioonide hulgas: kuna vorming töötati algselt välja kirillitsa tähestiku jaoks, on venekeelsetes tekstides FB2-s sõna sidekriipsud.

Formaat oli algselt mõeldud Venemaa kasutajatele ja välismaal seda praktiliselt ei kasutata. Seetõttu ei toeta FB2 maailma populaarsed e-lugerite tootjad – Amazon ja Barnes & Noble. Kuid see on Pocketbooki, Onyxi ja Wexleri Venemaal populaarsete e-lugerite peamine failivorming. Lisaks toetavad Sony lugejad nüüd FB2-d – pärast Venemaa turule sisenemist on ettevõte välja töötanud lugeja jaoks ametliku püsivara, mis võimaldab lugeda raamatuid FB2-s.

2. EPUB (elektrooniline väljaanne)- maailma populaarseim elektrooniline formaat lugejatele. Barnes & Noble ja Sony lugejad töötavad sellega. Paigutuse struktuuri poolest meenutab seda tüüpi fail arhiivitud veebilehte, mis sisaldab teksti, graafikat, manustatud fonte ja illustratsioone.

Lisaks lääne kaubamärkidele toetavad EPUB-vormingut Venemaa turule keskendunud tootjate mudelid (Pocketbook, Onyx, Wexler), kuna populaarsus on meie riigis kiiresti kasvanud. Lisaks kasutavad seda e-raamatu standardit iPhone ja . Apple'i iBooksi lugeja toetab EPUB-i.

3. MOBI- e-raamatute lugejate formaat. Kogub Venemaa veebiraamatukogudes populaarsust, kuna Kindle muutub Venemaal populaarsemaks. Teised lugejad toetavad seda vormingut „esitluseks”. MOBI on omadustelt sarnane EPUB-iga. Amazon tutvustas hiljuti teist elektroonilist tekstivormingut, Kindle Format 8 või KF8 (sellel on rikkalikum vorming), täpsustusega, et Amazoni uued ja vanad lugejad jätkavad MOBI toetamist.

4. TXT- lihtsate tekstidokumentide vorming. Saate teisendada teksti teisest vormingust TXT-vormingusse lihtsa kopeerimis-kleebi toiminguga. Hoolimata asjaolust, et seda tüüpi faile toetavad peaaegu kõik e-lugerid ja need võtavad väga vähe mäluruumi, ei soovita me e-lugerites selles sisalduvaid raamatuid lugeda. TXT-l puudub vormindamine, märgistus, sidekriipsutus ja joondus. See sobib lühikeste tekstimärkmete jaoks, kuid mitte täisväärtuslike e-raamatute jaoks.

5. PDF (portable Document Format)- Adobe Systemsi loodud elektrooniline dokumendivorming. Ebamugav kasutada lugejatel mitmel põhjusel. Esiteks on sellises vormingus failid väga mahukad, kuna need on mõeldud arvuti võimsuse jaoks ja avanevad e-lugerites üsna aeglaselt. Teiseks, kui fail ei ole spetsiaalselt loodud 6-tollise lugeja ekraanile, mille formaat on sarnane A6 paberilehega, siis lugege sellelt A4 PDF-i (ja enamik PDF-faile esitatakse täpselt paberilehe suuruses). standardpaberileht) on väga raske. PDF-is saate suurendada ainult skaalat, kuid mitte fondi suurust, mis tähendab, et ekraanile mahub ainult mingi osa leheküljest. Peate lehti osade kaupa lugema ja see on väga ebamugav.

Lugemiseks sobivad PDF-id, mille ekraani suurus võimaldab reprodutseerida lehte mugavaks lugemiseks piisavalt suures skaalas.

6. DJVU- skaneeritud dokumentide – raamatute, artiklite, käsikirjade – hoidmiseks mõeldud formaat. DJVU-s olev raamat on tegelikult skannitud lehtede kogu. Lugemismugavuse osas 6-tollistel lugejatel on kõik sarnane PDF-iga. Te ei suurenda fondi suurust, vaid skaala. Suumimisel ulatub leht ekraanist kaugemale ja lugemiseks peate suurendatud teksti ala pidevalt liigutama - mugavast lugemisest pole vaja rääkida. DJVU lugemiseks valige 9-tollise ekraaniga lugejad. Kuid isegi 9-tollistel lugejatel sõltub DJVU mugava lugemise võimalus sellest, kui hästi selles formaadis esitletud raamat skannitakse.

7. LRF- varem Sony lugejate patenteeritud vorming. Uutel mudelitel (alates PRS-T1-st) seda enam ei kasutata, kuna see on andnud teed EPUB-ile. Teisendab väga halvasti muudeks failitüüpideks. Hoolimata asjaolust, et see on mõnes raamatukogus endiselt esindatud, on selle kasutamine soovitatav ainult vanemate Sony mudelite omanikele.

8. RTF (rikastekstivorming)- vorming tekstidokumentide salvestamiseks. Kuulub kategooriasse “arvuti”, mitte “raamat”. RTF-is lugemine lugejatel pole eriti mugav - need on suured failid ja lugeja kiirust vähendatakse suurusjärgu võrra.

9. DOC(ja DOCX) – Microsoft Office'i tekstidokumendid. Neid vorminguid toetavad üsna paljud lugejad, kuid just dokumentide, mitte raamatute lugemiseks. Selles vormingus suured failid võivad olla suured ja nendega on lugejatel raske töötada. Parem on teisendada mitmeleheküljelised DOC-vormingus raamatud FB2- või EPUB-vormingusse.

Oleme välja toonud e-raamatute peamised vormingud. Me ei võta arvesse täiesti eksootilisi failitüüpe, mida mõnikord Internetis leidub, vaid otsustame, milline ülaltoodud vormingutest on kõige mugavam raamatute lugemiseks elektroonilistes lugejates.

Millist e-raamatu vormingut valida

Kui teil on e-luger, mis toetab kõiki vorminguid, saate valida konkreetse failitüübi mitme teguri põhjal. Oletame, et ostate oma esimese e-raamatu ja teil pole näiteks FB2-s eelnevalt kogutud raamatute kogu. Sel juhul valige failivorming, mida teie lugeja suudab kõige paremini reprodutseerida. Traditsioonilised “raamatu” vormingud EPUB või FB2 on lugejale (ja kasutajale) eelistatumad ja mugavamad kui “arvuti” PDF, TXT, DOC, DOCX ja RTF.

9-tolliste lugejate ja DJVU ja PDF-i lugemise vajaduse korral, kui kõik muud asjad on võrdsed, soovitame eelistada viimast, kuna PDF on moodsam formaat ja DJVU-s raamatud on sageli kehva kvaliteediga. .

Kasutusmugavuse seisukohalt on “raamatu” vormingute eelised ilmsed: EPUB, FB2 või MOBI näevad lugeja menüüs visuaalselt paremad välja (kuvatakse raamatukaaned), neid on mugavam sorteerida (on sildid: autor, pealkiri, žanr), võtavad need palju vähem mäluruumi ja selliste vormingute puhul on lugeja kiirus oluliselt suurem.

Kas vajate tuge kõigi vormingute jaoks?

Meie arvates ei ole üldse vaja valida täisformaadilist lugejat. Paljud kasutajad, kellel on kõiki vorminguid toetavad lugejad, laadivad raamatuid alla ühe või kahe failitüübina. Kõigil e-lugeritel (ka mitmeformaadilistel) on ühel või teisel viisil põhivorming ja lõpuks te ei vaheta seda teiste vastu. Pocketbooki, Onyxi ja Wexleri jaoks on peamised vormingud FB2 või EPUB, Barnes & Noble'i () ja Sony jaoks - EPUB, Kindle'i jaoks - MOBI.

Amazoni ja Barnes & Noble'i lugejate puhul, kui vajalik raamat on vormingus, mida need lugejad ei toeta, saab kasutada konverterit (näiteks Caliber). See on teie arvutisse installitud programm, mis võimaldab teil mõne minutiga teisendada sama FB2 MOBI- või EPUB-vormingusse.

Raamatute lugemine lugeja algvormingus on parem kui lugejasse installitud lisaprogrammide kasutamine. Meie nõuanne: võtke mõni minut aega, et teisendada näiteks raamat RTF-vormingust EPUB-vormingusse, kasutades konverterit Caliber. See on mugavam, kui lugeda seda "originaalis" täiendavalt installitud programmi abil (Sony PRS-T1 või Kindle'i puhul) või seadme aeglasema tööga (näiteks Pocketbooki lugejatel).

Pidage meeles, et peamine on e-raamatu kasutusmugavus, mitte selle parameetrites märgitud vormingute arv.

Nautige lugemist!

2015-03-11 | Kategooriata

Raamatuid armastav inimene püüab lugeda kõikjal ja igal pool. Seetõttu on e-lugerist või mobiiltelefonist lugemine viimastel aastatel nii populaarseks muutunud. Muidugi võime oma raamatukogule täiendusi valides rääkida nii palju kui tahame uue paberraamatu lõhna naudingutest, meeldivatest hetkedest raamatupoes, kuid fakt jääb faktiks, et igapäevases saginas. e-raamatute lugemine on lihtsam kui tavaliste paberköidete kaasas kandmine. Kui kirjutate ja soovite, et teie töö muutuks lugejatele mugavaks ja kättesaadavaks, ei piisa ainult avatud ressurssidele tekstide postitamisest, oleks tore lisada neile ka failiversioonid, et inimesed saaksid teie loomingut alla laadida ja seda vabal ajal hinnata .

Olenemata sellest, kas olete lugeja, kirjutaja või kaks-ühes, võite failidega tekste alla laadides või üles laadida, et teie telefon või lugeja ei toeta seda vormingut (või kurdavad teie lugejad, et failid saavad ei loe seda vormingut). Et mõista, miks see juhtub, oleme teile kirjutanud lühikese selgituse selle kohta, mis tüüpi e-raamatute vorminguid on olemas, kuidas need erinevad ning millised on nende eelised ja puudused.

Vormingute tüübid:

Esiteks tuleb märkida, et levinumad e-raamatu vormingud on: FB2, EPUB, MOBI, PDF, RTF, TXT, DOC/DOCX ja DjVu. Loomulikult on asjatundmatul inimesel sellise mitmekesisusega silmitsi seistes raske aru saada, mis on mis ja millist vormingut failide lugemiseks või teisendamiseks valida.

Microsoft Windows, kuid kahjuks ei toeta enamik lugejaid DOC/DOCX-i ja need ei pruugi alati mobiiltelefonides avaneda ning raamatute lugemine TXT-vormingus on väga-väga ebamugav.

Räägime aga kõigest järjekorras:

FB2 (ilukirjandusraamat)

Eelised: Üks levinumaid vorminguid Interneti venekeelses segmendis. Suurt dokumenti on mugav struktureerida, jaotada peatükkideks jne. FB2 failid võtavad vähe ruumi ja on kergesti teisendatavad muudesse vormingutesse.

Puudused: FB2 on Venemaal välja töötatud formaat. Seda ei toeta enamik lugejaid ja see on maailmas tundmatu. See avaneb ainult Vene püsivaraga seadmetes ja on võõras kaubamärgiga lugejatele, mis on maailmas juhtivad: Sony, Amazon Kindle, Barnes&Noble, Kobo jne. Jah, võite kihla vedada, et see avaneb Sony FB2-s, kuid ametlik püsivara, mis võimaldab selle vormingu avamiseks Sony lugejates, avaldati alles paar aastat tagasi ja seda pole installitud kõikidele mudelitele. Kui räägime sinu teoste müügist Amazonis või iTunesis, on vastus selge – FB2 ei sobi rahvusvahelistele platvormidele.

PDF (Adobe Portable Document Format) ja DjVu (hääldatakse "deja vu") - me ei käsitle neid eraldi ja ühendame need ühte punkti.

Eelised: mõlemat vormingut kasutatakse skannitud raamatute salvestamiseks. PDF võib luua väga värvilisi faile. DjVu lihtsalt tihendab failid üsna hästi, muutes need vähem kaaluvaks.

Puudused: PDF-failid on väga mahukad. Kui me räägime skannimisest, siis igal juhul on skannitud raamatuid ekraanilt ebamugav lugeda, kuna nende kvaliteet jätab palju soovida, olenemata sellest, kas skaneering postitatakse PDF-vormingus või DjVu-vormingus.

Eelised: TXT avaneb igal lugejal. DOC/DOCX on tuntud Microsoft Wordi vormingud.

Miinused: TXT-vormingus raamatute lugemine on kohutavalt ebamugav, kuna sellel puudub teksti vormindamine (laiuse joondamine, lõikude ümberkujundamine, peatükkideks jagamine jne). DOC/DOCX-i toetab väga väike arv lugemisseadmeid.

RTF (rikastekstivorming)

Eelised: Mugav ja kompaktne formaat tekstifailide salvestamiseks.

Puudused: seda toetavad äärmiselt harva lugejad ja mobiiltelefonid, tahvelarvutid jne.

Eelised: LRF on Sony spetsiaalne e-raamatu formaat. MOBI raamatuvorming Amazon Kindle'i jaoks.

Miinused: Praegu toetab Sony ka populaarsemat e-raamatu vormingut – EPUB.

EPUB (elektrooniline avaldamine)

Eelised: EPUB on kõige levinum e-raamatu formaat maailmas. Sellel pole äratundmisega probleeme ja see võimaldab luua hästi struktureeritud illustratsioonidega teksti. See formaat on juba omaette arhiiv ja seetõttu kompaktne ega vaja täiendavaid arhiive.

Nagu näete, on igal ülalmainitud vormingul oma eelised ja puudused. Näiteks e-raamatute kõige “loetavam” formaat on loomulikult TXT, kuid sellises formaadis raamatute lugemine on praktiliselt pilkupüüdev. Sellist teksti ei saa struktureerida, sellel puuduvad lõigud, peatükid, võimatu on lisada illustratsioone jne.

Levinuim ja mugavam e-raamatute lugemise formaat on EPUB. Kui aga räägime sellest, millisel kujul peaks autor oma teose netti üles riputama, oleks kõige ratsionaalsem lahendus postitada see mitmes formaadis korraga. Näiteks: EPUB (loetav kõikjal peale Amazon Kindle) + MOBI (loetav ainult Amazon Kindle'is) + DOC/DOCX (neile, kes on harjunud arvutist ja sülearvutist lugema). Loomulikult saab boonusena postitada teksti FB2-vormingus, millega venekeelne publik on nii harjunud, kuid mitte kõik seadmed ei ava selles formaadis faili.

Ja loomulikult teavitame selle artikli lõpus ja reklaamina, et SRÜ-s käivitati hiljuti uus Interneti-süsteem Booqla, mis on mõeldud käsikirjade mugavaks ja tasuta teisendamiseks EPUB-i ja MOBI formaadid. Sait pakub kasutajatele üle kogu maailma oma käsikirjade teisendamist elektroonilisse vormingusse ja abi e-raamatute müügil, kuid venekeelsele publikule on saadaval vaid käsikirjade tasuta teisendamine.

Registreerudes saate ise hinnata Booqla teenuse lihtsust ja mugavust

Lühidalt peamisest
Kui soovite epubist hea ettekujutuse saada, kujutage ette, et salvestasite veebilehe (nagu see) koos sellel kasutatud graafika ja stiilidega kettale. Kõigi kaasaegsete brauserite jaoks on see standardfunktsioon, näiteks FireFoxis saab seda teha menüü “Fail → Salvesta kui → Täielik veebileht” kaudu. Saate salvestada mitte ainult ühe, vaid mitu lehekülge kõrvuti. Seejärel asetate oma lehtede kõrvale kaks teenuse XML-faili. Üks on lihtsalt silt “see on epub” (container.xml), teine ​​sisaldab kõigi failide loendit – .html, .css, .jpg jne (tavaliselt fail content.opf).
Jääb vaid kõik see zip-arhiivi panna ja selle laiendus .zip-st .epub-iks muuta.
Kõik.
Raamat on valmis ja te juba teate, mis on epub. See pole nali ega liialdus – epub on lihtsalt zipitud html. Ei rohkem ega vähem.

Vormi kohta üksikasjalikult
Sisu paigutamine epub-arhiivi

Nagu me juba teada saime, on epub mitme failiga ZIP-arhiiv. Kui arhiveerite faile ZIP-arhiivi abil ja lisate arhiivile XML-faili container.xml, loote proosavormingus faili "Ava konteiner". Vaatamata selle sündmuse mõrvarlikult pretensioonikale nimele (IDPF oleks pidanud teadma, et on olemas ISO OPC standard ja mitte ratast uuesti leiutama), on täiesti võimalik IDPF-ile “Open Container Format” (OCF) puhul pöidlaid püsti panna (me teeme uuri allpool, miks).
Lisaks failile container.xml (peab olema META-INF-is) sisaldab epub tingimata veel üht teenusefaili, mis loetleb kõik muud arhiivis asuvad failid ja näitab nende tüübi, mida tavaliselt nimetatakse sisuks.opf.
Teadlikule inimesele meenutab kogu kujundus vägagi java pakette üldiselt ja OpenDocumenti eriti. Tõepoolest, IDPF soovib ühineda OpenDocumentiga. Pole väga selge, mis takistas meil OD-klooniga alustamast, kuna OpenDocument on kaks aastat vanem kui OCF, kuid ilmselt on jalgrattad paratamatu hulk amatööre, kes ei viitsinud dokumente õigel ajal lugeda. Nii et xpointer IDPF on ilmselt ka kindlalt ette nähtud EPUB3 raames uuesti leiutamiseks. Kuni 5 versioonid kasutavad linkide jaoks standardiseeritud w3c-vormingut ja otsivad ka võimalusi nende kombineerimiseks.

Milliseid andmeid epubis salvestatakse
epub sisaldab tavaliselt järgmist teavet:

  • Metaandmed: pealkiri, keel, autorid jne.
  • Navigeerimistööriistad: xhtml-failide ja saidikaardi sisu lehitsemise järjekord
  • Tegelik tekst on mitme xhtml-failina, mis võivad kasutada css-stiile, pilte jpg-s, gif-is ja png-vormingus, aga ka svg-vektorgraafikat ja -fonte. Uusim epub-versioon toetab MathML-i.
  • Lisaks võib epub sisaldada mitmeid täiendavaid väga spetsiifilisi märgistusfaile, raamatu PDF-versiooni printimiseks jne. eksootilist kraami, mida tegelikult ei kasutata, mida e-lugerid ei toeta ja mis ei paku huvilistele keskmine lugeja.
Metainfo epubis
Epubi minimaalne metateave sisaldab pealkirja, dokumendi ID-d ja keelt. Lisaks saab märkida autorid, tõlkijad ja teised raamatu loomisel osalejad, ilmumis/kirjutamise kuupäev, raamatu teema (vabas vormis), lihtteksti kirjeldus ja info kirjastaja kohta.
Võtmemetateave salvestatakse standardses Doublini tuumaskeemis, veidi laiendatuna. Autorite, teemade ja kõigi muude valdkondade (v.a kuupäevad ja keel) kirjeldused on antud vabas vormis, mis tegelikult välistab erinevatest allikatest pärit epubide efektiivse automaatse kataloogimise.

Navigeerimisvahendid
epub, nagu mäletame, võib sisaldada palju html-faile. Ja faile tuleb palju. Mitte sellepärast, et IDPF seda nõuab, vaid sellepärast, et epub-lugejad jooksevad kokku suurte failide tõttu ja kõik teevad palju väikeseid. Ja selleks, et lugejale tuttav “kerimine” toimiks, näitab epubi looja, millises järjekorras failid esitada. “Avamisel näitame 3.html, kui lugeja selle lõpuni läbi kerib, siis avame 1.html, siis 8.html. Ja faili footnotes.html ei saa otse kerides ligi, lugeja jõuab sinna allmärkuste kaudu,” midagi sellist. Tavaliselt sisaldub failis content.opf.
Teine vahend raamatus navigeerimiseks on sisukord. Kui see on olemas, salvestatakse see tavaliselt kausta toc.ncx. Tehniliselt on see sarnasem funktsiooniga "saidikaart" kui tavaline "sisu". Paberraamatu (või elektroonilise dokumendi) sisu järgib teksti ülesehitust, kuid .ncx ei ole seotud tekstifragmentide üldise järjekorraga ja võib nendega otseselt vastuollu minna. Kuid tegelikkuses kasutatakse faili tavaliselt sisuna ja see vormindatakse "tavaliselt", korrates lehitsemiseks määratud järjekorda.
Üldjuhul on samade andmete korduv salvestamine ja erinevatel viisidel ümberkirjutamine epubi kaubamärk. Metaandmeid hoitakse neljas kohas: OPF konteineri konteiner.xml kirjelduses, epub paketi content.opf kirjelduses, sisufailis toc.ncx ja html-failides (meta siltides). Sisu kirjeldatakse kolm korda - toc.ncx-i “raamatukaart” vaidleb sisu.opf-i fragmentide loetlemisega, milline neist on olulisem, ja h1-h6 pealkirjad html-is vaatavad seda kõike ja mõtlevad kättemaksule.

Raamatu tekst
Loomulikult sisaldab epub ka tegelikke html-faile koos raamatu tekstiga. Arhiivis hoitakse ka tekstis kasutatud elemente – graafikat, stiile, skripte, fonte.
HTML-i, css-i jne jaoks puuduvad olulised "lisandmoodulid" või "piirangud". epub ei seadista. Võtame kaasaegse veebisisu, mis pole muutunud isegi mitte “dünaamiliseks”, vaid “voolavaks” (epub toetab HTML5-d, mis näeb välja pigem OS-i kui märgistuskeelena; brauserid toetavad seda siiski piiratud määral), salvestame selle ketas, arhiveeri see – ja voilaa, e-raamat ongi valmis.
"Kallis, ma salvestasin Interneti kettale, mis edasi?"

Taust
Epubi põhitugevuse ja põhinõrkuse paremaks mõistmiseks läheme 12 aastat tagasi. Aastal 2000, kui teie alandlik teenija oli just liitunud elektroonilise lugemisega (täpsemalt köitis teda salakavalalt kurikuulus e-raamat), Moshkovi raamatukogu, Aldebaran, Litportal ja jumal teab, kui paljud teised väikesed raamatukogud. Päris palju tekste oli põhimõtteliselt saadaval. Peamiselt HTML-vormingus.
Juba HTML andis kõige laiemad võimalused kujunduseks. Tänu sellele lõid tekste koostanud inimesed mõnikord tõelisi küljenduse meistriteoseid. Piisab, kui meenutada, et Moshkovi raamatukogu lõigud olid (ja nüüd põleb Moshkov minu arvates samamoodi) kaunistatud siltide seguga.

Ja
Päriselu lugejad (iSilo, Microsoft Reader, Mobipocket, REB-seadmed jne) mõistsid aga vaid piiratud HTML-i dialekti ja veelgi piiratumat CSS-i alamhulka.  Muidugi ehitas iga lugeja vormingule “laiendused”, kuid keegi ei kujundanud seda konkreetse lugeja jaoks. 
Lõpuks, pärast HTML + CSS-i võimsusest inspireeritud ja piiramatut kujutlusvõimet tekstiloojate loominguliste läbimurrete kombineerimist tõeliste lugejatega, oli tulemus kasutaja ekraanil reeglina jama. Parimal juhul oli raamat inetu, aga loetav. Halvimal juhul läks tekst üldiselt pudruks.
Minu esimene vastus sellele oli ClearTXT, programm, mis eemaldab tekstist "loovuse". Kiiresti sai aga selgeks, et ükski heuristiline analüüs ei suuda html-raamatute loojate fantaasiaga sammu pidada. Lõpuks tuli ikka enam-vähem kätega tööd teha.

Murdeprobleemid polnud ainsad. Lugejaprogrammidel polnud mitte ainult individuaalseid "väljendusvahendeid" ja "keeleeelistusi". Ükski neist ei loe otseselt HTML-i (sellega seoses on vähe muutunud, muide, soovitan mõelda, miks). Iga programm kasutas andmete ettevalmistamiseks ja pakkimiseks oma, tavaliselt patenteeritud meetodit. lit, rb, lrf, chm - iga lugeja looja ja seadme arendaja pidas oma kohuseks "leiutada" uus suletud "formaat" ja oma isiklik DRM-lahendus. Tööriistad sellesse vormingusse teisendamiseks ei olnud sageli saadaval või avaldati platvormipõhiste rakenduste ja/või teekidena, dokumentatsiooniga piiratud või üldse mitte.

Kaks probleemi 2000. aastal, üks probleem 2012. aastal
Nii et aastal 2000 ei lasknud meil suvalist html-i võtta ja seda lugejale edastada kaks asja:

  1. Vajadus kasutada tülikaid kolmanda osapoole tööriistu HTML-i pakkimiseks lugejale loetavasse vormingusse
  2. Lugeja kokkusobimatus kasutatud märgistuse ja stiilidega
epub pakub lahendusi mõlemale probleemile:
  1. Pakkimisvahendid on standardiseeritud ja tehnoloogiliselt arenenud – saate isegi käsitsi, umbes 20 minutiga kokku panna väga keeruka raamatu, kasutades OCF-i, märkmikku ja zip-arhiivi.
  2. Nagu me juba nägime, ühildub epub kõigi dialektide, stiilide ja märgistusmeetoditega. Salvestage veebist, arhiivige ja lugege.
Näib, et kõik on korras.
Ja epubi pakendile pole peale esteetilise kaebusi. Kasutatakse küll mittestandardset ja mitte kõige edukamat lahendust, kuid see on ülesandega adekvaatne ja ka pulgana lihtne.
Kuid mis puudutab teksti kuvamist lugejates, siis ootavad meid halvad uudised. "Formaat" ise ühildub igasuguste HTML-idega, jah. Nii lihtne oleks olnud kirjutada standardisse “vt. html spetsifikatsioon". Kiusatus oli suur ja IDPF ei suutnud vastu panna. Kuid nüüd avame oma "mis tahes" HTML-i "mis tahes lugejas" ja...
Ja avastame, et me pole 2000. aastaga võrreldes tükikestki liigutanud. Nagu eelmise sajandi lõpus, mõistab iga konkreetne lugeja ainult oma piiratud html+css-i murret. Nagu eelmisel sajandil, on murre üldiselt dokumenteerimata. Nagu varemgi, tutvustab iga lugeja oma ühildumatuid laiendusi, et lahendada isegi selliseid standardprobleeme nagu joonealused märkused (otsige Google'ist epub-i allmärkusi, loomismeetodid erinevad lisaks allmärkuste linkideks muutmisele täiesti happelisest CSS-ist javascriptini). Lihtsamaid asju on peaaegu võimatu teha. Keerulised asjad kas ei tööta või põhjustavad lugeja krahhi.

Siin on teie kodutöö: ilma liitrit epubi vaatamata tehke epub, mille kahe lõigu vahele jääb tühi rida (tekst, tühi rida, jälle tekst, nagu enne seda lõiku), mis kuvatakse võrdselt iBooksis, ADE-s, Sonys ja Nookis. Jätame Hiina imelugejad ja muu eksootika kõrvale, et ülesanne jääks teostatavaks. Ja me ei küsi isegi joonealuste märkuste abil põhjendust ega sidekriipsu. Lihtsalt tühi string, silt fb2-s. Aeg on möödunud.

Kohtuotsus kohtuasjas epub
Formaadi ilmsed eelised on zip-paketi lihtsus ja valmistatavus ning avatus.
Plussiks võib pidada ka üksikut DRM-lahendust. IDPF teeskleb häbiväärselt, et epubis on DRM avatud ja igaüks saab ise teha. Kõik nagu usuvad. Ja nad mõistavad selgelt, et epub eksisteerib 99% tänu sellele, et Adobe toetab selle jaoks DRM-i infrastruktuuri. DRM on kurjast, kuid üks DRM kõigile on vähem kuri kui DRM poe kohta.
Jah, see on rumal, kui DRM-iga arhiveeritud HTML-i, mida saab ühe minutiga lahti murda, esitletakse kui kes teab mis uuendust. Kuid zip ja muu standardimine pole midagi muud kui edasiminek.
Mis puudutab eeliseid, siis see on kõik.

Kuid keeruka märgistuse loomise valdkonnas pole epub üldse hea ja tulevikus on ainult puudusi. Formaat ei anna raamatu loojale mingeid garantiisid selle kohta, mida lõpplugeja ekraanilt näeb, ega ka usaldusväärseid juhtimisvahendeid, mis võimaldaks vähemalt ilmselgelt “mittetöötavaid” valikuid ära lõigata ega ka valmis. standardülesannete lahendused. Minu esimene epub, mis oli just läbinud valideerimise, jooksis kahel kolmest lugejast, millel seda testisin (liiga suur html – 2MB ja liiga palju linke, nagu ma hiljem installisin,) kokku. Dokumendiloojad on sunnitud kas ignoreerima üksikute epub-lugejate "funktsioone" või pakkuma mitut epub-i, et lugeja saaks võtta faili, mis ühildub konkreetselt tema seadmega. Sellise lõpu pärast ei tasunud numbrit teha – mis mõtet on html5 välja panna, teades, et seda loetakse IE3-s?

Mida oodata epubilt tulevikus?
Epubi jaoks on kõige soodsam stsenaarium väikeste arendajate väljatõrjumine lugejaprogrammide nišist mitme suure mängija poolt. Täisfunktsionaalse html5-parseri tegemine koos lehekülgedega pole vähemasti lihtsam kui moodsa brauseri tegemine ja tootlus on võrreldamatult väiksem ning siin ei tule juhuslikke inimesi. Siiski ei tööta ei Google, Microsoft ega Opera veel uusi epub-lugeri mootoreid looma, et Adobe saaks oma imelise DRM-iga korralikult raha koguda. Ja Adobe ise on üsna selgelt näidanud oma potentsiaali lugejate arendamiseks – ADE-l pole endiselt ei joonealuste märkuste tuge ega tavalist tüpograafiat ega sidekriipsu.
Seega on palju tõenäolisem, et viie aasta pärast moodustub epub-i ümber omamoodi "kirjutamata IDPF", mitteametlik paigutusreeglite kogum, töötavad disainilahendused, mida testitakse juhtivate "häkkide" ja "nippide" lugejate peal. Veebikogukond on juba kujundamas "tõelist" epub-standardit kõike andestavale "html5+css3+everything_you_want_more" kõrval. Kirjeldatakse tõelisi lahendusi tõelistele lugejatele mõeldud probleemidele. Siis muutuvad need “nipid”, olles de facto standardiks, uute e-lugerite arendajatele kohustuslikuks. Need, kes on IT-ga tegelenud piisavalt kaua, et on jõudnud brauserisõdade suitsu alla neelata ning IE4, NN4 ja Opera 3-ga töötada, neil on suurepärane ettekujutus sellest, mis meid täpselt ees ootab – võrgukogukond on sellest rehast juba läbi astunud ja luksub ikka veel seda jalutuskäiku. Seega, kui ma näen teksti "see epub on optimeeritud iBooksi jaoks", ei kogen ma mitte ainult deja vu-d, vaid ka ägedat oksendamise refleksi.

Ja kuna nad üritavad meid tõrjuda "tagasi 90ndatesse", annan epubile läbikukkumise. Me ei vaja häkke, mis tarkvara uues versioonis ebaefektiivseks muutuvad. Me ei vaja kirjutamata reegleid, mis võetakse osade kaupa juhuslikult. Juriidilisi vigu pole vaja. Kõigi lugejate jaoks pole vaja "testimise teel kinnitamist" - "see näitab või ei näita." Me tegime seda kõike läbi.
Vajame usaldusväärset ja kasutajasõbralikku tehnoloogiat, selget standardit ja toimivat kvaliteedikontrolli. Ja epub ei saanud seda meile kahjuks anda.

See, mida epubist oodata, on kasutu
Epubi puuduste hulgas on veel üks, mida me pole veel puudutanud - põhimõtteline sobimatus teiste vormingutega. epub sünnib monopolistiks. Andmete eraldamine epub-ist ja teisendamine teise vormingusse isegi lihtsa html-i jaoks ei ole lihtne ülesanne. Kui epub küpseb ja kasvab seadmete häkkide ja keerukate lahendustega, nagu alamlehe allmärkused, kasutades CSS-i, on sealt millegi väljavõtmine peaaegu võimatu ülesanne. Ükskõik, millist vormingut Adobe arendab, on tulemuseks PDF - sisend on rubla ja väljund on viis.
Kuid me vajame endiselt tuge erinevatele (sh vanadele) lugejatele ja seadmetele. Vajame täielikku tuge alternatiivsetele vormingutele, mis on juba kaalus juurde võtnud (mobipocket Kindle'is) ja jätkavad turule ilmumist.

Lisaks vajame tööriistu kataloogimiseks, tsitaatide ja märkmete vahetamiseks ja nii edasi ja nii edasi, mida epub isegi deklaratiivsel tasemel veel ei luba. Teisisõnu vajame fb3-d, millest tuleb järgmine artikkel.

Peaaegu kõik inimesed, kes minult konkreetse lugemisseadme valimisel nõu küsivad, esitavad küsimusi ka e-raamatute formaatide kohta – kumb on parem ja miks. Selles artiklis vastan neile küsimustele väga üksikasjalikult; Kaalun nii ilukirjanduse lugemise formaate kui ka tehnika-, teadus- ja õppekirjanduse lugemise formaate.

Ilukirjandus

Internetist leiate ilukirjandust järgmistes vormingutes: TXT, RTF, FB2, EPUB, MOBI, DOC, PDF, DJVU. Ütlen kohe, et parem on raamatuid sisse osta/alla laadida EPUB, FB2 või MOBI. Just need formaadid on ilukirjanduse lugemiseks kõige sobivamad.

PDF- ja DJVU-vormingud on liiga rasked ja ebamugavad; Sageli on neis olev tekst tegelikult pilt, see tähendab, et saate skaleerida ainult tervet lehte, kuid mitte fondi enda suurust. Lugemisseadmetes (lugerites) ei kuvata PDF- ja DJVU-vormingus raamatuid mõnikord kuigi hästi: tähed võivad olla väga väikesed; Teksti on ebamugav lugeda.

TXT- ja RTF-vormingud on sellistest puudustest vabad, kuid neil on ka muid puudusi: TXT-vormingus teksti ei saa üldse vormindada, see tähendab, et pealkirjad, epigraafid, tsitaadid ei paista kuidagi silma; Lisaks ei toeta TXT kaaneid, pilte ja tabeleid. See on väga kehv ja lihtne formaat. RTF-is on vormindusvalikud muidugi rikkalikumad, kuid on ka puudusi: automaatselt kogutud sisukorda ja joonealuseid märkusi ei toetata. Lisaks on RTF-failid tavaliselt üsna suured ja mõned lugemisseadmed ei kuva neid alati õigesti.

DOC-vorming (ja selle variant DOCX) sobib suurepäraselt keerukate dokumentide jaoks, kuid ei sobi ilukirjanduse jaoks: see on liiga mahukas ja keeruline; DOC-dokumente kuvatakse erinevates seadmetes sageli erinevalt.

Täiesti erinev asi on kolm spetsiaalselt ilukirjanduse jaoks kohandatud vormingut: EPUB, MOBI, FB2 (ja selle variant FB2.ZIP). Need vormingud põhinevad nn ujuval paigutusel, mis võimaldab muuta suurust, fondi kirjatüüpi, reavahet ja veerise laiust. Lisaks toetavad need vormingud pilte, tabeleid, automaatselt kokkupandud sisukorda, joonealuseid märkusi ja palju muud. Raamatute lugemine FB2/FB2.ZIP, EPUB, MOBI kujul on tõesti meeldiv ja mugav.

Muidugi on nende vormingute vahel teatud erinevusi, kuid algajate jaoks pole need olulised. Kuigi väärib märkimist, et venekeelses Internetis on kõige rohkem raamatuid FB2-s, siis EPUB-is on neid juba vähem ja MOBI-s veelgi vähem.

Lõplik vormingu valik sõltub ka teie lugemisseadmest: see võib mõne vorminguga paremini töötada, teistega halvemini. See on koht, kus peate katsetama. Lisaks on seadmeid, mis toetavad ainult ühte kolmest määratud vormingust. Näiteks Amazon Kindle loeb ainult MOBI-d ja B&N Nook ainult EPUB-i.

Lisateavet saate FB2 formaadist, EPUB-ist, MOBI-st.

Teaduslik, tehniline ja õppekirjandus

Siin on kõik keerulisem: seda tüüpi kirjandust levitatakse tavaliselt PDF-, DJVU-, DOC (DOCX) vormingus, millest igaühel, nagu ma varem märkisin, on teatud puudused. Mõnikord teeb asja keeruliseks ikka see, et mõni raamat on saadaval vaid ühes vormingus, vahel aga ainult ühes versioonis.

DOC-vorming põhimõtteliselt polegi nii hull – võrreldes PDF/DJVU-ga. Raamatute lugemine arvutis on enam-vähem mugav. Lugemisseadmetega on olukord hullem: mõned lugejad kuvavad seda peaaegu palja tekstina, jättes välja hulga illustratsioone, tabeleid, valemeid jne. Teised kuvavad seda rohkem nagu pilti: kuvatakse kujunduselemente, kuid fondi suurust ja kirjatüüpi muuta ei saa, mis mõnikord muutub väikesel ekraanil katastroofiks.

PDF. Sellel vormingul on kolm varianti: tekst, graafika (“pilt”) ja OCR-kihiga graafika (“pilt”). Esimene võimalus on kõige eelistatavam: see võib sisaldada kõiki vorminguelemente ja tekst jääb skaleeritavaks. Graafilise PDF-i puhul on tekst vaid pilt, mida saab ainult tervikuna suurendada; Fondi suurust ei saa muuta. Graafilisi PDF-e on seetõttu väikese ekraaniga seadmetes väga raske lugeda.

Mõnikord rakendatakse OCR-i kiht graafilistele PDF-lehtedele, kasutades OCR-tarkvara. OCR-kihiga PDF-raamatus saate otsida ja kasutada sõnastikku. See on hea valik. Kuid jällegi ei näe kõik lugemisseadmed seda OCR-kihti. Ja see ei võimalda teil fondi suurust suurendada. Seetõttu osutub OCR-kiht sageli kasutuks.

DJVU-vorming sarnaneb üldiselt graafilise PDF-iga: tavaliselt on see vaid paberraamatu skaneeritud või fotode komplekt. Nende skaneeringute/fotode kvaliteet võib olla täiesti kohutav või üsna korralik. Mõnikord rakendatakse tekstituvastusprogrammi abil skaneeringutele/fotodele OCR-kihti. OCR-kihiga DJVU-raamatus saate otsida ja kasutada sõnastikku. See on hea valik. Kuid jällegi ei näe kõik lugemisseadmed seda OCR-kihti ja see ei võimalda teil fondi suurust suurendada. Seetõttu on OCR-kiht sageli praktiliselt kasutu.

Kokkuvõtteks: eelistatuim formaat teadus-/tehnilise/õppekirjanduse lugemiseks on teksti-PDF, teisele kohale paneksin DOC-i ning kolmandale kohale OCR-kihiga graafilise PDF-i ja DJVU. Viimase koha hõivavad ilma OCR-kihita pilt-PDF-id ja DJVU-d.

Dokumendid, tabelid ja esitlused

Enamik dokumente, tabeleid ja esitlusi levitatakse MS Office vormingutes: DOC/DOCX, XLS/XLSX, PPT/PPTX. Need vormingud on väga funktsionaalsed, kuid kahjuks üsna "kohmakad" ja väga "suletud" (teisisõnu, kolmanda osapoole arendajatel on nendes vormingutes failide lugemiseks programmi üsna keeruline luua). Seetõttu mõned seadmed neid ei toeta. Peame teisendama dokumendid PDF-vormingusse.

Dokumendi/tabeli/esitluse PDF-iks teisendamine on väga lihtne: seda saab teha iga korralik teksti-/arvutustabeliredaktor. Lisaks saate kasutada mõnda muundurit: leiate nende loendi.

Kui dokument on lihtne ja selles on peamine asi tekst, siis on parem teisendada see mitte PDF-iks, vaid FB2-ks - nii loetakse seda lugejal mugavamalt. Vaadake asjakohaste muundurite loendit.

Nautige lugemist!



Seotud väljaanded