Koji je format e-knjige bolji? Što je bolje fb2 ili epub? Fb2 epub usporedba

ePUB je jedan od najpopularnijih formata e-knjiga na svijetu. Zapravo, na Zapadu mu je jedina ozbiljna konkurencija MOBI (Amazonov vlasnički format, više o tome sljedeći put). U Rusiji i drugim zemljama post-sovjetskog prostora Fb2 je također popularan (govorim o tome). Ali čak iu nepreglednim prostranstvima naše bivše velike domovine, ePUB format dobiva sve veću popularnost, posebno u pozadini nedostatka Fb2 ažuriranja i jačanja borbe protiv piratstva. Stoga, evo nekoliko zanimljivih i korisnih detalja o ePUB formatu.

Što je ePUB?

ePUB je format za elektroničke verzije knjiga. Ime dolazi od engleske fraze “ e elektronička pub likaciju, a ispravan ruski izgovor je "ipab" (ne "epub"!). ePUB knjiga zapravo je arhiva koja sadrži nekoliko mapa. U jednoj je tekst knjige, u drugoj opis (ime autora, naslov, izdavač, jezik, matični broj itd.), u trećoj su slike, u četvrtoj servisne informacije. .. Program za čitanje skuplja sve to zajedno i daje čitatelju rezultat u formatiranom tekstu s ilustracijama, formulama itd. Format je otvoren - svatko ga može mijenjati. ePUB je format s "plutajućim izgledom". To znači da čitatelj može široko mijenjati parametre prikaza poput fonta i razmaka, a tekst će se automatski prilagoditi željenoj veličini zaslona. Razvio i održava Međunarodni forum za digitalno izdavaštvo (IDPF), prvenstveno Adobe.

Povijest ePUB formata

Prethodnik ePUB-a bio je OEB (Open eBook Publication), koji je razvila ista organizacija 1999. godine. Na njegovoj osnovi je 2007. godine nastao moderni ePUB. Format je brzo stekao popularnost na Zapadu. Razlozi su bili i pogodnost za krajnjeg korisnika i mogućnost ugradnje takozvane DRM zaštite u datoteke, koja vam omogućuje da ograničite raspon uređaja na kojima se knjiga može čitati. Sve do 2010. godine ePUB formatu Većina trgovina e-knjigama promijenila je. Učinila ga je standardom za pohranjivanje knjiga najveća knjižnica Gutenberg.com. Od izlaska iPada, ePUB je format koji podržavaju Appleove vlasničke aplikacije - iBooks, Pages, iAutor. Od 2009. godine postoji proširenje za Firefox koje vam omogućuje čitanje knjiga ovog formata izravno u pregledniku. Slično rješenje dostupno je za Chrome. Od 2012. Sony je ePUB učinio glavnim formatom za svoje uređaje, napuštajući vlasnički LRF. Od 2010. gospodarska izvješća američke vlade objavljuju se u ovom formatu. U listopadu 2011. godine predstavljena je trenutna verzija formata - 3.0, u koju su konačno implementirane fusnote.

Prednosti i nedostaci formata

Ako govorimo o prednostima i nedostacima, onda to ovisi o tome s čime se uspoređuje. Ako koristite "računalne" formate kao što su txt, rtf i doc, tada dobivate stalne prednosti. Ni txt ni rtf ne podržavaju tablice sadržaja i nemaju ili imaju vrlo ograničeno oblikovanje. Doc je vrlo "težak" format za programe za čitanje, stvoren posebno za Microsoft Word. Nijedan od ovih formata ne podržava "metapodatke". Ako se uspoređuje s PDF-om, onda je takva usporedba potpuno netočna, jer su to formati za različite namjene. Unatoč mogućnosti ugrađivanja slika i formula u tekst, ePUB nije baš prikladan za knjige koje su bogate tim elementima - prvenstveno udžbenike i stručnu literaturu. Prevođenje takve literature u ePUB prilično je težak zadatak. I tu PDF dolazi u pomoć. S druge strane, PDF je format s fiksnim izgledom; ne prilagođava se veličini zaslona. Prethodno je čitanje PDF dokumenata na ekranima manjim od 9" bilo potpuno problematično - prikazivao se samo dio stranice. Sada postoji poseban format, takozvani PDF6, ali ni on ne rješava problem.

Ali najrelevantnija usporedba bit će s popularnim konkurentima - Fb2 i MOBI. Za prosječnog čitatelja s potonjim praktički nema razlike. U usporedbi s Fb2, ePUB je “napredniji” format, ima više mogućnosti. Na primjer, podržava formule i neke druge elemente oblikovanja koji nisu dostupni za Fb2. Za izdavače i prodavače e-knjiga, važna prednost ePUB-a je mogućnost ugradnje DRM zaštite u datoteku. Ali za čitanje obične beletristike ne može se reći da je ePUB nešto radikalno bolji od Fb2.

U svakom slučaju, sada postoji veliki broj programa za pretvaranje koji vam omogućuju prijenos knjige koja vam je potrebna iz jednog formata u drugi. Stoga je rasprava o tome je li ePUB bolji ili lošiji od bilo kojeg drugog formata uvelike izgubila na važnosti.


Elektroničke knjige (čitači, čitači) odavno su postali uobičajeni uređaji za širok krug korisnika. Njihove prednosti: dostupnost sadržaja (potrebnu knjigu možete preuzeti s interneta za nekoliko minuta), E-ink ekran koji ne oštećuje vid, mogućnost da u čitaču imate kolekciju od tisuća knjiga, dugo rad s jednim punjenjem, postavke za vrstu i veličinu fonta. Nedavno su se pojavile e-knjige s pozadinskim osvjetljenjem ekrana - omogućuju vam čitanje u potpunom mraku. Općenito, prednosti čitača mogu se nabrajati jako dugo.

Međutim, prilikom upoznavanja s e-čitačima korisnici često imaju jedan problem. Ljudi koji se po prvi put odlučuju na kupnju čitača, kada se suoče s pojmom “elektronički formati knjiga” često ne razumiju o čemu govorimo. Problem je posebno aktualan za početnike, kojima kratice "FB2", "EPUB" ili "MOBI" ne znače apsolutno ništa.

Takozvani formati su razne vrste elektroničkih tekstualnih datoteka koje podržava (reproducira) jedan ili drugi. Internetske elektroničke knjižnice često nude velik skup vrsta datoteka: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT i druge. Izbor je širok, a to pred početnike predstavlja određene izazove. Opisat ćemo glavne formate e-knjiga, reći ćemo vam kako se međusobno razlikuju, koji čitači su podržani i koji je format bolje odabrati ako imate čitač više formata koji čita sve formate.

Raznolikost formata

1. FB2 (FictionBook)- format e-knjige koji je stvorila grupa ruskih programera. Knjige u ovoj vrsti datoteke imaju strukturirani izgled (to jest, sadrže raščlambu prema poglavljima, sadržaju, ilustracijama, naslovnici). Osim toga, ovaj standard pohranjuje informacije o datoteci (tzv. oznake: autor, naslov, žanr), koje čita čitač i omogućuje korisniku prikladno sortiranje datoteka na uređaju. Ova vrsta datoteke zauzima malo prostora, može se arhivirati, a također se lako pretvara u druge formate. Među značajkama: zbog činjenice da je format izvorno razvijen za ćirilicu, tekstovi na ruskom u FB2 imaju crtice riječi.

Format je izvorno dizajniran za ruske korisnike i praktički se ne koristi u inozemstvu. Zbog toga FB2 ne podržavaju svjetski popularni proizvođači e-čitača – Amazon i Barnes & Noble. Ali ovo je glavni format datoteke za e-čitače popularne u Rusiji od Pocketbooka, Onyxa i Wexlera. Osim toga, Sony čitači sada podržavaju FB2 - nakon ulaska na rusko tržište, tvrtka je razvila službeni firmware za čitač, koji vam omogućuje čitanje knjiga u FB2.

2. EPUB (elektronička publikacija)- najpopularniji svjetski elektronički format za čitatelje. Barnes & Noble i Sony čitači rade s njim. Što se tiče strukture izgleda, ova vrsta datoteke nalikuje arhiviranoj web stranici koja sadrži tekst, grafiku, ugrađene fontove i ilustracije.

Osim zapadnih marki, EPUB format podržavaju modeli proizvođača usmjerenih na rusko tržište (Pocketbook, Onyx, Wexler) zbog brzog rasta popularnosti u našoj zemlji. Osim toga, ovaj standard e-knjiga koriste iPhone i . Appleov iBooks čitač podržava EPUB.

3. MOBI- format čitača e-knjiga. Stječe popularnost u ruskim internetskim knjižnicama kako Kindle postaje sve popularniji u Rusiji. Drugi čitatelji podržavaju ovaj format "za pokazivanje". MOBI je po svojstvima sličan EPUB-u. Amazon je nedavno predstavio još jedan elektronički tekstualni format, Kindle Format 8 ili KF8 (sadrži bogatije formatiranje), uz pojašnjenje da će novi i stari čitači Amazona nastaviti podržavati MOBI.

4. TXT- format jednostavnih tekstualnih dokumenata. Tekst iz drugog formata možete pretvoriti u TXT jednostavnom radnjom kopiranja i lijepljenja. Unatoč činjenici da ovu vrstu datoteke podržavaju gotovo svi e-čitači i zauzima vrlo malo memorijskog prostora, ne bismo preporučili čitanje knjiga u njoj na e-čitačima. TXT nema formatiranje, označavanje, rastavljanje crtica i poravnanje. Pogodan je za kratke tekstualne bilješke, ali ne i za potpune e-knjige.

5. PDF (Portable Document Format)- format elektroničkog dokumenta koji je izradio Adobe Systems. Neprikladno za korištenje na čitačima iz više razloga. Prvo, datoteke u ovom formatu su vrlo glomazne, jer su dizajnirane za snagu računala i otvaraju se prilično sporo na e-čitačima. Drugo, ako datoteka nije posebno dizajnirana za zaslon čitača od 6 inča, koji ima format sličan A6 listu papira, tada se na njoj čita A4 PDF (a većina PDF datoteka prikazana je točno u veličini standardni list papira) bit će vrlo teško. U PDF-u možete povećati samo veličinu, ali ne i veličinu fonta, što znači da će samo neki dio stranice moći stati na ekran. Morat ćete čitati stranice u dijelovima, a to je vrlo nezgodno.

Za čitanje su prikladni PDF-ovi, čija vam veličina zaslona omogućuje reprodukciju stranice u mjerilu dovoljno velikom za ugodno čitanje.

6. DJVU- format namijenjen za pohranjivanje skeniranih dokumenata - knjiga, članaka, rukopisa. Knjiga u DJVU zapravo je zbirka skeniranih stranica. Što se tiče udobnosti čitanja na čitačima od 6 inča, sve je slično kao i s PDF-om. Nećete povećati veličinu fonta, samo veličinu. Prilikom zumiranja, stranica će se proširiti izvan zaslona, ​​a morat ćete stalno pomicati područje uvećanog teksta za čitanje - nema potrebe govoriti o ugodnom čitanju. Za čitanje DJVU odaberite čitače s ekranom od 9 inča. Međutim, čak i na čitačima od 9 inča, mogućnost praktičnog čitanja DJVU ovisi o tome koliko je dobro skenirana knjiga predstavljena u ovom formatu.

7. LRF- bivši vlasnički format Sony čitača. Na novim modelima (počevši od PRS-T1) više se ne koristi jer je ustupio mjesto EPUB-u. Vrlo loše pretvara u druge vrste datoteka. Unatoč činjenici da je još uvijek predstavljen u nekim knjižnicama, preporuča se koristiti ga isključivo vlasnicima starijih modela Sony.

8. RTF (Format obogaćenog teksta)- format za pohranu tekstualnih dokumenata. Pripada kategoriji "računalo", a ne "knjiga". Čitanje u RTF-u na čitačima nije baš zgodno - to su velike datoteke, a brzina čitača smanjena je za red veličine.

9. DOC(i DOCX) - Microsoft Office tekstualni dokumenti. Ove formate podržava dosta čitača, ali posebno za čitanje dokumenata, ne knjiga. Velike datoteke u ovom formatu mogu biti velike i s njima je teško raditi na čitačima. Bolje je pretvoriti knjige s više stranica u DOC formatu u FB2 ili EPUB.

Naveli smo glavne formate e-knjiga. Nećemo razmatrati potpuno egzotične vrste datoteka koje se ponekad nalaze na Internetu, već ćemo odlučiti koji je od gore navedenih formata najprikladniji za čitanje knjiga na elektroničkim čitačima.

Koji format e-knjige odabrati

Ako imate e-čitač koji podržava sve formate, možete odabrati određenu vrstu datoteke na temelju niza čimbenika. Recimo da ste kupili svoju prvu e-knjigu, a nemate unaprijed prikupljenu zbirku knjiga, npr. u FB2. U tom slučaju odaberite format datoteke koji vaš čitač najbolje reproducira. Tradicionalni "knjižni" formati EPUB ili FB2 su poželjniji i praktičniji za čitatelja (i za korisnika) od "računalnih" PDF, TXT, DOC, DOCX i RTF.

U slučaju čitača od 9 inča i potrebe za čitanjem DJVU i PDF-a, pod istim uvjetima, savjetujemo vam da prednost date potonjem, budući da je PDF moderniji format, a knjige u DJVU-u često su loše kvalitete .

S gledišta jednostavnosti korištenja, prednosti "knjiga" formata su očite: EPUB, FB2 ili MOBI vizualno bolje izgledaju u izborniku vašeg čitača (prikazuju se naslovnice knjiga), praktičniji su za sortiranje (postoje oznake: autor, naslov, žanr), zauzimaju mnogo manje memorijskog prostora i brzina čitača s takvim formatima bit će znatno veća.

Trebate li podršku za sve formate?

Po našem mišljenju, uopće nije potrebno odabrati čitač svih formata. Mnogi korisnici koji imaju čitače koji podržavaju sve formate preuzimaju knjige u jednoj ili dvije vrste datoteka. Svi e-čitači (uključujući one s više formata), na ovaj ili onaj način, imaju glavni format i na kraju ih nećete zamijeniti za druge. Za Pocketbook, Onyx i Wexler glavni formati su FB2 ili EPUB, za Barnes & Noble () i Sony - EPUB, za Kindle - MOBI.

U slučaju čitača Amazon i Barnes & Noble, ako je knjiga koju trebate u formatu koji ti čitači ne podržavaju, možete koristiti pretvarač (na primjer, Calibre). Ovo je program koji se instalira na vaše računalo i omogućuje vam da isti FB2 pretvorite u MOBI ili EPUB u nekoliko minuta.

Čitanje knjiga u izvornom formatu čitača bolje je od korištenja dodatnih programa instaliranih na čitaču. Naš savjet: odvojite nekoliko minuta da pretvorite knjigu, na primjer, iz RTF u EPUB pomoću pretvarača Calibre. To je praktičnije nego čitati ga "u originalu" pomoću dodatno instaliranog programa (na Sony PRS-T1 ili Kindle) ili naići na sporiji rad uređaja (na primjer, na Pocketbook čitačima).

Zapamtite da je glavna stvar jednostavnost korištenja e-knjige, a ne broj formata navedenih u njezinim parametrima.

Uživaj čitajući!

2015-03-11 | Nekategorizirano

Osoba koja voli knjige nastoji čitati bilo gdje i svugdje. Zbog toga je posljednjih godina toliko popularno čitanje s e-čitača ili mobitela. Naravno, možemo pričati koliko god hoćemo o dražima mirisa nove papirnate knjige, o ugodnim trenucima u knjižari, pri odabiru dodataka svojoj biblioteci, ali ostaje činjenica da u svakodnevnoj gužvi čitanje e-knjiga lakše je nego nositi sa sobom uobičajene papirnate knjige. Ako pišete i želite da vaš rad postane praktičan i dostupan čitateljima, nije dovoljno objavljivati ​​tekstove na otvorenim izvorima; bilo bi lijepo priložiti im i verzije datoteka kako bi ljudi mogli preuzeti vašu kreaciju i ocijeniti je u slobodno vrijeme. .

Bez obzira na to jeste li čitač, pisac ili dva u jednom, prilikom preuzimanja ili učitavanja tekstova s ​​datotekama možete naići na to da vaš telefon ili čitač ne podržavaju ovaj format (ili se vaši čitatelji žale da datoteke koje mogu ne čitam ovaj format). Da biste razumjeli zašto se to događa, za vas smo napisali kratko objašnjenje o tome koje sve vrste formata e-knjiga postoje, po čemu se razlikuju te koje su prednosti i nedostaci svakog od njih.

Vrste formata:

Prvo, treba napomenuti da su najčešći formati e-knjiga: FB2, EPUB, MOBI, PDF, RTF, TXT, DOC/DOCX i DjVu. Naravno, kada se neupućena osoba suoči s takvom raznolikošću, teško je shvatiti što je što i koji format odabrati za čitanje ili pretvaranje datoteka.

Microsoft Windows, ali, nažalost, DOC/DOCX ne podržava većina čitača i možda se neće uvijek otvoriti na mobilnim telefonima, a čitanje knjiga u TXT-u je vrlo, vrlo nezgodno.

Međutim, razgovarajmo o svemu redom:

FB2 (FictionBook)

Prednosti: Jedan od najčešćih formata u ruskom govornom segmentu Interneta. Prikladno je strukturirati veliki dokument, podijeliti ga na poglavlja itd. FB2 datoteke zauzimaju malo prostora i lako se pretvaraju u druge formate.

Nedostaci: FB2 je format razvijen u Rusiji. Ne podržava ga većina čitatelja i nepoznat je u cijelom svijetu. Otvara se samo na uređajima s ruskim firmwareom i stran je markiranim čitačima koji su vodeći u svijetu: Sony, Amazon Kindle, Barnes&Noble, Kobo itd. Da, možete se kladiti da se otvara na Sony FB2, ali službeni firmware koji dopušta da otvorite ovaj format na Sony čitačima, objavljen je tek prije nekoliko godina i nije instaliran na svim modelima. Ako govorimo o prodaji vaših radova na Amazonu ili iTunesu, odgovor je jasan – FB2 nije pogodan za međunarodne platforme.

PDF (Adobe Portable Document Format) i DjVu (izgovara se "deja vu") - nećemo razmatrati svaki zasebno i kombinirat ćemo ih u jednu točku.

Prednosti: Oba formata koriste se za pohranjivanje skeniranih knjiga. PDF može stvoriti vrlo šarene datoteke. DjVu jednostavno komprimira datoteke prilično dobro, čineći ih manje težim.

Nedostaci: PDF datoteke su vrlo glomazne. Ako govorimo o skeniranju, onda je skenirane knjige u svakom slučaju nezgodno čitati s ekrana, jer njihova kvaliteta ostavlja mnogo za željeti, bez obzira na to je li skeniranje objavljeno u PDF-u ili DjVu.

Prednosti: TXT se otvara na bilo kojem čitaču. DOC/DOCX su dobro poznati Microsoft Word formati.

Nedostaci: Čitanje knjiga u TXT-u je užasno nezgodno, jer nema formatiranja teksta (poravnanje po širini, prelamanje odlomaka, podjela na poglavlja itd.). DOC/DOCX podržava vrlo mali broj uređaja za čitanje.

RTF (Format obogaćenog teksta)

Prednosti: Prikladan i kompaktan format za pohranu tekstualnih datoteka.

Nedostaci: Izuzetno ga rijetko podržavaju čitači i mobiteli, tableti itd.

Prednosti: LRF je poseban format e-knjige tvrtke Sony. MOBI format knjige za Amazon Kindle.

Nedostaci: Sony trenutno podržava i popularniji format e-knjiga - EPUB.

EPUB (Electronic PUBlishing)

Prednosti: EPUB je najčešći format e-knjige na svijetu. Nema problema s prepoznavanjem i omogućuje vam stvaranje dobro strukturiranog teksta s ilustracijama. Ovaj format je već sam po sebi arhiva, stoga je kompaktan i ne zahtijeva dodatne programe za arhiviranje.

Kao što vidite, svaki od gore navedenih formata ima svoje prednosti i nedostatke. Na primjer, naravno, "najčitljiviji" format za e-knjige bit će TXT, ali čitanje knjiga u ovom formatu praktički je ruganje očima. Takav tekst se ne može strukturirati, nedostaju mu odlomci, poglavlja, nemoguće je umetnuti ilustracije itd.

Najčešći i najprikladniji format za čitanje e-knjiga je EPUB. Međutim, ako govorimo o obliku u kojem bi autor trebao objaviti svoj rad na internetu, najracionalnije rješenje bilo bi objaviti ga u nekoliko formata odjednom. Na primjer: EPUB (čitljivo svugdje osim Amazon Kindle) + MOBI (čitljivo samo na Amazon Kindle) + DOC/DOCX (za one koji su navikli čitati s računala i prijenosnih računala). Naravno, kao bonus, možete objaviti tekst u FB2 formatu, na koji je publika koja govori ruski toliko navikla, međutim, neće svi uređaji otvoriti datoteku u ovom formatu.

I naravno, na kraju ovog članka i kao reklamu, želimo vas obavijestiti da je novi internetski sustav, Booqla, nedavno pokrenut u CIS-u, dizajniran za praktičnu i, pozornost, besplatnu konverziju rukopisa u EPUB i MOBI formati. Stranica nudi korisnicima iz cijelog svijeta pretvaranje njihovih rukopisa u elektronički format i pruža pomoć u prodaji e-knjiga, ali samo besplatna konverzija rukopisa bit će dostupna za publiku koja govori ruski.

U jednostavnost i praktičnost usluge Booqla možete se i sami uvjeriti registracijom na

Ukratko o glavnom
Ako želite steći dobru predodžbu o epubu, zamislite da ste spremili web stranicu (poput ove) na disk, zajedno s grafikom i stilovima koji se na njoj koriste. Za sve moderne preglednike ovo je standardna funkcija, na primjer u FireFoxu to se radi kroz izbornik “Datoteka → Spremi kao → Cijela web stranica”. Možete spremiti ne samo jednu, već nekoliko stranica jednu do druge. Zatim postavite dvije servisne XML datoteke pored svojih stranica. Jedan je jednostavno oznaka "ovo je epub" (container.xml), drugi sadrži popis svih datoteka - .html, .css, .jpg itd. (obično datoteka content.opf).
Ostalo je samo sve to staviti u zip arhivu i promijeniti joj ekstenziju iz .zip u .epub.
Svi.
Knjiga je gotova, a vi već znate što je epub. Ovo nije šala niti pretjerivanje - epub je samo komprimirani html. Ni više ni manje.

Detaljno o formatu
Smještanje sadržaja u epub arhivu

Kao što smo već saznali, epub je zip arhiva s nekoliko datoteka. Kada arhivirate datoteke pomoću ZIP arhivera i priložite XML datoteku container.xml u arhivu, stvarate datoteku u formatu "Otvoreni spremnik" u prozi. Unatoč ubojito pretencioznom nazivu ovog događaja (IDPF je trebao znati da postoji ISO OPC standard, a ne izmišljati kotač), sasvim je moguće dati IDPF-u palac gore za "Open Container Format" (OCF) (mi ćemo u nastavku saznajte zašto).
Osim datoteke container.xml (mora biti u META-INF), epub obavezno sadrži još jednu servisnu datoteku, u kojoj su navedene sve ostale datoteke koje se nalaze u arhivi i naznačena njihova vrsta, obično nazvana content.opf.
Za upućenu osobu, cijeli dizajn vrlo podsjeća na java pakete općenito, a posebno na OpenDocument. Doista, IDPF se želi spojiti s OpenDocumentom. Nije baš jasno što nas je spriječilo da počnemo s OD klonom, budući da je OpenDocument dvije godine stariji od OCF-a, ali, očito, bicikli su neizbježni amateri; nisu se potrudili pročitati dokumente na vrijeme. Očigledno, xpointer IDPF također ima čvrstu namjeru da bude ponovno osmišljen unutar okvira EPUB3. Verzije do 5 će shvatiti da koriste standardizirani w3c format za veze i također će tražiti načine da ih kombiniraju.

Koji se podaci pohranjuju u epub
epub obično sadrži sljedeće podatke:

  • Meta podaci: naslov, jezik, autori itd.
  • Alati za navigaciju: redoslijed stranica za xhtml datoteke i “sadržaj karte web mjesta”
  • Stvarni tekst je u obliku nekoliko xhtml datoteka koje mogu koristiti css stilove, slike u jpg, gif i png, kao i svg vektorsku grafiku i fontove. Najnovija epub verzija izjavljuje podršku za MathML.
  • Osim toga, epub može sadržavati brojne dodatne visokospecijalizirane označne datoteke, PDF verziju knjige za ispis, itd. egzotične stvari koje se stvarno ne koriste, ne podržavaju ih e-čitači i nisu od interesa za prosječan čitatelj.
Meta informacije u epub
Minimalne meta informacije za epub uključuju naslov, ID dokumenta i jezik. Osim toga, možete navesti autore, prevoditelje i druge sudionike u stvaranju knjige, datum izdavanja/pisanja, temu knjige (u slobodnom obliku), opis u otvorenom tekstu i podatke o izdavaču.
Ključne meta informacije pohranjene su u standardnoj shemi Dublin Core, malo proširenoj. Opisi autora, tema i sva ostala polja (osim datuma i jezika) daju se u obliku slobodnog teksta, što zapravo isključuje učinkovito automatsko katalogiziranje epubova iz različitih izvora.

Navigacijska pomagala
epub, kao što se sjećamo, može uključivati ​​mnoge html datoteke. I bit će puno datoteka. Ne zato što IDPF to zahtijeva, nego zato što se epub čitači ruše zbog velikih datoteka i svi rade puno malih. A kako bi "klizanje" poznato čitatelju funkcioniralo, kreator epuba označava redoslijed kojim bi datoteke trebale biti predstavljene. “Prilikom otvaranja prikazujemo 3.html, kada čitatelj skrola do kraja otvaramo 1.html, pa 8.html. A datoteka fusnote.html je nedostupna kada se pomiče izravno; čitatelj će tamo stići kroz bilješke,” tako nešto. Obično se nalazi u datoteci content.opf.
Još jedno sredstvo za navigaciju unutar knjige je sadržaj. Ako postoji, obično se pohranjuje u toc.ncx. Tehnički, ovo je više analogno funkciji "karte web mjesta" nego uobičajenom "sadržaju". Sadržaj u papirnatoj knjizi (ili elektroničkom dokumentu) slijedi strukturu teksta, ali .ncx nije povezan s općim redoslijedom fragmenata teksta i može im izravno proturječiti. Međutim, u stvarnosti, datoteka se obično koristi kao sadržaj i formatirana je "normalno", ponavljajući redoslijed naveden za straničenje.
Općenito, opetovano pohranjivanje i prepisivanje istih podataka na različite načine zaštitni je znak epuba. Meta podaci pohranjuju se na četiri mjesta: u opisu OPF spremnika container.xml, u opisu epub paketa content.opf, u toc.ncx datoteci sadržaja i u html datotekama (u meta tagovima). Sadržaj je opisan tri puta - “karta knjiga” iz toc.ncx argumentira nabrajanjem fragmenata u content.opf koji je od njih važniji, a naslovi h1-h6 u html-u sve to gledaju i razmišljaju o osveti.

Tekst knjige
Naravno, epub sadrži i stvarne html datoteke s tekstom knjige. Arhiva također pohranjuje elemente korištene u tekstu - grafike, stilove, skripte, fontove.
Nema značajnih "dodataka" ili "ograničenja" u pogledu html-a, css-a itd. epub ne postavlja. Uzimamo moderan web-sadržaj, koji nije postao čak ni "dinamičan", već "fluidan" (epub izjavljuje podršku za html5, koji više liči na OS nego na označni jezik; preglednici ga još uvijek podržavaju u ograničenoj mjeri), spremamo ga na disk, arhivirajte ga - i voila, e-knjiga je spremna.
“Dragi, spremio sam internet na disk, što dalje?”

Pozadina
Da bismo bolje razumjeli temeljnu snagu i temeljnu slabost epuba, vratimo se 12 godina unatrag. Godine 2000., kada se vaš ponizni sluga tek pridružio elektroničkom čitanju (točnije, na njega ga je podmuklo zakačio notorni the-ebook), Knjižnici Moshkov, Aldebaranu, Litportalu i Bog zna koliko još malih knjižnica. Dosta tekstova je, u principu, bilo dostupno. Uglavnom u HTML obliku.
HTML je već tada pružao najšire mogućnosti dizajna. Zahvaljujući tome, ljudi koji su pripremali tekstove ponekad su stvarali prava remek-djela prijeloma. Dovoljno je prisjetiti se da su odlomci u Moshkovljevoj biblioteci bili (i sada Moshkov gori na isti način, po mom mišljenju) ukrašeni mješavinom oznaka

I
Međutim, čitatelji iz stvarnog života (iSilo, Microsoft Reader, Mobipocket, REB uređaji itd.) razumjeli su samo ograničeni dijalekt HTML-a i još ograničeniji podskup CSS-a.  Naravno, svaki je čitač napravio "proširenja" na formatu, ali nitko ga nije dizajnirao za određenog čitača. 
Na kraju, nakon spajanja kreativnih iskoraka kreatora teksta, nadahnutih snagom HTML + CSS-a i neograničenog leta svoje mašte, sa stvarnim čitateljima, rezultat na zaslonu korisnika u pravilu je bio besmislica. U najboljem slučaju, knjiga je bila neugledna, ali čitka. U najgorem slučaju, tekst se općenito pretvorio u kašu.
Moj prvi odgovor na to bio je ClearTXT, program koji uklanja "kreativnost" iz teksta. Međutim, brzo je postalo jasno da nikakva heuristička analiza ne može držati korak s maštom kreatora html knjiga. Na kraju sam još manje-više morao raditi rukama.

Problemi s dijalektom nisu bili jedini. Programi za čitanje nisu imali samo individualna “izražajna sredstva” i “jezične preferencije”. Nitko od njih ne čita HTML izravno (u tom pogledu malo se toga promijenilo, usput, predlažem da razmislite zašto). Svaki je program koristio vlastitu, obično vlasničku, metodu pripreme i pakiranja podataka. lit, rb, lrf, chm - svaki kreator čitača i razvijač uređaja smatrao je svojom dužnošću "izmisliti" novi zatvoreni "format" i vlastito, osobno DRM rješenje. Alati za pretvorbu u ovaj vlasnički format često su bili ili nedostupni ili objavljeni kao aplikacije i/ili biblioteke specifične za platformu, s ograničenom dokumentacijom ili bez nje.

Dva problema 2000., jedan problem 2012
Dakle, 2000. dvije su nas stvari spriječile da uzmemo proizvoljni html i damo ga čitatelju:

  1. Potreba za korištenjem glomaznih alata treće strane za pakiranje HTML-a u format čitljiv za čitanje
  2. Neusklađenost čitača s korištenim oznakama i stilovima
epub nudi rješenja za oba problema:
  1. Sredstva za pakiranje su standardizirana i tehnološki napredna - možete čak i ručno, u 20-ak minuta, sastaviti vrlo složenu knjigu koristeći OCF, notepad i zip arhiver.
  2. Kao što smo već vidjeli, epub je kompatibilan sa svim dijalektima, stilovima i metodama označavanja. Spremite s weba, arhivirajte i čitajte.
Čini se da je sve u redu.
A na pakiranje za epub nema nikakvih zamjerki, osim estetskih. Rješenje, doduše nestandardno i ne najuspješnije, koristi se, ali je primjereno zadatku, a također jednostavno kao štap.
No, što se tiče prikaza teksta u čitačima, čekaju nas loše vijesti. Sam "format" je kompatibilan sa svim vrstama HTML-a, da. Bilo bi tako lako napisati standardnim “vidi. html specifikacija". Iskušenje je bilo veliko i IDPF nije mogao odoljeti. Ali sada otvaramo naš “bilo koji” HTML u “bilo kojem čitaču” i...
I otkrivamo da se nismo pomaknuli ni za jotu u odnosu na 2000. godinu. Kao i krajem prošlog stoljeća, svaki pojedini čitatelj razumije samo svoj ograničeni dijalekt html+css. Kao iu prošlom stoljeću, dijalekt je općenito nedokumentiran. Kao i prije, svaki čitač uvodi vlastita nekompatibilna proširenja za rješavanje čak i standardnih problema kao što su fusnote (potražite epub fusnote na Googleu, metode stvaranja, osim pretvaranja fusnota u poveznice, variraju od potpuno kiselog CSS-a do javascripta). Najjednostavnije stvari gotovo je nemoguće učiniti; složene stvari ili ne rade ili uzrokuju pad čitatelja.

Evo ti domaća zadaća: bez gledanja epub-a iz litre, napravi epub s praznim redom između dva odlomka (tekst, prazan red, opet tekst, kao prije ovog odlomka), koji se jednako prikazuje u iBooks, ADE, Sony i Nook. Ostavimo čitače kineskih čuda i ostale egzotične stvari po strani kako bi zadatak ostao izvediv. A nećemo ni tražiti opravdanje ili rastavljanje riječi s fusnotama. Samo prazan niz, oznaka na fb2. Vrijeme je prošlo.

Presuda u slučaju epub
Očigledne prednosti formata su jednostavnost i mogućnost izrade zip paketa te otvorenost.
Jedno DRM rješenje također se može smatrati plusom. IDPF se sramotno pretvara da je DRM u epubu otvoren i da svatko može napraviti svoj vlastiti. Svi nekako vjeruju. I oni jasno razumiju da epub postoji 99% zahvaljujući činjenici da Adobe podržava DRM infrastrukturu za njega. DRM je zlo, ali jedan DRM za sve je manje zlo od DRM-a po trgovini.
Da, glupo je kada se arhivirani HTML s DRM-om koji se može probiti u jednoj minuti predstavlja kao tko zna kakva inovacija. Ali zip i druge standardizacije nisu ništa drugo nego napredak.
Što se tiče prednosti, to je sve.

Ali u području stvaranja složenih oznaka, epub uopće nije dobar i u budućnosti će biti samo nedostataka. Format ne daje kreatoru knjige nikakva jamstva što će krajnji čitatelj vidjeti na ekranu, niti pouzdana sredstva kontrole koja će nam omogućiti da odsječemo barem očito "neradne" opcije, niti gotove rješenja za standardne zadatke. Moj prvi epub, koji je upravo prošao provjeru valjanosti, srušio je dva od tri čitača na kojima sam ga testirao (prevelik html - 2 MB, i previše poveznica, kako sam kasnije instalirao). Kreatori dokumenata prisiljeni su zanemariti "značajke" pojedinačnih epub čitača ili ponuditi nekoliko epubova kako bi čitač mogao preuzeti datoteku koja je kompatibilna upravo s njegovim uređajem. Nije vrijedilo dizati buku zbog takvog završetka - koja je svrha postavljanja html5 znajući da će se čitati u IE3?

Što možemo očekivati ​​od epuba u budućnosti?
Najpovoljniji scenarij za epub je istiskivanje malih programera iz niše programa za čitanje od strane nekoliko velikih igrača. Napraviti potpuno funkcionalan html5 parser s paginacijom nije barem ništa lakše od izrade modernog preglednika, a povrat je neusporedivo manji i ovdje neće biti slučajnih ljudi. Međutim, ni Google, ni Microsoft, ni Opera još uvijek ne rade na stvaranju novih motora za čitanje epub-a kako bi Adobe mogao pravilno prikupiti novac na svom čudesnom DRM-u. I sam Adobe je prilično jasno pokazao svoj potencijal za razvoj čitača - ADE još uvijek nema ni podršku za fusnote, ni normalnu tipografiju, ni crtice.
Stoga je mnogo vjerojatnije da će se za pet godina oko epuba formirati neka vrsta "nepisanog IDPF-a", neformalnog skupa pravila izgleda, radnih dizajnerskih rješenja, testiranih na vodećim čitateljima "hack" i "tricks". Mrežna zajednica već formira "pravi" epub standard povrh sveoproštajnog "html5+css3+everything_you_want_more." Opisana su stvarna rješenja za stvarne probleme u stvarnim čitateljima. Tada će ti "trikovi", budući da su de facto standard, postati obvezni za programere novih e-čitača. Oni koji su dovoljno dugo u IT-u da su imali vremena progutati dim ratova preglednika i raditi s IE4, NN4 i Operom 3, dobro znaju što nas točno čeka - online zajednica je već prošla kroz ove grablje i još uvijek štuca ovu šetnju. Stoga, kad vidim da je "ovaj epub optimiziran za iBooks" ne doživljavam samo deja vu, već i akutni refleks grčanja.

I zato što nas pokušavaju gurnuti "natrag u 90-e", smatram da je epub neuspješan. Ne trebaju nam hakovi koji postaju neučinkoviti u novoj verziji softvera. Ne trebaju nam nepisana pravila koja se nasumično biraju malo po malo. Nema potrebe za pravnim greškama. Nema potrebe za "provjerom valjanosti testiranjem" za sve čitatelje - "pokazat će se ili neće pokazati." Sve smo ovo prošli.
Potrebna nam je pouzdana i korisniku prilagođena tehnologija, jasan standard i radna kontrola kvalitete. A epub nam to, nažalost, nije mogao dati.

Ono što očekivati ​​od epuba je beskorisno
Među nedostacima epuba postoji još jedan, kojeg još nismo dotakli - temeljna nekompatibilnost s drugim formatima. epub je rođen da bude monopolist. Izdvajanje podataka iz epub-a i njihovo pretvaranje u drugi format, čak ni za jednostavan html, nije lak zadatak. Kada epub sazrije i postane obrastao hakovima za uređaje i zamršenim rješenjima, kao što su fusnote na podstranicama koje koriste CSS, izvlačenje bilo čega iz njega bit će gotovo nemoguć zadatak. Koji god format Adobe razvio, rezultat je PDF - ulaz je rublja, a izlaz pet.
Ali i dalje trebamo podršku za različite (uključujući stare) čitače i uređaje. Potrebna nam je puna podrška za alternativne formate koji su već dobili na težini (mobipocket na Kindleu) i koji će se i dalje pojavljivati ​​na tržištu.

Osim toga, potrebni su nam alati za katalogizaciju, razmjenu citata i bilješki i tako dalje i tako dalje, što epub još ne obećava ni na deklarativnoj razini. Drugim riječima, potreban nam je fb3, što će biti tema sljedećeg članka.

Gotovo svi ljudi koji me pitaju za savjet o odabiru određenog uređaja za čitanje također postavljaju pitanja o formatima e-knjiga - koji je bolji i zašto. U ovom ću članku vrlo detaljno odgovoriti na ova pitanja; Razmotrit ću i formate za čitanje beletristike i formate za čitanje tehničke, znanstvene i obrazovne literature.

Fikcija

Postoje sljedeći formati u kojima možete pronaći beletristiku na internetu: TXT, RTF, FB2, EPUB, MOBI, DOC, PDF, DJVU. Odmah ću reći da je bolje kupiti / preuzeti knjige u EPUB, FB2 ili MOBI. Upravo su ti formati najprikladniji za čitanje fikcije.

PDF i DJVU formati su preteški i nezgodni; Često je tekst u njima zapravo slika, odnosno možete skalirati samo cijelu stranicu, ali ne i veličinu samog fonta. Na uređajima za čitanje (čitačima) knjige u PDF-u i DJVU ponekad se ne prikazuju baš dobro: slova mogu biti vrlo mala; Tekst je nezgodan za čitanje.

Formati TXT i RTF nemaju takvih nedostataka, ali imaju druge nedostatke: tekst u TXT-u se uopće ne može formatirati, odnosno naslovi, epigrafi, citati neće se ni na koji način isticati; Štoviše, TXT ne podržava naslovnice, slike i tablice. Ovo je vrlo loš, jednostavan format. U RTF-u su, naravno, mogućnosti oblikovanja bogatije, ali postoje i nedostaci: automatski prikupljeni sadržaj i bilješke nisu podržani. Osim toga, RTF datoteke obično su prilično velike, a neki uređaji za čitanje ih ne prikazuju uvijek ispravno.

Format DOC (i njegova varijanta DOCX) odličan je za složene dokumente, ali nije prikladan za fikciju: previše je glomazan i složen; DOC dokumenti često se različito prikazuju na različitim uređajima.

Sasvim druga stvar su tri specijalizirana formata skrojena posebno za beletristiku: EPUB, MOBI, FB2 (i njegova varijanta FB2.ZIP). Ovi se formati temelje na takozvanom "plutajućem izgledu", koji vam omogućuje promjenu veličine, tipa fonta, proreda i širine margine. Štoviše, ovi formati podržavaju slike, tablice, automatski sastavljen sadržaj, bilješke i mnoge druge stvari. Čitanje knjiga u FB2/FB2.ZIP, EPUB, MOBI stvarno je ugodno i ugodno.

Naravno, postoje određene razlike između ovih formata, ali za početnike one nisu značajne. Iako vrijedi napomenuti da je na internetu na ruskom jeziku najviše knjiga u FB2, u EPUB-u ih je već manje, au MOBI-u još manje.

Konačni odabir formata također ovisi o vašem uređaju za čitanje: s nekim formatima može raditi bolje, a s drugima lošije. Ovdje trebate eksperimentirati. Osim toga, postoje uređaji koji podržavaju samo jedan od navedena tri formata. Na primjer, Amazon Kindle čita samo MOBI, a B&N Nook samo EPUB.

Možete pročitati više o FB2 formatu, o EPUB-u, o MOBI-u.

Znanstvena, stručna i obrazovna literatura

Ovdje je sve kompliciranije: ova vrsta literature obično se distribuira u formatima PDF, DJVU, DOC (DOCX), od kojih svaki, kao što sam ranije primijetio, ima određene nedostatke. Ponekad je još komplicirano činjenicom da su neke knjige dostupne samo u jednom formatu, a ponekad samo u jednoj verziji.

DOC format, u principu, nije tako loš - u usporedbi s PDF/DJVU. Čitanje knjiga na računalu je više-manje ugodno. Situacija je gora s uređajima za čitanje: neki čitači ga prikazuju gotovo kao goli tekst, isključujući niz ilustracija, tablica, formula itd. Drugi ga prikazuju više kao sliku: prikazani su elementi dizajna, ali ne možete promijeniti veličinu fonta i tip slova, što se ponekad pretvara u katastrofu na malom ekranu.

PDF. Postoje tri varijante ovog formata: tekst, grafika (“slika”) i grafika (“slika”) s OCR slojem. Prva opcija je najpoželjnija: može sadržavati sve elemente oblikovanja, a tekst ostaje skalabilan. U slučaju grafičkog PDF-a, tekst je samo slika koja se može povećati samo u cijelosti; Veličina fonta se ne može promijeniti. Stoga je grafičke PDF-ove vrlo teško čitati na uređajima s malim zaslonima.

Ponekad se OCR sloj primjenjuje na grafičke PDF stranice pomoću OCR softvera. U PDF knjizi s OCR slojem možete pretraživati ​​i koristiti rječnik. Ovo je dobra opcija. Ali, opet, ne vide svi uređaji za čitanje ovaj OCR sloj. I ne dopušta vam povećanje veličine fonta. Stoga se OCR sloj često pokaže beskorisnim.

DJVU format općenito nalikuje grafičkom PDF-u: obično je to samo skup skeniranih ili fotografija papirnate knjige. Kvaliteta ovih skeniranja/fotografija može biti apsolutno užasna, ili može biti sasvim pristojna. Ponekad se OCR sloj primjenjuje na skenirane slike/fotografije pomoću programa za prepoznavanje teksta. U DJVU knjizi s OCR slojem možete pretraživati ​​i koristiti rječnik. Ovo je dobra opcija. Ali, opet, ne vide svi uređaji za čitanje ovaj OCR sloj i neće vam dopustiti povećanje veličine fonta. Stoga je OCR sloj često praktički beskoristan.

Ukratko: najpoželjniji format za čitanje znanstvene/tehničke/edukativne literature je tekstualni PDF, na drugo mjesto stavio bih DOC, a na treće grafički PDF i DJVU s OCR slojem. Posljednje mjesto zauzimaju slikovni PDF-ovi i DJVU-ovi bez OCR sloja.

Dokumenti, proračunske tablice i prezentacije

Većina dokumenata, tablica i prezentacija distribuira se u MS Office formatima: DOC/DOCX, XLS/XLSX, PPT/PPTX. Ovi formati su vrlo funkcionalni, ali, nažalost, prilično "glomazni" i vrlo "zatvoreni" (drugim riječima, programerima trećih strana prilično je teško stvoriti program za čitanje datoteka u tim formatima). Stoga ih neki uređaji ne podržavaju. Moramo pretvoriti dokumente u PDF.

Pretvaranje dokumenta/tablice/prezentacije u PDF vrlo je jednostavno: svaki pristojan uređivač teksta/proračunske tablice to može učiniti. Osim toga, možete koristiti neki pretvarač: možete pronaći njihov popis.

Ako je dokument jednostavan, a glavna stvar u njemu je tekst, onda ga je bolje pretvoriti ne u PDF, već u FB2 - na taj način će se čitati na čitaču s većom udobnošću. Pogledajte popis relevantnih pretvarača.

Uživaj čitajući!



Povezane publikacije