最小のEPUB3―電子書籍を作る(4)

3030ito最低限のファイルだけで構成されたEPUB3(EPUB3フォーマットって?―電子書籍を作る(3))を作ってみました。
epub HelloWorld.epub

出来上がったファイルは、Windows8上の
Adobe Digital Editions 2.0
Adobe Digital Editionsで表示

Kindle Previewerでちゃんと表示されることを確認。
Kindle Previewerで表示

そしてリーダーのkobo TouchとiPad miniに転送してみました。
kobo Touchでは表示されましたが、
kobo Touchで表示
iPad miniのiBooks3.0では表示されません。
iBooksでは表示できない

そこで、EPUBのチェックをしてくれるEPUB Validatorで、このフォーマットのどこに問題があるのかを調べてみました。

epub_validatorでチェックした結果
見つかったエラーは3つ。
EPUBを構成するドキュメントの内容を記述しているパッケージドキュメントのopfファイルに、ncxやnavといった目次にかかわる要素が無いよ、というエラーのようです。

ここからは、EPUB3のサンプルファイルを見ながら試行錯誤。

わざわざEPUB3のファイルを手書きせずとも、EPUB作成サービスやプログラムを利用すれば簡単に電子書籍を作ることはできるのですが、出来上がった電子書籍の細かいところを修正したい場合には、EPUB3フォーマットを知っている必要があるので、面倒だけれど手書きでやってみることにします。

EPUB3フォーマットって?―電子書籍を作る(3)

3030itoEPUB3について調べてみる。

EPUB3フォーマットはInternational Digital Publishing Forum (IDPF:国際電子出版フォーラム)が提唱しているフォーマット。
中身は、XML文書とウエブで使われているコンテンツ―テキスト(xhtml、css)、画像、音声、フォント―の集まり。それらをEPUB3の仕様でコンテナにおさめてzipで圧縮したファイルが電子書籍としてのEPUB3。

IDPFのEPUB 3 Overviewにある、1.2 Roadmapによれば、最小のEPUB3は4つのファイルで作ることができるということらしい。

mimetype
 ┃
META-INF
 ┣ container.xml
Content
 ┣ HelloWorld.opf
 ┗ HelloWorld.xhtml

mimetypeの内容は
application/epub+zip
この一行だけ。ただしEPUBコンテナ(zipファイル)の先頭に未圧縮の状態で置かなくてはならない。ファイル名と内容は固定。必須。

META-INFディレクトリは、EPUBコンテナの情報を入れておく。ディレクトリ名は固定。必須。
container.xmlファイルはxml文書で、EPUBコンテナのルート要素(package要素)が入っているパッケージ文書(.opfファイル)の場所とメディアタイプを指定する。ファイル名は固定。必須。

<?xml version=”1.0″?>
<container version=”1.0″ xmlns=”urn:oasis:names:tc:opendocument:xmlns:container”>
<rootfiles>
<rootfile full-path=”Content/HelloWorld.opf”
media-type=”application/oebps-package+xml” />
</rootfiles>
</container>

Contentディレクトリは、パッケージ文書(.opfファイル)やコンテンツを格納する。ディレクトリ名は任意。
HelloWorld.opfファイルは、EPUBとしての電子書籍情報が書き込まれているファイル。拡張子.opfは固定。必須。

<?xml version=”1.0″?>
<package version=”3.0″
xml:lang=”en”
xmlns=”http://www.idpf.org/2007/opf”
unique-identifier=”pub-id”>
<metadata xmlns:dc=”http://purl.org/dc/elements/1.1/”>
<dc:identifier id=”pub-id”>
urn:uuid:B9B412F2-CAAD-4A44-B91F-A375068478A0
</dc:identifier>
<dc:language>en</dc:language>
<dc:title>HelloWorld</dc:title>
<meta property=”dcterms:modified“>
2013-02-06T12:00:00Z
</meta>
</metadata>
<manifest>
<item id=”HelloWorld”
href=”HelloWorld.xhtml”
media-type=”application/xhtml+xml”/>
</manifest>
<spine toc=”ncx”>
<itemref idref=”HelloWorld”/>
</spine>
</package>

  • package要素には、version、unique-identifier属性が必須。
  • metadata要素には、identifier、language、title、dcterms:modifiedが必須。
  • identifierのuuidはMicrosoft Exchange Server GUID Generatorなどを利用して作成。
  • manifest要素には、EPUBが利用するコンテンツ一覧を示す。各コンテンツごとにitem要素で指定する。item要素には、id、href、media-type属性が必須。
  • spine要素には、コンテンツを読む順番を指定する。

HelloWorld.xhtmlファイルは電子書籍の内容そのもの。HTML5で記述。

<?xml version=”1.0″ encoding=”UTF-8″?>
<!DOCTYPE html>
<html xmlns=”http://www.w3.org/1999/xhtml”
lang=”en”
xml:lang=”en”>
<head>
<title>HelloWorld</title>
</head>
<body>
HelloWorld!
</body>
</html>

取りあえずこれだけでEPUB3仕様の電子書籍になる。
はずでしたが・・・・

EPUB3を選んだ理由―電子書籍を作る(2)

3030itoメディアデザインではEPUB3仕様の電子書籍を作ることにしました。現在、多くの電子書店でスタンダードとなりつつある規格であることが一番の理由ですが、それ以外にも電子書籍作成のプロセスにEPUB3を選ぶメリットを見出すことができます。
ebook_process


音声が再生できる電子書籍――視覚障害者や普通の印刷物を読むことが困難な人々のためのデジタル録音図書の国際標準規格DAISY図書というものがありますが、このDAISYの次世代規格DAISY4は中間フォーマットの形となり、DAISY4規格の電子書籍は、エンドユーザーの手にはEPUB3の形式で配布されるようになるとか。EPUB3が作成できれば、それと同じプロセスでDAISY図書も作成できるのです。

次のDAISY4は、皆さんが手にするときの形はEPUB3という名前になりますが、次のような4つの種類になります。

まず録音図書。音声とDAISYのナビゲーションができる目次だけの録音図書。これもEPUB3になります。
それからテキストと目次。音声の入っていない。静止画像を入れてもいい。音声の入っていないテキストDAISYと言ってもいいです。その代わり、読ませるときは音声合成エンジンTTSが必要。それが第2のEPUBです。
第3のEPUBは、テキストと録音図書を合体したもの。今で言うマルチメディアDAISYです。
そして第4が登場します。第4はそこにビデオが入るということです。手話を見たい人は手話の画面を入れる。あるいは動作を説明するときに言葉で説明されてもなかなかわかりませんから、言葉で説明すると同時に動画を使いたいという場合、動画も使えるというものです。

(「DAISYの新時代―EPUB3とDAISYの連携によるインパクト」河村 宏 DAISYコンソーシアム 会長より)


AmazonのキンドルストアではEPUBファイルをキンドル用のMOBIファイルに変換してくれます。
>>サポートされているファイル形式


.bookやXMDFといった規格でも記述フォーマット(中間フォーマット)にはEPUB3と同様にXMLが使われていることから、EPUB3の規格に準拠したファイルが作成できれば他の規格の電子書籍を作成するのも容易だと考えられます。


また、電子書籍作成のプロセスとは直接関係ありませんが、今年の7月1日に施行される改正国立国会図書館法では、電子書籍や電子雑誌などの「オンライン資料」を国会図書館に送信する義務が生じますが、その受入れ規格の一つがEPUBとなっています。(他はPDF、PDF/A、DAISYに限定)
>>国立国会図書館:オンライン資料の収集
こういった状況からも、EPUB3が電子書籍の代表的な規格と認識されていることがうかがえます。

電子出版を始めます(1)

一般社団法人メディアデザインでは電子出版を始めます。
ところで電子出版って何?
まずはメディアデザインのパンフレットをご覧ください。
その最後は、こんなふうになっていました。

densi01
densi02

さてこの結果は?
電子出版を始めます(2)をお楽しみに!

フォーマットをどうする?―電子書籍を作る(1)

3030ito皆様こんにちは。
メディアデザイン研究室長のイトーです。

「仙台文庫e」の電子書籍のフォーマットを何にしよう?
  
 電子書籍のためのフォーマットは様々な種類があって統一されてはおらず、今後もどうなるかわかりません。とはいうものの、それらの中からフォーマットを選ばなくてはなりません。

電子書籍のフォーマット

日本独自のフォーマット―.book,XMDF
 日本では「.book(ドットブック)」や「XMDF」も利用されていますが世界的ではないので、選択候補からは外します。「青空文庫形式」はテキストデータにタグ付けをするだけなので作成するのが簡単です。しかしこれも日本独自のフォーマットで、電子書店で流通させるのは難しい。

音声読上げは魅力的―DAISY
 「DAISY」の持つテキスト読み上げ機能は魅力的ですが、これも電子書店で流通させるのは今の所は難しい。

スタンダードな―PDF,MOBI,EPUB
 残った「PDF」「MOBI」「EPUB」の3つは世界中で広く流通しているフォーマットで、電子書店で流通していおり、現時点でのスタンダードと呼べるフォーマット。この3つの中から、「仙台文庫e」では「EPUB」を使うことにしました。

作りやすい―PDF
 作成のしやすさでいえば、制作環境が整っている「PDF」が一番簡単ですね。しかし、パソコンとは違い画面の小さなタブレットやスマートフォンなどの端末で拡大して読もうとすると、全体を拡大するしかありません。

リフローさせたい
 文字サイズだけを拡大し、一画面に収まるように再レイアウトされる「リフロー型」の表示ができず、ページをめくって読むことができないのが欠点です。その一方で再レイアウトされないというのは、段組や画像の配置などのレイアウトが崩れないという長所にもなるわけで、雑誌や画像中心の電子書籍向きのフォーマットなのかもしれません。

電子書籍を広めた―Kindle(MOBI)
 「MOBI」はAmazonのKindle専用のフォーマット。ですが、利用者の拡大によって電子書籍フォーマットのメインストリームとなっています。販売サイトのAmazonがネット通販として広く認知されていることと、その電子書店Kindleストアで電子書籍を販売することが比較的簡単という参入のしやすさが、このフォーマットを一気に拡大させています。

デファクトスタンダードとなるか―EPUB
 オープンな規格である「EPUB」は縦書きやルビといった日本語の表現(組版)に対応していませんでしたが「EPUB3」となりこれらをサポートするようになりました。読むための環境も整っていて電子書店での取り扱いも多く、Kindleストアを除けば一番期待されいるフォーマット。

というわけで、「EPUB3」仕様の電子書籍を作っていきます。

電子出版とは?

イトー博士皆様こんにちは。
メディアデザイン研究室長のイトーです。

 一般社団法人メディアデザインでは、電子書籍のレーベル「仙台文庫e」の創刊を予定しており、そのための電子出版の研究に取り組んでいます。

 電子出版とはなんだろう?
 そこから考えてみると、インターネット上のデジタルデータ化された文字情報――ホームページなどのコンテンツも広い意味では電子出版と言えるのかもしれません。

 日本電子出版協会による定義でも、

電子的なコンテンツはすべて電子出版だということができます。

 とありますから、このホームページからして、既に電子出版だということになるのでしょう。

 電子出版はこれまでの出版の常識を飛び越えて、思いもよらないようなカタチになっていくのかもしれません。しかしながら、当研究室では紙に印刷され本や雑誌といったカタチで配布されている文字や画像の情報を、電子情報(デジタルデータ)に加工して製品化(パッケージ)し配布するような出版形態の電子出版を扱っていく予定です。