Guidelines for PDF Creation




すでにISO規格となっているPDF/Aに加え
2007年 「PDF 1.7」 の仕様全体がAIIMに提出され PDFのフル仕様をISOの世界標準とすることを目指す動きがある。ここではまず PDF/A の概要について概要 普及状況 ガイドラインをまとめる。





● PDF/Aは PDF 1.4の機能を必須とする機能、使用を制限する機能、使用を禁止する機能 に分け 長期保存に適したPDFを作成するための規格である。

○ 1990年にAdobe社によってPDFは開発され 1993年より使われている。
○ 2005年に ISO19005-1として PDF/A-1という規格が決められた。
○ PDF/A-1のAは 「Archive」 を意味している。
○ PDF/A-1の1は 「バージョン1」 を意味していて 現在PDF/A-2が検討中である。
○ PDF/A-1は PDF1.4をベースとしている。
○ 準拠レベルとして レベルAとレベルBがあり Aの方が包括的である。
○ PDF/A-1a (レベルA) は ISO 19005-1 全部準拠
○ PDF/A-1b (レベルB) は ISO 19005-1 一部準拠

参考資料:http://ja.wikipedia.org/wiki/PDF/A


● 米国議会図書館はPDF/A-1の普及状況(2007年時点)について次のようにまとめる

○ 2005年の発表以来 作成ツール、変換ツール、検証ツールが順調に発売されている
○ Acrobat Professional 7.0は ドラフト段階の規格に準拠する形でファイル出力できる
○ Acrobat 8は 2005年リリース規格に完全準拠したファイルを出力できる
○ 2006年に いくつかのメーカー(主にヨーロッパの会社)から 大規模組織向けのツールが発売された 
(Apago, Inc., Visioneer (for scanning paper to PDF/A), Callas Software, Compart Systemhaus, Luratech, Nuance, PDF Tools AG)
○ Apache FOPのバージョン0.93が、PDF/A-1bをサポートした
○ 標準規格の作成段階から PDF/Aの普及の鍵を握る団体を巻き込んでいた (のでスムーズに普及していくと思われる)

参考資料 : http://www.digitalpreservation.gov/formats/fdd/fdd000125.shtml


● オランダ国立図書館が10項目のガイドラインとして具体的な指針を示す

 1.パスワード保護 暗号化 DRM などのセキュリティ機能は使用しないこと
 2.Adobe Acrobatを使って タグ付きPDFにすること (文書構造や代替情報を付加)
 3.ハイパーリンクを設定する場合 URLを明記して 人が読めるようにしておくこと
 4.埋め込みが法的に許されていて かつ WinAnsiEncodingかMacRomanEncodingでエンコードされたフォントだけを使用し 全てのフォントを埋め込むこと
 5.圧縮の使用は避けること (どうしても必要な場合 ZIPのような可逆圧縮を用いること)
 6.画像のダウンサンプリングは避けること
 7.透過画像は使わないこと
 8.アクション、スクリプト、フォーム などの使用は避けること
 9.外部コンテンツやアプリケーションへの参照など外部依存性を排除し PDF内で完結するように作成すること
 10.デバイスに依存しないカラースペース (CalGray、CalRGB、LAB、ないしICCベース)を使うか OutputIntentの指定でカラー再現性を保証すること

参考資料 : http://www.kb.nl/hrd/dd/dd_links_en_publicaties/PDF_Guidelines.pdf



補足1
 電子化を語る場合 既存の紙ベースの資料やマイクロフィルムをスキャン・保存していく「アーカイブ」と これから作成されるボーンデジタル・ファイルを発行・保存していく 「カレント」 を峻別して考えていく必要があり 当 『ガイドライン』 は 「カレント」 に関する記述であることを意識する必要がある。


★ほぼ日刊資料保存で 以下のように紹介されているが オランダ国立図書館が別途発表した 『Alternative File Formats for Storing Master Images of Digitisation Projects』 の内容と混同している。
(simple Report 057参照)

オランダ国立図書館 (Koninklijke Bibliotheek) はこのほど マス・デジタル化によるマスター画像のファイル形式として 現在の非圧縮型TIFFに替わりPDFを採用する可能性を探ったレポート PDF Guidelines: Recommendations for the creation of PDF files for long-term preservation and access を公開した。

TIFFは画像の質としては問題ないが 長期保存にはあまりにもファイル容量が大きいため としている。 以下のページから報告書全文がダウンロードできる。
 http://www.hozon.co.jp/hobo/hobo_top.htm 2008年3月25日の記事より


★『ガイドライン』 の冒頭で 以下のように説明する。

e-Depotに保存されているファイルの88%はPDFであるので PDFに関するガイドラインを最初に発行しようと考えた。

http://www.kb.nl/hrd/dd/dd_links_en_publicaties/PDF_Guidelines.pdf p.2

e-Depotは、オランダ国立図書館の運営する学術機関リポジトリ。

★オランダ国立図書館の 『ガイドライン』 は ボーンデジタル・ファイルの投稿に関して PDF作成ガイドラインを提示したものである。
すなわち 「カレント」 に関する議論である。

補足2 PDF/A準拠の製品 (日本国内入手可能製品の例 )

★Abobe Acrobat 8
○ PDFlib
 http://pdflib.jp/
 http://pdflib.opentype.jp/cookbook/pdf-flavors/starter-pdfa/
○ OpenOffice 2.4
 http://download.openoffice.org/other.html#ja
 http://journal.mycom.co.jp/news/2008/01/30/029/
○ OpenFlow
 http://www.dod-net.co.jp/
 http://www.dod-net.co.jp/openflow/openflow.html
○ PDF Edit 2 Professional
 http://japan.nuance.com/
 http://japan.nuance.com/pdf/edit2/featurescreate.asp
○ XSL Formatter V4.3
 http://www.antenna.co.jp/
 http://www.antenna.co.jp/XSL-FO/

補足3 参考文献

http://www.antenna.co.jp/PDF/reference/PDFA.htm
http://www.antenna.co.jp/PDF/reference/PDFAOutline.pdfhttp://help.adobe.com/ja_JP/Acrobat/8.0/3D/help.html?content=WS58a04a822e3e50102bd615109794195ff-7b40.html



 (2008年 収集)