pCOSを試します。
これは良い
凄く便利に使えると思う、とりあえずお試し版は1ファイル5ページまで
と制限があるけれど
アイディア次第で結構色々使えると思う。
サーバー的利用ではなくて
コマンドラインツールのデスクトップ利用なら
99ドルとまぁ良いんじゃね?と思いますね。
アップルスクリプトとかと組み合わせて色々出来そう
暗号化されてないものは弾くとか
パスワード設定されていないものを探すとか
PDF/X PDF/Aになってるか?とか
大量にPDFを扱う現場なら
受領データの切り分けとか
切り分けに使えますね。
サーバー管理者なら
階層ディレクトリ中のPDFをfindして
パスワードが掛かっているか?確認するとか
色々発想次第で使えると思います。
ダウンロードはこちらから
【pCOS】[LINK]
DMGファイルがダウンロードされます
binの中に
コマンドバイナリが入っています
ではインストールを
(このまま使っても良いですけど)
cd
(cdの後に半角1バイトスペースが入ります)と入力して
binフォルダをターミナルにドラッグして
sh-3.2$ cd /Volumes/pCOS-2.0-MacOSX-Intel/bin
sh-3.2$ sudo cp ./pcos /usr/local/sbin/
Password:
sh-3.2$
でインストール完了です。
では
マニュアル見ながら色々やってみましょう。
pcosはドキュメントの色々な情報を戻り値として返してきます。
まずはpscs ファイル名を
pcos /Users/Shared/Desktop/test.pdf
sh-3.2$ pcos /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
File name: /Users/Shared/Desktop/test.pdf
File size: 487279
PDF version: 1.6
Encryption: No encryption
Master pw: false
User pw: false
nocopy: false (copying is allowed)
nomodify: false (adding form fields and other changes is allowed)
noannots: false (adding or changing comments or form fields is allowed)
noassemble: false (insert/delete/rotate pages, creating bookmarks is allowed)
noforms: false (filling form fields is allowed)
noaccessible: false (extracting text or graphics for accessibility is allowed)
nohiresprint: false (high-resolution printing is allowed)
plainmetadata: true (metadata is not encrypted)
Linearized: false
PDF/X status: none
PDF/A status: none
Tagged PDF: false
Signatures: 0
Reader-enabled: false
No. of pages: 1
No. of fonts: 3
embedded Type 1 CFF font ITCAvantGardeStd-Bk
embedded Type 1 CFF (CID) font UDShinGoPro-Medium
embedded Type 1 CFF font DINMittelschriftStd
CreationDate: 'D:20100803100553+09'00''
Creator: 'Adobe Illustrator CS4'
ModDate: 'D:20100825122754+09'00''
Producer: 'Adobe PDF library 9.00'
Title: 'レターヘッドA4'
XMP meta data: is present
XFA data: no
PDF Package: no
これって結構凄くないです?
何ページで
フォント、ファイル名、作成APP名 PDFXやら フォームの有無
なかなか凄いです。
フォームフィールドの内容が出ます。
pcos --field /Users/Shared/Desktop/test.pdf
sh-3.2$ pcos --field /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
fields[0]/fullname: Text1
fields[0]/FT: Tx
fields[0]/V:
fields[1]/fullname: Text2
fields[1]/FT: Tx
fields[1]/V:
fields[2]/fullname: Text3
fields[2]/FT: Tx
fields[2]/V:
fields[3]/fullname: Text4
fields[3]/FT: Tx
fields[3]/V: について
fields[4]/fullname: Text5
fields[4]/FT: Tx
よろしくお願いいたします。
sh-3.2$
ページサイズ
pcos --pagesize /Users/Shared/Desktop/test.pdf
sh-3.2$ pcos --pagesize /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
pages[0]/width: 595.28
pages[0]/height: 841.89
pages[0]/MediaBox: 0 0 595.28 841.89
pages[0]/CropBox:
pages[0]/Rotate: 0
縦横サイズだけでなく
メディアボックスやcropboxが指定されているか?
も確認できます。。
PDF/対応
pcos --pdfx --pdfa /Users/Shared/Desktop/test.pdf
sh-3.2$ pcos --pdfx --pdfa /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
PDF/X version: none
PDF/A version: none
署名の有無と署名者
sh-3.2$ pcos --signature /Users/Shared/Desktop/sig.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Visible, signed signature field: Signature2
Filter: Adobe.PPKLite
Name: XXXXXXXXXXXXXXXXXXXXXXX
Time of signing: D:20100928204818+09'00'
sh-3.2$
データの書き出し
注釈の添付ファイルを書き出す
pcos --extract attachment /Users/Shared/Desktop/att.pdf
↓こんな感じのファイルです
sh-3.2$ pcos --extract attachment /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted attachment on page 1, number 1, filename='att/attachment/1/1.test.png'
sh-3.2$
同じ階層に
『注釈に添付』されていたファイルが書き出されます。
添付ファイルを書き出す
pcos --extract embeddedfile /Users/Shared/Desktop/att.pdf
こんなファイルですね。
sh-3.2$ pcos --extract embeddedfile /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted embedded file number 1, filename='att/embeddedfile/0.test.png'
sh-3.2$
こんな感じで書き出されます。
TETでも取り出せましたが
メタデータを書き出せます。
pcos --extract metadata /Users/Shared/Desktop/att.pdf
sh-3.2$ pcos --extract metadata /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted XMP meta data, filename='att/metadata/document.xmp'
こんな感じで
ファイルで取り出せます。
TETより良いですね
TETはその場で見るだけ
TETは取り出し
ですかね。
他にもオプション色々ですので
マニュアルみながら
色々やってみてください
最後に
そのPDFに使われている『フォントの数』
だったら
sh-3.2$ pcos --pcospath "length:fonts" /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
3
sh-3.2$
と
フォントの数だけ取り出すのも簡単です。
あとは
現場の要望にあわせて
組み合わせてあげるのが良しでしょう。