« [PDF]TETPluginを試す:ちょっと便利だが日本語が【pdflib】 | トップページ | [PDF]PDFファイルの分割と結合【ビデオデモ】 »

[PDF]pCOSを試す:お試しは5ページまで【PDFlib】

pCOSを試します。
これは良い
凄く便利に使えると思う、とりあえずお試し版は1ファイル5ページまで
と制限があるけれど
アイディア次第で結構色々使えると思う。
サーバー的利用ではなくて
コマンドラインツールのデスクトップ利用なら
99ドルとまぁ良いんじゃね?と思いますね。

アップルスクリプトとかと組み合わせて色々出来そう
暗号化されてないものは弾くとか
パスワード設定されていないものを探すとか
PDF/X PDF/Aになってるか?とか
大量にPDFを扱う現場なら
受領データの切り分けとか
切り分けに使えますね。
サーバー管理者なら
階層ディレクトリ中のPDFをfindして
パスワードが掛かっているか?確認するとか

色々発想次第で使えると思います。

 


ダウンロードはこちらから

1028x542_pcos_01
pCOS[LINK]新しいウィンドで開きます


DMGファイルがダウンロードされます

505x135_pcos_01

binの中に

859x317_pcos_02

コマンドバイナリが入っています

808x329_pcos_03

ではインストールを
(このまま使っても良いですけど)

cd
(cdの後に半角1バイトスペースが入ります)と入力して
binフォルダをターミナルにドラッグして

505x247_pcos_01

sh-3.2$ cd /Volumes/pCOS-2.0-MacOSX-Intel/bin sh-3.2$ sudo cp ./pcos /usr/local/sbin/ Password: sh-3.2$

Force4u00220928_203323

でインストール完了です。

 

では
マニュアル見ながら色々やってみましょう。

pcosはドキュメントの色々な情報を戻り値として返してきます。

まずはpscs ファイル名を
pcos /Users/Shared/Desktop/test.pdf


sh-3.2$ pcos /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
File name: /Users/Shared/Desktop/test.pdf
File size: 487279
PDF version: 1.6
Encryption: No encryption
Master pw: false
User pw: false
nocopy: false (copying is allowed)
nomodify: false (adding form fields and other changes is allowed)
noannots: false (adding or changing comments or form fields is allowed)
noassemble: false (insert/delete/rotate pages, creating bookmarks is allowed)
noforms: false (filling form fields is allowed)
noaccessible: false (extracting text or graphics for accessibility is allowed)
nohiresprint: false (high-resolution printing is allowed)
plainmetadata: true (metadata is not encrypted)
Linearized: false
PDF/X status: none
PDF/A status: none
Tagged PDF: false
Signatures: 0
Reader-enabled: false

No. of pages: 1
No. of fonts: 3
embedded Type 1 CFF font ITCAvantGardeStd-Bk
embedded Type 1 CFF (CID) font UDShinGoPro-Medium
embedded Type 1 CFF font DINMittelschriftStd

CreationDate: 'D:20100803100553+09'00''
Creator: 'Adobe Illustrator CS4'
ModDate: 'D:20100825122754+09'00''
Producer: 'Adobe PDF library 9.00'
Title: 'レターヘッドA4'

XMP meta data: is present
XFA data: no
PDF Package: no



これって結構凄くないです?
何ページで
フォント、ファイル名、作成APP名 PDFXやら フォームの有無

なかなか凄いです。

 

フォームフィールドの内容が出ます。

pcos --field /Users/Shared/Desktop/test.pdf


sh-3.2$ pcos --field /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
fields[0]/fullname: Text1
fields[0]/FT: Tx
fields[0]/V:
fields[1]/fullname: Text2
fields[1]/FT: Tx
fields[1]/V:
fields[2]/fullname: Text3
fields[2]/FT: Tx
fields[2]/V:
fields[3]/fullname: Text4
fields[3]/FT: Tx
fields[3]/V:      について
fields[4]/fullname: Text5
fields[4]/FT: Tx
よろしくお願いいたします。
sh-3.2$



 

ページサイズ
pcos --pagesize /Users/Shared/Desktop/test.pdf


sh-3.2$ pcos --pagesize /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
pages[0]/width: 595.28
pages[0]/height: 841.89
pages[0]/MediaBox: 0 0 595.28 841.89
pages[0]/CropBox:
pages[0]/Rotate: 0




縦横サイズだけでなく
メディアボックスやcropboxが指定されているか?
も確認できます。。


 

PDF/対応

pcos --pdfx --pdfa /Users/Shared/Desktop/test.pdf



sh-3.2$ pcos --pdfx --pdfa /Users/Shared/Desktop/test.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
PDF/X version: none
PDF/A version: none



 

署名の有無と署名者



sh-3.2$ pcos --signature /Users/Shared/Desktop/sig.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Visible, signed signature field: Signature2
Filter: Adobe.PPKLite
Name: XXXXXXXXXXXXXXXXXXXXXXX
Time of signing: D:20100928204818+09'00'
sh-3.2$



 

データの書き出し
注釈の添付ファイルを書き出す
pcos --extract attachment /Users/Shared/Desktop/att.pdf
↓こんな感じのファイルです
Force4u00220928_205826


sh-3.2$ pcos --extract attachment /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted attachment on page 1, number 1, filename='att/attachment/1/1.test.png'
sh-3.2$




Force4u00220928_205945

同じ階層に
『注釈に添付』されていたファイルが書き出されます。

 

添付ファイルを書き出す
pcos --extract embeddedfile /Users/Shared/Desktop/att.pdf
こんなファイルですね。
Force4u00220928_210206




sh-3.2$ pcos --extract embeddedfile /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted embedded file number 1, filename='att/embeddedfile/0.test.png'
sh-3.2$



Force4u00220928_210359

こんな感じで書き出されます。

 
TETでも取り出せましたが
メタデータを書き出せます。

pcos --extract metadata /Users/Shared/Desktop/att.pdf



sh-3.2$ pcos --extract metadata /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
Extracted XMP meta data, filename='att/metadata/document.xmp'




Force4u00220928_210609

こんな感じで
ファイルで取り出せます。
TETより良いですね
TETはその場で見るだけ
TETは取り出し
ですかね。

 

他にもオプション色々ですので
マニュアルみながら
色々やってみてください

最後に
そのPDFに使われている『フォントの数』
だったら


sh-3.2$ pcos --pcospath "length:fonts" /Users/Shared/Desktop/att.pdf
PDFlib pCOS: PDF Information Retrieval Tool, 2.0
(c) 2007 PDFlib GmbH www.pdflib.com sales@pdflib.com
3
sh-3.2$




フォントの数だけ取り出すのも簡単です。


あとは
現場の要望にあわせて
組み合わせてあげるのが良しでしょう。

|

« [PDF]TETPluginを試す:ちょっと便利だが日本語が【pdflib】 | トップページ | [PDF]PDFファイルの分割と結合【ビデオデモ】 »

PDFlib」カテゴリの記事

コメント

この記事へのコメントは終了しました。