PDFlib FontReporter【文字を検索出来ないPDF】
文字列を見た目の文字通りに検索出来ないPDFについては
こちら
DTP駆け込み寺 掲示板に
書き込みしていますので
詳細は掲示板を読んでください。
PDFlib FontReporter[LINK]
『美しい日本語』と入力したテキストファイルで
JeditXからPS吐かせてディスティラでPDF化した場合の
検索出来ないPDFの場合
OSAKAー等幅
通常の文字コードと字形がマッチする
検索可能なPDFの場合
新ゴUD
サブセット化されたフォントと
字形 字形と文字コードの紐付けが確認出来ます。
OSAKA等幅のPSファイルを見ると
↑このように
字形と文字コードが紐づいていません
新ゴで出力すると
↑このように
字形と文字コードが紐づきます
同じアプリケーション
同じようなPDFの作成手順であっても
フォントが違うだけで
(見た目の文字どおり)検索出来ないファイルが出来てしまいます。
勘違いしやすいのが
こちら[LINK]のような誤解です。
上記で説明した通り
作成したアプリケーション
と
使用したフォント
と
PDF化する方法
によって
字形と文字コードが紐づいていないPDFが出来るだけで
カスタムエンコードだから
見た目の文字通り検索出来ないわけではありません。
この対象のPDFはPScript5.dllで作成されている
のと
PDFのバージョン
で
このような事になっているだけではないだろうか?
パスワードかけている事から
検索エンジンに読まれないようにするためなら
暗号化すれば良いわけだし。
(ほとんどの内閣府のPDFはアクセシブルになっている)
人の振りして我が振りで
配布用PDFを作成する場合には注意したいですね。
PDFlib FontReporterは
グリフの内容が確認出来る便利なプラグイン
ですが
最近のアクロバットは『プラグイン』があると
アップデート時に『アップデート出来ない』事があります。
上記のプラグインを試す場合は
業務で使うマシン以外で試してくださいね。
ちなみに私は
Acrobat8にはプラグインてんこもり
で
Acrobat9にはプラグインを入れない
って
方法をとっています。(良いか悪いかは別にして..w)
| 固定リンク
「Acrobat Character」カテゴリの記事
- 字形と文字コードが紐づいていないPDF(決定版解説)(2021.02.28)
- PDFのテキスト構造(縦書きPDFとオフィス書き出し)(2016.09.12)
- [PDF]見た目通りの字形ではない文字(透明透かしでラスタライズ後にClearScanでOCR)(2015.02.15)
- PDFlib FontReporter【文字を検索出来ないPDF】(2010.08.04)
この記事へのコメントは終了しました。
コメント