PDFの「文章のプロパティ」って、意外と大事だと思う

ホームページなどでは、よくPDFで書類をダウンロードできたり、チラシなどを見せたりしていますよね。

そんな時に、ちょっとだけ気にしておくといいかもしれない事をご紹介します。

サイトからPDFのデータにアクセスした時、ブラウザによってはこんな表示を見たりしませんか?

何やら妙な数字の羅列…
(Chromeの場合です)

これは何か?
じつはこれは、このPDFの「タイトル」です。
ファイル名とは違います。

ファイル名はあくまでもそのPDFファイルそのものにつける名前です。
ファイル整理のためのナンバリングと言ったところですか。

タイトルとは、このPDFファイルの内容に対するタイトルですね。
「Adobe Acrobat」でPDFを開いた時に、右クリックメニューの「文章のプロパティ」で開いたり、「ファイル」メニューのプロパティから設定できる項目です。

他にも「制作者」「サブタイトル」「キーワード」などを入力できます。

…なぜこんな事をこのブログで紹介するのか?
それはこのプロパティ、特に「タイトル」は、あながちWEBと無関係とは言えないからですよ。

ここで最初にお見せした画像です。妙な数字の羅列。
…もうお察しですね?
そう、あの部分に表示されているのは、このプロパティで設定されている「タイトル」の部分です。
Chromeの場合、ブラウザ上部のタブ部分(ページタイトル)にもこいつが表示されてしまいます。

画像でお見せしたのは、おそらくスキャナーとかで資料をPDF化した時に、こんなタイトルが付いたと思われます。
(検証してないので、推測ですが)

要は、PDFを作成した状況によっては、ここに意図しない文字が入り、かつサイトにアップした場合はそれがブラウザに表示されてしまっているという事です。
しかもこのPDFがGoogleにキャッシュされれば、このタイトルが検索一覧に表示され…

はい、怖いですね。
ですので、PDFファイルをアップする時は、ちゃんと「文書のプロパティ」もチェックしておいた方が良いですよ。

ちなみに「タイトル」が空白の場合は、「ファイル名」が表示されるみたいです。

ただしページタイトルはちょっと違います。
googleなどの検索一覧の場合、PDFがテキストデータを持っている場合はそこからある程度文字を拾ってくれますが、画像をPDF化した場合は「Untitled」なんて呼ばれてしまう場合もあるみたいです。

「文書のプロパティ」を設定してみたPDFのサンプル

サブタイトルとかがどう影響してくるかは、ちょっと検証中ですが、
こちらはそこまで気にしなくてもいいと思います。

※不特定多数の人がダウンロードできるという意味では、気にした方がいいかもしれませんが、勝手に何か値が入ってたりする事はなさそうです。