[AppleScripts]シングルクオトのエスケープ処理(phpを使う時のお約束)
| 固定リンク
| 固定リンク
Json等でよく使われるUnicode16進エスケープ形式の文字列を
テキストにデコードします。
その1はphpを使いました
その2ではpythonを使います
ながれはこんな感じ
\の処理が面倒でAppleScriptから使うのはちょっと無理があったかな
phpの方が良いですね
「unicode_escape.py.rtf」をダウンロード
「unicode_escape.py.scpt.zip」をダウンロード
| 固定リンク
Json等でよく使われるUnicode16進エスケープ形式の文字列を
テキストにデコードします。
こんな流れになります
一旦
CharacterEntityへ変換してから
CharacterEntityをテキストに戻します。
「UniEsc2Text.rtf」をダウンロード
「UniEsc2Text.scpt.zip」をダウンロード
| 固定リンク
あの〜ぉ
ハートみたいな変な文字(母国語な人に失礼です...笑)を
BLOGとかにコピペしたらぁ〜
文字バケしちゃうんですぅ〜
だそうで
問題の文字はこれ『ღ』
こちらの記事
【[MorxTester]フォントの文字のGIDやUIDを確認する: [FORCE]】[LINK]に書いた
前に
後に;
を入れるんだよ
って説明したが
首かしげたままだったので
ダメな様子トホホ
じゃぁこれでやって
【[AppleScript]htmlentities変換【TextEdit版】: [FORCE]】[LINK]
って事で終わるんだろうけれども
?エラー?なんで?phpの制限?
面倒だったので
こんなんして終了
まぁねぇ
仕事用じゃぁないし...笑
URLエンコードを
PHPを使ってエンコード・デーコードします。
urlencode — 文字列を URL エンコードする
urldecode — URL エンコードされた文字列をデコードする
文字列を URL エンコードする
urlencode
URL エンコードされた文字列をデコードする
urldecode
「urlencode.zip」をダウンロード[Download]
【PHP: rawurlencode - Manual】[LINK]
【PHP: urldecode - Manual】[LINK]
こちらの記事
【[AppleScript]htmlentities変換: [FORCE]】[LINK]
の
テキストエディット版
OSX内蔵?phpを使います
■【htmlentities】
適用可能な文字を全て HTML エンティティに変換する
html_entity_decode
htmlentities
■【htmlspecialchars】
特殊文字を HTML エンティティに変換する
htmlspecialchars_decode
htmlspecialchars
■【htmlentities】
適用可能な文字を全て HTML エンティティに変換する
htmlentities
html_entity_decode
■【htmlspecialchars】
特殊文字を HTML エンティティに変換する
htmlspecialchars_decode
htmlspecialchars
「htmlentities.zip」をダウンロード[Download]
【PHP: htmlspecialchars - Manual】[LINK]
【PHP: htmlspecialchars_decode - Manual】[LINK]
【PHP: html_entity_decode - Manual】[LINK]
【PHP: htmlentities - Manual】[LINK]
html5.jp[LINK]に以下のような記述があります。
『エンティティ参照は amp, lt, gt, apos, quot のみ。それ以外は、例えば であれば   といった表記を使うこと。』
なるほど
& < > ' " (& < > ' " )は
今までどおり使えて
ノーブレイクスペース (無改行スペース)
が使えなくなるのですね。
むう〜
面倒だなぁ〜色々
ちなみに
10進
 
16進
 
です。
16進の方がなじみがいいな
前回[LINK]
UnicodeのCharacterEntityについて
10進数と16進数の違いを
iWorkのnumbersを使って見てみました。
今回はURLエンコードと比較します。
日本語の『あ』は
Unicode(16進数)で3042
UTF-8でE38182
URLエンコードとキャラクタ実体での違いを
図にすると
このような違いになっている事がわかります。
CharacterEntityでは
3042に『&#x』を頭に 終わりに『;』を付けます
あとなります
一方URLエンコードは
UTF-8での『あ』のコード値の
E38182を2文字づつ『%』で区切ります。
%E3%81%82
では
このUTF-8のコード値はどうやって取得したら良いでしょう。
(文字パレット以外の方法で)
■バイナリーエディタを使う事で取得出来ます
UTF-8で保存してあるテキストファイルを
バイナリエディタで開く事で簡単に確認できます
コピーしたりするのも比較的簡単ですね。
■ hexdumpコマンドを使って表示させる事が出来ます。
まずはデスクトップに
以下のようなファイルを用意します。
a.txt には『あ』を
a.hex.txtは空のテキストファイルを用意しておきます。
こまんど
hexdump -v ~/Desktop/a.txt
で
このように
図のようにUTF-8の16進数コードを得る事が出来ます。
また
hexdump -v ~/Desktop/a.txt > ~/Desktop/a.hex.txt
このようにすれば
先ほどのテキストファイルに
最近では日本語のURLについて
サーバー DNS ブラウザ 共に対応が進んでいますので
あまり使う事も無くなりました
URLエンコードですが
仕組みについては
覚えておいても良いですね。
普段はこちら[LINK]のような
変換サービスを利用するのが吉でしょう。
追記
URLエンコードについては
UTF-8もSJISも同じ考え方
2文字づつ『%』で区切るは同じです。
上の図のように
SJISなら
『%82%a0』になります。
また
JeditX[LINK]を使って
URLエンコードする事も可能です。
(PHPのコマンドを使っています)
ライブラリ[LINK]にある
『選択部分をURLエンコード/デコードする』で
簡単変換出来ます。
このスクリプトを使えば
文字コードを表示する事も可能ですね。
(%取ればいいだけですから)
参考にしてください
Accessibility AccessibilityCheck AccessibilityForm AccessibilityInDesign AccessibilityPDF Acrobat Acrobat Action Acrobat Annotation Acrobat AppleScripts Acrobat Character Acrobat Layer Acrobat PDF Embed API Acrobat PDF Form Print Acrobat Plug-ins Acrobat Portfolios Acrobat Print AcrobatBarcode AcrobatDialog AcrobatForm AcrobatJS AcrobatMenu AcrobatPDF AcrobatStamp AcrobatYouTube AddressBook Adobe Adobe InDesign Adobe Photoshop AdobeAppleScript AdobeBridge AdobeIllustrator AdobeJSX aed Alfresco Android AnimationGif Apple Apple Support AppleScript AppleScriptBasics AppleScriptCharacter AppleScriptColor AppleScriptDroplet AppleScriptErrorNum AppleScriptFolder AppleScriptFontBook AppleScriptRename AppleScriptTools AppleSymbols Applications Barcode Barcode2D BarcodePostal BetterHTMLExport Book BOX Browser buzz Certificates CharacterEntity CharacterSets Colors Cool Site CSS Cutting DecoMail DecorationMail Design Desktop Diff DJ dmg DNS Documents Download DTP eBook Editer eMail Envelopes ExifTool Facebook FFmpeg File System Fonts FontsTool FontsWeb FOOD FormPrint ftp Gadget Gif Animation Google Google Chrome Enterprise HexEditor HTML info iPhoto ISBN ISO iTunes iWork iWorkNumbers iWorkNumbersCalendar iWorkNumbersTimecard iWorkPages JavaScript JeditX JeditX Regexp JeditXAppleScript JIS jquery Letterpress Library logo Mac Admin Mac Archiver Mac Browser Mac Browser Plugin Mac QuickLook Mac Setup Mac Spotlight Mac Video Map Memo Microsoft Teams Mobby mobileconfig Moto Movies Music Network Basic ntp OCR Office OfficePowerPoint OSX Paint Pantone Paper PDFlib Permission Photo Pictograms Print Public Python QuickLook QuickTime QuickTimeSetting QuickTimeSound Real Media ReName ResourceFork ruby Sample Screen ScreenCast Search Security SEO Sharing SLAResource Sound Spotlight Stamp SWF TCC.db Tutorial PSD TV Twitter Typography Unicode Utilities Video WEB APP WebFont Wedding Windows WindowsMedia XML XMP XPS YouTube YouTube Rss