JeditX Regexp

[正規表現]Quotationクォテーションの置き換え

めったに無い英語系
慣れないので、戸惑う事が多い
『幸い』大量ページ物では無かったので、短時間で済んだが
用紙サイズはまだしも
禁則に関しては『何が正解』なんだか?状態で非常に難儀した

クオテーションの直しがあり
Jedit Xの複数置換で対応したが…
校正も初めての業者さんで、慣れないのもあり
ホント難儀した…

Website_image00280312_222409

上のような原稿を
下のように置き換えます。

こんな感じです。

Website_image00280312_222401

Jedit Xの置換ファイル
「ReplaceQuotation.txt」をダウンロード

実際には
赤字の部分のPRIME関連の置き換えは実施せずに
検索かけながらの手作業にした(結局は1カ所だけだった)

Website_image00280312_222812


---
一応お約束でAppleScriptも作ったが
ファイル数が多くないならJedit Xの置換の方が堅い



set theText to "I'm \"NO, the is the 'Right Way!'\" she replied. 6' 2\" tall"





set theDoneReplace to doReplace(theText, " ", " ") as text
set theDoneReplace to doReplace(theText, "\\", "") as text
-----Apostrophe
set theDoneReplace to doReplace(theDoneReplace, "′", "'") as text

-----DoubleQuotation
set theDoneReplace to doReplace(theDoneReplace, " \"", " “") as text
set theDoneReplace to doReplace(theDoneReplace, "\" ", "” ") as text
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\" | awk 'gsub(/(\"$)/, \"”\") \"\"'"
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\" | awk 'gsub(/(^\")/, \"“\") \"\"'"

-----SingleQuotation

set theDoneReplace to doReplace(theDoneReplace, " '", " ‘") as text
set theDoneReplace to doReplace(theDoneReplace, "' ", "’ ") as text
set theDoneReplace to doReplace(theDoneReplace, "“'", "“‘") as text
set theDoneReplace to doReplace(theDoneReplace, "'“", "‘“") as text
set theDoneReplace to doReplace(theDoneReplace, "”'", "”’") as text
set theDoneReplace to doReplace(theDoneReplace, "'”", "’”") as text
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\"| awk 'gsub(/'\\''$/, \"’\" ) \"\"'"
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\" | awk 'gsub(/^'\\''/, \"‘\" ) \"\"'"

-----Prime
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\"| sed -e 's/\\([0-9]\\)\\(’\\)\\( \\)/\\1′\\3/g'"
set theDoneReplace to doReplace(theDoneReplace, "\"", "\\\"") as text
set theDoneReplace to do shell script "echo \"" & theDoneReplace & "\"| sed -e 's/\\([0-9]\\)\\(”\\)\\( \\)/\\1′\\3/g'"




tell application "TextEdit" to launch
tell application "TextEdit"
make new document with properties {text:theDoneReplace}
tell document 1
properties
set font to "Georgia"
set size to 48
end tell

end tell
tell application "TextEdit" to activate



--------////////文字の置き換えのサブルーチン
to doReplace(theText, orgStr, newStr)
set oldDelim to AppleScript's text item delimiters
set AppleScript's text item delimiters to orgStr
set tmpList to every text item of theText
set AppleScript's text item delimiters to newStr
set tmpStr to tmpList as text
set AppleScript's text item delimiters to oldDelim
return tmpStr
end doReplace

「ReplaceQuotation.scpt.zip」をダウンロード

|

[Jedit X]Tab区切りテキストからテーブルを生成する

タブ区切りテキストをJedit Xの複数一括置換をつかって
HTMLテーブルに整形します。

Image00230112_13829

YouTube - [Jedit X]Tab区切りテキストからテーブルを生成する[YOUTUBE]新しいウィンドで開きます

ビデオで使った複数一括置換ファイル

シンプルなテーブル用
「tab2table.txt」をダウンロード

アクセシブル対応用

「tab2tableFull.txt」をダウンロード

| | コメント (0) | トラックバック (0)

[正規表現]#からはじまる行を削除

特定の文字からはじまる行を削除します。
例題はです。
Image00230111_54036


Image00230111_54049

解説としては以下
Image00230111_55129


ようになります。

行を残さずに削除する場合は
行末→改行にすれば良いので


Image00230111_55532

このようになります。

| | コメント (0) | トラックバック (0)

[RegExp]文字間にスペースを入れる(正規表現)

Jedit Xの正規表現
文字と文字の間に『スペース』を入れます。

Regexp1


Regexp2

(.)(.)
()はグループ
.は任意の1文字
ですね。

グループはそのままにして
スペースを入れたいのでこのようになります。


Regexp1_2

| | コメント (0) | トラックバック (0)

[Jeditx]特定の文字数毎に改行

改行の無い長い文字列に
特定の文字数で改行を入れます

Photo


Im00221202_190016

サンプルはデータストリームを整形した時の物です

| | コメント (0)

[住所録]はがきデザインキットの住所録データを使う【その1】

郵便番号の整形は以前こちらの記事
[LINK]アイコン:新しいウィンドで開きますでやりましたが

ちょうど今クリスマスカードの印刷をやっているので
ちょいとメモ
 

はがきデザインキットの住所録から
住所録データを書き出すと
こんな感じで
Im00221124_71950

郵便番号が連続データになってしまいます。
この
9999999形式の郵便番号を

999 9999 (スペース区切り)

999-9999(ハイフン区切り)
に変更します。


 


999 9999 (スペース区切り)

Im00221124_71804

 


999-9999(ハイフン区切り)


Im00221124_71825



こんな感じで置換します。

 

ちなみに住所録の場所はここ
Im00221124_75503

通常の定期的なバックアップの他に
2重にバックアップしています。

辞書ファイルと住所録は宝物っすね。

  

| | コメント (0)

[XLS]エクセルでコマンドを整形する【やっつけ系】

日々の業務で
『量』が多いと
何か簡単に作業したい!楽したい!...笑
と思うのが人情

Force4u00221002_63942_2

今回は『やっつけ』系です...笑

本来なら
行数カウントしてループさせて.....
書き出し終わった行数も確認して....
となりますが
やっつけちゃいたい!場合のヒントです

 

サンプルは以下

■500行のテキストを50行毎に別ファイルにする

Force4u00221002_62302


エクセル上でコマンドを整形しちゃいます。

このぐらいの量だと
テキストエディット上で編集した方が早いかも?ですが
量が多くなった場合は
結構エクセル便利です。

Force4u00221002_62846

行数とかは
計算式で50足したり
書き出しファイル名はドラッグすれば良いですね
Force4u00221002_62948

ナンバーズだと
カンマ区切りテキストしか選べませんが
後でカンマ取ればいいですね。
(直接テキストエディット等にコピペも有りです)

私は
一応
スペース区切りテキストへ
吐き出させます。
Force4u00221002_62543

そうすれば
そのまま出来上がりです。

Force4u00221002_62811


対象のファイルのディレクトリで

Force4u00221002_62605

ドン
Force4u00221002_63558


ドン

Force4u00221002_62820

一回きり
やっつけ系でした。...笑
(やっつけ....嫌いじゃないな..汗)

  

cat moto.txt | awk ' 1 <= NR && NR <= 50' >> 1.txt
cat moto.txt | awk ' 51<= NR && NR <=100' >> 51.txt
cat moto.txt | awk '101<= NR && NR <=150' >> 101.txt
cat moto.txt | awk '151<= NR && NR <=200' >> 151.txt
cat moto.txt | awk '201<= NR && NR <=250' >> 201.txt
cat moto.txt | awk '251<= NR && NR <=300' >> 251.txt
cat moto.txt | awk '301<= NR && NR <=350' >> 301.txt
cat moto.txt | awk '351<= NR && NR <=400' >> 351.txt
cat moto.txt | awk '401<= NR && NR <=450' >> 401.txt
cat moto.txt | awk '451<= NR && NR <=500' >> 451.txt

  

| | コメント (0)

[JeditX]特定の文字以外を削除【正規表現】

こちらで
[awk]テキストファイルの整形【列の取り出し】: [FORCE][LINK]新しいウィンドで開きます
やった
縦方向への文字の取り出しですが
Jeditの正規表現置換でも可能です。


まずは
カンマ区切りテキストCSVをタブ区切りテキストに変換します。

Force4u00220930_180701

今回のサンプルテキストなら

Force4u00220930_180803


こんな感じで
縦方向に取り出しできます。

Force4u00220930_181338

意味的にはこんな感じ

Force4u00220930_181558

↑は文字が固定している事が前提なので
タブの数で取り出すなら

Force4u00220930_182619

これなら3目のグループだけを
残す
って事で解決できますね。


| | コメント (0)

[JeditX]特定の文字からはじまる行『以外』を削除【正規表現】

何かもう少しいい方法があるのかも?
しれませんが
とりあえず
今日はこれで乗り切ったので
メモしておく。

https以外の行を削除する。(httpsの行だけ抽出したい)

Jeditx


Force4u00220922_191552


Force4u00220922_191611


Grep

打ち消し否定が
面倒ですなぁ〜

これはファイルにして
cat XXXX | grep https
のだわなぁ〜

| | コメント (0)

[JeditX]Applescriptでの正規表現

Jeditのアップルスクリプト中の
正規表現の指定は

grep true

replaceAll string "^http.*\n" to "" with select all, case sensitive, grep and entire word

こんな感じになります。

Force4u00220922_190634


正規表現 - Wikipedia[LINK]新しいウィンドで開きます

Regular expression - Wikipedia, the free encyclopedia[LINK]新しいウィンドで開きます

| | コメント (0)

その他のカテゴリー

Accessibility AccessibilityCheck AccessibilityForm AccessibilityInDesign AccessibilityPDF Acrobat Acrobat Action Acrobat Annotation Acrobat AppleScripts Acrobat Character Acrobat Layer Acrobat PDF Embed API Acrobat PDF Form Print Acrobat Plug-ins Acrobat Portfolios Acrobat Print AcrobatBarcode AcrobatDialog AcrobatForm AcrobatJS AcrobatMenu AcrobatPDF AcrobatStamp AcrobatYouTube AddressBook Adobe Adobe InDesign Adobe Photoshop AdobeAppleScript AdobeBridge AdobeIllustrator AdobeJSX aed Alfresco Android AnimationGif Apple Apple Support AppleScript AppleScriptBasics AppleScriptCharacter AppleScriptColor AppleScriptDroplet AppleScriptErrorNum AppleScriptFolder AppleScriptFontBook AppleScriptRename AppleScriptTools AppleSymbols Applications Barcode Barcode2D BarcodePostal BetterHTMLExport Book BOX Browser buzz Certificates CharacterEntity CharacterSets Colors Cool Site CSS Cutting DecoMail DecorationMail Design Desktop Diff DJ dmg DNS Documents Download DTP eBook Editer eMail Envelopes ExifTool Facebook FFmpeg File System Fonts FontsTool FontsWeb FOOD FormPrint ftp Gadget Gif Animation Google Google Chrome Enterprise HexEditor HTML info iPhoto ISBN ISO iTunes iWork iWorkNumbers iWorkNumbersCalendar iWorkNumbersTimecard iWorkPages JavaScript JeditX JeditX Regexp JeditXAppleScript JIS jquery Letterpress Library logo Mac Admin Mac Archiver Mac Browser Mac Browser Plugin Mac QuickLook Mac Setup Mac Spotlight Mac Video Map Memo Microsoft Teams Mobby mobileconfig Moto Movies Music Network Basic ntp OCR Office OfficePowerPoint OSX Paint Pantone Paper PDFlib Permission Photo Pictograms Print Public Python QuickLook QuickTime QuickTimeSetting QuickTimeSound Real Media ReName ResourceFork ruby Sample Screen ScreenCast Search Security SEO Sharing SLAResource Sound Spotlight Stamp SWF TCC.db Tutorial PSD TV Twitter Typography Unicode Utilities Video WEB APP WebFont Wedding Windows WindowsMedia XML XMP XPS YouTube YouTube Rss