読者です 読者をやめる 読者になる 読者になる

<pandas, regexp> パンダさんと正規表現を使って置換

pandasのapply()で正規表現regexpを使った置換。 まずは、セットアップ。 In [1]: import pandas as pd In [2]: import re In [3]: df = pd.DataFrame([ ...: '(00001) hage', ...: '(00002) hige', ...: '(02000) taro', ...: '(12345) jiro', ...: ]) In […

<Regexp> 正規表現チェック

正規表現 regexp がチェックできるところらしい。 regex101.com

<Python, pandas, regexp> 各要素に対して正規表現で検索かける。

DataFrameの各要素elementに対して正規表現regexpで検索かける方法。 DataFrame.applymap()を使う。 In [1]: df = pd.DataFrame({ ...: 'a':['hage', 'hoge', 'hige'], ...: 'b':['null', 'hige', 'hage'], ...: 'c':['fugu', 'fuga', 'fugo']}) In [2]: imp…

<Python, regexp> 例題, アパッチログからのテキストの抽出

Webサーフィン中に正規表現regexpの例題を見つけたので分析。 たまに練習しないと難しくて理解できん。。。 In [1]: s = '127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326' In [2]: s Out[2]: '127.0.0.1 - frank […

sed 2行置きにファイルの内容を出力

>cat hogehoge.txt | sed -ne '0~2p' 本当に2行置き? を見るには cat -n で >cat -n hogehoge.txt | sed -ne '0~2p' 10行置きは、 >cat hogehoge.txt | sed -ne '0~10p' 3行目からは、 >cat hogehoge.txt | sed -ne '3~10p' p 行の内容を単純に出力-n …

sed マッチしたキーワードを再利用

>echo 'hogehoge' | sed 's/hogehoge/this is &./'>this is hogehoge. & --> マッチしたキーワードを出力\(\)だと\1, \2 とかで呼び出す。

sed 正規表現 同じ文字列が2回出てくる時にマッチ

>echo abcdefgabcdefg | sed 's/\(.*\)\1/\1/g'>abcdefg 同じ文字列が2回出てくるところにマッチ。 (.*) で文字列にマッチ + マッチ内容を記憶 \(.*\) で () をエスケープ\1 でマッチ内容をリピート\(.*\)\1 で同じ文字列を繰り返し

sed 正規表現 /* */

s/^\(.*\)$/\/* \1 *\// 行を /* */ でコメントアウトする置換^.*$で全部にマッチ。^(.*)$でマッチ内容をメモリ()をエスケープするため ^\(.\)$ \1 でメモリ内容を出力