pandas

<pandas, Python> 条件にあった行を削除する。

条件conditionにあった行Rowを削除dropする。 まずは、お見本データフレームDataFrame作成。 In [54]: data=''' ...: 1 2 3 4 5 ...: a b c d e ...: f g h i j ...: k l m n o ...: ''' In [55]: df = pd.read_table(io.StringIO(data), sep=' ') In [56]: …

<pandas, Python> ふたつのカラムの値でソートする。

2つ、ふたつのカラムcolumnの値でソートsortする。 In [58]: df = pd.DataFrame({'a':[2,2,1,1,1],'b':[2,1,3,1,2],'c':['a','b','c','d','e']}) In [59]: df Out[59]: a b c 0 2 2 a 1 2 1 b 2 1 3 c 3 1 1 d 4 1 2 e In [60]: df.sort_values(['a','b'], …

<pandas, Python> カラムの値を比較して、同じ値の行を抽出する。

カラムcolumnの値を比較して、同じ値の行rowを抽出する。 対象のカラムを選択して、apply()をして、その中で、lambda関数で文字列比較処理をすればいい。 In [7]: df = pd.DataFrame({'a':[1,2,3,4,5],'b':[1,4,6,8,10],'c':[5,7,8,9,10]}) In [8]: df Out[8…

<Python, pandas> to_csvでUnicodeEncodeError

Flaskさん中で、subprocessを使って、Pythonスクリプトを呼び出す。 呼び出されたPythonスクリプト中で、pandas.DataFrame.to_csv()を使って、データフレームをcsv出力。 データフレーム中に入っているデータが、元UTF-8だった場合、かつFlask環境がLANG=asc…

<Python, pandas, Beautiful Soup> html tableからpandas dataframeへ。

html中にあるtableから、pandas dataframeを作る。 <tr> <td>タブとかを、ちくちくと、Beautiful Soupでパースしないといけないのか、、、 いやいや、そんな面倒なことは、誰かが、既に何かを作っているはず、、と思ってたら、あった。 pd.read_html()でいける。ちょ</td></tr>…

<Python, pandas, sentdex> resample

目的とするDataFrameから、値を抜き取りする、リサンプリング resample をしてみた。 In [20]: import datetime as dt In [21]: import pandas as pd In [22]: import pandas_datareader.data as web In [23]: s = dt.datetime(2000,1,1) In [24]: e = dt.da…

<pandas, Python, sentdex> Python Programming for Finance

www.youtube.com やってみた。 In [1]: import datetime as dt In [2]: import matplotlib.pyplot as plt In [3]: from matplotlib import style In [4]: import pandas as pd In [5]: import pandas_datareader.data as web In [6]: style.use('ggplot') In…

<Python, pandas> 縦にずらす。

縦にずらす。 In [22]: df = pd.DataFrame({'a':[1,2,3,4,5,6]}) In [23]: df Out[23]: a 0 1 1 2 2 3 3 4 4 5 5 6 In [24]: df.shift(-1) Out[24]: a 0 2.0 1 3.0 2 4.0 3 5.0 4 6.0 5 NaN In [25]: df.shift(1) Out[25]: a 0 NaN 1 1.0 2 2.0 3 3.0 4 4.0 …

<Python, pandas> 日経平均を読み込む。

日経平均N225を読み込む。 pandas-datareaderを使う。 pandas-datareader — pandas-datareader 0.1 documentation まずはインストール。 % conda install pandas-datareader Fetching package metadata ......... Solving package specifications: .........…

<Python, pandas> 行(row)を追加する。

行rowを追加する。行の追加。 こういうデータフレームDataFrameがあった時、 In [71]: df Out[71]: id name birthday is_relative 0 1 Hage 1960-01-01 1 1 2 Hige 1960-01-02 1 1行追加したい時は、シリーズSeriesでデータ作って、.append()すればいいっぽ…

<Pandas, peewee, sqlite> peeweeを少しためす。

peeweeを少しためしてみた。 まずは、データベースdatabase作成とデータ登録。 In [51]: from peewee import * In [52]: db = SqliteDatabase('people.db') In [53]: class Person(Model): ...: name = CharField() ...: birthday = DateField() ...: is_rel…

<Python, pandas> 文字列の置換

シリーズSeriesでの文字列置換str replace df['column'].str.replace('','')を使う。 In [52]: df = pd.DataFrame({'a':['HAGE*', 'HAGE*']}) In [53]: df.a Out[53]: 0 HAGE* 1 HAGE* Name: a, dtype: object In [54]: df.a.str.replace('\*','') Out[54]: …

<Python, pandas, Beautiful Soup> Excel から DataFrame への変換

PythonでエクセルExcelのデータを読み込んで、データフレームDataFrameにしたい。 最近のExcelさんは中身がバイナリでなくて、XMLってことは知っていたので、Beautiful Soupと組み合わせてみた。 と、いうことで、ファイル読み込み。 普通にリードしてみる。…

<Python, pandas> duplicate

重複したものを探すには、duplicate()。 In [85]: import pandas as pd In [86]: df = pd.DataFrame([[1,2],[1,3],[1,4]]) In [87]: df Out[87]: 0 1 0 1 2 1 1 3 2 1 4 で、duplicate()。 引数argvは、カラムcolumnを指定可。 In [88]: df.duplicated() Out…

<Python, pandas> ix / iloc / loc の違い

パンダさんのデータフレームpandas.DataFrameで、 ixとilocとlocの違い。 DataFrameが空emptyの場合、locさんだけは、データを追加できる! 例。 まずは、空のDataFrame作成。 In [63]: import pandas as pd In [64]: df = pd.DataFrame() In [65]: df Out[6…

<Python, pandas> 要素が全て同じカラムを削る。

要素elementが全て同じカラムcolumnを削る。 2つ技あり。.isin()と.applymap()。 まずはベースのデータフレームDataFrame作成。 In [1]: import pandas as pd In [3]: df = pd.DataFrame({'a':[1,2,'a'],'b':['a','a','a'],'c':['ab','ab','ab']}) In [4]: …

<Python, pandas> 文字列を空白で分割して、新たなカラムを作成する。

データフレームDataFrameの中に取り込んだ文字列strを、 空白blankで分割splitして、新たなカラムcolumnを作成する。 In [73]: import pandas as pd In [74]: import io In [75]: s = ''' ...: 1 aaa AAA ...: 2 bbb BBB ...: 3 ccc CCC ...: ''' In [80]: d…

<Python, pandas> DataFrame.query()で変数を使う場合

.query()(grepみたいなもの)で変数を使う場合。 @を使う。 例。 In [100]: df = pd.DataFrame({'a':[1,2,'X'],'b':[4,'X',5]}) In [101]: df Out[101]: a b 0 1 4 1 2 X 2 X 5 In [102]: df.query('a == "X"') Out[102]: a b 2 X 5 In [103]: s = 'X' In […

<Python, pandas> lambda + if

lambda式に条件を追加する場合。 例。 In [77]: f = lambda x: str(x).replace('X', '') if type(x) == str else x という風に書く。 ちなみに、elseを省くと、、、 In [78]: f = lambda x: str(x).replace('X', '') if type(x) == str File "<ipython-input-78-05daadfaf1eb>", line 1 f = </ipython-input-78-05daadfaf1eb>…

<Python, pandas> 列が一定でないデータを読み込む時、、

pandasさんで、列columnが一定でないデータを読み込むとエラーをはく。 In [18]: csv_data = ''' ...: 1,2,3,4,5 ...: 1,2,3, ...: 1,2,3,4,5,6 ...: ''' In [19]: df = pd.read_csv(io.StringIO(csv_data)) ----------------------------------------------…

<pandas, regexp> パンダさんと正規表現を使って置換

pandasのapply()で正規表現regexpを使った置換。 まずは、セットアップ。 In [1]: import pandas as pd In [2]: import re In [3]: df = pd.DataFrame([ ...: '(00001) hage', ...: '(00002) hige', ...: '(02000) taro', ...: '(12345) jiro', ...: ]) In […

<jinja, pandas> pandasでjinjaをちょっと。

pandasでjinjaをちょっとやってみた。 pandasのシリーズSeriesの要素を順に並べる。 まず、importして、jinjaのテンプレートtemplateを作る。 In [109]: import pandas as pd In [110]: from jinja2 import Template In [111]: df = pd.DataFrame({'a':[1,2,…

<Python, pandas> イタレータの要素を少しのぞく

イタレータiteraterの要素を確認する方法。 リスト内包表記で確認してたけど、next()が使えるらしい。 内包表記。 In [1]: import pandas as pd In [2]: df = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]}) In [3]: df Out[3]: a b c 0 1 4 7 1 2 5 …

<Python, pandas> カラムを削除する。

列/カラムcolumnを削除deleteする。 delだと思ったてけど、.drop()が使えるらしい。 In [1]: import pandas as pd In [2]: df = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]}) In [3]: df Out[3]: a b c 0 1 4 7 1 2 5 8 2 3 6 9 delの場合。 In [4]…

<Flask, pandas> Flask-SQLAlchemy + pandas

ちとFlask-SQLAlchemyを試してみた。 データベースを直接呼び出すのでなく、それを包むオブジェクト wrapper object経由で操作するものらしい。 まずはインポート import。 接続するデータベースは、app.config['SQLALCHEMY_DATABASE_URI']で指定しないとい…

<Python, pandas, SQlite> pandasでsqlite3する。

pandasでsqlite3を使う。 1.. DB作成。 In [1]: import sqlite3 In [2]: con = sqlite3.connect(':memory:') In [4]: con.execute(''' ...: create table {table} ( ...: {id} integer primary key autoincrement, ...: {name} text not null, ...: {brightn…

<Python, pandas> 対象の値の要素を選択 (grep)

データフレームDataFrame中で、見つけたい文字Stringがある場合。 .isin()を使う。 検索する値は、リストlistで渡す。 ちなみに、正規表現regexpは効かないっぽい。 値が完全に一致するものを見つけにいってる。 In [150]: df Out[150]: a b c 0 a ab x 1 b …

<Python, pandas> booleanのリストを使った行列選択

booleanのlistか、Seriesを使いデータフレームDataFrameの行列選択する。 データフレームから、Noneの部分を.applymapを使って判定。 In [129]: df Out[129]: a b 0 1 None 1 2 NaN 2 3 5 3 NaN 8 4 4 a 5 5 9 6 NaN 8 7 6 None In [130]: a = df.applymap(l…

<Python, pandas> NoneTypeの判定

NoneTypeの判定。 In [66]: n = None In [67]: n In [68]: type(n) Out[68]: NoneType In [69]: isinstance(n, NoneType) --------------------------------------------------------------------------- NameError Traceback (most recent call last) <ipython-input-69-d5714e961eee> in <module>(</module></ipython-input-69-d5714e961eee>…

<Python, pandas> インデックスを付け直す

その1 インデックスindexを付け直すresetする方法。 df.reset_index(drop=True) Stackoverflow stackoverflow.com マニュアル Indexing and Selecting Data — pandas 0.18.0 documentation pandas.DataFrame.reset_index — pandas 0.18.0 documentation そ…