<Python, pandas, Beautiful Soup> html tableからpandas dataframeへ。
html
中にあるtable
から、pandas
dataframe
を作る。
<tr>
<td>
タブとかを、ちくちくと、Beautiful Soup
でパースしないといけないのか、、、
いやいや、そんな面倒なことは、誰かが、既に何かを作っているはず、、と思ってたら、あった。
pd.read_html()
でいける。ちょー楽。
In [1]: import pandas as pd In [2]: lst = pd.read_html('http://stocks.finance.yahoo.co.jp/stocks/history/?code=998407.O', flavor='bs4') In [3]: lst[0].head() Out[3]: 0 1 2 3 0 日経平均株価 NaN 19871.96 前日比-23.74(-0.12%) In [4]: lst[1].head() Out[4]: 0 1 2 3 4 0 日付 始値 高値 安値 終値 1 2017年5月8日 19709.01 19929.48 19705.13 19895.7 2 2017年5月2日 19335.72 19464.3 19335.02 19445.7 3 2017年5月1日 19154.03 19311.21 19144.62 19310.52 4 2017年4月28日 19240.65 19264.57 19164.68 19196.74
すげー。