[問題] 爬蟲 期貨表格

作者: WhiteComet (???N)   2018-11-20 10:45:30
code
https://pastebin.com/7nj8i6RD
如下:
import requests
import sys
import re
from bs4 import BeautifulSoup
import pandas
import lxml
Juridical_person = "http://www.taifex.com.tw/cht/3/futContractsDateExcel"
df = pandas.read_html(Juridical_person)
print(df[1])
pandas讀進來之後,print出來發現表格歪掉了
可能是前兩欄有些儲存格合併的關係
我該怎麼呈現和網頁一樣的效果呢?
我應該在讀進來之前就先對html作處理
還是讀進來之後再對df作表格的排版
作者: jiyu520 (不要鯽魚我)   2018-11-20 16:13:00
或許用BeautifulSoup抓回table後, 再做清理解析比較好

Links booklink

Contact Us: admin [ a t ] ucptt.com