[問題] 新手請益關於抓資料 ppoo1215 PTT批踢踢實業坊

[問題] 新手請益關於抓資料

作者: ppoo1215 (po) 2018-06-02 17:28:45

各位大神好，小弟上次問了問題卻沒有附上程式碼
還是有前輩願意回答先謝謝
附上程式碼以及我想做的事
從玩股網的這個頁面
抓出*美林這個券商在股票1101的進出明細
小弟目前做出來的方法
只能跑出含有<td class="up">+150</td>.....
這樣的結果
想請問要怎麼做才能夠只選出數字然後將數字結果全部加總呢??
*電腦排版手機可能格式會跑掉
在此感謝之前回應過的大神們但小弟不才 python目前正在學習階段
有請大神們幫幫忙謝謝
# -*- coding: utf-8 -*-
from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.support.ui import Select
import time
driver = webdriver.Chrome()
driver.get('https://www.wantgoo.com/stock/agentsata?types=8')
time.sleep(0.5)
driver.find_element_by_id("broker").click()
Select(driver.find_element_by_id("broker")).select_by_visible_text(u"美林")
time.sleep(0.5)
driver.find_element_by_id("stock").click()
Select(driver.find_element_by_id("stock")).select_by_value('1101') #index(int)
time.sleep(0.5)
driver.find_element_by_id("sendSubmit").click()
time.sleep(0.5)
html = driver.page_source
sp = BeautifulSoup(html,'lxml')
def has_class_but_no_id(tag):
return tag.has_attr('class') and not tag.has_attr('id')
data = sp.find(id = "datalist")
qq = data.find_all(has_class_but_no_id)
print (qq)
driver.close()

作者: kobe8112 (小B) 2018-06-02 18:23:00

個人小小拙見建議你可以先大概了解一下html中元素、屬性、內容等基本組成的差別，然後這些專有名詞可能用英文來記憶，比較不會發生詞彙在中文定義不統一造成的混淆，大概了解一下之後，你就能區別你想要的跟程式碼抓的，到底是選擇的元素，還是元素的屬性、內容值

作者: wefan (wefan) 2018-06-02 21:25:00

bs有get_text()這個方法取出內容把最後改成qq.get_text()試試

作者: ppoo1215 (po) 2018-06-02 22:24:00

謝謝上面兩位大神的提點，我繼續努力

作者: D0128431 (運氣小馬) 2018-06-03 00:48:00

.text 就可以抓了啊然後再用正則表達式抓150出來

作者: ppoo1215 (po) 2018-06-03 11:46:00

回D大：我想用find all抓出所有我要的數值但是find all不支援.text用法@@

作者: D0128431 (運氣小馬) 2018-06-03 13:41:00

Findall 指的是找出所有符合的標籤所以你無法直接.text 如果你選擇finall這個list裡面特定的item就可以用 .text

作者: virgil246 (virgil585) 2018-06-03 13:55:00

表格狀的可以試試pandas

繼續閱讀

[問題] 陣列放值進去出錯tsrn37992307 Re: [問題] while迴圈問題TW185930 Re: [問題] while迴圈問題MOONY135 [問題] while迴圈問題TW185930 [問題] python的o是唸作［o] 還是［a]？wang19980531 [討論] 循環執行N個函式的寫法icetofux [問題] pygame徵求問問題計費的家教b05703 [問題] SQL一個欄位裡面找複數目標MAGICXX [問題] 爬蟲,消失的資料unhumanWu [問題] Anaconda 建立虛擬環境問題yimean

[問題] 新手請益 關於抓資料

[問題] 新手請益關於抓資料