各位好,小弟看了python的爬蟲基礎
要把網頁的這段爬下來<title>Scraping tutorial 1 | 莫烦Python</title>
看了教學是用以下這段
res=re.findall(r"<title>(.+?)</title>",html)
print(res[0])
想問的是用r"" 這個用法裡面為什麼不是用r"<title>[.+?]</title>"
而是用(.+?) ,搞不太懂()的意義,也搞不太懂有沒有加?的差別
懇請各位大大解釋
因為findall會將所有符合的情況以list回傳,例如html="<title>A</title><title>B</title><title>C</title>", 那re.findall就會回傳["A", "B", "C"]