在沒有瀏覽器的情況下破解Web

這是一個傳統問題。您希望在程序中使用數據,但它位於網頁上。有些網站有一個API,當然,通常,您通常是自己的。您可以通過HTTP和解析它來縮短整個頁面。或者您可以使用一些工具“刮”該網站。一個令人著迷的方法是這樣做的是Woob – Web在瀏覽器之外。

該系統利用在特定站點上量身定制的一系列後端。有一系列官方後端,以及你同樣可以製作自己的。有一個後端,您可以配置它以及從Python使用它。以下是發現銀行賬戶餘額的示例:

>>>來自Woob.core進口Woob
>>>來自Woob.Capabilities.Bank導入Capbank
>>> w = woob()
>>> W.Load_Backends(Capbank)
{‘societegenerale’:,’creditmutuel’:}
>>> pint(list(w.iter_accounts())))
[<帳戶ID ='7418529638527412'標籤= u'compte de ch \ xe8ques'>,
<帳戶ID ='9876543216549871'label = u'livret a'>,
<帳戶ID ='123456789123456789123456789123456789123eur'標籤= u'c / c eurocompte concort m roger philibert'>]
>>> ACC = NEXT(ITER(W.ITER_ACCOUNTS()))
>>> Acc.Balance.
十進制(’87 .32’)
提供的後端列表令人印象深刻,但最終,您將想要製作自己的模塊。值得慶幸的是,有很多關於如何做到這一點的文檔。該框架使您可以將數據發佈到網站,并快速檢查結果。每個後端都同樣具有一個測試,可以找到網站中的修改是否突破代碼,這是具有此類方案的典型問題。

我們沒有看到Hackaday後端。還有糟糕的。然而,許多應用示例是基於控制台的和利用Qt。例如,您可以瀏覽電影,處理食譜或約會網站。

當然,有許多方法可能發生這個問題。也許你要求發現下一列火車離開時。

Leave a Reply

Your email address will not be published. Required fields are marked *