查看完整版本: 網路爬蟲能不能直接爬本機目錄的網頁?
頁: [1]

koala888 發表於 2022-5-13 03:15 PM

網路爬蟲能不能直接爬本機目錄的網頁?

本帖最後由 koala888 於 2022-5-13 03:20 PM 編輯

我最近在做網路爬蟲,我要爬本機的內部網頁,是在C:\底下,我是用C#寫的,我直接把目錄貼上去不行,會發生錯誤。我就是用HtmlAgilityPack正常的方法做爬蟲的。
string url = "C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";HtmlWeb web = new HtmlWeb();HtmlDocument doc = web.Load(url);

程式就錯在 HtmlDocument doc = web.Load(url); 請問有沒有辦法改呢?還是本機的網頁都不能爬蟲?謝謝

...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div><div></div>

tryit244178 發表於 2022-5-14 06:37 AM

在 Html Agility Pack 的網站上面是寫// From File
var doc = new HtmlDocument();
doc.Load(filePath);
頁: [1]