|
 |
「有效率地取得可信、完整度高、合於時效、不偏頗的高品質資料」是進行資料分析的重要前提,在開放資料(Open Data)有益提高資料透明度、滿足產業需求、促進價值共創的浪潮之下,許多資料取得來源開始側重線上政府官方統計或權威性組織單位資訊,網路爬蟲作為現今常見且易於取得網路資料的方式之一,其藉由網頁鏈接的URL或API向目標網站伺服器發送HTTP請求並獲得響應,解析伺服器回傳的內容以取得所需資料。而爬蟲所取得的原始資料透過資料正則化後,可篩選出資料中所需的重要關鍵因子,以達成分析及進一步的跨領域運用。
|
 |
Python 網路爬蟲:
執行流程(用戶請求流程、程式請求流程)、爬蟲的禮貌、爬蟲的應用場域、法律觀點
陳偉傑 助教
|
 |
Python 資料正則化:
組成字元(普通字元、特殊字元、數量字元)、正規表達法常用函式(group、findall、sub、split、compile)
吳貫綸 助教
|
 |
|
|