淡江大學高等教育深耕專區-活動花絮

日期：2019-11-11

點閱：187

參考檔案：

教師跨領域研究學社群「智慧觀光服務跨領域研究社群(第三次)」

SDGs：

講解程式碼

接續上一堂的課程內容，在同學們了解在瀏覽網頁時，資料是如何傳輸，以什麼樣的形式傳輸後，即可利用Python程式語言實作爬蟲，取得網頁上的資料。這次的課程使用Python的專案管理器安裝了兩個模塊：BeautifulSoup以及requests。
BeautifulSoup是一個Python的函式庫模塊，可以讓同學們撰寫少量的程式碼，就可以快速解析網頁的HTML原始碼，並且從HTML原始碼頗析出同學們「有興趣」，也就是同學們的「目標資料」。這個模組降低了開發的門檻，僅利用不到二十行的程式碼，即可萃取出想要的內容。
requests也是一個Python實用的模塊，用來處理對目標發送請求的所有設定，例如：統一資源定位符、HTTP方法、傳送資料時所帶的參數......等等。
課程中運用這兩個Python模塊，實作一個crawler.py爬蟲應用程式，取得使用者在終端機輸入的關鍵字在Google搜尋引擎查詢後的內容，取得在搜尋引擎第一頁出現的所有標題。

同學們實作爬蟲

計畫別：全球在地逐鹿萬里--研究茁壯群雄爭鋒

發佈單位：

上一則：分鏡背後的觀點
下一則：113學年度觀光西語自主學習成果發表

活動花絮

教師跨領域研究學社群「智慧觀光服務跨領域研究社群(第三次)」

講解程式碼

同學們實作爬蟲

解析度/瀏覽器

網站建置/維護

其它資訊