活動花絮

日期:2019-11-11

點閱:158

參考檔案:

教師跨領域研究學社群「智慧觀光服務跨領域研究社群(第三次)」

SDGs:
講解程式碼
講解程式碼
接續上一堂的課程內容,在同學們了解在瀏覽網頁時,資料是如何傳輸,以什麼樣的形式傳輸後,即可利用Python程式語言實作爬蟲,取得網頁上的資料。這次的課程使用Python的專案管理器安裝了兩個模塊:BeautifulSoup以及requests。
BeautifulSoup是一個Python的函式庫模塊,可以讓同學們撰寫少量的程式碼,就可以快速解析網頁的HTML原始碼,並且從HTML原始碼頗析出同學們「有興趣」,也就是同學們的「目標資料」。這個模組降低了開發的門檻,僅利用不到二十行的程式碼,即可萃取出想要的內容。
requests也是一個Python實用的模塊,用來處理對目標發送請求的所有設定,例如:統一資源定位符、HTTP方法、傳送資料時所帶的參數......等等。
課程中運用這兩個Python模塊,實作一個crawler.py爬蟲應用程式,取得使用者在終端機輸入的關鍵字在Google搜尋引擎查詢後的內容,取得在搜尋引擎第一頁出現的所有標題。
同學們實作爬蟲
同學們實作爬蟲

計畫別:全球在地逐鹿萬里--研究茁壯群雄爭鋒

發佈單位:

上一則:分鏡背後的觀點
下一則:校園與社區服務學習課程地方創生專題活動:菁桐捨石山