跳到主要內容

Python 資料科學實作


BurgeoningCourse
只能經由邀請註冊這課程

▸ 初階課程,可零基礎入門

▸ 影片時數:共約 12 小時

▸ 章節及單元數:8 章節 64 單元

▸ 授課語言/字幕:皆為繁體中文

▸ 課程證書:有,須通過課程評分標準,才可獲得免費電子版完課證書,紙本證書需額外申請付費。

▸ 費用:4500 元(購課流程

▸ 使用期限:一年


100% 純線上:可重複觀看所有課程影片,學習時間彈性自主安排。

專業教材:老師提供精心編製簡報、範例程式碼。

完整度高:授課內容完整涵蓋此領域的重要知識。

討論區:課程期間可無限次、隨時詢問老師問題,老師親自為您解答。

理論 + 實作:課程編排為觀念與實作交互前進,讓您能理解原理又有實作能力。


這門課程將帶您入門並掌握資料科學(Data Science)中重要的知識與技術,並能夠使用Python程式語言進行資料科學的完整流程,具備獨立完成資料科學專案的能力。因此,在這門課程中,您將學習到:

  • 資料科學完整的流程與相關技術,包含:資料匯入、資料預處理、資料分析、資料視覺化、機器學習等。
  • 使用 Python 獲取並處理各種類型的資料。
  • 使用 Python 進行多種資料分析和視覺化方法,並從中獲得洞察。
  • 使用 Python 建立機器學習模型進行預測。
  • 熟悉 Python 資料科學的重要套件,包含:numpy、matplotlib、pandas、scikit-learn。

#課程關鍵詞

#Python #資料科學 #網路爬蟲 #資料預處理 #資料分析 #統計分析 #相關性分析 #樞紐分析 #時間序列處理 #異常值偵測 #購物籃分析 #資料視覺化 #機器學習


資料驅動的新時代

由於當今資料收集、資料分析、人工智慧的技術已趨於成熟,善用資料成為各個領域創造突破的關鍵,越來越多企業懂得利用資料分析帶來對業務的全新洞察,進而創造更有效的決策和行動方案,甚至結合機器學習技術推出嶄新、更能滿足客戶需求的服務。所以本課程將帶您認識並運用資料科學的技術,讓您實際發揮資料的價值!

資料科學的目的是從資料中獲得洞察,進而產生決策、行動以及智慧應用。

為了讓資料創造價值,資料科學應運而生,並結合了電腦科學、數學及統計等領域,為資料帶來嶄新的應用價值。所以本課程將帶您學習如何運用各種資料處理、分析和視覺化方法,讓您從資料中獲得洞察,以及如何進一步運用機器學習方法,建立能從資料中學習並精準預測的模型。

Python 是實作資料科學的熱門程式語言

資料科學的流程中包含了資料獲取、資料預處理、資料分析、資料視覺化、機器學習建模等工作,而Python擁有豐富、完整,功能強大的資料科學相關套件,不僅能充分滿足您各種資料分析需求,其簡潔、高階的語法更讓您學習起來更加容易!因此,本課程將帶您學習Python用於資料科學的各個重要套件,包含:numpy、pandas、matplotlib、scikitl-learn等,讓您能用Python實作資料科學的各項技術。



觀念與實作並進,充分掌握資料科學關鍵知識和技術

不同於單純學術性或技術性的知識,本課程同時結合觀念與實作,讓您充分掌握資料科學的關鍵知識和技術。觀念部分包含資料科學相關的數學、統計、演算法、程式知識,以及資料科學實務上的流程、團隊、概念等。實作部分則會教您如何用Python實作資料科學完整流程中的各項工作,讓您不僅懂原理,還懂得如何實作!

由淺入深、循序漸進的清晰整理及講解

本課程的講義及程式碼都是由老師親自精心編製而成,為了讓您更容易理解資料科學背後的知識,不會陷入艱澀的學理之中,老師不以傳統課堂知識的講解方式,而是以理解重點原理、實用性為目的,並以淺顯易懂、循序漸進的方式編排課程,幫助大家更容易上手資料科學。

豐富又貼近生活的專題實作,讓您充分熟練資料科學技術

資料科學相當生活化,也容易應用到各個領域之中。因此,本課程除了經典的資料集之外,還特別收集了各種真實世界的資料集,例如:股市、房價、全球地表溫度、新冠肺炎等,並以專題實作的方式帶您利用這些資料集充分演練資料科學的各項技術。



主題

內容

資料科學導論

  • 什麼是資料科學?
  • 資料科學經典案例
  • 資料科學的領域與團隊
  • 資料科學與大數據
  • 資料科學實作流程
  • 為何用 Python?

資料科學常用資料結構

  • Numpy、Pandas 資料結構與基礎操作
    • Numpy 基礎陣列運算
    • Pandas Series/DataFrame 基礎處理:創建、取值、改值等

資料匯入

  • 多格式資料之匯入與處理:資料庫、Excel、CSV、JSON、XML
  • 網路爬蟲(Web Crawler)
    • 網頁傳值方法介紹:GET vs. POST
    • 使用 Python requests 爬取網頁資料
    • 使用 Pandas 快速讀取網頁表格
    • HTML 剖析與處理
    • 專題實作1:博客來網路書店
    • 專題實作2:公開資訊觀測站

資料預處理

  • 認識資料種類與測量量尺
  • Pandas DataFrame 的四種合併法
  • Pandas DataFrame 資料預處理
    • 資料清理:重複值、遺失值
    • 資料轉換:對應、分箱

資料分析方法

  • 統計分析(Statistical Analysis)
    • 描述性統計、各種平均方法、四分位數等
  • 異常值偵測(Anomaly Detection)
  • 資料聚合(Aggregation/Grouping)
  • 相關性分析(Correlation Analysis)
    • 專題實作:台灣房價相關性分析
  • 樞紐分析表(Pivot Table)
    • 專題實作:腸病毒健保就診狀況
  • 時間序列(Time Series)處理與週期性分析
    • 專題實作:全球地表溫度溫度變化
  • 主次因素分析(Pareto Analysis)
  • 購物籃分析(Basket Analysis)

資料視覺化

  • 繪製統計圖表:折線圖、直方圖、長條圖、散佈圖、箱形圖、圓餅圖等
  • 視覺化常用功能:作圖風格、座標軸名稱、標註、圖例、多圖整合等

專題綜合實作(一)

  • 台股大盤指數分析與視覺化
  • 綜合示範:爬取台股大盤指數、資料預處理、指數相關性分析、指數異常值偵測、視覺化等

基礎機器學習

  • 監督式學習(Supervised Learning)
    • 線性與非線性迴歸(Nonlinear & Linear Regression)
    • 迴歸效果評估法:MSE、R平方
    • 專題實作:台灣房價預測
    • 羅吉斯迴歸(Logistic Regression)
    • 分類效果評估法:混淆矩陣(Confusion Matrix)
    • 經典專題實作:鳶尾花分類(分類效果評估、視覺化)
    • 特徵選擇:資訊增益(Information Gain, IG)
    • 決策分類樹(Decision Tree Classifier)
    • 經典專題實作:鳶尾花分類(決策樹視覺化、特徵重要性)
  • 非監督式學習(Unsupervised Learning)
    • 分群法(Clustering):K-means
    • 分群效果評估與 K 值調校
    • 專題實作:台股個股分群

專題綜合實作(二)

  • 新型冠狀病毒(COVID-19)疫情分析與預測
  • 綜合示範:資料匯入、疫情分析及視覺化、預測確診數等

進階資料科學技術導論

  • 進階視覺化簡介
    • Seaborn、plotly、Bokeh 等
    • 地圖式視覺化
    • 文字視覺化
  • 深度學習與人工智慧(Deep Learning and Artificial Intelligence)
  • 自然語言處理(Natural Language Processing, NLP)
  • 社會網路分析(Social Network Analysis)

資料科學的現在與未來:DT 時代

  • 三大應用面向:分析過去、預測未來、改變現在
  • 各行各業的 DT 時代:資料科學的領域應用
  • 資料隱私權問題
  • What's Next?如何繼續精進資料科學領域?

備註:課程內容會根據同學需求持續做調整和更新。


  • 教材內容:本課程包含觀念與實作兩種教學影片,觀念以「簡報」的方式錄製,實作則是以「螢幕畫面」的方式錄製,除課程影片之外,課程中的簡報及範例程式皆可下載。部分補充內容會以文字、圖片、影片等方式呈現。
  • 回覆問題:報名後會提供您老師個人Email,您可以利用此Email詢問任何課程或作業的問題,老師收到問題後,會盡可能在一日內回覆您。

此為初階入門課程,無需任何程式經驗或資訊背景。報名本課程,即贈「Python 程式語言入門」免費課程(可永久使用),若您未學習過 Python,建議先從此課程開始學習起。

只需具備以下先備知識:高中數學程度、基本英文閱讀能力(可查看函式說明文件)。


  • 您個人或企業擁有資料,想認識該如何發揮資料的價值,提升個人或企業競爭力。
  • 希望從資料中獲得洞察,並據此擬定決策和行動、解決問題。
  • 希望利用資料建立機器學習模型,進行各種預測任務。
  • 想學習如何用 Python 實作資料科學流程中的各項工作。
  • 想從事或正從事於「資料分析」或「資料科學」相關工作。

徐浩軒

「補根課程」(Burgeoning Course)共同創辦人

「Python 資料科學與人工智慧」FB粉絲專頁 共同創辦人

清華大學 資訊系統與應用研究所 博士

清華大學 資訊工程學系 學士


目前已開設「Python 資料科學實作」、「Python 機器學習與深度學習實作」、「Python 金融數據分析與預測實作」、「Python 自然語言處理實作」、「Python 資料視覺化入門:讓圖說出好故事」等課程,累積學生超過兩千位。

期刊著作
  • H. H. Hsu and N. F. Huang, "Xiao-Shih: A Self-Enriched Question Answering Bot With Machine Learning on Chinese-Based MOOCs," in IEEE Transactions on Learning Technologies, vol. 15, no. 2, pp. 223-237, 1 April 2022, doi: 10.1109/TLT.2022.3162572.
翻譯著作
  • 《領域驅動設計學習手冊》(歐萊禮,2023)
  • 《打造機器學習應用|從構想邁向產品》(歐萊禮,2021)
專利
  • 孫宏民、徐浩軒、黃能富、韓傳祥「車禍嚴重度預測方法及裝置、電腦可讀取的記錄媒體」中華民國發明專利號 I801082。

Q1、我可以立即報名嗎?

沒問題,這門課程可以隨時報名、立即學習,報名後就可以觀看到課程所有的教材。


Q2、課程可以使用多久?

一年(從您報名的隔日算起)。設計一年使用期限有兩個主要原因:第一個是鼓勵大家在有限時間內完成學習;第二個是本課程提供的都是符合當下最新的知識,但知識演進快速,不希望大家學習到過時的知識。如果過了一年期限還想學習,可以透過轉班方式換到最新的一班學習(僅需繳交轉班手續費用500元)。


Q3、可以詢問老師問題嗎?

當然可以,報名後會提供您老師個人Email,您可以利用此Email詢問任何課程或作業的問題,老師收到問題後,會盡可能在一日內回覆您。


Q4、課程會更新嗎?

會。本課程會依學員需求和問題、知識和工具更新等持續更新。


若還有其它問題,歡迎來信詢問:burgeoningcourse@gmail.com