跳到主要內容
:::

強化學習理論與應用實務

理解強化學習與監督式學習和非監督式學習不同點並且理解其理論基礎和推導針對 value base 和 policy base 去做探討並且實作出來。預期達成之具體成果為(1)結業學員具備專業能力(2)對產業鏈及相關企業人才供應之助益

  • 開課單位:僑光科技大學
  • 課程大綱:(一 )What is Reinforcement Learning
    1.What is RL
    2.Different with others Learning
    (二)Raise up
    1.DeepMind & OpenAI
    2.Alpha zero
    3.Alpha Go
    (三)Model Free Theory
    1.Markov Decision
    2.MarkovDecision Process
    3.Example:Student Question
    (四)Environment
    1.OpenAI gym
    2.Pytorch tutorial
    3.Pytorch install
    4.Why we using Pytorch instead of Tensorflow
    (五)Deep Learning
    1.What is Deep Learning
    2.Neural Network
    3.Forward propagation
    4.Gradient Descent
    5.Loss function
    6.Back propagation
    (六)Value Base
    1.Q-learning
    2.Theory
    3.Deep Q-Learning
    4.Example: CartPole
    (七)Policy Base
    1.Different on value and policy
    2. Theory
    3. How is Entropy
    4.Example: MountainCar
    5. Choice Policy and Value
    (八)Policy update
    1.On policy
    2.Off policy
    (九)Analyzing Env Question
    1.Discrete Question
    2.Continue Question
    (十)Advantage Value Base
    1.Q-Learning problem
    2.DoubleDeep Q-learning
    (十一)Actor Critic
    1.Theory
    2.Network Design
    3.Example Pendulum
    (十二)Advantage DNN
    1.Visual Detect
    2.Convulation Neural Network
    3.CNN + Q-Learning
    4.Example Vizdoom
    5.Recurrent Neural Network
    6.Long-short term memory
  • 開課日期:2019-07-06
  • 結束日期:2019-07-27
  • 上課時間:13:00~17:00
  • 上課時數:16
  • 課程費用:9,800元
  • 費用:學員負擔:4,900元/政府負擔:4,900元
  • 繳費方式:需先至開課單位繳交全額費用
  • 預計招生人數:15
  • 聯絡人:陳怡華
  • 連絡電話:04-24511533
  • 先備知識:
    基本微積分、線性代數、離散數學,對pytorch框架有一定基礎。
  • 授課師資:黃祥麟
  • 招生對象:
    學生、業界人士、研究人員
  • 上課地點:僑光科技大學(臺中市西屯區僑光路100號)
  • 課程報名網址: