強化學習的示意圖
為了與量子電腦做區別,現在常見的電腦、手機、伺服器乃至超級電腦,都歸類為經典電腦
QRL 示意圖
Picture come from arXiv:2108.06849v
QTRL 示意圖
CartPole 環境下,經典與 QTRL 方法所需參數數量,以及最後十次訓練的平均積分(reward)
橫軸類似遊戲回合數,縱軸是該次回合獲得的 reward,紅線是經典方法的實驗結果,藍線 QTRL 方法,顏色越深代表 QNN 的深度越深
MiniGrid-Empty 環境下,經典與 QTRL 方法的訓練結果圖
MiniGrid-Empty 環境下,經典與 QTRL 方法所需參數數量,以及最後十次訓練的平均積分(reward)
此文章僅作初步導讀,有更多內容在本文中沒有詳細提到,歡迎參看原論文## 參考資料 - [強化學習簡介](https://www.youtube.com/watch?v=XWukX-ayIrs&list=PLJV_el3uVTsMhtt7_Y6sgTHGHp1Vb2P2J&index=29) - [Quantum Train 總覽](https://github.com/Hon-Hai-Quantum-Computing/QuantumTrain) - [arXiv:2407.06103 [quant-ph]](https://arxiv.org/abs/2407.06103)
陳世杰
LinkedIn
Entangletech 的實習生,興趣在於量子計算以及機器學習,也將繼續探索這兩個領域。
林昱誠
LinkedIn
林昱誠是 EntangleTech 技術長,同時也是一名藥師,研究所期間致力於藥物化學研究。2023 年 IBM 評選為臺灣第七個 Qiskit advocate,也是臺灣唯一一個非理工出身的 Qiskit advocate,致力於推廣量子計算應用於藥學與醫學領域。