- 取得連結
- X
- 以電子郵件傳送
- 其他應用程式
比較模擬結果的方法有很多種,我們可以分為兩種類類型,(1) 模擬值與量測值的相關性、(2) 模擬與量測值的誤差。
基於相關性的模擬結果評估方法
基於相關性的評估方法中,最常見的方法是進行模擬與實測值的簡單線性回歸,通常會將模擬值輸出為y軸,實測值輸出為x軸,當斜率接近1、截距接近0、R2接近1時,我們可以可以認定為良好的模式。
另一個方法就是計算 r - 相關係數(Correlation coefficient)
$r=\tfrac{\sum\limits_{i=1}^n(o_i-\bar{o})(s_i-\bar{s})}
{\sqrt{\sum\limits_{i=1}^n(o_i-\bar{o})^2}\sqrt{\sum\limits_{i=1}^n(s_i-\bar{s})^2}}$
符號 $o_i$ 代表實測值、 $s_i$ 代表相對應的模擬值
基於誤差的評估方法
常見的包括RMSE, RRMSE, MAE, EF,以下分別進行說明,
所使用的符號 $o_i$ 代表實測值、 $s_i$ 代表相對應的模擬值
均方根差 (RMSE)
最常見的方法為均方根誤差(root mean squre error,RMSE),計算公式如下:
$RMSE = \sqrt{ \tfrac{1}{n} \times \sum\limits_{i=1}^n (o_i - s_i)^2 }$
另外也可以將RMSE除以實測值的平均值,成為相對均方根誤差(relative root mean square error, RRMSE),公式如下
$RRMSE = \tfrac{RMSE} {\bar{o_i} }$
通常均方根誤差都帶有單位,例如RMSE = 653.2 (kg/ha),代表模擬與實測的產量誤差有653.2,RRMSE就可以代表相對值例如0.23,可以提供我們了解RMSE 的的佔比。
無腦指標 - EF
推薦一個無腦的指標就是EF (Nash–Sutcliffe Efficiency),公式如下
$EF=1-\tfrac{ \sum\limits_{i=1}^n (o_i-s_i)^2 }
{ \sum\limits_{i=1}^n (o_i - \bar{o_i})^2 }$
如果是完美的模式,模擬值會與實測值相同,也就是 $s_i = o_i$,因此EF = 1。
如果每次的模擬值都是實測的平均值,也就是 $s_i = \bar{o_i}$,計算起來EF = 0,我們可以說EF = 0 的模式並不是好模式,只要用一個平均值去猜就跟模擬值一樣了;如果EF < 0,就顯示這個模式比平均值還要差。
在這邊可做一個簡單的結論是
EF = 1,完美模式
EF = 0,不好 (模式預測效果和使用平均值一樣)
EF < 0,差 (模式預測結果比使用平均值猜測更糟糕)
EF其實也是R2的另一種形式
我們重新整理EF值的公式 ,可以改寫成如下
$EF = 1- \tfrac{MSE}{MSE_{\bar y}}$
其中,
$MSE_\bar{y} = \sum\limits_{i=1}^n (y_i- \bar{y})
= var(y)(n/1)/n$
可以理解$MSE_\bar{y}$為模擬值使用實測平均值($\bar o$) 所計算出來的平均誤差,EF值是比較MSE和$MSE_\bar{y}$ 的結果,因此EF的分子項(MSE)是用來計算模式無法解釋的觀察資料變異量,而分母則衡量的是觀察值的總變異量。
這正是決定係數(R2)的其中一種定義
$R^2 = 1- \tfrac{TSS}{RSS}$
兩者都是 $ 1- \tfrac{模型預測誤差平方和}{觀察資料總變異}$
參考文獻
- Soltani, A., T.R. Sinclair (2012) Modeling Physiology of Crop Development, Growth and Yield. CABI, USA.
- Wallach, D., D. Makowski, J.W. Jones, and F. Brun (2019) Working with Dynamic Crop Models: Methods, Tools, and Examples for Agriculture and Environment. Elsvier, United Kingdom
留言
張貼留言