In English
Kommentteja IJCNN'98 artikkeliin
Artikkelissa esitetylle algoritmille on olemassa Bayesiläinen tulkinta:
- G. E. Hinton ja
D. van Camp. (1993)
Keeping neural networks simple by minimizing the description length
of the weights. In Proceedings of COLT-93.
- D. MacKay. (1995)
Probable networks and plausible predictions - a review of practical
Bayesian methods for supervised neural networks. Network 6(3),
pp. 469-505.
- D. MacKay. (1995)
Ensemble learning and evidence maximization.
Vain Post Script
-versiona.
- D. MacKay. (1995?)
Developments in Probabilistic Modelling with Neural Networks - Ensemble Learning.
Vain Post Script
-versiona.
Bayesiläisen tulkinnan mukaan artikkelissani on tehty parametrien
posterioritiheyden approksimaatio (tasajakautunut painojen virittämän
avaruuden akselien suuntaisessa särmiössä). Jos approksimaatio olisi
diagonaalinen gaussinen tiheys, kaavan 15 termi 1/2 ln 12 v_i pitäisi
olla 1/2 ln 2 pi e v_i. Eli suosittelen käyttämään arvoa 2 pi e (noin
17,08) eikä arvoa 12.