先下載 MNIST dataset:
共有四個檔案,分別是training set, training labels, testing set, testing labels
下載並解壓縮.
這些檔案都用ubyte儲存,所以要先了解它的檔案格式.同一個網站的底部有檔案格式的解說,截圖如下:
如何把ubyte轉換成int或float格式,就看各位對python還有資料種類的了解程度.
預期的進度
- 把這些檔案切成28*28的int 或float array.(0~255)
- 把label轉成0~9的int value
- 可視化(option)
參考資料
[1]:http://hemingwang.blogspot.com/2017/04/mailab0003mnist-and-lenet.html
[2]:https://github.com/ZhengLungWu/Pytorch-Taoyuan-LeNet-implement/blob/master/Pytorch%2BTaoyuan_LeNet01.ipynb