Jovian
⭐️
Sign In

从一台新电脑到配置TensorFlow与Keras来运行FDSSC的代码。

配置硬盘

因为本电脑DeepLearn采用SSD 250GB与HHD 3TB混合使用,对于固态硬盘,SATA 硬件设置应为AHCI。具体操作流程如下:

  1. 进入BIOS界面
  2. 选择PCH存储设备设置
  3. SATA Mode Selection选择AHCI

注:本主板为华硕Z370

安装Windows 10系统与配置驱动

采用U盘启动安装系统与驱动大师自动配置驱动。

注:Windows10系统的ISO文件超过4GB,U盘为FAT32格式无法导入。应将U盘重新格式化为NTFS格式。

安装Visual Studio

安装Visual Studio根据电脑的配置,时间长短不一,这一步可能是时间最长的。

安装CUDA Toolkit 9.0与Cudnn 7.0

TensorFlow1.8需要特定的版本,若安装Cudn 和Cudnn的其它版本,请删除重新安装。

安装CUDA之前,要先安Visual Stdio

注:Cudn需要特定的NVIDA GPU,即其Compute Capability大于3.0。

可前往官网https://developer.nvidia.com/cuda-gpus 查询。

注:一定要将CUDA与cudnn的路径加入系统的环境变量中。

安装Python3.5与Pycharm

直接前往官网下载软件包安装。

安装Tensorflow 1.8.0

命令行中输入:

pip install tensorflow-gpu==1.8.0

安装Keras框架

在cmd命令行中输入pip install –user keras

常见问题

GPU显存不足

2019-09-26 19:49:48.698959: E T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_driver.cc:1080] failed to synchronize the stop event: CUDA_ERROR_LAUNCH_FAILED
2019-09-26 19:49:48.713629: E T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_timer.cc:54] Internal: error destroying CUDA event in context 000001AEA5B61E90: CUDA_ERROR_LAUNCH_FAILED
2019-09-26 19:49:48.714072: E T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_timer.cc:59] Internal: error destroying CUDA event in context 000001AEA5B61E90: CUDA_ERROR_LAUNCH_FAILED
2019-09-26 19:49:48.714658: F T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_dnn.cc:3390] failed to set stream for cudnn handle: CUDNN_STATUS

以上问题是训练设置的批处理大小Batch_Size相对于运行环境中所有GPU显存过大。

解决方法:将Batch_Size不断调小到GPU能运行,又能吃满大部分显卡。

In [2]:
import jovian

jovian.commit(nb_filename='Week1.ipynb')
[jovian] Saving notebook..
[jovian] Updating notebook "9d798908e78a4aa89468a5712259d0bc" on https://jvn.io [jovian] Uploading notebook.. [jovian] Capturing environment.. [jovian] Committed successfully! https://jvn.io/shuguang-52/9d798908e78a4aa89468a5712259d0bc
In [ ]: