自动化后台训练日志保存、数据上传和及时关机~
-
这里是一个简单易用的一个后台全自动化训练日志记录、结果数据自动保存和自动关机的脚本。
仓库地址:https://github.com/Littleor/HY-Auto-Trainer特性
- 使用
nohup
在后台进行训练,完全可以断开ssh
的连接,解放双手。 - 训练完成自动打包运行结果到
OSS
上,避免结果丢失。 - 上传完成自动关机,省钱省事~
用法
配置
- 复制目录下所有的
*.sh
文件到项目目录(如/hy-tmp
) - 给
*.sh
文件加上权限:chmod a+x *.sh
- 修改
run.sh
中的logPath
来修改日志保存路径 - 修改
end.sh
中的resultPath
来修改需要保存的运行结果的路径 - 如果非 Python 项目, 则需要修改
end.sh
的python
为对应的执行命令即可
使用
以本项目为例,在项目中有个
Train/main.py
文件作为模拟训练的文件,并将项目文件放在/hy-tmp
目录下。运行方法:
# ./run.sh [可执行文件目录] [Tag 用于标注结果] ./run.sh /hy-tmp/Train/main.py Test-Trainer
- 使用
-
有点优秀,希望更多炼丹师可以来分享这些小技巧!