Navigation

    Gpushare.com

    • Register
    • Login
    • Search
    • Popular
    • Categories
    • Recent
    • Tags

    【小技巧-后台篇】如何防止训练不中断?

    新手教程
    1
    1
    81
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • Alice_恒源云
      Alice_恒源云 last edited by

      1、训练期间因网络抖动中断,怎样将训练任务放到后台运行?

      推荐使用 Tmux 终端复用器,能够将进程放到后台运行,需要时重新接管。

      为了防止 SSH 因网络断开造成的进程运行中断,建议把所有需要长期运行的训练等任务都使用 Tmux 终端。参考 Tmux 文档。

      2、关闭本地电脑,训练任务会中断吗?

      如果是通过 Tmux 将任务放在后台运行,或使用 JupyterLab 浏览器运行的任务,关闭本地电脑不会中断训练。

      如果是直接在终端中执行训练,或使用 VSCode 等 IDE 连接执行训练,则关闭电脑会中断训练。

      3、关闭 JupyterLab 浏览器,训练任务会中断吗?

      若是关闭了 JupyterLab 的浏览器页面,只要实例不关闭,JupyterLab 中 NoteBook 和终端中的训练任务会继续运行。

      4、关闭 VSCode、PyCharm、iTerm2 等 IDE 或终端,训练任务会中断吗?

      使用 IDE 连接到实例执行训练任务,如果关闭 IDE 或终端会中断训练任务。

      如果需要后台运行推荐使用 Tmux 终端。参考 Tmux 文档。

      1 Reply Last reply Reply Quote 1
      • First post
        Last post