Navigation

    Gpushare.com

    • Register
    • Login
    • Search
    • Popular
    • Categories
    • Recent
    • Tags

    【小技巧-工具篇】JupyterLab/TensorBoard使用问题?

    新手教程
    2
    2
    168
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • Alice_恒源云
      Alice_恒源云 last edited by Alice_恒源云

      1、JupyterLab/TensorBoard 如何使用?

      可参考JupyterLab文档、TensorBoard文档。

      2、JupyterLab打不开或者响应慢怎么办?

      如果遇到JupyterLab页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启JupyterLab

      supervisorctl restart jupyterlab
      

      不建议通过JupyterLab页面直接运行较消耗资源的程序,因为该程序很可能会导致JupyterLab无响应或者运行缓慢问题,可通过tmux工具放置在实例后台运行。

      3、tensorboard打不开或者响应慢怎么办?

      如果遇到tensorboard页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启tensorboard

      supervisorctl restart tensorboard
      

      4、自定义镜像如何安装jupyterlab?

      自定义镜像登录实例后,执行如下命令,即可完成安装jupyterlab,安装完成后,可通过控制台打开jupyterlab页面

      curl -OL "https://download.gpushare.com/download/custom_install"
      chmod u+x ./custom_install
      ./custom_install jupyterlab
      

      5、自定义镜像如何安装tensorboard?

      自定义镜像登录实例后,执行如下命令,即可完成安装tensorboard,安装完成后,可通过控制台打开tensorboard页面

      curl -OL "https://download.gpushare.com/download/custom_install"
      chmod u+x ./custom_install
      ./custom_install tensorboard
      

      6、JupyterLab 要输入密码怎么办?

      通过终端执行 jupyter server list 命令可以得到 JupyterLab 的登陆 Token。

      如下可以从执行结果内获得 Token 为 3fq593blw4afqjtqgdp3ldk5。

      root@I15b96311d0280127d:~# jupyter server list
      Currently running servers:
      http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /
      

      7、TensorFlow 训练报 ptxas fatal 错误

      当在 RTX 3000 系列显卡上使用 TensorFlow 2.4 For CUDA 11.0 时,训练会出现下列警告。

      W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'
      

      原因是该版本的 PTX compiler 不支持 8.6 compute capability。此报错为警告,不影响正常训练。

      该警告可以通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 关闭。

      此问题虽然不影响训练但性能上会降低,推荐创建 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。

      1 1 Reply Last reply Reply Quote 1
      • 1
        188****4765 @Alice_恒源云 last edited by

        @alice_恒源云
        yolov5训练期间,在项目目录用
        tensorboard --logdir=./runs
        运行后,在实例管理那打开tensorboard没有东西,我在本地一样的操作就可以在浏览器里看到结果了,有点没搞懂

        1 Reply Last reply Reply Quote 0
        • First post
          Last post