久久久精品2019中文字幕神马_欧美亚洲一区三区_欧美大人香蕉在线_精品88久久久久88久久久_中文字幕一区二区三区在线播放 _精品国产一区二区三区久久影院_欧洲av在线精品_粉嫩av一区二区三区_亚洲欧美一区二区三区极速播放_国产亚洲精品久久

首頁 > 收藏

多卡訓(xùn)練 當(dāng)前短訊

來源:博客園 時間:2023-06-24 00:09:45

1、前言

近期做到的一些工作涉及到多卡訓(xùn)練,不得不感慨深度學(xué)習(xí)真的是一個燒錢的活,順便記錄一下,主要記錄用法,不涉及實現(xiàn)原理。

2、單機(jī)多卡并行

官方DDP文檔:

GETTING STARTED WITH DISTRIBUTED DATA PARALLEL


(資料圖)

Github 倉庫:

Github 中文文檔

GETTING STARTED WITH DISTRIBUTED DATA PARALLEL

DataParallel

使用 nn.Dataarallel() 將模型變換一下,一行搞定

model = nn.DataParallel(model)

根據(jù)

為方便說明,我們假設(shè)模型輸入為(32, input_dim),這里的 32 表示batch_size,模型輸出為(32, output_dim),使用 4 個GPU訓(xùn)練。nn.DataParallel起到的作用是將這 32 個樣本拆成 4 份,發(fā)送給 4 個GPU 分別做 forward,然后生成 4 個大小為(8, output_dim)的輸出,然后再將這 4 個輸出都收集到cuda:0上并合并成(32, output_dim)。可以看出,nn.DataParallel沒有改變模型的輸入輸出,因此其他部分的代碼不需要做任何更改,非常方便。但弊端是,后續(xù)的loss計算只會在cuda:0上進(jìn)行,沒法并行,因此會導(dǎo)致負(fù)載不均衡的問題。

針對負(fù)載不均衡問題,一個緩解的方法是將 loss 放入模型內(nèi)部計算,即在 forward 的時候計算 loss。

DistributedDatarallel

分布式數(shù)據(jù)并行方法,通過多進(jìn)程實現(xiàn)。

1、從一開始就會啟動多個進(jìn)程(進(jìn)程數(shù)等于GPU數(shù)),每個進(jìn)程獨享一個GPU,每個進(jìn)程都會獨立地執(zhí)行代碼。這意味著每個進(jìn)程都獨立地初始化模型、訓(xùn)練,當(dāng)然,在每次迭代過程中會通過進(jìn)程間通信共享梯度,整合梯度,然后獨立地更新參數(shù)。2、每個進(jìn)程都會初始化一份訓(xùn)練數(shù)據(jù)集,通過DistributedSampler函數(shù)實現(xiàn),即同樣的模型喂進(jìn)去不同的數(shù)據(jù)做訓(xùn)練,也就是所謂的數(shù)據(jù)并行。3、進(jìn)程通過local_rank變量來標(biāo)識自己,local_rank為0的為master,其他是slave。這個變量是torch.distributed包幫我們創(chuàng)建的,使用方法如下:

import argparse  parser = argparse.ArgumentParser()parser.add_argument("--local_rank", type=int, default=-1)args = parser.parse_args()

運行代碼

python -m torch.distributed.launch --nproc_per_node=4 --nnodes=1 train.py

其中,nnodes 表示節(jié)點數(shù)量,單機(jī),即為1,nproc_per_node 為每個節(jié)點的進(jìn)程數(shù)量,與 GPU 數(shù)量一致。

模型保存與加載TODO

3、遇到的問題

1、DistributedDataarallel 方法,有時候會出現(xiàn)進(jìn)程卡死的問題,現(xiàn)象上即為顯卡的利用率卡在 100%,未啟動進(jìn)程組,根據(jù)tjds排查是IO 虛擬化(也稱為 VT-d 或 IOMMU)啟用了ACS導(dǎo)致,具體原因參考 故障排除——NCCL2.16.2 文檔。

方法一:排查原因是BIOS里IO虛擬化(VT-d)默認(rèn)啟動了PCI訪問控制服務(wù)(ACS)導(dǎo)致GPU間無法直接通過P2P方式通信,需在BIOS關(guān)閉此功能,具體操作參考 tjds

1、 查看ACS是否開啟執(zhí)行 lspci -vvv | grep -I acsctl 如果有顯示SrcValid+說明已啟用ACS功能2、 添加iommu=pt參數(shù)到grub(此步驟應(yīng)該可以跳過)編輯/etc/default/grub文件添加iommu=pt,再執(zhí)行update-grub更新grub文件3、 關(guān)閉BIOS里ACS功能重啟操作系統(tǒng)開機(jī)時按 del 進(jìn)入 BIOS 關(guān)閉 ACS 功能,不關(guān) VT-d 只關(guān)閉 ACS 功能,具體路徑:Path: Advanced -> Chipset Configuration -> North Bridge -> IIO Configuration -> Intel VT for Directed I/O (VT-d) -> ACS Control -> Enable / Disable.4、 檢查ACS是否關(guān)閉執(zhí)行l(wèi)spci -vvv | grep -I acsctl 如果全顯示SrcValid-說明已關(guān)閉ACS功能

方法二:仍然使用 ‘nccl‘ 后端,禁用 GPU 的 P2P 通信。

torch.distributed.init_process_group(backend="ncll")
NCCL_P2P_DISABLE=1 CUDA_VISIBLE_DEVICES=0,1,2,3 python -m torch.distributed.launch --nproc_per_node=4 train.py 

嫌麻煩可以寫入 bashrc 環(huán)境變量。

方法三:更換后端為 ‘gloo’ , shell命令運行程序,縱享絲滑。

torch.distributed.init_process_group(backend="gloo")
CUDA_VISIBLE_DEVICES=0,1,2,3 python -m torch.distributed.launch --nproc_per_node=4 train.py 

缺點就是 gloo 的通信在我用的時候要比 nccl 慢很多。

2、如果訓(xùn)練過程中使用了 Sampler 進(jìn)行數(shù)據(jù)分發(fā), dataloader 的 shuffle 不能設(shè)置為 True。

3、dataloader 設(shè)置 batch_size 時,注意盡量保證每次循環(huán)每張卡至少可以分到一個 sample,不然有時候會因某張卡等待輸入卡死。

4、我在訓(xùn)練時,dataloader的 num_works 通過 CPU 幫助 GPU 加載數(shù)據(jù)能夠提升 GPU 利用率,倒是沒遇到報錯。

5、dataloader 的 pin_memory (鎖頁內(nèi)存) 按道理是可以鎖住一部分內(nèi)存,減少 CPU 內(nèi)存拷貝的,但是我用的時候會極大降低 GPU 利用率,此處存疑。

待更新ing

相關(guān)稿件

多卡訓(xùn)練 當(dāng)前短訊

OpenAI放大!將推出史上超強(qiáng)「模型商店」,打通所有ChatGPT應(yīng)用|天天熱資訊

每日簡訊:DeepMind 聯(lián)合創(chuàng)始人提出新的圖靈測試:讓 AI 將 10 萬美元變成 100 萬美元

世界觀熱點:“引爆”夜市,新余這場“三零一戴”活動超燃…

江西省崇義縣發(fā)布雷電黃色預(yù)警 速訊

曹沖稱象課文原文_曹沖稱象原文-今日播報

天天微資訊!如何評價龍珠里面的亞奇洛貝

嘉興海寧7.18億掛牌1宗宅地 起始樓面1.17萬元/平米創(chuàng)歷史新高 每日簡訊

環(huán)球今熱點:恭喜發(fā)財廣場舞視頻(恭喜發(fā)財廣場舞)

2023年中考今天拉開序幕|當(dāng)前關(guān)注

中國導(dǎo)演徐磊:“我不擔(dān)心韓國觀眾看不懂中國電影”

【世界速看料】不公布GMV的618,誰是大贏家?

當(dāng)前要聞:招生計劃隨手查!2023年黑龍江省全國普通高等學(xué)校招生計劃電子版發(fā)布!

全球?qū)崟r:大學(xué)生第一支香水推薦!平價香水推薦!

世界報道:2023年南寧龍舟公開賽在南寧舉行

2023端午檔新片總票房破4億

環(huán)球熱點評!6月21日滌棉紗為17820.00

第三屆全球饒商大會舉行 現(xiàn)場簽約項目總額超300億元 環(huán)球新資訊

閃耀暖暖春別空山套裝獲取方法攻略 今日視點

2023年A股線路板概念股全梳理(6月23日)

AIGC相關(guān)上市公司龍頭有哪些?(2023/6/23)

每日訊息!山西省萬榮縣發(fā)布雷暴大風(fēng)藍(lán)色預(yù)警

名利圈的潛規(guī)則,趙子琪都吃過虧,秦嵐還在原地打轉(zhuǎn)? 全球聚看點

瑞浦蘭鈞 x TüV萊茵 | 聯(lián)合發(fā)聲,共建綠色能源新未來|當(dāng)前短訊

即時:光伏儲能概念股2023年股價查詢(6月23日)

減脂時,是不是不能吃豬肉?-今日要聞

怎么做番茄牛肉好吃,番茄牛肉最正宗的做法?|即時焦點

3元早餐、5元咖啡、10元吃面,血拼價格戰(zhàn),今年餐飲怎么了?

全流程“平臺流轉(zhuǎn)、線上辦理”,揚州“智慧破產(chǎn)平臺”啟動建設(shè)-世界觀焦點

金水區(qū)大石橋街道同樂社區(qū)與轄區(qū)居民“粽享歡樂”


久久久精品2019中文字幕神马_欧美亚洲一区三区_欧美大人香蕉在线_精品88久久久久88久久久_中文字幕一区二区三区在线播放 _精品国产一区二区三区久久影院_欧洲av在线精品_粉嫩av一区二区三区_亚洲欧美一区二区三区极速播放_国产亚洲精品久久
日韩av电影免费观看高清完整版 | 欧日韩精品视频| 亚洲v中文字幕| 成人美女视频在线看| 视频一区二区国产| 亚洲另类色综合网站| 夜夜操天天操亚洲| 亚洲综合一区二区三区| 日韩精品国产欧美| 盗摄精品av一区二区三区| 91一区二区三区在线观看| 在线观看91视频| 久久久久久久久久电影| 一区二区三区在线视频观看58 | 一区二区三区在线影院| 日本网站在线观看一区二区三区 | 色av一区二区| 欧美成人猛片aaaaaaa| 中文字幕一区二区三区在线不卡 | 国产日韩精品视频一区| 亚洲欧美一区二区不卡| 日韩av网站在线观看| 成人理论电影网| 日韩午夜在线观看| 中文字幕在线观看一区二区| 日本强好片久久久久久aaa| 99在线精品观看| 欧美精品一区视频| 日韩高清在线电影| 91亚洲国产成人精品一区二三| 精品国产乱子伦一区| 亚洲香肠在线观看| 99re亚洲国产精品| 国产欧美一区二区三区在线看蜜臀| 五月天视频一区| 色8久久精品久久久久久蜜| 中文字幕欧美国产| 免费成人你懂的| 欧美一区二区三区日韩视频| 一区二区三区久久久| 91丝袜高跟美女视频| 国产亚洲综合在线| 国产91色综合久久免费分享| 久久欧美一区二区| 激情欧美一区二区三区在线观看| 欧美一区日韩一区| 日本不卡在线视频| 日韩欧美国产三级电影视频| 久久国产人妖系列| 精品国产电影一区二区| 麻豆久久久久久久| 精品国产乱码久久久久久夜甘婷婷| 日韩av电影天堂| 日韩午夜小视频| 国精品**一区二区三区在线蜜桃| 欧美一区日韩一区| 九色|91porny| 久久精品欧美一区二区三区不卡 | 久久久不卡网国产精品二区| 精久久久久久久久久久| 久久久久久久综合狠狠综合| 国产精品99久久久久| 国产精品欧美一区喷水| 91麻豆自制传媒国产之光| 亚洲综合一区二区| 日韩一区二区三区在线视频| 黄页视频在线91| 中文字幕一区三区| 欧美区一区二区三区| 寂寞少妇一区二区三区| 国产精品久久夜| 欧美精品久久天天躁| 国产一区欧美一区| 亚洲欧美偷拍三级| 精品成a人在线观看| 波多野结衣在线aⅴ中文字幕不卡| 亚洲精品中文在线| 日韩欧美成人午夜| 91伊人久久大香线蕉| 蜜桃一区二区三区在线| 国产精品免费视频一区| 9191成人精品久久| 成人一级片在线观看| 天堂蜜桃91精品| 国产精品沙发午睡系列990531| 欧美精品123区| 粉嫩高潮美女一区二区三区| 日韩影院在线观看| 一区在线观看免费| 日韩欧美的一区| 欧美三级日韩三级| 丁香另类激情小说| 另类调教123区| 亚洲国产欧美在线人成| 国产精品天美传媒| 精品捆绑美女sm三区| 欧美在线观看一区| 丁香激情综合五月| 久久精品99国产精品日本| 亚洲综合一二区| 日韩一区欧美一区| 国产精品亲子乱子伦xxxx裸| 久久夜色精品一区| 欧美精品在线一区二区三区| 色哟哟国产精品| av激情综合网| 成人中文字幕合集| 粉嫩一区二区三区性色av| 麻豆精品久久精品色综合| 天天综合日日夜夜精品| 亚洲一区二区偷拍精品| 亚洲精品v日韩精品| 最新久久zyz资源站| 中文字幕一区二区三区不卡在线| 中文幕一区二区三区久久蜜桃| 久久亚洲影视婷婷| 久久久久久久久岛国免费| 欧美电影免费观看完整版| 在线观看91精品国产麻豆| 欧美视频精品在线| 欧美日韩国产美| 5566中文字幕一区二区电影| 日本精品一级二级| 欧美亚洲禁片免费| 欧美日韩视频专区在线播放| 欧美系列日韩一区| 欧美日韩二区三区| 日韩女优视频免费观看| 欧美区在线观看| 精品理论电影在线| 国产亚洲欧洲997久久综合| 国产精品欧美久久久久一区二区| 亚洲欧洲av一区二区三区久久| 亚洲精品中文在线| 日韩av一区二| 国产高清在线精品| 色诱视频网站一区| 欧美精品777| 国产婷婷精品av在线| 国产精品理伦片| 亚洲影视在线观看| 久久99深爱久久99精品| 91尤物视频在线观看| 欧美福利一区二区| 国产三级精品三级在线专区| 亚洲欧美视频在线观看视频| 奇米精品一区二区三区四区| av中文字幕一区| 91精品国产一区二区| 中文字幕av一区 二区| 午夜视频一区二区三区| 国产精品系列在线播放| 欧美日韩一区中文字幕| 亚洲国产精品传媒在线观看| 日韩主播视频在线| 波多野结衣中文字幕一区| 7777精品伊人久久久大香线蕉| 国产日韩视频一区二区三区| 三级成人在线视频| 色婷婷亚洲婷婷| 国产午夜精品一区二区三区四区| 亚洲成人久久影院| av中文字幕在线不卡| 欧美电影免费观看高清完整版在线 | 91看片淫黄大片一级在线观看| 欧美夫妻性生活| 亚洲欧美一区二区在线观看| 久久电影网站中文字幕| 日本高清不卡一区| 国产天堂亚洲国产碰碰| 天天色天天爱天天射综合| 波多野结衣在线aⅴ中文字幕不卡| 欧美一区二区三区日韩| 亚洲精品久久7777| kk眼镜猥琐国模调教系列一区二区 | 欧美成人一区二区| 日日嗨av一区二区三区四区| 日本久久一区二区| 最近中文字幕一区二区三区| 高清国产一区二区| 国产色综合一区| 国产精品一区在线观看乱码 | 午夜精品久久久久久久99水蜜桃| 99精品1区2区| 亚洲人成在线播放网站岛国| 成人国产精品免费观看动漫| 国产精品沙发午睡系列990531| 大陆成人av片| 日韩一区欧美小说| 91在线精品一区二区| 亚洲三级电影全部在线观看高清| 成人午夜免费电影| 综合色中文字幕| 在线一区二区三区| 亚洲一级片在线观看| 欧美日韩卡一卡二| 麻豆精品国产91久久久久久| 精品久久久久久久久久久院品网| 久草中文综合在线| 国产精品久久久久久久裸模|