Karpathy表示:“這是一臺(tái)性能卓越的超級(jí)計(jì)算機(jī),以FLOPS計(jì),它大概可以在全球超級(jí)計(jì)算機(jī)中排到第5位”。
通過(guò)將汽車(chē)行業(yè)前所未有的算力作為其研發(fā)周期的核心,特斯拉讓其自動(dòng)駕駛汽車(chē)工程師能夠使用前沿技術(shù)來(lái)高效完成工作。
NVIDIA A100 GPU為全球最強(qiáng)的數(shù)據(jù)中心提供各種尺度的加速。A100 GPU基于NVIDIA Ampere架構(gòu)打造,其性能比上一代產(chǎn)品高出20倍,并且可以劃分成7個(gè)GPU實(shí)例,動(dòng)態(tài)地適配不同的需求。
使用100多萬(wàn)輛在路上行駛的Tesla汽車(chē)(的數(shù)據(jù))來(lái)持續(xù)優(yōu)化和迭代新功能,是Tesla自動(dòng)駕駛的垂直整合之道,而GPU集群在其中扮演了重要角色。
從汽車(chē)到數(shù)據(jù)中心
特斯拉的數(shù)據(jù)循環(huán)始于汽車(chē)?!坝白幽J健痹诓粚?shí)際控制車(chē)輛的情況下,悄無(wú)聲息地執(zhí)行著感知和預(yù)測(cè)深度神經(jīng)網(wǎng)絡(luò)(DNN)。
任何錯(cuò)誤預(yù)測(cè)、誤識(shí)別都會(huì)被記錄下來(lái)。隨后,這些實(shí)例會(huì)被特斯拉工程師所用,來(lái)創(chuàng)建/擴(kuò)充一個(gè)包含多種復(fù)雜場(chǎng)景的訓(xùn)練數(shù)據(jù)集,以完善DNN。
當(dāng)前已經(jīng)收集了100萬(wàn)個(gè)以每秒36幀的速度記錄的10秒片段,總數(shù)據(jù)量高達(dá)1.5PB。在數(shù)據(jù)中心,DNN基于這些場(chǎng)景被反復(fù)訓(xùn)練直到性能可接受。最后,DNN被發(fā)送回車(chē)內(nèi),并開(kāi)始下一輪(數(shù)據(jù))循環(huán)。
Karpathy表示,以這種方式在如此大量的數(shù)據(jù)上訓(xùn)練DNN需要龐大的計(jì)算能力,特斯拉為此建立并部署了內(nèi)置高性能A100 GPU的最新一代超級(jí)計(jì)算機(jī)。
連續(xù)迭代
除了全方位的訓(xùn)練之外,特斯拉的超級(jí)計(jì)算機(jī)還為自動(dòng)駕駛汽車(chē)工程師提供了在開(kāi)發(fā)過(guò)程中進(jìn)行實(shí)驗(yàn)和迭代所需的性能。
Karpathy表示,特斯拉目前部署的DNN結(jié)構(gòu)可以讓一個(gè)由20名工程師組成的團(tuán)隊(duì)同時(shí)在一個(gè)網(wǎng)絡(luò)上工作,通過(guò)隔離不同功能來(lái)實(shí)現(xiàn)并行開(kāi)發(fā)。
這些DNN運(yùn)行訓(xùn)練數(shù)據(jù)集的速度會(huì)比之前快速迭代時(shí)還更快。
Karpathy表示:“計(jì)算機(jī)視覺(jué)是我們一切工作的基礎(chǔ),并且也是實(shí)現(xiàn)Autopilot的關(guān)鍵。為此,我們必須訓(xùn)練一個(gè)龐大的神經(jīng)網(wǎng)絡(luò)并進(jìn)行大量實(shí)驗(yàn)。這也是我們?cè)谒懔Ψ矫嫱度氪罅抠Y金的原因?!?nbsp;
(轉(zhuǎn)載)