
微軟和英偉達今天宣布了由DeepSpeed和Megatron驅(qū)動的Megatron-Turing自然語言生成模型(MT-NLG),這是迄今為止訓練的最大和最強大的解碼語言模型。這個模型包括5300億個參數(shù),與現(xiàn)有最大的模型GPT-3相比,參數(shù)數(shù)量是其3倍。
訓練這樣的大型模型涉及各種挑戰(zhàn),沿著所有的人工智能軸線進行了許多創(chuàng)新和突破。例如,通過緊密合作,英偉達和微軟將最先進的GPU加速訓練基礎(chǔ)設施與尖端的分布式學習軟件堆棧相融合,實現(xiàn)了前所未有的訓練效率。
微軟與NVIDIA建立了高質(zhì)量的自然語言訓練語料庫,其中包含數(shù)千億個標記,并共同開發(fā)了訓練配方,以提高優(yōu)化效率和穩(wěn)定性。
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 www.hexin8.com All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
深水埗区| 建始县| 凤台县| 八宿县| 兰考县| 中西区| 门头沟区| 南靖县| 永和县| 迁安市| 南充市| 平定县| 洛隆县| 邳州市| 尖扎县| 呼玛县| 林周县| 朝阳区| 江源县| 桦川县| 如东县| 辽阳市| 蓬莱市| 铜山县| 出国| 丹凤县| 峨边| 吉木萨尔县| 镇原县| 富源县| 临泽县| 桃江县| 邯郸市| 东莞市| 塘沽区| 监利县| 黄大仙区| 岱山县| 古丈县| 新野县| 崇左市|