當(dāng)前位置:首頁 > 資訊 > 行業(yè)資訊 >
DeepMindAI 的這一研究表明,當(dāng)用于訓(xùn)練分類器(數(shù)據(jù)增強(qiáng))時(shí),GAN 生成在看起來真實(shí)的樣本的能力有限。初始分?jǐn)?shù)與分類表現(xiàn)呈負(fù)相關(guān)。
我們探討了矢量量化變分自動(dòng)編碼(VQ-VAE)模型在大規(guī)模圖像生成中的應(yīng)用。為此,我們對(duì)VQ-VAE 中使用的自回歸先驗(yàn)進(jìn)行了縮放和增強(qiáng),目的是生成比以前具有更高相關(guān)度和保真度的合成樣本。我們使用簡單的前饋編解碼器網(wǎng)絡(luò),這讓我們的模型對(duì)于編碼\解碼速度至關(guān)重要的應(yīng)用非常有用。此外,VQ-VAE 僅僅只需要在壓縮潛在空間中對(duì)自回歸模型進(jìn)行采樣,這比在像素空間中的采樣在速度上快一個(gè)數(shù)量級(jí),對(duì)于大型圖像尤其如此。我們證明了一個(gè) VQ-VAE 的多尺度層次組織,加上強(qiáng)大的先驗(yàn)潛在代碼,能夠在多種數(shù)據(jù)集(如 ImageNet)上生成質(zhì)量與最先進(jìn)的生成對(duì)抗網(wǎng)絡(luò)相媲美的樣本,同時(shí)不受 GAN 的已知缺點(diǎn),如模式崩潰、多樣性的缺乏等的影響。