文生图和文生视频的底层技术框架较为相似,主要包括GAN、自回归和扩散模型三大路径,其中扩散模型(Diffusion model)为当前主流生成模型,多个指标对比下综合占优,能在较为可控的算力成本和较快的速度下生成具备多样性、高质量的图像:①图像质量:扩散模型>自回归模型>GAN模型。FID值(Fréchet Inception Distance score)是用于评估模型生成的图像质量的指标,是用来计算真实图像与生成图像的特征向量间距离的一种度量。FID值越小,可以认为图像质量在一定程度上越优。从不同模型的FID得分来看,扩散模型平均数较小,反应图像质量较高。②参数量:自回归模型>扩散模型>GAN模型。GAN的参数量一般在千万级别,整体较为轻巧,扩散模型的参数量在十亿级别,自回归模型在十亿到百亿级不等。③生成速度(由快到慢):GAN模型>扩散模型>自回归模型。生成速度与参数量级为负相关关系。④训练成本:自回归>扩散模型>GAN模型。由于参数量级较小,GAN模型训练成本小且开源模型多,仍具备一定优势。而自回归模型参数量级较大,整体训练成本更高。在单张A100GPU下,120亿参数的DALL-E需要18万小时,200亿参数的 Parti更是需要超过100万小时,扩散模型参数量在十亿级别,整体训练成本较为适中。
相关报告
AIGC深度报告:新一轮内容生产力革命的起点
8944
类型:行研
上传时间:2023-03
标签:AIGC、内容生产力)
语言:中文
金额:5积分
2023AIGC市场研究报告:ChatGPT推动的变革趋势与投资机会-甲子光年
6845
类型:专题
上传时间:2023-02
标签:AIGC、ChatGPT)
语言:中文
金额:5积分
AIGC、ChatGPT-人工智能迭代的核心驱动力《生成式人工智能:AIGC的逻辑与应用》读书笔记
5342
类型:读书笔记
上传时间:2023-06
标签:人工智能、ChatGPT、AIGC)
语言:中文
金额:9.9元
中国AIGC产业全景报告暨AIGC+50榜单
5308
类型:行研
上传时间:2023-04
标签:AIGC、产业全景、0榜单)
语言:中文
金额:5积分
AIGC之AI绘画行业发展研究报告2023【无界AI】
4859
类型:行研
上传时间:2023-07
标签:AIGC、AI绘画)
语言:中文
金额:5积分
全球人工智能研究院-AIGC生成式人工智能对企业的影响和意义
4655
类型:行研
上传时间:2023-04
标签:人工智能、AIGC、AI)
语言:中文
金额:5积分
腾讯研究院AIGC发展趋势报告2023
4181
类型:行研
上传时间:2023-02
标签:AIGC)
语言:中文
金额:免费
清华大学:AIGC(GPT-4)赋能通信行业应用白皮书(2023)
3403
类型:行研
上传时间:2023-03
标签:AIGC、GPT-4、通信)
语言:中文
金额:5积分
清华AIGC和ChatGPT发展研究报告1.0
3326
类型:行研
上传时间:2023-05
标签:AIGC、ChatGPT)
语言:中文
金额:免费
计算机行业:AIGC行业应用畅想
3022
类型:行研
上传时间:2023-04
标签:计算机、AIGC)
语言:中文
金额:5积分
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册