E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    AI画图作为目前AICG最具代表性应用案例,在今年也是震惊到了不少小伙伴,不过大众消费者要是想体验到这个神奇的AI功能,那就需要一张相对高端的显卡,才可以有比较不错的出图速度,作为AI领域的领导者NVIDIA就帮大家解决难题了,他们在最近就为Stable Diffusion推出了一个TensorRT扩展,可以大幅提高GeForce RTX 系列显卡的文生图性能,同时也就间接降低了AI画画对显卡的需求门槛。

    手机通道:哔哩哔哩

    NVIDIA TensorRT简介

    首先我们还是来简单了解一下TensorRT是个什么东东,它是NVIDIA专门用于高性能深度学习推理的SDK,此前TensorRT主要应用在行业和专业用户,现在TensorRT开始面向Windows个人用户,就在前不久NVIDIA推出了TensorRT-LLM for Windows,这是一款提升AI推理性能的免费开源软件,用于在个人PC上提高大语言模型的推理性能,而这只需要配置有GeForce RTX显卡(8GB及以上显存)的,台式机或者笔记本电脑就能在本地部署运行,不仅在搭建成本上对个人用户更友好,也带来了更安全的个人隐私数据保护。

    而在流行的AI画图工具Stable Diffusion Webui上面,用户也能够通过TensorRT for Windows的加持,调用GeForce RTX系列显卡里面的AI运算单元Tensor Core来针对AI画图进行加速,从而提升生产效率。

    众所周知,NVIDIA的GeForce RTX系列显卡都是带有Tensor Core的,所以除了最新的GeForce RTX 40系列显卡,上一代的RTX 30系和更早的RTX 20系列显卡都是可以调用这个TensorRT,而且它还优化了显存占用,最低只需要8GB显存,我们实测在进行较大尺寸的AI画图时,整体显存占用也只是在5GB左右,所以一张8GB的RTX 4060也是足够用的。

    为了验证TensorRT的加速效果,我们找来了NVIDIA目前全系GeForce RTX 40系列显卡,RTX 4090、RTX 4080、RTX 4070 Ti、RTX 4070、RTX 4060 Ti、RTX 4060,以及目前仍然在主流级市场广受欢迎的上一代显卡,RTX 3060 12G来进行Stable Diffusion的AI画图测试。

    测试平台

    需要注意的是,Stable Diffusion在测试过程中生成第一幅图像的速度,可能要比后面生产图像的慢得多,这是因为最初可能需要将模型加载到内存中,因此我们每批测试都会运行 2 次来避免这个情况,并采用批次生成的第二次测试结果。

    AI画图性能测试

    从测试结果可以看到,RTX 4090和4080这两张高端显卡本来就很快了,在有了TensorRT的优化加持之后,相比xformers以及标准模式下面,有着接近翻倍的出图性能提升,而其它几张显卡也都有大幅度的加速。

    当中最值得一提的就是RTX 4060系列了,RTX 4060的出图速度从原来基本不可用,现在翻倍到了17张每分钟,而RTX 4060 Ti也直接翻倍到了22张,即使是输出更大一点分辨率,每分钟也有9张出图,这样的表现其实已经接近标准模式下的RTX 4090了,TensorRT的加速效果非常明显。

    从不同单批数量的出图测试也可以看出,在TensorRT的帮助下,其实上到RTX 4060级别,甚至RTX 3060 12G都已经有非常可用的出图性能了,可以说是把AI画图真正普及给广大RTX显卡用户了。

    另外TensorRT还提供了自定义引擎的设置,可以根据显卡的核心性能和显存大小,调整出图的分辨率大小上限,静态或者动态的单批数量输出等等,在经过优化调整TensorRT的自定义引擎后,还可以做到更快的出图速度。

    总结

    不难看出,有了TensorRT之后,NVIDIA的GeForce RTX显卡在AI画图上面,可以更加充分发挥出硬件的优势,不仅高端显卡的出图速度变得更快,入门级显卡也有了可以上场一战的能力,大大拉近了广大普通用户与前沿AI技术的距离。

    考虑到AI如今处于蓬勃发展的阶段,为了方便大家了解显卡的AI性能高低,我们在显卡天梯榜上加入了AI性能排名,可以看到目前NVIDIA的显卡几乎统治了榜单的前排位置,从综合的AI画图性能以及运算能力精度上,都属于是遥遥领先于AMD和Intel,可见NVIDIA是如今AI领域当之无愧的领跑者。

    所以对于消费级用户,如果你是内容创作者或者有生产力的需求,想要快速的AI画图,便于不断调优自己的作品,并且想要输出大一点的图,目前最好的选择是入手RTX 4070 Ti以上的高端显卡

    至于主流级光追显卡RTX 4060系列,RTX 4060和RTX 4060 Ti都借助TensorRT,实现了AI出图速度的翻倍,加上最近RTX 4060系列的售价都有所下调,这对于持有N卡的玩家来说,显卡的附加价值在不断增加,特别是对于初入门AI画图的爱好者,无论是用来体验AI画图,或者用来学习调校提示词,RTX 4060系列都会是性价比挺高的AI显卡。

    不得不说,NVIDIA这个TensorRT把原本高高在上的AI画图,现在让主流RTX显卡用户们可以轻松体验到,实在是一个非常不错的福利功能,大家手上有NVIDIA RTX显卡的话,不妨去下载来试试吧。

    ×
    热门文章
    1传AMD下一代移动处理器不再支持Win10,包括“Strix Point”Ryzen 9000系列
    2国内HBM开发取得进展:两家存储器制造商跟进,目标2026年生产HBM2
    3联发科或与英伟达合作,开发游戏掌机使用的SoC
    4微星CLAW掌上游戏机评测:将核显游戏体验也变成一种享受
    5英伟达Blackwell架构计算卡或3万美元起步,AI服务器高达300万美元
    6ID-Cooling推出霜界240/360一体水冷散热器:经典无光设计,售价239元起
    7索尼正在蚕食微软游戏主机市场:2024Q1里PS5销量是Xbox Series S|X的5倍
    8英特尔发布41份安全公告:涉及90多个漏洞,包括1个等级最高的AI工具漏洞
    9江波龙将带来FORESEE LPCAMM2内存:最高64GB,速率达7500MT/s
    已有 1 条评论,共 15 人参与。
    登录快速注册 后发表评论
    • lyahehehehe教授 2023-12-27 19:22    |  加入黑名单

      不能用ControlNet,不能用LoRA,TensorRT一般没人用,除非你瞎画着玩。

      已有4次举报

      支持(9)  |   反对(1)  |   举报  |   回复

      1#

    提示:本页有 1 个评论因未通过审核而被隐藏

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明