英伟达TensorRT-LLM库登陆Windows PC，瞄准提高性能

2023-10-18 11:31:25仇菲江

导读【网盟资讯】10月18日消息，英伟达，硬件领域的人工智能巨头，迈向新的里程碑，推出了一项旨在提升大型语言模型(LLM)性能的软件工具，适用

【网盟资讯】10月18日消息，英伟达，硬件领域的人工智能巨头，迈向新的里程碑，推出了一项旨在提升大型语言模型(LLM)性能的软件工具，适用于本地 Windows PC。英伟达的 GPU 在全球领先科技公司，如微软和OpenAI的数据中心中发挥重要作用，驱动着Bing Chat、ChatGPT等人工智能服务。TensorRT-LLM库是英伟达最新的开源工具，原本是为数据中心开发的，现在已经扩展到Windows PC。最引人瞩目的特性之一是，如果Windows PC搭载英伟达GeForce RTX GPU，TensorRT-LLM能够将LLM在该平台上的运行速度提升至原有速度的四倍。

据ITBEAR科技资讯了解，英伟达在博客文章中详细介绍了TensorRT-LLM对开发者和终端用户的潜在益处。在更大的批量大小下，TensorRT-LLM的加速效果显著，尤其在处理更复杂的LLM任务，如写作和编码助手时，能够同时输出多个独特的自动完成结果，从而提高性能和结果质量，让用户可以有更多智能的选择。

文章中还举例展示了TensorRT-LLM的运作方式。当提问“《心灵杀手 2》集成了NVIDIA的哪些技术?”时，传统LLM只能给出“游戏尚未公布”的无帮助回答。然而，使用TensorRT-LLM结合RAG模型，将GeForce新闻添加到向量库中并连接到相同的Llama2模型，不仅能提供正确答案，包括NVIDIA DLSS 3.5、NVIDIA Reflex和全景光线追踪等技术，而且在TensorRT-LLM的加速下，响应速度更加迅猛，为用户提供更加智能的解决方案。

TensorRT-LLM预计将很快在英伟达的开发者网站上提供，这将为广大开发者提供更强大的工具和资源，以更好地利用英伟达的GPU性能。

此外，英伟达还在最新的GeForce驱动更新中加入了一些基于人工智能的功能。其中包括全新的RTX Video Super Resolution功能的1.5版本，能够在观看在线视频时提供更高的分辨率增强效果，减少了压缩效果。此外，英伟达还为拥有GeForce RTX GPU的用户增加了TensorRT人工智能加速功能，进一步提升了从人工智能图片生成器获取图像的速度。这一系列的更新将进一步提高用户体验，使其受益于英伟达强大的硬件和软件创新。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:微软推出AI工具Azure AI Content Safety，致力于打造健康的社交媒体环境

下一篇:微软研究团队发布GPT-4研究报告：揭示“越狱”漏洞