windows操作系统本地部署开源语言模型ChatGLM3-6b,超详细

前言

首先感谢智谱AI和清华大学 KEG 实验室联合开源的ChatGLM3对话预训练模型,让我们国人有属于自己的AI聊天机器人。

ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。

默认情况下,模型以 FP16 精度加载,测试运行需要大概 16GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,或者CPU运算方式测试运行模型,下面流程是基于GPU的。

ChatGLM2和ChatGLM3性能对比

与二代模型相比,其效果平均提升了超过 50%

安装流程

1 部署python>=3.10运行环境(使用conda)

2 安装duda和cudnn(比较麻烦,cudnn需要登录NVIDIA,cudnn下载我是科学上网通过的

3 安装torch和torch.cuda

4 chatGML3源码下载

5 chatGML3-6b-8k模型下载

6 修改测试代码模型的路径为本地

下载安装conda

conda是什么不过多介绍了,自行百度。。

下载地址:Free Download | Anaconda

安装对应版本的CUDA 和 cuDNN

好吧,先说一下cuda是什么还有cuDNN是什么

CUDA 是 NVIDIA 公司推出的一种通用并行计算架构,全称为 Compute Unified Device Architecture。它旨在让软件开发人员能够利用 NVIDIA GPU(图形处理器)的强大并行计算能力来解决复杂的计算问题,尤其是在那些原本由 CPU(中央处理器)执行时效率较低或耗时较长的任务上。

cuDNN 是 NVIDIA 提供的用于深度神经网络的 GPU 加速库,它高效实现了深度学习中常见的运算原语(如卷积、池化、归一化和激活函数),旨在提升深度学习模型训练和推理的性能、易用性和内存效率。

注意:CUDA和cuDNN在模型测推理和下载pytorch版本时候都是相关联的

查看自己电脑对应的cuda版本号

按住win + R 调出命令终端,输出cmd

nvidia-smi

 

上图红色框内的12.4就是cuda的版本

CUDA的安装链接: CUDA 

 

本地和软件下载都一样不要纠结。。。。。这个文件也比较大,需要一些时间。

这是一个很详细的cuda和cuDNN安装教程,包括一些环境变量的配置:链接: CUDA安装教程.

创建虚拟环境

 conda create -n chatglm3 python=3.10

 conda activate chatglm3

 conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

注意:python版本需要>=3.10 

pytorch-cuda版本的查看地址: pytorch

注意:pytorch-cuda=12.1   12.1要修改为您自己对应的版本,而且版本一定要和cuda的版本对应!

验证torch.cuda是否安装成功

import torch
print(torch.cuda.is_available())


返回true代表成功 

ChatGLM3源码安装

切换到conda

模型基础运行代码已经上传到 github 和 SwanHub 两个平台,两个平台的信息同步。开发者通过以下方式下载模型代码。

从 github 下载源码

git clone https://github.com/THUDM/ChatGLM3.git

从 SwanHub 下载源码

git clone https://swanhub.co/ZhipuAI/ChatGLM3.git

 安装扩展

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

下载预训练好的基础模型文件 

Huggingface 下载

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b.git

Modelscope 下载

git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

SwanHub 下载

git lfs install
git clone https://swanhub.co/ZhipuAI/chatglm3-6b.git

注意:这里文件比较大,需要一些时间的,下载好就是下面的样子

 测试模型demo

MODEL_PATH 是模型文件存储的地方,也就是预训练的基础文件目录
TOKENIZER_PATH 是分词器目录,和MODEL_PATH一样就可以

注意:我的显卡是4090 24G显存,如果你的低于这个配置,最好模型量化测试,不然不知道显卡会不会烧坏。。。。

模型量化 

量化方式加载模型,使用方法如下:

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).quantize(4).cuda()

CPU 部署 

如果你没有 GPU 硬件的话,也可以在 CPU 上进行推理,但是推理速度会更慢。

注意:除了慢还需要至少32G以上内存

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).float()

 运行测试
 

测试文件在basic_demo目录下 

python cli_demo.py

 当出现一下画面,就可以和chatglm3对话了!!!兄弟,点个赞吧!!!!

web_demo_gradio.py 是页面的demo,python  web_demo_gradio.py 运行。

关注我:后续还会更新如何微调 chatglm3 ,也就是让它成为你的个性化ai智能语言模型


http://www.niftyadmin.cn/n/5461955.html

相关文章

解决 docker swarm 节点容器无法获取客户端真实IP

下载工具 https://github.com/sangbobo/docker-ingress-routing-daemon 下载代码 将docker-ingress-routing-daemon放到/usr/bin下 mv docker-ingress-routing-daemon chmod x docker-ingress-routing-daemon设置开启自启 vi /etc/systemd/system/dird.service填入内容 [U…

线程池实现与性能分析

一、线程池是什么 线程池是一种池式结构(用来解决资源的频繁创建和销毁的问题)。 其他的池式结构:内存池,连接池,对象池(避免对象的频繁创建和销毁)。 线程池是维持和管理固定数量线程的池式结…

C#面:简单介绍 FileMode 枚举成员

C# 的 FileMode 枚举类型定义了在文件操作中使用的不同文件访问模式。 它包含以下成员: FileMode.Create:如果文件不存在,则创建一个新文件。如果文件已存在,则覆盖原有文件。FileMode.CreateNew:创建一个新文件。如果…

2024年 前端JavaScript 进阶 第2天 笔记

2.1-内容和创建对象方式 2.2-164-构造函数 2.3-new实例化执行过程 2.4-实例成员和静态成员 2.5-基本包装类型 2.6-0bject静态方法 2.7-数组reduce累计方法 对象数组 加0 2.7-数组find、every和转换为真 --说明手册文档 MDN Web Docs 2.8-字符串常见方法 2.3 String 1.常见实例…

day14-二叉树part01(递归法/迭代法)

递归三部曲(时刻牢记) 1.确认递归函数需要的参数与返回值 一般为传入一个根节点 传入一个数组用来存放结果数组 2.确定终止条件 3.确定单层递归逻辑 递归的实现就是:每一次递归调用都会把函数的局部变量、参数值和返回地址等压入调用栈中,然后递归返回的…

傻瓜式启动关闭重启docker容器的脚本

运行脚本后,界面如下: 选择对应的编号后,会列举所有关闭的容器或者所有开启的容器列表,当我要启动一个容器 时输入1,就会出现下面的页面。 然后输入指定的编号后,就会启动对应的容器。 脚本代码如下&#…

vitess sysbench性能测试

参考资料: 1、sysbench的使用: https://blog.51cto.com/u_15739244/5781745 1、 安装和部署 1.1 、安装sysbench git clonehttps://github.com/akopytov/sysbench.git cd sysbench git checkout 0.5 yum -y install make automake libtool pkgconf…

DVWA之SQL注入漏洞学习记录

一、什么是SQL注入呢? SQL注入漏洞是指攻击者通过在应用程序的输入字段中插入恶意的SQL代码,从而绕过应用程序的身份验证和访问控制,进而执行操纵数据库的操作。这种漏洞是由于应用程序没有对用户输入进行充分的验证和过滤导致的。 攻击者可以…