开源 LLM 安全扫描器

news/2024/7/10 19:58:18 标签: 安全, 开源, 扫描, 模型, 工具

Vigil 是一款开源安全扫描程序,可检测即时注入、越狱以及对大型语言模型(LLM) 的其他潜在威胁。

当攻击者使用专门设计的输入成功影响 LLM 时,就会出现即时注入。这导致 LLM 无意中实现了攻击者设定的目标。

LLM<a class=安全扫描仪" class="aligncenter" height="300" src="https://img-blog.csdnimg.cn/img_convert/ab668fac812ede67f99274bb9205656c.jpeg" width="650" />

我对 LLM 的可能性感到非常兴奋,但也注意到围绕它们构建的应用程序以及我们允许应用程序访问的数据需要更好的安全实践。

这个项目给了我一个很好的机会在人工智能和网络安全的交叉点上构建一些东西。希望它能为其他安全研究人员和开发人员提供一个尝试现有的 LLM 输入和输出安全措施,甚至创建自己的安全措施的开始。

Vigil 的创建者 Adam M. Swanda 告诉我们,这比期望直接在生产中使用的任何东西都更有“可能”。

Vigil LLM 安全扫描仪亮点

  • 模块化和可扩展的设计
  • 支持YARA(启发式)、矢量数据库相似性、变压器模型、提示响应相似性
  • 只需很少的代码即可添加自定义扫描
  • 自托管或使用 OpenAI
  • 提供嵌入数据集和 YARA 签名
  • 扫描仪阈值匹配时,Vector DB 可以根据检测到的提示自动更新
  • 非常可配置(启用/禁用扫描仪、修改阈值、使用不同的嵌入模型等)
  • 通过添加自定义扫描仪、新的 YARA 签名或更新矢量数据库来轻松扩展

Vigil 可在 GitHub 上下载。该存储库还提供开始自托管所需的检测签名和数据集。

Swanda 计划在短期内继续开发 Vigil。

具体来说,他一直在开发一个应用程序,旨在根据自定义数据集评估 Vigil 及其各种扫描仪。

该应用程序评估误报和其他相关指标等方面。

此外,Swand 正在探索检测基于图像的提示注入的方法。


http://www.niftyadmin.cn/n/5231697.html

相关文章

一招解除电脑带宽保留-提高上网速度

现在宽带最低是200兆&#xff0c;但明明是200M的宽带&#xff0c;网速却非常慢&#xff0c;其实影响网络的原因有很多种&#xff0c;下面就教朋友们如何解除宽带限制。 1、首先我们要排除硬件因素&#xff0c;先确定自己家的光猫网口是否支持千兆&#xff0c;如果是百兆网口 你…

XmlRPC协议详解(一款不支持原生异步请求的协议)

XmlRPC协议详解 文章目录 XmlRPC协议详解什么是RPC&#xff1f;什么是XmlRPC&#xff1f;XmlRPC详解请求示例响应示例错误响应示例参数的数据类型 结束语 什么是RPC&#xff1f; RPC&#xff08;远程过程调用&#xff09;是一种用于实现分布式系统中不同进程或不同计算机之间通…

Android 手机屏幕适配方式和原理

其适配原理主要是根据dp/sp与px的转换&#xff0c;而dp/sp与px的转换又与DisplayMetrics的density相关&#xff0c;所以可以通过改变DisplayMetrics的density&#xff0c;scaledDensity和densityDpi的值来适配不同分辨率机型。 在开始分析之前&#xff0c;我们需要了解一些概念…

k8S 发布spring boot的jar包

在Kubernetes&#xff08;K8s&#xff09;上部署Spring Boot应用&#xff08;打包成jar文件&#xff09;的基本步骤如下&#xff1a; 1. 准备Spring Boot应用的Jar包 确保你的Spring Boot应用已经成功构建&#xff0c;生成了可执行的jar包。 2. 创建Docker镜像 为你的Sprin…

VScode异常处理 (因为在此系统上禁止运行脚本)

在使用 VScode 自带程序终端的时候会报出"系统禁止脚本运行的错误" 这是由于 Windows PowerShell执行策略导致的 解决办法 管理员身份运行 Windows PowerShell执行&#xff1a;get-ExecutionPolicy1&#xff0c;显示Restricted2执行&#xff1a;Set-ExecutionPoli…

arcgis投影栅格不可用

1、使用【投影栅格】工具进行栅格数据投影转换时报错。 解决方法&#xff1a;如果使用的是arcgis10.5及以下的版本&#xff0c;则需要更换更高的版本&#xff0c;因为这个是软件问题&#xff0c;需要更换到arcgis10.6及以上版本&#xff0c;更高级别的版本已经修复了这个问题。…

element中el-input限制只输入正整数或保留两位小数

文章目录 一、前言二、实现2.1、HTML2.2、只输入正整数2.3、只能输入数字或小数点 三、最后 一、前言 常见的el-input可能会限制用户只能输入正整数或保留两位小数&#xff0c;达到输入金额的需求&#xff0c;点击【跳转】访问el-input的官方文档 element-ui是有el-input-numb…

接口验签规则

一、验签的背景 在网络发展快速的过程中&#xff0c;总是会忽略接口数据安全问题&#xff0c;进行验签则能够在一定程度上能够防刷&#xff0c;数据篡改。 二、什么是加签验签 加签验签&#xff0c; 发送消息方&#xff0c;对消息加签名&#xff1b; 接受消息方&#xff0…