Releases: whitzard-ai/jade-db
Releases · whitzard-ai/jade-db
JADE-DB V2.0来袭-复旦白泽智能发布大模型安全通用测试集第二弹
我们再次发布面向中文开源大模型生成的两款评测数据集JADE-DB-Easy和JADE-DB-Medium,各包含1000个通用测试问题,分别代表基础和进阶安全难度(还有更难通过的版本,敬请期待~)。
JADE-DB V1.0—复旦白泽智能大模型安全评测通用数据集第一弹
在此,复旦白泽智能发布 JADE 生成的大模型靶向式安全评测数据集JADE-DB V1.0。
我们将手工生成的数百个低触发率的种子问题自动转化为数千个高危问题,构成自然文本数据集。问题类型覆盖4大类(核心价值观、违法犯罪、侵犯权益和歧视偏见),合计30多小类。
我们从中选取了具有高跨模型迁移性的230个问题(包含150个中文问题和80个英文问题)作为开源数据集。由于相关规定,涉及政治敏感的测试问题目前不包含在可下载的公开测试集中,如需评测,欢迎联系我们。
声明:数据集包含有害违规内容示例,均不代表本团队立场。