安全加强版的 DeepSeek-R1-Safe

2025-09-24点滴生活254

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

作者: 莫自高    时间: 2025-9-21 23:03
DeepSeek-R1-Safe是由浙江大学网络空间安全学院和华为合作的基于DeepSeek衍生的安全大模型,在华为昇腾芯片和MindSpeedLLM等框架的基础上开发。
该模型的训练流程如下:
训练数据生成:构建安全、合规的数据集
安全监督训练:在训练过程中引入安全约束
安全强化学习:通过 RLHF 等方法优化模型行为
模型性能评测:对安全性能和通用性能进行全面评估
https://github.com/ZJUAISafety/DeepSeek-R1-Safe
20250921_225918.jpg (366.01 KB, 下载次数: 0)下载附件2025-9-21 23:01 上传
作者: 江大桥    时间: 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
作者: npcjy    时间: 2025-9-22 07:42
江大桥 发表于 2025-9-21 23:07
讲政治的ai就是一坨屎,是个鸡肋。
自己给自己出题打分,别人不承认也不使用,主打一个中国特色的AI。

本文转载于9090社区,帖子链接:https://qq9090.top/thread-584455-1-1.html

“安全加强版的 DeepSeek-R1-Safe” 的相关文章

磁带机就像机械表一样

作者: 委座    时间: 前天 09:10机械调教必须精准,磁头角度偏一毫,压带轮的位置偏一丝,最终效果就差太多。没有丝毫的容错空间。一台声音播放低频有力高频漂亮的磁带机,必然是一台调教到完美的机械...

请教个问题

作者: 三两碎银    时间: 前天 19:38看B站的雍正王朝,下面的翻译是中文+英文和??文(暗语?)  谁懂的帮解释一下? image.jpg (44.08 KB, 下载次数: 0)下载附件前天...

刚在少年宫给小孩报了模拟飞行社团

作者: just56    时间: 2023-12-9 10:02秦淮区少年宫今天开始报名春季学期的,看起来模拟飞行这条赛道还不太拥挤南京有开展的学校只搜到金中和浦口实验IMG_20231209_09...

论坛的黑名单设置有BUG了,会闹出误会

作者: wuyue770    时间: 昨天 23:10但是我引用他的话呢,就可以正常回复9090.jpg(60.97 KB, 下载次数: 0)下载附件昨天 23:10 上传作者: wuyue770 ...

25年-35年 10年扩大内需剧本

作者: 602032119    时间: 前天 11:34 本帖最后由 602032119 于 2025-1-18 11:38 编辑 https://v.douyin.com/ifLTRp5R/论坛出...