为千行百业植入“安全基因”!百度加入“内生安全生态伙伴计划”

2025-12-03 15:49:4849人阅读

11月28日,由紫金山实验室主办的第五届网络空间内生安全学术大会暨IEEE CRESS 2025国际会议在南京启幕。大会由中国通信学会、中国计算机学会、中国汽车工程学会、中国网络空间安全学会指导,紫金山实验室主办,以“AI+生态构建新挑战,安全可信新机遇”为主题,集中展现我国在网络空间内生安全领域的原创突破与产业实践成果。同时,大会正式启动“内生安全生态伙伴计划”,该计划联合了百度、奇安信、深信服等行业领军企业开展深度合作,形成共生共存的产业生态链条,以加速技术创新与成果转化,让内生安全技术更好地赋能千行百业。

第五届网络空间内生安全学术大会

大模型技术的深度应用在释放生产力的同时,也潜藏着多重安全隐患。一旦保护不到位,可能导致用户隐私泄露,甚至被用于诈骗、盗用身份等违法犯罪活动。技术开发过程中,若核心数据或算法被窃取,不仅损害企业利益,还可能被不法分子篡改功能,导致模型输出错误结果,影响医疗、金融等关键领域。这些风险不仅威胁企业及个人权益,还可能破坏社会信任,甚至影响国家安全。因此,需要通过加强数据保护、完善技术架构、制定行业规范等多方面措施,以确保大模型在安全可控的前提下发挥作用。为此,百度提出了大模型安全护栏建设理念,为行业提供了一套系统性的内生安全解决方案,构建功能完备、服务全面的大模型安全护栏产品矩阵,针对大模型场景存在的各类风险,提供一站式的大模型输入、输出安全护栏产品。


内生安全生态伙伴计划

具体而言,百度大模型安全护栏构建了从云端到边缘侧的立体化防御体系。在云端,系统对文本实施输入输出的全链路管控,依托高精度“红线知识库”与基于权威信源的“信任域RAG”,实现了对敏感问题的精准应答与正向引导,有效避免模型幻觉并符合社会价值观;针对多模态与高级攻击,采用剪枝优化的统一大模型审核方案,在图文融合场景下表现优异,并能通过语义意图与固定模式检测精准识别角色扮演等隐蔽攻击。在端侧,适应端云协同趋势并满足GB/T 45654标准,系统部署了离线安全审核算子,在节省底座模型算力的同时确保离线治理能力,支持用户封禁及敏感词干预,实现了对突发风险的快速响应。


AI安全架构

与此同时,百度将大模型安全评测体系视为保障安全的“生命线”。该体系由海量高质量评测数据集与全流程自动化评测系统构成,不仅全面覆盖通用场景及垂直领域智能体,更能持续吸纳时下最新的风险事件与对抗性样本,保持题库的鲜活性与高对抗性。针对传统人工评测成本高、标准不一的痛点,该体系的核心创新在于引入了微调后的“裁判大模型”进行自动化标注,其准确率已高达95%以上,显著优于人工水平。通过对待测模型的例行化访问与深度评估,系统能快速生成精准报告,为合作伙伴提供科学、高效的安全水位评估,确立模型上线前的最后一道安全防线。


大模型安全评测框架

百度的创新实践不仅体现在技术层面,更重要的是我们始终坚持将安全理念融入大模型全生命周期。从数据清洗、安全对齐、内生安全到大模型安全运营,我们构建了一套完整的原生安全体系。特别在跨模态安全治理方面,我们通过视觉理解与文本语义的双重审核,引入区域关注、跨模态对齐等机制,有效提升了对复合内容的风险管控能力。未来,我们将继续携手行业合作伙伴,以技术创新推动大模型安全的健康发展。我们将在大模型安全领域持续投入,为各行各业提供更加专业、可靠的安全服务,助力人工智能产业的可持续发展,为构建更加安全可信的AI应用环境贡献力量。


0
现金券
0
兑换券
立即领取
领取成功