为千行百业植入“安全基因”！百度加入“内生安全生态伙伴计划”

2025 百度 ESG 报告发布：以 AI 筑盾，共建可信数字生态

产品人气榜

为千行百业植入“安全基因”！百度加入“内生安全生态伙伴计划”

2025-12-03 15:49:4816972人阅读

11月28日，由紫金山实验室主办的第五届网络空间内生安全学术大会暨IEEE CRESS 2025国际会议在南京启幕。大会由中国通信学会、中国计算机学会、中国汽车工程学会、中国网络空间安全学会指导，紫金山实验室主办，以“AI+生态构建新挑战，安全可信新机遇”为主题，集中展现我国在网络空间内生安全领域的原创突破与产业实践成果。同时，大会正式启动“内生安全生态伙伴计划”，该计划联合了百度、奇安信、深信服等行业领军企业开展深度合作，形成共生共存的产业生态链条，以加速技术创新与成果转化，让内生安全技术更好地赋能千行百业。

第五届网络空间内生安全学术大会

大模型技术的深度应用在释放生产力的同时，也潜藏着多重安全隐患。一旦保护不到位，可能导致用户隐私泄露，甚至被用于诈骗、盗用身份等违法犯罪活动。技术开发过程中，若核心数据或算法被窃取，不仅损害企业利益，还可能被不法分子篡改功能，导致模型输出错误结果，影响医疗、金融等关键领域。这些风险不仅威胁企业及个人权益，还可能破坏社会信任，甚至影响国家安全。因此，需要通过加强数据保护、完善技术架构、制定行业规范等多方面措施，以确保大模型在安全可控的前提下发挥作用。为此，百度提出了大模型安全护栏建设理念，为行业提供了一套系统性的内生安全解决方案，构建功能完备、服务全面的大模型安全护栏产品矩阵，针对大模型场景存在的各类风险，提供一站式的大模型输入、输出安全护栏产品。

内生安全生态伙伴计划

具体而言，百度大模型安全护栏构建了从云端到边缘侧的立体化防御体系。在云端，系统对文本实施输入输出的全链路管控，依托高精度“红线知识库”与基于权威信源的“信任域RAG”，实现了对敏感问题的精准应答与正向引导，有效避免模型幻觉并符合社会价值观；针对多模态与高级攻击，采用剪枝优化的统一大模型审核方案，在图文融合场景下表现优异，并能通过语义意图与固定模式检测精准识别角色扮演等隐蔽攻击。在端侧，适应端云协同趋势并满足GB/T 45654标准，系统部署了离线安全审核算子，在节省底座模型算力的同时确保离线治理能力，支持用户封禁及敏感词干预，实现了对突发风险的快速响应。

AI安全架构

与此同时，百度将大模型安全评测体系视为保障安全的“生命线”。该体系由海量高质量评测数据集与全流程自动化评测系统构成，不仅全面覆盖通用场景及垂直领域智能体，更能持续吸纳时下最新的风险事件与对抗性样本，保持题库的鲜活性与高对抗性。针对传统人工评测成本高、标准不一的痛点，该体系的核心创新在于引入了微调后的“裁判大模型”进行自动化标注，其准确率已高达95%以上，显著优于人工水平。通过对待测模型的例行化访问与深度评估，系统能快速生成精准报告，为合作伙伴提供科学、高效的安全水位评估，确立模型上线前的最后一道安全防线。

大模型安全评测框架

百度的创新实践不仅体现在技术层面，更重要的是我们始终坚持将安全理念融入大模型全生命周期。从数据清洗、安全对齐、内生安全到大模型安全运营，我们构建了一套完整的原生安全体系。特别在跨模态安全治理方面，我们通过视觉理解与文本语义的双重审核，引入区域关注、跨模态对齐等机制，有效提升了对复合内容的风险管控能力。未来，我们将继续携手行业合作伙伴，以技术创新推动大模型安全的健康发展。我们将在大模型安全领域持续投入，为各行各业提供更加专业、可靠的安全服务，助力人工智能产业的可持续发展，为构建更加安全可信的AI应用环境贡献力量。

热门主题

热门文章

为千行百业植入“安全基因”！百度加入“内生安全生态伙伴计划”