垃圾短信识别及短信分类系统白皮书

2018-09-12 17:23:0812088人阅读

产品简介

垃圾短信识别&短信分类系统是百度依托其在人工智 能特别是深度学习领域和中文处理的多年积累,基于大规 模数据处理和训练框架,并在亿级用户规模的产品上精炼 多年而推出的短信内容识别和精准分类系统。它具有高准 确、高智能、处理速度快、处理吞吐量大和接入简单等特 点,在短信识别和分类领域已经达到业界领先水平。 

 产品架构

image.png

短信内容精准分类

依托百度自主研发的深度学习框架

  • 依托百度对中文自然语言处理领域积累的知识经验,经过 600亿+短信的精炼数据对深度神经网络模型进行训练。 

  • 对短信内容进行精准分类,支持类别包括诈骗、色情违法、 广告、中介等12类(用户可自定义分类)。用户还可以自 定义实时规则,精准的判定短信类别。 

垃圾短信识别

垃圾短信的内容,不仅具有时效强的特点,还会故意改变常见语句用法以对抗反垃圾系统的拦截。除采用深度学习技术之外,在系统层面也具有实时更新的能力,能够针对新产生的垃圾短信和用户举报短信进行及时更新和模型修正,提高准召率。

短信内容鉴定

  • 对短信中的URL进行提取,对URL进行恶意网址分析和分类 。

  • 对短信中电话号码进行提取,对电话号码进行分析是否被标注。

  • 敏感词实时分类,敏感词垃圾短信判别。

  • 对发送的短信进行全内容识别,伪基站短信进行风险分析和分类。

产品规格

1. 关键指标

  • 准确率:99%

  • 召回率:98%

2. 性能指标

  • 吞吐1.2亿条/日/台

  • 处理延时:<30毫秒

3. 行业沉淀

  • 7年磨一剑

  • 上亿用户打磨

  • 600亿短信检验

4. 系统配置

  • 云端部署

  • 加密请求

部署方式

1. API接口方式调用

使用HTTP协议 RESTful风格的接口,简单而快速,可有效降低使用成本和维护成 本。无需对技术人员进行额外的培训,客户即可方便快捷的 将垃圾短信拦截&精准分类功能引入自己的业务。 

2. SDK工具包

使用SDK提供给开发人员进行应用 程序开发的,这样程序员就可以快速 的建立应用软件,而省去了编写硬件 代码和基础代码框架的过程。 


详细文档请戳此下载>>短信识别&分类白皮书.pdf

0
现金券
0
兑换券
立即领取
领取成功