互联网公司WAF系统设计

0×01 WAF 简介

WAF 全称是 web Application Firewall, 简单讲就是 web 防火墙，是对 web 业务进行防护的一种安全防护手段。其实，现在很多的移动 app，也是使用的 http 协议进行数据交换，也可以理解成 web 业务，可以对 app server 进行防护。

主要的 web 危害，一般指的是 OWASP Top 10，比如 SQL 注入、XSS、CSRF 等常见的 web 危害方法。当然可能不止这些方法，比如社工。轻则用你的服务器打个 ddos，重则数据全部被盗，损失公司的信誉和 money。

互联网公司的业务倾向于云平台，云 WAF 就应运而生，除去考虑硬件 WAF 的考虑，下面只讲基于互联网公司的需求，打造一款 WAF 联动系统。

0×02 WAF 基本组成

大部分互联网公司的业务，都会使用 Nginx 做各种各样的工作，负载均衡、A/B 测试、Web 网关等等的功能；另外，加上 openresty（nginx + lua) 的开发效率和易用性，提高了程序猿开发 nginx 功能的效率。现在互联网公司招 WAF 开发的，一般都会加上 nginx lua 的要求，可见使用 nginx + lua 开发 WAF，实在是天时地利人和。

现在简单的说一下 WAF 系统的组成。WAF 系统主要是由三部分组成的：执行前端、后端中心系统及数据库。

执行前端是 WAF 的执行引擎，主要是根据规则进行过滤。根据规则匹配的结果，执行相应的动作。

后端中心系统主要是生成规则的逻辑，并与执行前端的 nginx 进行必要的数据交换。

数据库就是存放规则和一些配置及状态的地方，可以根据实际情况，选择关系型数据库或者 Nosql。

其中，可以看到后端中心系统相当于 WAF 的大脑，会根据不同的域名或者设备 hostname 的配置生成对应的逻辑。当执行前端拉取配置和规则时，后端中心会把它对应的内容发给执行前端。这里做成集中式的管理模式，主要是方便统一管理，另外可以监控执行前端的状态，具体的状态数据，可以根据实际的情况进行协商，目前是建议 json 数据走 http 协议，方便易用。当然，数据传输的过程最好还是使用对称加密加 base64 encode。

0×03 WAF 细节考虑

一直比较关注 cloudflare 的云 WAF，基本上 WAF 规则可以考虑为三类（不考虑长亭科技的 sqlchop ，据说有类似的 xss 要开源)：: :one: 通用的规则，比如 sql、xss 规则，拦截恶意爬虫和扫描器等等的非常有效，这种基本上通用的。:two:cms 规则，就是根据不同的 cms，根据相应的漏洞定制的规则，比如 php 网站，不可能存在 java 语言的漏洞，具有专一性。:three: 自定义规则，这就是根据自己的需求，自定义一些规则。根据入侵类型，再细分就会更多了，拦截 shell、爬虫等等的，这里只是输了大概。

在 github 上面，最具参考的 lua waf 就属她了，其它的并不是说不好，然而只有这个最接近 Modsecurity 的逻辑，最突出的有点就是规则的弹性化，最接近 Modsecrity 的规则。不过，里面的很多防御方法，也是可以借鉴的。

执行前端：

基于 p0pr0ck5 的 WAF，二次修改一下，就可以做成上述的执行前端，但是它是有 Bug 的，生产环境下需要线下流量测试。主要在这个基础上，添加拉取配置和规则的 timer 就可以了，有些人说用 zookeeper 什么的，另外还有用的 http 来进行配置更新通知，zookeeper 不建议，当你 reload 的时候，就可以看见很多 nginx 处于 shutting down 状态，就只 zookeeper 处于 keepalive 状态。使用 http 访问加共享内存，京东的涛哥是这样做的，也是有些坑，不过 timer 最简单，每个 worker 单独维护一个配置，避免了锁的情况。

另外，收集日志最好不要用 kafka，打火焰图的时候，明显 cpu 时间有点长，用 tcp 或者 http 发送最靠谱。执行前端大概就是这些内容，记得加上 xpcall 能把一些小的问题 catch 到，避免影响请求。

所有的配置是用 json 传输的，然后转换成 lua 的数据格式，使其能正确识别出 WAF 规则。WAF 规则类似如下：

{
    "vars": [
        {
            "parse": {
                "values": 1
            }, 
            "type": "REQUEST_ARGS"
        }
    ], 
    "pattern": "select[^A-Za-z].*from\\W|union\\W.*select[^A-Za-z]", 
    "actions": {
        "disrupt": "SCORE", 
        "nondisrupt": [
            {
                "action": "setvar", 
                "data": {
                    "key": "anomaly_score", 
                    "col": "TX", 
                    "value": 8, 
                    "inc": 1
                }
            }
        ]
    }, 
    "msg": "SQLInject", 
    "operator": "REGEX", 
    "id": 10001
}

确保 WAF 能够识别出这些规则就可以了，严格按照它的格式来，毕竟 lua 脚本的优势在这里体现的一览无余。

后端中心系统:

后端中心系统同样是使用的 Openresty(别的我也不会，开个玩笑），设计成类似 api 网关，还是那句话好管理。根据不同的域名和设备 Hostname 发送不同的配置。甚至，可以把所有 WAF 的逻辑放到这里，这是 lua 支持热加载的功能。这里是如何做你的 WAF 的关键，主要逻辑还是在这里。

这里是一些基本配置涵盖了：

WAF 基本配置，包括了规则拉取服务配置、日志中心配置及更新组件等配置。
这些基本配置决定了，WAF 主要的逻辑处理。
IP 列表，包括了所有黑名单的 ip，及对应 host 或者 uri 对应的 ip，其中，支持配置生效时间。
规则列表，主要是 Web 入侵规则配置，包括了 default 集合及对应 host 的 waf 配置。

基本配置主要是配置规则拉取服务配置、日志中心配置及更新组件等配置。这些配置也可以有由服务端动态生成。

conifg =  {              
    ip_status = "off",
    waf_status = "off",
    srvhost="127.0.0.1",
    srvport=80,
    srvuir="/api/get_waf_data",
    loghost="127.0.0.1",
    logport=80,
    loguri="/api/post_waf_log",
    deny_code=201,
    delay = 10,
}

IP 列表，其中有些是全局封禁，有些是针对某些接口，配置有过期时间的功能。

ip_list = {
    global_ip = {
        {
            "1.1.1.1",
            0
        },
        {
            "2.2.2.2",
            123124
        },
        {
            "3.3.3.3",
            0
        }
    }
    host = {
        {
            "1.1.1.1",
            123124214
        },
        {
            "2.2.2.2",
            123412412
        }
    }
    host1_uri1 = {
        {
            "1.1.1.1",
            0
        },
        {
            "2.2.2.2",
            123412412
        }
    }
    host2_uri2 = {
        {
            "1.1.1.1",
            1231241
        },
        {
            "2.2.2.2",
            0
        }
    }
},

规则的内容就是上面已经列出的内容了。其中因为要适合配置的逻辑需要根据根据自己的需求进行修改。

数据库和 Web：

数据库规则设计：

CREATE TABLE `waf_rules_info` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `ruleid` int(10) NOT NULL COMMENT '规则id',
  `patterntype` varchar(32) DEFAULT 'REGEX',
  `specific` varchar(255) DEFAULT NULL,
  `vartype` varchar(255) DEFAULT NULL,
  `patternvalue` varchar(255) DEFAULT NULL COMMENT 'base64 封装',
  `action` varchar(32) DEFAULT NULL,
  `score` int(10) DEFAULT NULL,
  `description` varchar(512) DEFAULT NULL COMMENT 'decrption',
  `transforms` varchar(512) DEFAULT NULL COMMENT 'json 结构体',
  `negated` int(5) DEFAULT '0',
  `ruletype` varchar(32) DEFAULT NULL,
  `rulephase` varchar(32) DEFAULT NULL,
  PRIMARY KEY (`id`,`ruleid`),
  KEY `rule_id` (`ruleid`)
) ENGINE=MyISAM AUTO_INCREMENT=53 DEFAULT CHARSET=utf8;

这个是最主要的，有些属性暂时没有设置。

对于 web 而言，主要还是配合下发配置，规则方面，我是设置了三层结构：规则 -> 规则组 ->host。它们只是逻辑上的关系，具体在后面逻辑实现时，会把散列的规则进行分组并根据数据库的逻辑进行组合，生成对唯一 host 的配置。同理，可以设置不同的分组，达到灰度测试的目的。

这是具体规则的 web 设置，规则配置增删改规则，规则分组则是对规则分组的增删改操作，规则应用则是对不同 host 配置不同的规则分组。这里说明一下，规则分组是按照 XSS、SQLi 、灰度等功能分开的，对于 host 进行不同的配置。

目前，阿里云有自定义的规则，太单一，远远比不上 cloudflare 的设计，而且 cloudflare 更贴近互联网公司的需求，最主要的如何让自定义功能更有弹性，更大限度的支持规则的弹性。

简简单单，就说了个大概，如果真的对 WAF 有研究的话，剩余的就比较轻松了，算是抛砖引玉了。

0×04 其它

记得有个作者提到，WAF 位置卡位比较好，现在很多 CC 和扫描器都是在七层防御的，WAF 封禁某些 ip 和用户还是比较靠谱的，另外很多是 cdn 过来的请求，只能靠 x-forward-for 取出来的 ip 进行封禁，当然它可以伪造，就看数据分析的能力，把真实的 ip 抓出来。WAF 规则 p0pr0ck5 提供了一些 Modsecurity 转译的，可以参考它实现自己的规则。另外，WAF 的性能也很重要，章亦春大神的很多讲座 ppt 有提到的，可以作为参考。章亦春大神已经创业了，它打造的商业 openresty 就有 WAF 的支持。

最后，就先写这些吧，有问题的可以私信我，后面会引入大数据分析和安全数据挖掘。第一次发文章，欢迎各位大神轻拍。

来源: http://www.tuicool.com/articles/VBzMZzV

与本文相关文章

暂无,快来抢沙发吧！