自动化威胁监测报告(2)

报表数据分析

对一些统计数据进行描图，这里以其中一个图为例
pip install matplotlib

matplotlib对中文支持不友好，需要配置一下

# 指定默认字体
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
# 解决负号显示为方块的问题
matplotlib.rcParams['axes.unicode_minus']=False

def draw_pic_2_1(data_list):
    """
    画图2-1
    param:
        data_list: 事件列表
    ret:
        None
    """
    x_data = []
    y_data = []
    for data in data_list:
        x_data.append(data[0])
        y_data.append(data[1])
    bar_width = 0.5
    plt.figure(figsize=(12,8),dpi=80)
    x = [i for i in range(len(x_data))]
    _xtick_labels = x_data
    plt.title('威胁数量图',fontsize=18)
    plt.grid(axis="y",alpha=0.4)
    plt.ylabel("次数",fontsize=14)
    # plt.xlabel("威胁名称",fontsize=14)
    for a,b in zip(x_data,y_data):
        plt.text(a, b+0.05, '%.0f' % b, ha='center', va='bottom',fontsize=14)
    # plt.tick_params(axis='y', labelsize=8)
    # plt.barh(x_data,y_data) #横向条形图
    plt.tick_params(axis='x', labelsize=14)
    plt.tick_params(axis='y', labelsize=14)
    # plt.xticks(x,_xtick_labels,rotation=45)
    # plt.bar(x_data,y_data,width=bar_width)
    plt.xticks(x,_xtick_labels)
    plt.bar(x_data,y_data)
    plt.savefig(r'./preprocessed/pic2-1.jpg')
    # plt.show()

IP归属地查询

要分析威胁事件，首先要查寻一下IP归属地，这里是单独写的一个模块

我采用爬虫的方式，获取相关信息，网站地址就不展示了，一个常用网站，懂得都懂

import requests
import re

class ip_to_addr_spider(object):
    def __init__(self):
        self.url = "https://www.xxxxx.com/iplookup.asp?ip={}&action=2"
        self.headers = {"User-Agent":"Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"}
        
    def get_data(self,ip):
        self.url = self.url.format(ip)
        try:
            response = requests.get(self.url, headers=self.headers, timeout=5).content.decode("gbk")
        except:
            return None
        return response
    def parse_data(self, response):
        re_com = re.compile("""var ip_result.*};""")
        try:
            ret = re_com.search(response)
            data = eval(ret.group(0)[16:-1]) # 截取出所需的数据，转化成python对象
        except:
            data = None
        return data
        
    def run(self,ip):
        response = self.get_data(ip)
        data = self.parse_data(response)
        if data:
            dst_ct = data["ip_c_list"][0]["ct"]
            ASN = data['ASN归属地']
        else:
            dst_ct = None
            ASN = None
        return dst_ct,ASN
        
if __name__ == "__main__":
    ip = "xxx.12.21.xx"
    proxy = ip_to_addr_spider()
    dst_ct,ASN = proxy.run(ip)
    print(ASN)
    print(dst_ct)

因为表中的IP存在一个单元格有多个的情况，需要拆分，并去除内网IP

形成IP列表，方便爬虫发送请求

def deal_with_ip_list(data_list):
    """
    将源目IP中，有几个的情况拆分，并去除内网IP
    param:
        data_list: IP列表
    ret:
        ip_list: 处理好的IP列表
    """
    data_list = data_list[1:]
    new_list = []
    for data in data_list:
        if data.find(",") != -1:
            t_list = data.split(",")
            new_list.extend(t_list)
        else:
            new_list.append(data)
    new_list = set(new_list)
    ip_list = list(new_list)
    new_list = []
    for ip in ip_list:
        if ip.find("192.168") == -1: # 去除内网IP
            new_list.append(ip)
    ip_list = new_list
    return ip_list

筛选出国处的IP

def analyze_ip(ip_list):
    """
    筛选非国内的IP
    param：
        ip_list: 处理过的IP列表
    ret:
        new_list: 国外IP列表
        new_dict: {IP:"国家",}
    """
    new_list = []
    new_dict = {}
    for ip in ip_list:
        time.sleep(0.5)
        ip_spider = IP_spider.ip_to_addr_spider()
        ct,asi = ip_spider.run(ip)
        if ct:
            if ct.find("中国") == -1:
                new_list.append(ip)
                new_dict[ip] = ct
    return new_list,new_dict

筛选第一类高危事件

def high_risk_ip(ip_list, data_list):
    """
    通过对比，IP处于国外且风险为高的情况
    param:
        ip_list:
        data_list: 总行
    ret:
        temp_list: 高危行
    """
    temp_list = []
    for data in data_list:
        d_ip = data[2]
        if d_ip.find(",") != -1:
            t_list = d_ip.split(",")
            for t in t_list:
                if t in ip_list and data[4].find("高")!=-1:
                    temp_list.append(data)
        else:
            if d_ip in ip_list and data[4].find("高")!=-1:
                temp_list.append(data)
    return temp_list