基于网络查询的快速子域名收集工具
主要是为了快速收集 https://src.edu-info.edu.cn 平台的学校子域名等目标写的一些工具集合.
下载 taoman 使用命令:
python taoman.py -f data/edusrc_school_domains.txt
taoman代码基于python2
data 目录:
根据网络查询收集的平台上学校的 10 万左右域名,过滤出的域名元数据与简单统计的数据. 可用 pydictor 的 -tool counter 功能,结合自己需求,筛选data目录内元数据的高频域名单词, 作为针对教育行业子域名爆破的爆破字典.
edusrc_SLD_name_raw_list 常用二级域名单词元数据 edusrc_SLD_top_1000 1000个最常用的二级域名单词 edusrc_SLD_top_3000 3000个最常用的二级域名单词 edusrc_SLD_unique_name 去重后的所有二级域名单词 edusrc_MLD_name_raw_list 常用多级域名单词元数据 edusrc_MLD_top_300 300个最常用的多级域名单词 edusrc_MLD_top_600 600个最常用的多级域名单词 edusrc_school_domains 使用collectfromsrc收集的学校主页地址 edusrc_school_name 使用collectfromsrc收集的学校名字
others 目录:
domain_to_ip.py 一个批量解析域名为ip地址的小脚本,使用socket.gethostbyname方法实现,自动修正非法域名、结果去重. collectfromsrc.py 一个自动收集src平台学校名字并利用百度找到名字对应的主页地址的小脚本
这里其实是用的爆破子域名edusrc_school_domains.txt 是全国高校的主域名
data目录里其他文本是一些字典 也可以自己添加一些字典
等脚本跑完之后会在工具的文件夹里生成一个文本,里面大概会有8万多个子域名