1. 博客
  2. 爬虫技术
  3. 帖子详情

浙江省建筑市场监管公共服务系统—数据爬虫采集


浙江省建筑市场监管公共服务系统包括企业59264家、人员2385677人、项目195606个。


    浙江省建筑市场监管公共服务系统(https://jzsc.jst.zj.gov.cn)数据包括企业(省内企业、省外企业、进浙企业备案、 企业代表、工程业绩)、人员(省内人员、省外人员 、未入库注册人员、在建项目人员、人员频繁变更、个人代表、工程业绩)、项目     、诚信 (信用评价  、企业诚信 、个人诚信 )、 招投标(招标信息、中标信息)、 资质抽查结果等。


    其中 浙江省建筑市场监管公共服务系统包括企业59264家、人员2385677人、项目195606个。

    

一、企业采集

    请求网页地址:https://jzsc.jst.zj.gov.cn/PublicWeb/index.html#/company

图片.png

    其中接口返回了基本的企业信息其中包括统一社会信用代码、企业名称、法人、所在城市、所在区县、审核时间,其中可以看到corpcode和scucode其实就是信用代码通过AES加密的(解密方式见四、AES加解密)。

企业访问详情:https://jzsc.jst.zj.gov.cn/PublicWeb/index.html#/company/companyDetail?CORPCODE=lGhx2VzBFzf18LjK10MxFvKESUx6TGI1lRXbeSa3eNo%3D

其中CORPCODE就是信用代码AES解密。


二、人员采集

 请求网页地址:https://jzsc.jst.zj.gov.cn/PublicWeb/index.html#/personnel

图片.png

      其中接口返回了基本的人员信息姓名、证件号码、人员类型、人员学历、证书编号、所在企业名称、审核通过时间。其中可以看到访客的时间idcard1和idcard,其中idcard就是证件号码,idcard1是处理过,idcard是通过AES加密的(解密方式见四、AES加解密)。

个体访问详情:https://jzsc.jst.zj.gov.cn/PublicWeb/index.html#/personnel/personnelDeail?IDCard=UXcE5AlPQsbs9eLKgkeNNm0FixiJz2UPJathkkgA5qM%3D

其中IDCardE就是证件号码AES解密。


三、项目采集

 请求网页地址:https://jzsc.jst.zj.gov.cn/PublicWeb/index.html#/project

图片.png

    其中接口返回了基本的项目信息项目名称、项目所在地、施工许可编号、项目分类、施工单位名称、建设单位名称、数据等级、项目进度、项目补录。


四、AES加解密

    该平台采用的是AES方式对企业信用代码和人员证件号进行加解密,采用的是AES/CBC/PKCS7Padding

    key=*********

    iv=*********

图片.png


这里不方便公布秘钥key和偏移量iv,如果需要可以联系作者。

可以加我QQ:2041635829 微信:yi18_net (手机:13518355196)专注于企业爬虫技术;
微信:图片.png


人员 企业 爬虫

关于我

甘三数据网创始人-陈磊(tngou); 7年的互联网老兵,精通WBE技术、爬虫技技术、应用数据处理、大数据开发、自然语言处理与分析; 专业从事数据收集整理多年,并且和大家一起分享应用数据;海量数据,无限未来。

查看名片 →
热门文章
最新动态

陈磊个人信息


TG微信号