1. 博客
  2. 爬虫技术
  3. 帖子详情

重庆市企业数据名录爬取采集——信用中国(重庆)


重庆企业数据爬虫采集,重庆企业接口,最新企业抓取,信用中国(重庆)网站企业信息爬取。


信用中国(重庆)


一、平台介绍

网址:http://www.creditsc.gov.cn

图片.png

    该网站主要收集了重庆市企业名录库,当前总计151万 条结果,2020年重庆市公布的市场主体已经有280万市场主体。该重庆新用户中的150万条,主要是公司类型:有限公司,个人独资公司,集团公司……其中不包含个体工商。


二、全量数据抓取分析:

重庆信用平台相对其他平台抓取简单地多,我们可以访问搜索界面,

网站: http://www.xycq.gov.cn/html/query/credit/list.html     

图片.png

    通过该页面,我们可以看到反话的总数,企业名称和信用代码,这里可以通过页面不断的变化就能抓取了所以企业信息。这里页面显示虽然只有10页,但是可以通过其方式来遍历所以数据(我这里就不相信讲解,如果需要可以联系我【微信:13880334484(手机同号),QQ:397713572】)



三、新增企业抓取:

    网站存储企业id直接是id自增长 例如URL :http://www.xycq.gov.cn/html/query/credit/detail.html?ids=962445 中的ids就企业id,我们可以通过id添加的方式来实现抓取最新企业。只要我们不断的记录最大的id,这样就能实现企业新增抓取,通用用这个方式也可以抓取全量数据。

企业详情抓取详情页面:http://www.xycq.gov.cn/html/query/credit/detail.html?ids=1354468&contentType=1 

图片.png

    信用中国(重庆),给的工商注册数据相对比较少主要是

名称、 统一社会信用代码、地址、工商注册号、法人信息、成立日期、企业类型、注册机关;

行政许可、行政处罚、守信红名单、黑名单;这些基本信息,同时也缺少,注册资本,经营范围等等重要的工商注册信息。

但对于要求不高这些信息住够满足基本需求。


4、信息补充

    重庆信用中国公布的工商信息相对比较少,我们可以通过抓取的名称到国家工商局和第三方企业平台(企查查、天眼查)  去查询相关的详细信息(我这里就不解释如果通过其他平台取得更大信息,如果需要可以联系我【微信:13880334484(手机同号),QQ:397713572】)   。由于信用中国(重庆)只提供了公司,对需要个体数据也是一个相对的难点,我在这里推荐一个专门的重庆工商数据接口平台(https://www.tngou.net/doc/show/2  ),其中就提供了企业和个体接口列表:

    1、企业列表接口https://www.tngou.net/openapi/v1/comp/complist?api_id=1&ProvinceCode=50&Type=1&sign=236cd91fe607bb380cd0238ace653dc5&ssl=on 

    2、个体工商接口https://www.tngou.net/openapi/v1/comp/complist?api_id=1&ProvinceCode=50&Type=0&sign=d0c0d1e84a1fca515b2bd020c2a6e2ba&ssl=on

通过这两个接口就能取到重庆市全量的企业和个体。

            

        


重庆企业名录 企业大全

关于我

甘三数据网创始人-陈磊(tngou); 7年的互联网老兵,精通WBE技术、爬虫技技术、应用数据处理、大数据开发、自然语言处理与分析; 专业从事数据收集整理多年,并且和大家一起分享应用数据;海量数据,无限未来。

查看名片 →
热门文章
最新动态

陈磊个人信息


TG微信号