1. 博客
  2. 爬虫技术
  3. 帖子详情

全国一般纳税人企业爬虫数据采集


全国一般纳税人企业爬虫数据采集,三种方式抓取一般纳税人企业名单 方式一:通过全国纳税平台;方式二:第三方数据平台;方式三:通过第三方平台下载


 

能评为一般纳税人企业市需要一年达到一定的销售额,并且连续几年有一定的纳税情况。所有一般纳税人企业可以说都是有一定规模的企业。所有一般纳税企业也是一个城市的重要产业。最近在研究一般纳税企业,所有找了几种方式来抓取企业,这里提供三种方式抓取一般纳税人企业名单。


方式一:通过全国纳税平台

现在还没有一个地方可以查询一般纳税人的网站和平台。各个地方税务平台可以查询单个城市整理网址:https://www.tngou.net/blog/show/42 

图片.png 

这里收集的地方上一般纳税人企业查询,但是大多数平台都是,通过名称查询的,没有企业的完整列表,而且还需要纳税识别号才能查询

图片.png 

所有要得到全部的一般纳税人就需要全国的企业的纳税识别号去查询,这个工作量也是很大的。


方式二:第三方数据平台

这里我们就可以考虑通过天眼查或者企查查去查询其实是否市一般纳税人

图片.png 

如果不需要字典相信的信息,就可以直接采集概要,

图片.png 

如果通过第三方平台,我们就可以知道企业是否属于一般纳税人,当问题也是,我们要有全国的企业名单。


方式三:通过第三方平台下载

这里业找到一个可以下载一般纳税人企业名单的地址:https://www.tngou.net/tmall/show/89 (公布的有970万家企业)业可以减轻一些抓取成本,直接用数据。

图片.png

 

    现在能想到的就是这三种方式,但是都需要有一个全国名单才能采集,难度和成本还是比较高的,如果这边找到了其他方式,我也会尽快的更新博客。

 

 

 

 


一般纳税人 爬虫 数据采集

关于我

甘三数据网创始人-陈磊(tngou); 7年的互联网老兵,精通WBE技术、爬虫技技术、应用数据处理、大数据开发、自然语言处理与分析; 专业从事数据收集整理多年,并且和大家一起分享应用数据;海量数据,无限未来。

查看名片 →
热门文章
最新动态

陈磊个人信息


TG微信号