【python】批量获取企业公司的统一社会代码

这篇具有很好参考价值的文章主要介绍了【python】批量获取企业公司的统一社会代码。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1.任务需求

输入

输出

2.解决办法 

3.运行结果

4.特殊情况

4.1 公司统一社会代码为0?

4.2 搜索次数过多,会弹出验证码或者登陆界面?

4.3 安装selenium包,提示没有find_element_by_id用法?


1.任务需求

输入

 给定一个公司企业的列表,用excel存放,如下图所示: 

批量查询企业统一社会信用代码,Pytorch,python,开发语言,统一社会代码,企查查,selenium

输出

通过企查查(或者天眼查等)获取企业的18位统一社会代码,最终存放在excel中,如下所示:

批量查询企业统一社会信用代码,Pytorch,python,开发语言,统一社会代码,企查查,selenium

2.解决办法 

使用python中的web自动化测试包selenium可以解决。

代码如下:

import openpyxl
from time import sleep

#获取查询名单
list_name = []
path = r'C:\Users\Aiken\Desktop\data.xlsx'
wb = openpyxl.load_workbook(path)
wb_sheet = wb['Sheet2']
maxrows = wb_sheet.max_row
for i in range(maxrows-1):
    name = wb_sheet.cell(i+2,1).value
    list_name.append(name)


from selenium import webdriver
# #进入企查查
driver = webdriver.Chrome()
url = 'https://www.qcc.com/?utm_source=baidu1&utm_medium=cpc&utm_term=pzsy'
driver.get(url)
driver.refresh()

sleep(15)
cnt = 0
for j in list_name:
    cnt += 1
    # 如果发生需要验证码或者登陆的情况,可以用if判断在上一次中断的地方继续
    # if(cnt >= 353) :
    # sleep(1)
    driver.find_element_by_id('searchKey').clear() #定位到搜索框
    driver.find_element_by_id('searchKey').send_keys(j) #在搜索框中输入查询企业名单
    try:
        driver.find_element_by_xpath('/html/body/div[1]/div[2]/section[1]/div/div/div/div[1]/div/div/span/button').click()
    except:
        driver.find_element_by_xpath('/html/body/div[1]/div[1]/div/div/div/div/div/div/span/button').click()
    try:
        name_id = driver.find_element_by_xpath('/html/body/div[1]/div[2]/div[2]/div[3]/div/div[2]/div/table/tr[1]/td[3]/div/div[4]/div[1]/span[4]/span/div/span[1]').text
    except:
        name_id = "0000"
    print(cnt, j, name_id)

    wb_sheet.cell(list_name.index(j)+2,2,value = name_id)

wb.save(path)
wb.close()
driver.close()




3.运行结果

终端会输出相关信息,同时如果不报错的话,会直接写入到excel中。

批量查询企业统一社会信用代码,Pytorch,python,开发语言,统一社会代码,企查查,selenium

4.特殊情况

4.1 公司统一社会代码为0?

部分公司数据可能为0,这是因为有的公司的企查查信息布局不一样,导致使用html语法定位时候没找到数据。如果数据量少,可以直接手动修改。如果数据量多,可以修改代码。

4.2 搜索次数过多,会弹出验证码或者登陆界面?

可以设置好睡眠时间sleep(10),手动扫码登陆,然后通过断点的方式继续输出,然后把输出的数据放到txt中,再转化一下就行。 (更好的办法肯定是解决反爬虫机制!)

批量查询企业统一社会信用代码,Pytorch,python,开发语言,统一社会代码,企查查,selenium

 

4.3 安装selenium包,提示没有find_element_by_id用法?

这是因为高版本的selenium更改了语法方式。可以把selenium版本更改为3.3.1(亲测可行)文章来源地址https://www.toymoban.com/news/detail-807036.html

到了这里,关于【python】批量获取企业公司的统一社会代码的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 以数字孪生技术服务社会,推动企业高质量发展

           随着“十四五”规划和2035年远景目标纲要中提出,要加快数字化发展,建设数字中国。为建设数字孪生智慧城市提供了国家战略指引。         新兴技术是数字孪生发展的助推剂,臻图信息通过数字孪生技术及研发的实景三维渲染引擎,搭载自主研发的ZTMap3D技

    2024年02月15日
    浏览(55)
  • 【Python网络爬虫】企查查高级搜索及批量查询接口爬虫

    写在前面: 本文所介绍的企查查爬虫代码需要用到cookie,且cookie所对应的账号需要为vip或以上等级具有高级搜索和批量查询的功能,无此功能的账号暂不支持; 本文所介绍的是在其他人分析了前端headers哈希加密后的基础上的进一步补充和完善,并会提供完整的请求代码;

    2024年02月03日
    浏览(46)
  • 使用python制作一个批量查询搜索排名的SEO免费工具

    💂 个人网站:【海拥】【摸鱼游戏】【神级源码资源网】 🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】 💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 最近工作中需要用上 Google SEO(搜索引擎优化),有了解过的朋友们应该都知道SEO必不

    2024年02月09日
    浏览(58)
  • 【Python&GIS】基于高德Api实现批量地址查询经纬度

            之前因为同事需要几千个小区的经纬度信息,所以就帮同事写了一段Python代码,通过调取高德地图的api实现地址查询经纬度这个功能。对于如何使用经纬度查询地址的方法,我之前分享过博文:【Python入门教程】获取图片可视化精准定位(逆地理编码),如果大家感

    2024年02月03日
    浏览(54)
  • 当~python批量获取某电商:商品数据并作可视化

    前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 开发环境: 首先我们先来安装一下写代码的软件(对没安装的小白说) Python 3.8 / 编译器 Pycharm 2021.2版本 / 编辑器 专业版是付费的 文章下方名片可获取魔法永久用~ 社区版是免费的 第三方模块使用: requests pip install requests 数据请

    2024年02月04日
    浏览(44)
  • 企业邮箱安全对比:哪家公司的产品更可靠?

    邮箱仍然是企业沟通的关键组成部分,但往往容易受到安全威胁。为了保护敏感信息,企业需要采取措施使企业邮箱更加安全。这可以通过投资先进的安全解决方案,创建限制或控制访问的策略,并定期对员工进行最佳实践培训来实现。 企业应该投资于能够检测和响应安全威

    2024年02月02日
    浏览(48)
  • python爬虫练手项目之获取某地企业名录

    因为很多网站都增加了登录验证,所以需要添加一段利用cookies跳过登陆验证码的操作 cookies获取方式 chrmoe浏览器,F12,把name和value填入cookies agent获取方式 任意点击一条网络资源,右侧headers往下翻到底 测试访问是否成功 访问成功的话进入下一步 一般翻页后查看网址变化就能

    2024年02月07日
    浏览(43)
  • <信息安全>《2 国内主要企业网络安全公司概览(二)》

    信息 内容 LOGO 成立日期 创始于1995年 总部 北京市海淀区上地东路1号院3号楼北侧301室 背景 民营企业 是否上市 天融信[002212]A股 市值 99亿 主要产品 网络安全 大数据 云服务 员工规模 6000多人 简介 天融信科技集团(证券代码:002212)创始于1995年,是上市公司中成立最早的网络

    2024年01月22日
    浏览(49)
  • (企业 / 公司项目)微服务项目解决跨域问题:

    前后端分离项目中前端出现了跨域的问题  在网关模块配置文件中添加 配置 application.properties

    2024年02月05日
    浏览(68)
  • 公司运营数据分析大屏:引领企业决策,驱动业务增长

    在数字化时代,数据已经成为企业决策的关键。为了更好地 洞察市场趋势 、 优化业务流程 、 提升运营效率 ,越来越多的企业开始引入数据分析大屏以分析公司运营状况。这一创新举措不仅改变了传统的管理模式,更引领企业迈向智能化决策的新篇章。 公司运营数据分析大

    2024年01月16日
    浏览(64)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包