已解决requests.exceptions.MissingSchema: Invalid URL

这篇具有很好参考价值的文章主要介绍了已解决requests.exceptions.MissingSchema: Invalid URL。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

已解决Python爬虫报错requests.exceptions.MissingSchema: Invalid URL 解决方法,亲测有效!!!









报错问题



粉丝群里面的一个小伙伴遇到问题跑来私信我,想用python爬虫爬取数据,已经拿到URL再次往下访问,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下所示:

def get_html_str(url):
    authority = re.findall("img\d.*?\.360buyimg.com", url)[0]
    path = url.replace(authority, '')
    path = path.replace('https://', '')
    headers = {'User-Agent': random.choice(ua_list),
               'authority': authority,
               'method': 'GET',
               'path': path,
               'scheme': 'https',
               'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
               'Accept-Encoding': 'gzip, deflate, br',
               'Accept-Language': 'zh-CN,zh;q=0.9',
               'Cache-Control': 'max-age=0',
               'sec-ch-ua': '"Not_A Brand";v="99", "Google Chrome";v="109", "Chromium";v="109"',
               'sec-ch-ua-mobile': '?0',
               'sec-ch-ua-platform': '"Windows"',
               'sec-fetch-dest': 'document',
               'sec-fetch-mode': 'navigate',
               'sec-fetch-site': 'none',
               'sec-fetch-user': '?1',
               'upgrade-insecure-requests': '1'

               }
    pp = get_ip.ProxiesPool(1, 1, '微博爬虫')
    proxies = pp.get_one_proxies_from_pool()
    pp.conn_close()
    try:
        r = requests.get(url, headers=headers, proxies=proxies)
    except:
        while True:
            r = requests.get(url, headers=headers, proxies=proxies, timeout=20)
            if r.status_code == '200':
                break
    html_str = r.content

    return html_str

报错信息如下所示

requests.exceptions.MissingSchema: Invalid URL '//img10.360buyimg.com/n7/jfs/t1/100311/13/29804/192054/628720f2E8729cc85/73fc66160d584283.jpg': No schema supplied. Perhaps you meant http:////img10.360buyimg.com/n7/jfs/t1/100311/13/29804/192054/628720f2E8729cc85/73fc66160d584283.jpg?



报错翻译



报错信息翻译如下所示

requests.例外情况.缺少架构:URL无效。



报错原因



报错原因

因为网页源码里面返回的URL链接只有半截如下所示:

已解决requests.exceptions.MissingSchema: Invalid URL



解决方法



用字符串和半截URL拼接一下就好了:

url = 'https:' + goods_image

以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!

千人全栈VIP答疑群联系博主帮忙解决报错

由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html

  • 优点作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!

  • 专栏福利简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等

  • 注意:如果希望得到及时回复,和大佬们交流学习,订阅专栏后私信博主进千人VIP答疑群已解决requests.exceptions.MissingSchema: Invalid URL
    已解决requests.exceptions.MissingSchema: Invalid URL

免费资料获取,更多粉丝福利,关注下方公众号获取

已解决requests.exceptions.MissingSchema: Invalid URL文章来源地址https://www.toymoban.com/news/detail-443116.html

到了这里,关于已解决requests.exceptions.MissingSchema: Invalid URL的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【报错解决】selenium.common.exceptions.WebDriverException: Message: invalid argument

    在做Web自动化测试的实验报告的时候遇到一个报错。 运行代码: 报错: selenium.common.exceptions.WebDriverException: Message: invalid argument (Session info: chrome=113.0.5672.92) (Driver info: chromedriver=113.0.5672.63 (0e1a4471d5ae5bf128b1bd8f4d627c8cbd55f70c-refs/branch-heads/5672@{#912}),platform=Windows NT 10.0.19044 x86_64) 这

    2024年02月05日
    浏览(46)
  • requests.exceptions.SSLError解决方案

    事实上在 requests 里面,要修改 Cipher Suits 中的加密算法,需要修改 urllib3 里面的 ssl 上下文,并实现一个新的 HTTP 适配器( HTTPAdapter )。 debug跟踪到了几处可能可以修改TLS握手特征的代码 路径如下:/usr/local/lib/python3.9/site-packages/urllib3/util/ssl_.py其中, session.mount 的第一个参数表

    2024年02月05日
    浏览(41)
  • 已解决selenium.common.exceptions.WebDriverException: Message: invalid session id

    已解决selenium循环翻页抛出selenium.common.exceptions.WebDriverException: Message: invalid session id的正确解决方法,亲测有效!!! 粉丝群里面的一个小伙伴遇到问题跑来私信我,想用selenium循环翻页,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,

    2023年04月08日
    浏览(54)
  • selenium.common.exceptions.InvalidSessionIdException: Message: invalid session id 报错解决方法

    原因是在使用webdriver之前调用了 close_driver() 将webdriver关闭了,则webdriver就失效了。 在使用selenium进行自动获取信息时,报错:InvalidSessionIdException: Message: invalid session id 因为我需要获取多个页面的数据,让他自动进入下一页获取信息,但是我却在让他在第一页完了后就关闭了

    2024年02月11日
    浏览(52)
  • 已解决selenium.common.exceptions.InvalidCookieDomainException: Message: invalid cookie domain: Cookie ‘

    已解决selenium.common.exceptions.InvalidCookieDomainException: Message: invalid cookie domain: Cookie ‘domain’ mismatch 粉丝群里面的一个小伙伴遇到问题跑来私信我,想用selenium携带cookie登录网站,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一

    2024年02月07日
    浏览(34)
  • 成功解决requests 报错raise SSLError(e, request=request)_requests.exceptions.SSLError_ HTTPSConnectionPool

    问题描述 在使用requests调用https接口时,会遇到ssl证书报错 解决思路 因为有的网站需要验证书,比如:12306, 所以只需要加加上参数:verify=证书路径,或verify=Flase 解决方法 步骤1: 在requests请求时,加上参数Verify 但是,加上参数后,会有警告,提示安全问题 如何忽略警告呢

    2024年02月12日
    浏览(50)
  • Python爬虫-requests.exceptions.SSLError: HTTPSConnectionPool疑难杂症解决(1)

    前言 本文是该专栏的第7篇,后面会持续分享python爬虫案例干货,记得关注。 在爬虫项目开发中,偶尔可能会遇到SSL验证问题“ requests.exceptions.SSLError: HTTPSConnectionPool (host=\\\'www.xxxxxx.com\\\', port=443): Max retries exceeded with url ... ”。亦或是验证之后的提示警告“ InsecureRequestWarning: Un

    2024年02月05日
    浏览(44)
  • 微信公众号 H5 JS-SDK wx.config 报错 invalid url domain 及 invalid signature 错误原因及解决方式

    在项目进行JSSDK使用的过程中,出现了很多问题,其中报错invalid url domain 以及 invalid signature最多,也最头疼,部分坑在文档里也并没有写清楚,这里就简单说下这两个报错的原因和解决方式 当报错invalid url domain时 其实离成功不远了,错误原因也很直白,就是url并没有在公众

    2024年02月08日
    浏览(40)
  • 已解决requests.exceptions.ConnectionError: (‘Connection aborted .’, ConnectionResetError(10054,“远程主机强迫关

    已解决(Python爬虫报错,设置代理ip解决)requests.exceptions.ConnectionError: (‘Connection aborted .’, ConnectionResetError(10054,\\\"远程主机强迫关闭了一个现有的连接。\\\',None,1656,None) 粉丝群里面一个小伙伴想用Python爬虫爬取图片,但是发生了报错问题(连安装模块都要出问题,当时他

    2024年01月16日
    浏览(54)
  • 已解决java.lang.IllegalArgumentException: Invalid character found in the request target.

    已解决java.lang.IllegalArgumentException: Invalid character found in the request target. 下滑查看解决方法 java.lang.IllegalArgumentException: Invalid character found in the request target. 对于Java.lang.IllegalArgumentException: Invalid character found in the request target的错误,可能是由于URL中包含了非法字符所致。 下滑查看

    2024年02月16日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包