旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

这篇具有很好参考价值的文章主要介绍了旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

“旅”是旅行,外出,即为了实现某一目的而在空间上从甲地到乙地的行进过程;

“游”是外出游览、观光、娱乐,即为达到这些目的所作的旅行。

二者合起来即旅游。所以,旅游不但有“行”,且有观光、娱乐含义。

知识点:

  • requests 发送网络请求

  • parsel 解析数据

  • csv 保存数据

开发环境:

  • 版 本: python 3.8

  • 编辑器:pycharm 2021.2

第三方库:

  • requests >>>发送网络请求的模块

  • parsel >>> 解析数据的模块

第三方模块安装:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:

pip install -i https://pypi.doubanio.com/simple/ requests

python资料、源码、教程\福利皆: 点击此处跳转文末名片获取

旅游数据采集

import requests
import parsel
import csv
import time
import random
csv_qne = open('去哪儿.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.writer(csv_qne)

写入数据

csv_writer.writerow(['地点', '短评', '出发时间', '天数', '人均消费', '人物', '玩法', '浏览量'])

(1) 向目标网址发送请求 (get, post)

for page in range(1, 201):
    url = f'https://*****/travelbook/list.htm?page={page}&order=hot_heat'
    # <Response [200]>: 告诉我们 请求成功了
    response = requests.get(url)

(2). 获取数据(网页源代码)

    html_data = response.text

(3). 解析网页(re正则表达式,css选择器,xpath,bs4/六年没更新了,json)

    selector = parsel.Selector(html_data)
    # ::attr(href) url_list:列表
    url_list = selector.css('.b_strategy_list li h2 a::attr(href)').getall()
    for detail_url in url_list:
        # 字符串的 替换方法
        detail_id = detail_url.replace('/youji/', '')
        url_1 = 'https://*****/travelbook/note/' + detail_id
        print(url_1)

(4). 向详情页网站发送请求(get,post)

        response_1 = requests.get(url_1).text

(5).解析网页(re正则表达式,css选择器,xpath,bs4 / 六年没更新了,json)

        selector_1 = parsel.Selector(response_1)
        # :nth-child(): 伪类选择器
        # ::text 提取文本内容
        # * 代表所有
        # 地点
        title = selector_1.css('.b_crumb_cont *:nth-child(3)::text').get().replace('旅游攻略', '')
        # 短评
        comment = selector_1.css('.title.white::text').get()
        # 出发日期
        date = selector_1.css('#js_mainleft > div.b_foreword > ul > li.f_item.when > p > span.data::text').get()
        # 天数
        days = selector_1.css('#js_mainleft > div.b_foreword > ul > li.f_item.howlong > p > span.data::text').get()
        # 人均消费
        money = selector_1.css('#js_mainleft > div.b_foreword > ul > li.f_item.howmuch > p > span.data::text').get()
        # 人物
        character = selector_1.css('#js_mainleft > div.b_foreword > ul > li.f_item.who > p > span.data::text').get()
        # 玩法
        play_list = selector_1.css('#js_mainleft > div.b_foreword > ul > li.f_item.how > p > span.data span::text').getall()
        play = ' '.join(play_list)
        # 浏览量
        count = selector_1.css('.view_count::text').get()
        # None: 空值 当前没有提取到内容 就会为空
        print(title, comment, date, days, money, character, play, count)

(6). 保存数据 (保存为文本,保存到数据库,保存特定格式的文件)

        # 保存成csv
        csv_writer.writerow([title, comment, date, days, money, character, play, count])
        # 设置了延迟 为的就是避免  爬虫程序被抓到
        time.sleep(random.randint(3, 5))
csv_qne.close()
    """
    报错, 请求次数过于频繁 导致ip被限制, 此时我们有两种方法
        1. 搭建自己的ip代理池
            在系统课程当中会教大家怎么搭建自己的代理池
            怎么加快爬虫的效率问题
        2. 通过延迟操作 去模拟正常用户发送请求
            延迟时间尽量不去固定
    """

攻略分析

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

综上述分析可得到一些结论:

个人认为性价比较高的旅游城市:杭州、成都。

旅游天数大多控制在2-5天内,不宜过多。

三五好友一起旅游是最令人们喜欢的出游方式。

“摄影”与“美食”已成为旅游的代名词。

避开旅游高峰期,三月和六月的周末短途旅行也是不错的选择。

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇文章来源地址https://www.toymoban.com/news/detail-467857.html

到了这里,关于旅游有哪些好玩的地方? 今天用python分析适合年轻人的旅游攻略的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 区块链论文一般发表在哪些地方?

    会议类 : 安全、密码、分布式理论方面的会议:IEEE SP (Oakland),、ACM CCS,、IACR Crypto、IACR Eurocrypto、USENIX Security、ACM PODC。 分布式系统、网络系统、数据库系统方面的会议:USENIX NSDI、ACM SIGMOD、IEEE ICDCS 和 IEEE Infocom等。 其余比较小众的:IFCA Financial Crypto、ISOC NDSS 期刊类 : 目前

    2024年01月24日
    浏览(26)
  • 大数据爬虫分析基于Python+Django旅游大数据分析系统

    欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。    基于Python和Django的旅游大数据分析系统是一种使用Python编程语言和Django框架开发的系统,用于处理和分析旅游行业的大数据,为旅游从业者和决策者提供有关旅游趋势、客户需求、市场竞争

    2024年02月03日
    浏览(47)
  • 【python】python旅游网数据抓取分析(源码+论文)【独一无二】

    👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 每个爬虫针对特定的目标网站(去哪儿网

    2024年02月04日
    浏览(43)
  • 2.Python数据分析项目——旅游景点票价预测

    流程 具体操作 基本查看 查看缺失值、查看数值类型 预处理 缺失值处理(填充)拆分数据(获取有需要的值) 、统一数据格式 数据分析 groupby分组求最值数据、seaborn可视化 预测(RandomForestRegressor) 拆分数据集、建立模型、训练模型、预测、评估模型 数量查看:条形图 占

    2024年02月10日
    浏览(43)
  • 新手小白做跨境电商有哪些注意的地方?

    近两年,受疫情刺激,线上电商出现前所未有的高速增长,中国品牌纷纷出海,跨境电商腾飞。此外,国内电商市场发展趋于平淡,市场需求不断萎缩,也让越来越多的大卖家和平台盯上了这块大蛋糕。不仅中小企业入驻亚马逊、全球速卖通等平台,国内几大电商巨头也纷纷

    2024年02月01日
    浏览(31)
  • Python爬取旅游网站数据机票酒店价格对比分析

    本文将介绍如何使用Python爬虫从旅游网站上获取机票和酒店的价格数据,并实现价格对比分析,帮助你做出明智的旅行决策。我们提供了完善的方案和代码,让你能够轻松操作并获得实际价值。 使用Python爬虫获取旅游网站上的机票和酒店价格数据,可以帮助你快速比较不同供

    2024年02月10日
    浏览(23)
  • 基于python的旅游信息爬取以及数据分析

    收藏和点赞,您的关注是我创作的动力   随着计算机网络技术的发展,近年来,新的编程语言层出不穷,python语言就是近些年来最为火爆的一门语言,python语言,相对于其他高级语言而言,python有着更加便捷实用的模块以及库,具有语法简单,语句清晰的特点,使得它在代

    2024年02月04日
    浏览(43)
  • ChatGPT成为工作工具,具体都应用在哪些地方?

      Verified Market Research估计,到2030年,人工智能写作辅助软件市场将达到约65亿美元,复合年增长率为27%。生成式人工智能的浪潮正在席卷世界各地的营销部门。 Botco对美国1000名工作人员进行的调查发现,73%的人表示他们会利用生成式AI工具来创建文本、图像、视频或其他营销

    2024年02月12日
    浏览(28)
  • 基于Python热门旅游景点数据分析系统设计与实现

    博主介绍 : ✌全网粉丝30W+,csdn特邀作者、博客专家、CSDN新星计划导师、java优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战 ✌ 🍅 文末获取源码联系 🍅 👇🏻 精彩专栏 推荐订阅 👇🏻 不然下次找不到哟 java项目精品实战

    2024年02月11日
    浏览(35)
  • 大火的AIGC是什么?能用到工作中哪些地方?

    AIGC(即Artificial Intelligence Generated Content),中文译为人工智能生成内容。简单来说,就是以前本来需要人类用思考和创造力才能完成的工作,现在可以利用人工智能技术来替代我们完成。 在狭义上,AIGC是指利用AI自动生成内容的生产方式,比如自动写作、自动设计等。在广义

    2024年02月12日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包