Python天气数据处理、数据清洗

这篇具有很好参考价值的文章主要介绍了Python天气数据处理、数据清洗。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文章目录

前言

一、获取原始数据

二、数据处理

1.代码

2.处理结果

总结



前言

        在工作的时候,需要做一个天气情况的报表,一开始没学习爬虫的时候,需要手动到天气网站上去截取天气数据做到表格里,复制粘贴下来的数据需要做一些处理,考虑用Python简化这些步骤。


一、获取原始数据

        从全国城市天气预报_城市天气预报查询_国内天气预报查询_天气网中进入需要查询的城市,选择40天天气,选中需要的内容复制粘贴到EXCEL表里,不同城市放到不同的SHEET里,序号、城市列为固定列,只需更新内容列。

用什么编写天气预测数据清洗(源程序),python,开发语言

用什么编写天气预测数据清洗(源程序),python,开发语言用什么编写天气预测数据清洗(源程序),python,开发语言用什么编写天气预测数据清洗(源程序),python,开发语言

二、数据处理

1.代码

        由于粘贴到EXCEL里的数据形式比较规律,因此只需找到排列规律进行操作即可,观察可知同类数据所在位置为序号间隔为3的等差数列,遍历数据列取出间隔为3的数据即可,取出数据后通过数据清洗呈现为自己想要的格式,代码如下:

import pandas as pd
import numpy as np
df2excel = pd.ExcelWriter('future.xlsx',engine='xlsxwriter')
#北京
sheetName="北京"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
A=sheet["序号"]
B=sheet["内容"]
C=sheet["城市"]
D=[]
E=[]
F=[]
n1=1
n2=2
n3=3
n=1
for i in range(0,120,3):
    S=B[i]
    D.append(S)
for j in range(1,120,3):
    S1=B[j]
    E.append(S1)
for k in range(2,121,3):
    S2=B[k]
    F.append(S2)     
DataSet1 = list(zip(D,E,F))
df = pd.DataFrame(data = DataSet1,columns=["日期","天气","温度"])
res=df['温度'].str.split('~',expand=True)
df[['低温','温度']]=res
df['温度']=df['温度'].str.replace('℃','')
riqi=df.pop('日期')
riqi=riqi.str[:5]
df.insert(0,'日期',riqi)

#上海
sheetName="上海"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
A=sheet["序号"]
B=sheet["内容"]
C=sheet["城市"]
D=[]
E=[]
F=[]
n1=1
n2=2
n3=3
n=1
for i in range(0,120,3):
    S=B[i]
    D.append(S)
for j in range(1,120,3):
    S1=B[j]
    E.append(S1)
for k in range(2,121,3):
    S2=B[k]
    F.append(S2)     
DataSet1 = list(zip(D,E,F))
df1 = pd.DataFrame(data = DataSet1,columns=["日期","天气","温度"])
res=df1['温度'].str.split('~',expand=True)
df1[['低温','温度']]=res
df1['温度']=df1['温度'].str.replace('℃','')
riqi=df1.pop('日期')
riqi=riqi.str[:5]
df1.insert(0,'日期',riqi)

#广州
sheetName="广州"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
A=sheet["序号"]
B=sheet["内容"]
C=sheet["城市"]
D=[]
E=[]
F=[]
n1=1
n2=2
n3=3
n=1
for i in range(0,120,3):
    S=B[i]
    D.append(S)
for j in range(1,120,3):
    S1=B[j]
    E.append(S1)
for k in range(2,121,3):
    S2=B[k]
    F.append(S2)     
DataSet1 = list(zip(D,E,F))
df3 = pd.DataFrame(data = DataSet1,columns=["日期","天气","温度"])
res=df3['温度'].str.split('~',expand=True)
df3[['低温','温度']]=res
df3['温度']=df3['温度'].str.replace('℃','')
riqi=df3.pop('日期')
riqi=riqi.str[:5]
df3.insert(0,'日期',riqi)

df.to_excel(df2excel,index=False,sheet_name="北京")
df1.to_excel(df2excel,index=False,sheet_name="上海")
df3.to_excel(df2excel,index=False,sheet_name="广州")
df2excel.save()

2.处理结果

结果如下:

用什么编写天气预测数据清洗(源程序),python,开发语言用什么编写天气预测数据清洗(源程序),python,开发语言

这里用ExcelWriter()函数在同一个表格里追加不同的Sheet。

df2excel = pd.ExcelWriter('future.xlsx',engine='xlsxwriter')
sheetName="北京"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
sheetName="上海"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
sheetName="广州"
sheet=pd.read_excel('weilai.xlsx',sheet_name=sheetName)
df.to_excel(df2excel,index=False,sheet_name="北京")
df1.to_excel(df2excel,index=False,sheet_name="上海")
df3.to_excel(df2excel,index=False,sheet_name="广州")
df2excel.save()

总结

        上述操作在原数据获取的时候还比较麻烦,后续考虑用爬虫的方式解决这一块。文章来源地址https://www.toymoban.com/news/detail-789012.html

到了这里,关于Python天气数据处理、数据清洗的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【python】数据挖掘分析清洗——离群点(异常值)处理方法汇总

    本文链接:https://blog.csdn.net/weixin_47058355/article/details/129949060?spm=1001.2014.3001.5501 异常值处理的意义在于提高数据分析的准确性和可靠性。异常值往往会影响数据的统计特征,如平均值、方差等,从而导致错误的结论或预测结果。此外,异常值还可能干扰模型的拟合效果,使得模

    2024年02月08日
    浏览(61)
  • 利用Python进行数据清洗与预处理:Pandas的高级用法【第147篇—Pandas的高级用法】

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 在数据科学和机器学习领域,数据清洗和预处理是至关重要的步骤。Pandas库作为Python中最受欢迎的数据处理工具之一,提供了强大的功能来处

    2024年04月09日
    浏览(104)
  • 头歌:数据预处理之数据清洗

    本关任务:完成泰坦尼克号遇难数据的清洗。   案例背景 泰坦尼克号遭遇的灾难震惊世界,如何避免灾难甚至预测灾难呢? 要实现首先要做好泰坦尼克号的损失数据统计,才能为数据分析打下基础。 编程要求 根据提示,你需要完成: 缺失值填充 离群点检测

    2024年02月11日
    浏览(42)
  • 离线数据处理 任务二:数据清洗

    hive数据库和表的创建 给dim添加最新状态记录 任务           接着上一篇数据抽取的任务继续 需用到上篇ods数据抽取的数据继续练习 hive数据库和表的创建         1、创建dwd数据库         2、创建dim_user_info 表,分区字段etl_date         3、创建dim_sku_info 表,分区

    2023年04月09日
    浏览(41)
  • 数据清洗和预处理

    预计更新 一、 爬虫技术概述 1.1 什么是爬虫技术 1.2 爬虫技术的应用领域 1.3 爬虫技术的工作原理 二、 网络协议和HTTP协议 2.1 网络协议概述 2.2 HTTP协议介绍 2.3 HTTP请求和响应 三、 Python基础 3.1 Python语言概述 3.2 Python的基本数据类型 3.3 Python的流程控制语句 3.4 Python的函数和模

    2024年02月07日
    浏览(51)
  • pandas数据清洗——缺失值处理

    使用DataFrame对象的info()方法 原始数据 ​​ 注:NaN为空缺值   查看是否有缺失值    Non-Null Count列显示的是每个索引中不是空缺的个数 使用DataFrame的isnull()方法和notnull()方法 1. isnull()方法——判断是否为空,输出结果为True和False,不为NaN时返回False,为NaN时返回True。     2.

    2024年02月12日
    浏览(53)
  • 【机器学习】数据清洗之处理缺失点

    🎈个人主页:甜美的江 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏:机器学习 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 引言: 在机器学习领域,数据被广泛认为是驱动模型性能的关键。然而,在真实世界的数据中,缺

    2024年02月20日
    浏览(40)
  • 数据挖掘 | 实验一 数据的清洗与预处理

    1)了解数据质量问题、掌握常用解决方法; 2)熟练掌握数据预处理方法,并使用Python语言实现; PC机 + Python3.7环境(pycharm、anaconda或其它都可以) 清洗与预处理的必要性 在实际数据挖掘过程中,我们拿到的初始数据,往往存在缺失值、重复值、异常值或者错误值,通常这

    2023年04月08日
    浏览(45)
  • 机器翻译的大数据挑战:数据清洗与处理

    机器翻译是人工智能领域的一个重要研究方向,其目标是让计算机能够自动地将一种自然语言翻译成另一种自然语言。随着大数据时代的到来,机器翻译面临着巨大的数据挑战。这篇文章将从数据清洗和处理的角度探讨机器翻译的大数据挑战。 机器翻译具有广泛的应用,例如

    2024年04月15日
    浏览(55)
  • 【数据预处理】基于Kettle的字符串数据清洗、Kettle的字段清洗、Kettle的使用参照表集成数据

    🚀 本文选自专栏:AI领域专栏 从基础到实践,深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家,通过案例和项目实践,掌握核心概念和实用技能。每篇案例都包含代码实例,详细讲解供大家学习。 📌📌📌本专栏

    2024年02月03日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包