AI写Python代码进行数据分析

这篇具有很好参考价值的文章主要介绍了AI写Python代码进行数据分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

国内AI大语言模型写代码的能力比预期好多了,准确且出错率低。本次用的AI大语言模型为智谱清言。活动链接:DateWhale微信公众号

一、详细处理内容如下:

1.将四个Excel进行合并

2.在合并的文件中提取湖南地区的数据

3.将湖南地区的数据中,部分指标分别加总求该地区的和。指标包括:销售额、数量、利润

二、Prompt参考教程如下:

假设你是最懂数据处理的专家,take the breath,let’s think step by step。帮我写一个python脚本来执行以下两个任务:
1.汇总:脚本应该遍历当前文件夹中的所有Excel文件,并将它们的内容汇总到一个新的Excel文件中。第一行需要在汇总的表格中,每行数据需要添加一个新列“表格名”,以标识该数据来自哪个原始表格。完成后,请将这个新的Excel文件保存在当前目录下,并命名为“汇总”。
2.统计:在“汇总”文件中,除了上述汇总内容,还请添加一个新的工作表。在这个新工作表中,我需要统计湖南地区办公用品类别的总销售额、总数量和总利润。为您参考,我上传了一个示例表格,其中包含了类似的数据格式和内容。
当前文件夹中其中一个表格数据如下所示:
行 ID 订单 ID 订单日期 发货日期 邮寄方式 客户 ID 客户名称 细分 城市 省/自治区 国家/地区 地区 产品 ID 类别 子类别 产品名称 销售额 数量 折扣 利润
11 CN-2018-4195213 2018/12/22 2018/12/24 二级 谢雯-21700 谢雯 小型企业 榆林 陕西 中国 西北 技术-设备-10000001 技术 设备 爱普生 计算器, 耐用 434.28 2 0 4.2
44 CN-2018-2932548 2018/5/17 2018/5/22 二级 唐婉-21385 唐婉 小型企业 南昌 江西 中国 华东 办公用-收纳-10004212 办公用品 收纳具 Fellowes 锁柜, 蓝色 1935.08 2 0 0
 

三、具体Python代码如下:文章来源地址https://www.toymoban.com/news/detail-768095.html

import pandas as pd
import os

#将18-21年订单合并
os.chdir('D:\\hebing\\pythonProject')
excel_files = [file for file in os.listdir() if file.endswith('.xlsx')]

frames = []
for file in excel_files[:4]:
    df = pd.read_excel(file)
    frames.append(df)

combined_df = pd.concat(frames, ignore_index=True)
combined_df.to_excel('combined_file.xlsx', index=False)

#对合并后湖南地区的数据进行处理

# 加载Excel文件
file_path = 'combined_file.xlsx'
try:
    df = pd.read_excel(file_path)
except FileNotFoundError:
    print(f"未找到文件:'{file_path}'。")
    exit()
except Exception as e:
    print(f"读取Excel文件时发生错误:{e}")
    exit()

# 找到列名为“省/自治区”的列
if '省/自治区' in df.columns:
    region_column = df['省/自治区']
else:
    print("未找到名为'省/自治区'的列。")
    exit()

# 筛选出“地区”这一列填写的是“湖南”的所有行
hunan_rows = region_column == '湖南'

# 删除“地区”不为“湖南”的所有行
df = df[hunan_rows]

# 保存处理后的数据到新的Excel文件
output_file_path = 'processed_file.xlsx'
try:
    df.to_excel(output_file_path, index=False)
    print(f"处理后的数据已保存到'{output_file_path}'。")
except Exception as e:
    print(f"保存Excel文件时发生错误:{e}")

#对湖南地区的销售额、数量、利润进行汇总计算

# Excel文件路径
file_path = 'processed_file.xlsx'
# 读取Excel文件
df = pd.read_excel(file_path)
# 确保“销售额”、“数量”和“利润”列存在
required_columns = ['销售额', '数量', '利润']
missing_columns = [col for col in required_columns if col not in df.columns]
if missing_columns:
    print(f"缺少以下列:{missing_columns}")
    exit()
# 计算每列的总和
summary = df[['销售额', '数量', '利润']].sum()
# 将总和添加到最后一行
df.loc[len(df.index)] = summary
# 保存处理后的数据到新的Excel文件
output_file_path = 'homework1.xlsx'  # 可以修改为新的文件名
try:
    df.to_excel(output_file_path, index=False)
    print(f"处理后的数据已保存到'{output_file_path}'。")
except Exception as e:
    print(f"保存Excel文件时发生错误:{e}")

到了这里,关于AI写Python代码进行数据分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据探索的人工智能与机器学习:如何应用AI技术提高分析效率

    数据探索是数据科学家和机器学习工程师在处理新数据集时所经历的过程。在这个过程中,他们需要理解数据的结构、特征和关系,以便为业务提供有价值的见解。然而,随着数据规模的增加,手动进行这些分析变得越来越困难。因此,人工智能和机器学习技术在数据探索领

    2024年02月20日
    浏览(87)
  • 【数据分析入门】人工智能、数据分析和深度学习是什么关系?如何快速入门 Python Pandas?

    本文详细介绍了人工智能、数据分析和深度学习之间的关系,并就数据分析所需的Pandas库做了胎教般的入门引导。祝读得开心!   本文是原 《数据分析大全》 、现改名为 《数据分析》 专栏的第二篇,我在写这篇文章的时候突然意识到—— 单靠我是不可能把数据分析的方

    2024年02月14日
    浏览(74)
  • 使用人工智能和传感器技术,结合观测数据,实时获取自然界中变化的事件并进行分析预测。

    作者:禅与计算机程序设计艺术 随着全球数字化转型,物联网、智慧城市、智能农业、智能医疗等新兴产业正在改变世界,传感器网络已经成为连接各类传感器设备的基础设施。而人工智能也逐渐成为各行各业的基础性科技工具,在对环境的高速采集、实时的计算、及其规模

    2024年02月06日
    浏览(52)
  • 使用Python进行数据分析——方差分析

    大家好,方差分析可以用来判断几组观察到的数据或者处理的结果是否存在显著差异。本文介绍的方差分析(Analysis of Variance,简称ANOVA)就是用于检验两组或者两组以上样本的均值是否具备显著性差异的一种数理统计方法。 根据影响试验条件的因素个数可以将方差分析分为

    2024年02月15日
    浏览(72)
  • 使用Python进行数据分析——线性回归分析

    大家好,线性回归是确定两种或两种以上变量之间互相依赖的定量关系的一种统计分析方法。根据自变量的个数,可以将线性回归分为一元线性回归和多元线性回归分析。 一元线性回归:就是只包含一个自变量,且该自变量与因变量之间的关系是线性关系。例如通过广告费这

    2023年04月10日
    浏览(97)
  • Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能

    安装 Python 环境,选择一个 IDE,如 PyCharm、VSCode等。 安装 Python 环境是使用 Python 进行编程的第一步。Python 官网提供了 Windows、Linux 和 macOS 等主流操作系统的安装包,可以前往官网下载对应版本的 Python 并进行安装。 在安装完 Python 后,需要使用 pip 工具对常用的第三方库进行

    2024年02月09日
    浏览(71)
  • ChatGPT4 助力 Python 数据分析与可视化、人工智能建模及论文高效撰写

    2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。202

    2024年02月02日
    浏览(70)
  • GPT4助力Python数据分析与可视化、人工智能建模及论文高效撰写

    详情点击链接:GPT4助力Python数据分析与可视化、人工智能建模及论文高效撰写 第一: GPT 4 基础入门 1、ChatGPT概述(GPT-1、GPT-2、GPT-3、GPT-3.5、GPT-4模型的演变) 2、ChatGPT对话初体验(注册与充值、购买方法) 3、GPT-4与GPT-3.5的区别,以及与国内大语言模型(文心一言、星火等

    2024年01月18日
    浏览(62)
  • ChatGPT4助力Python数据分析与可视化、人工智能建模及论文高效撰写

    2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。202

    2024年02月03日
    浏览(67)
  • 使用Python批量进行数据分析

    知识延伸 1、sort_value()是pandas模块中DataFrame对象的函数,用于将数据区域按照某个字段的数据进行排序,这个字段可以是行字段,也可以是列字段。 语法格式: sort_value(by=\\\'##\\\',axis=0,ascending=True,inplace=False,na_position=\\\'last\\\') 参数 说明 by 要排序的列名或索引值 axis 如果省略或者为

    2024年02月10日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包