用python获取.csv文件中某一列或者某些列

这篇具有很好参考价值的文章主要介绍了用python获取.csv文件中某一列或者某些列。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.把三个csv文件中的feature值整合到一个文件中,同时添加相应的label。

# -*-coding:utf-8 -*-
import csv;
label1 = '1'
label2 = '2'
label3 = '3'
a = "feature1,feature2,feature3,feature4,feature5,feature6,feature7,feature8,feature9,feature10,label" + "\n"
with open("./dataset/dataTime2.csv", 'a') as rfile:
     rfile.writelines(a)
with open("./dataset/f02.csv", 'rb') as file:
    a = file.readline().strip()
    while a:
        a = a + ',' + label1 + "\n"
        #a = label1 + ',' + a + "\n"
        with open("./dataset/dataTime2.csv", 'a') as rfile:
            rfile.writelines(a)
        a = file.readline().strip()
with open("./dataset/g03.csv", 'rb') as file:
    a = file.readline().strip()
    while a:
        a = a + ',' + label2 + "\n"
        #a = label2 + ',' + a + "\n"
        with open("./dataset/dataTime2.csv", 'a') as rfile:
            rfile.writelines(a)
        a = file.readline().strip()
with open("./dataset/normal05.csv", 'rb') as file:
    a = file.readline().strip()
    while a:
        a = a + ',' + label3 + "\n"
        #a = label3 + ',' + a + "\n"
        with open("./dataset/dataTime2.csv", 'a') as rfile:
            rfile.writelines(a)
        a = file.readline().strip()

 

2.获取csv文件中某一列,下面可以获得label为表头的列中对应的所有数值。

filename = "./dataset/dataTime2.csv"
list1 = []
with open(filename, 'r') as file:
    reader = csv.DictReader(file)
    column = [row['label'] for row in reader]

 

3.获取csv文件中某些列,下面可以获得除label表头的对应列之外所有数值。

import pandas as pd
odata = pd.read_csv(filename)
y = odata['label']
x = odata.drop(['label'], axis=1) #除去label列之外的所有feature值

4.也可以处理成list[np.array]形式的数据。

filename = "./dataset/dataTime2.csv"
list1 = []
with open(filename, 'r') as file:
    a = file.readline()
    while a:
        c = np.array(a.strip("\n").split(","))
        list1.append(c)

5.也可以处理成tensor格式数据集

# -*-coding:utf-8 -*-
import tensorflow as tf
# 读取的时候需要跳过第一行
filename = tf.train.string_input_producer(["./dataset/dataTime.csv"])
reader = tf.TextLineReader(skip_header_lines=1)
key, value = reader.read(filename)
record_defaults = [[1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], tf.constant([], dtype=tf.int32)]
col1, col2, col3, col4, col5, col6, col7, col8, col9, col10, col11= tf.decode_csv(
    value, record_defaults=record_defaults)
features = tf.stack([col1, col2, col3, col4, col5, col6, col7, col8, col9, col10])
with tf.Session() as sess:
  # Start populating the filename queue.
  coord = tf.train.Coordinator()
  threads = tf.train.start_queue_runners(coord=coord)
  trainx = []
  trainy = []
  for i in range(81000):
    # Retrieve a single instance:
      example, label = sess.run([features, col11])
      trainx.append(example)
      trainy.append(label)
  coord.request_stop()
  coord.join(threads)
#最后长度是81000,trainx是10个特征

参考资料:http://t.csdn.cn/HFTPy文章来源地址https://www.toymoban.com/news/detail-540044.html

到了这里,关于用python获取.csv文件中某一列或者某些列的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Echarts—X轴鼠标滑动或者缩放/多列柱状图中某一列数据为0时不占位

    用柱状图展示12个月的项目对应的供应商数据; 每个月有多个项目不确定,1-50之间,也就是说,12个月,每个月的X轴上有不确定的柱状;例如:1月有20根柱子,2月有5根柱子,3月有15根… 每月的每根柱子代表是一个项目,鼠标移入每月的每一个项目的柱子上要悬浮展示该月该

    2024年02月09日
    浏览(86)
  • Python读取excel某一列的数据

    把这几列分别读出来,并且每一列都对应一个数组  代码:

    2024年02月13日
    浏览(39)
  • python:openpyxl取某一行、某一列、应用excel函数

    (话外:如何取某一列这个,真的是气死我气死我气死我拉!) 依然记录学习使用,属于昨天内容的进阶版! 如果想要基础操作,如创建excel,创建sheet,可以点击下方链接哦~  python:openpyxl基础操作(一):创建.xlsx文件_豆包的戳苏的博客-CSDN博客 首先,我们快速创建一个

    2024年02月09日
    浏览(38)
  • 【python】【pandas】读取DataFrame的某一列形成一个列表

    输出结果: 在上述代码中,我们创建了一个示例DataFrame df ,其中包含三列(\\\'A\\\'、\\\'B\\\'、\\\'C\\\'),每列都有一些示例值。 然后,我们使用 df.iloc[:, 1] 来访问DataFrame的第一列。这里的 iloc[:, 1] 表示选择所有行(使用 : ),并选择索引为1的列(即第二列)。 接下来,我们使用 tolist

    2024年02月11日
    浏览(44)
  • chatgpt赋能python:如何用Python选取Excel表格的某一列

    Python 是一种高效的编程语言,广泛应用于数据分析和处理。它提供了丰富的库和工具,可以帮助我们处理各种格式的数据,包括 Microsoft Excel 文件。今天,我将向您介绍如何用 Python 选取 Excel 表格的某一列数据。 在开始本教程之前,请确保已安装以下 Python 库: pandas openpyx

    2024年02月10日
    浏览(55)
  • python dataframe 删除 选择 某一列满足指定条件的所有行

    python dataframe 删除某一列大于指定值的所有行 python dataframe 只保留某一列等于指定值的所有行 python dataframe 删除某一列等于指定值的所有行 Python matplotlib 画图 显示中文 中文乱码 无法显示负号 方式一,删除年份大于1999的所有行 方式二,只保留年份1999和2009的所有行 方式三,

    2024年02月12日
    浏览(46)
  • Python pandas库怎样根据某一列的数据将所有数据分类

    在数据处理中,数据分类是一项基础而重要的工作。本文将介绍如何使用Python pandas库,根据某一列的数据将所有数据分类。 1. 读取数据文件,生成数据框(DataFrame)对象 首先,需要读取数据文件,生成数据框(DataFrame)对象。这里以读取CSV格式的数据文件为例,代码如下:

    2024年02月07日
    浏览(46)
  • python取矩阵的某一行_Pythonnumpy提取矩阵的某一行或某一列的实例

    python取矩阵的某一行_Pythonnumpy提取矩阵的某一行或某一列的实例_weixin_39843677的博客-CSDN博客 最全--python取矩阵中的一个元素、某一行、特定位置元素_Mr DaYang的博客-CSDN博客_python获取矩阵中元素  

    2024年02月12日
    浏览(36)
  • 使用TortoiseGit拉取GitLab代码仓库中某一项目的某一分支的代码

    你安装好git+TortoiseGit后,你的右键变为: 说明你安装成功!!! 步骤一:打开GitLab网站,先通过 Clone 下拉框,在其中选择HTTP网址,进行copy【假设这个是:http://test123.git】 还有一点要注意: 这里有一些分支【在例子中是3个】,每个分支由扮演不同角色的人进行维护 步骤二

    2024年03月22日
    浏览(53)
  • 剑指 Offer 44.!! 数字序列中某一位的数字

    参考资料 剑指 Offer 44. 数字序列中某一位的数字 中等 351 相关企业 数字以0123456789101112131415…的格式序列化到一个字符序列中。在这个序列中,第5位(从下标0开始计数)是5,第13位是1,第19位是4,等等。 请写一个函数,求任意第n位对应的数字。 示例 1: 输入:n = 3 输出:

    2024年02月15日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包