pd.merge()函数的使用(Python数据科学手册)

这篇具有很好参考价值的文章主要介绍了pd.merge()函数的使用(Python数据科学手册)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.merge函数的构成

merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x','_y'), copy=True, indicator=False)
                             

2.merge函数的参数

left:参与合并的左侧的dataframe

right:参与合并的右侧的dataframe

how:连接方式

on:用于连接的列索引的名称,必须存在于左右的两个dataframe中,如果没有指定其他的 且其他的参数也没有指定,则以两个dataframe列名交集作为连接键

left_on:左侧dataframe中用于连接键的列名,这个参数左右列各不同但含义相同时非常有用

right_on:右侧的dataframe中用于连接的列名

left_index:使用左侧dataframe的行索引作为连接键

right_index:使用右侧dataframe的行索引作为连接键

sort:默认为True,将合并的数据进行排序,设置为false可以提高性能

suffixes:字符串值组成的元组,用于指定当左右dataframe存在相同列名时在后面附加的后缀名

3.merge函数的使用

1、数据连接的类型

一对一连接,多对一连接,多对多连接

代码实例

一对一

from cv2 import merge
import pandas as pd

df1 = pd.DataFrame({'employee': ['Bob', 'jake', 'lisa', 'Sue'],
                   'groups': ['Accounting', 'Engineering', 'Engineering', 'HR']})

df2 = pd.DataFrame({'employee': ['lisa', 'Bob', 'jake', 'Sue'],
                    'hire_date': [2004, 2008, 2012, 2014]})
print(df1)
print(df2)

print(pd.merge(df1, df2))

pd.merge()函数的使用(Python数据科学手册)

 多对一

from cv2 import merge
import pandas as pd

df1 = pd.DataFrame({'employee': ['Bob', 'jake', 'lisa', 'Sue'],
                   'group': ['Accounting', 'Engineering', 'Engineering', 'HR']})

df2 = pd.DataFrame({'employee': ['lisa', 'Bob', 'jake', 'Sue'],
                    'hire_date': [2004, 2008, 2012, 2014]})
# print(df1)
# print(df2)

df3 = pd.merge(df1, df2)

print(df3)

df4 = pd.DataFrame({'group': ['According', 'Engineering', 'HR'],
                    'supervisor': ['Carly', 'Guido', 'Steve']})

print(df4)

print(pd.merge(df3, df4))

pd.merge()函数的使用(Python数据科学手册)

多对多

 

from cv2 import merge
import pandas as pd

df1 = pd.DataFrame({'employee': ['Bob', 'jake', 'lisa', 'Sue'],
                   'group': ['Accounting', 'Engineering', 'Engineering', 'HR']})

df2 = pd.DataFrame({'employee': ['lisa', 'Bob', 'jake', 'Sue'],
                    'hire_date': [2004, 2008, 2012, 2014]})
print(df1)
# print(df2)

df3 = pd.merge(df1, df2)

# print(df3)

df4 = pd.DataFrame({'group': ['According', 'Engineering', 'HR'],
                    'supervisor': ['Carly', 'Guido', 'Steve']})

# print(df4)

df5 = pd.DataFrame({'group': ['Accounting', 'Accounting', 'Engineering', 'Engineering', 'HR', 'HR'],
                    'skills': ['math', 'spreadsheets', 'coding', 'linux', 'spreadsheets', 'organization']})

print(df5)

print(pd.merge(df1, df5))

pd.merge()函数的使用(Python数据科学手册)

2、设置数据合并的键

on参数的用法,最简单的方法就是直接将参数on设置为一个列名字符串或者一个包含列名称的列表,这个参数只能在两个dataframe有共同列名时才可以使用

3、left_on与right_on参数

合并两个列名不同的数据框

会获取很多列,有多余的列用dataframe中的drop函数删除

4、left_index与right_index参数

除了合并列以外,还需要合并列的索引

5、设置数据连接的集合操作规则

内连接:结果中只包含两个输入集合的交集

外连接:返回两个输入的列的并集,所有的缺失值用NaN填充

左连接和右连接:返回的结果分别只包含左列与右列

6、重复列名(suffixes)

输入datafram有重复列名的情况

代码比较简单,就不放代码在这里了

 文章来源地址https://www.toymoban.com/news/detail-460652.html

到了这里,关于pd.merge()函数的使用(Python数据科学手册)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python-pandas:数据合并merge函数用法详解

    介绍一下数据分析中很常用的一个函数——merge,它能够进行高效的数据合并操作。先看一下语法格式及其初步解释: 生成的两个DataFrame对象如下: 1、参数left,right: 将df_d作为左侧的frame,df_e作为右侧的frame,则参数left=df_d,right=df_e; 2、参数how: 当参数how=\\\'left\\\':仅使用左

    2024年02月15日
    浏览(48)
  • 4.11 Pandas中的DataFrame数据类型API函数参考手册(一) (Python)

    前言 Pandas 是一个专门用于数据处理和分析的 Python 库,它提供了众多强大的数据结构和函数,帮助用户更加轻松、高效地完成数据处理和分析任务。其中,DataFrame 数据类型是 Pandas 中非常重要的一种数据结构,可以方便地对二维表格数据进行操作、处理、统计和可视化等工作

    2024年02月10日
    浏览(47)
  • Python中Pandas库提供的函数——pd.DataFrame的基本用法

    pd.DataFrame 是 Pandas 库中的一个类,用于创建和操作数据框(DataFrame)。DataFrame 是 Pandas 的核心数据结构,用于以表格形式和处理数据,类似提供电子表格或数据库表格。类了创建 pd.DataFrame 数据框、访问数据、进行数据操作和分析的方法和属性。 表格形式 :DataFrame是一个二维

    2024年02月05日
    浏览(57)
  • 【python】数据可视化,使用pandas.merge()对dataframe和geopandas类型数据进行数据对齐

    目录 0.环境 1.适用场景 2.pandas.merge()函数详细介绍 3.名词解释“数据对齐”(来自chatGPT3.5) 4.本文将给出两种数据对齐的例子 1)dataframe类型数据和dataframe类型数据对齐(对齐NAME列); 数据对齐前的两组数据集: 数据对齐后的数据集(通过pandas.merge()函数对齐): 代码 2)

    2024年02月09日
    浏览(51)
  • Python 内置函数速查手册(函数大全,带示例)

    abs() 返回数字的绝对值。 abs(-7) **输出:**7 abs(7) 输出: 7 all() 将容器作为参数。如果 python 可迭代对象中的所有值都是 True ,则此函数返回 True。空值为 False。 all({\\\'*\\\',\\\'\\\',\\\'\\\'}) 输出: False all([\\\' \\\',\\\' \\\',\\\' \\\']) 输出: True 如果可迭代对象中的任意一个值为 True,则此函数返回 True。。

    2024年02月09日
    浏览(42)
  • 解决Python中使用pd.read_excel报错的问题

    解决Python中使用pd.read_excel报错的问题 在Python中,我们常常需要读取Excel表格文件来进行数据分析和处理。其中,pandas库的read_excel函数是一个十分常用的方法,可以直接读取Excel表格并将其转化成DataFrame格式,非常方便。但是,在使用read_excel函数时,有时会出现xlrd.biffh.XLRDE

    2024年02月11日
    浏览(37)
  • 【数据科学】Python开源库数据集大全(附代码)

    为了使初学者更容易入门,许多开源库提供了丰富而标准化的示例数据集,其中包括scikit-learn、NLTK、TensorFlow Datasets、Keras Datasets、Statsmodels以及Seaborn等。 这些工具库不仅为初学者提供了方便的数据资源,还有对应的使用教程案例,基本上涵盖了所有数据类型:分类任务、预

    2024年03月24日
    浏览(35)
  • 极速系列03—python进行数据合并(concat/merge)

    两个表中的数据,要根据段,进行合并。 在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。 pd.concat 函数 拼接的对象可以是series,还可以是dataframe 拼接对象的个数不受限 axis 控制拼接方向(既支持上下拼接,也支持左右拼接) 左右拼接 axis=1,

    2024年02月09日
    浏览(34)
  • Python3数据科学包系列(三):数据分析实战

    Python3中类的高级语法及实战 Python3(基础|高级)语法实战(|多线程|多进程|线程池|进程池技术)|多线程安全问题解决方案 Python3数据科学包系列(一):数据分析实战 Python3数据科学包系列(二):数据分析实战 Python3数据科学包系列(三):数据分析实战 国庆中秋宅家自省: Python在Excel中绘图

    2024年02月07日
    浏览(50)
  • python使用pd.read_csv(),出现错误UnicodeDecodeError: ‘utf-8‘ codec can‘t decode ......

    首先说一下这个原因, 所读取的csv文件的编码方式不是utf-8,然后现在指定encoding=\\\"UTF-8\\\"会出现以上问题。 一、查看你的csv文件时什么编码方式 使用 记事本 打开csv文件,红框所示即csv文件的编码方式。 现在你的csv文件的编码格式就是\\\"ANSI\\\",这时候再去指定encoding=\\\"UTF-8\\\",就会

    2024年02月15日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包