分组排序及首单时间计算

这篇具有很好参考价值的文章主要介绍了分组排序及首单时间计算。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

import  pandas as pd
import numpy as np
downpath='/Users/kangyongqing/Downloads/'
downfile='20230725_105033.csv'

dd=pd.read_csv(downpath+downfile)
dd.rename(columns={'student_user_id':'学生id'},inplace=True)
result=[]
for i in range(dd.shape[0]):
    user,feetime=dd.loc[i,['学生id','付费时间']].values
    tmp=dd[(dd['学生id']==user)]
    feemin=tmp['付费时间'].min()
    result.append(feemin)
result=pd.DataFrame(result,columns=['首付费时间'])

dd1=pd.concat((dd,result),axis=1)
dd1['xulie']=dd1.groupby('学生id').付费时间.rank(method='first',ascending=True)


print(dd1.head(2).T)
dd1['学生id']=dd1['学生id'].astype(np.int64).astype(str)
dd1['parent_user_id']=dd1['parent_user_id'].astype(np.int64).astype(str)
dd1.to_excel(downpath+'ceshi.xlsx')

分组排序及首单时间计算,Pandas

知识点:

  1. 首次付费时间计算;
  2. 用户第一单记录,rank排序实现;
  3. 长id转换字符串

 文章来源地址https://www.toymoban.com/news/detail-606332.html

到了这里,关于分组排序及首单时间计算的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • pandas分组与聚合groupby()函数详解

    一、groupby分组与聚合 分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=_NoDefault.no_default, squeeze=_NoDefault.no_default, observed=False, dropna=True) :使用映射器或按一Serie

    2024年02月14日
    浏览(34)
  • Pandas实战100例 | 案例 22: 分组运算

    案例 22: 分组运算 知识点讲解 Pandas 的 groupby 方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。 分组后求和 : groupby 后使用 sum 方法可以对每个分组的数值求和。 分组后求平均 : groupby 后使用 mean 方法可

    2024年01月21日
    浏览(33)
  • 分组聚合不再难:Pandas groupby使用指南

    处理大量数据时,经常需要对数据进行分组和汇总, groupby 为我们提供了一种简洁、高效的方式来实现这些操作,从而简化了数据分析的流程。 分组 是指根据一个或多个列的值将数据分成多个组,每个组包含具有相同键值(这里的键值即用来分组的列值)的数据行。 聚合

    2024年03月09日
    浏览(33)
  • Pandas实战100例 | 案例 50: 分组后的过滤

    案例 50: 分组后的过滤 知识点讲解 在 Pandas 中,你可以对分组后的数据进行过滤,根据每个组的特性选择或排除特定的组。这通常通过 groupby 结合 filter 方法实现。 分组后的过滤 : 使用 filter 方法,可以根据分组的属性(如组内均值、最大值等)决定是否保留整个组。 示例代

    2024年01月15日
    浏览(31)
  • pandas数据分析——groupby得到分组后的数据

    Pandas怎样实现groupby聚合后字符串列的合并(四十) pandas—groupby如何得到分组里的数据 在处理时间序列的数据中,有时候会遇到有些日期的数据缺失的情况,这时候可以用pandas的 date_range 函数快速补齐缺失日期,再根据实际情况补齐缺失值。 常用参数为: start :指定生成时

    2024年02月11日
    浏览(27)
  • Pandas.DataFrame.groupby() 数据分组(数据透视、分类汇总) 详解 含代码 含测试数据集 随Pandas版本持续更新

    关于Pandas版本: 本文基于 pandas2.2.0 编写。 关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。 传送门: Pandas API参考目录 传送门: Pandas 版本更新及新特性 传送门: Pandas 由浅入深系列教程 DataFrame.groupby() 方法用于使用映射器或指定的列,对 D

    2024年01月16日
    浏览(37)
  • excel 分组排序

    excel中会遇到对不同分组数据进行排序,比如对于不同班级里的学生按照分数高低进行升序排序,可以采用如下公式 如果需要 进行降序排序,将公式中的大于号替换为小于号即可

    2024年02月10日
    浏览(25)
  • Excel分组排序

    公式:「=SUMPRODUCT((A$2:A$12=A2)*(C$2:C$12C2))+1」。加1是因为大于当前值的个数加1正好就是当前值的排名。 A2:A12分组列,C2:C12排序值列 啰嗦: 教导主任给了我这次全校学生的期中考试成绩表,让我把每位同学所在班级排名名次以及在全校排名名次都列出来。 有个比较特别的函数

    2024年02月10日
    浏览(29)
  • MapReduce实战小案例(自定义排序、二次排序、分组、分区)

    MapReduce是什么? 我们来看官方文档的解释(我们下载的hadoop中有离线文档:hadoop-2.10.1/share/doc) Hadoop MapReduce 是一个易于编写应用程序的软件框架,它以可靠、容错的方式并行处理商业硬件的大型集群(数千个节点)上的大量数据(数 TB 数据集)。 这里我们可以提炼一下MapReduce的

    2024年02月07日
    浏览(34)
  • MySQL时间分组:按小时统计数据(mysql按小时分组)

    MySQL时间分组是一类涉及MySQL数据库的SQL语句,能够以小时对数据进行分组统计。 比如,如果你想根据一定的时间间隔,把MySQL数据库中的记录分成几组,那么MySQL时间分组技术就派上用场了。 MySQL时间分组主要使用MySQL语句YEAR(), WEEK(), HOUR()和GROUP BY来实现,按小时统计数据实

    2024年02月12日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包