Pearson相关性分析& plot绘图(相关性系数柱状图、绘制非空值数量柱状图)

这篇具有很好参考价值的文章主要介绍了Pearson相关性分析& plot绘图(相关性系数柱状图、绘制非空值数量柱状图)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Pearson相关性分析 & plot绘图(相关性系数柱状图、绘制非空值数量柱状图)

1.Pearson相关性分析

  • Pearson相关性分析是一种用于检测两个变量之间线性关系强度的统计方法,其结果介于-1和1之间。一个相关系数为1表示完全正相关,-1表示完全负相关,0则表示没有线性关系。 Pearson相关性分析假设数据来自正态分布,并且对异常值敏感。

2.Pearson相关性分析实例

# 计算pearsonr相关系数
def calculate_pearsonr(pd):
    head = pd.head().columns.values
    GDM = pd["目标变量"].tolist()
    coefficient_of_association = {}
    significance_level = {}
    feature_cnt = {}
    for feature in head:
        if feature != "目标变量":
            ftc = 0
            feature_values = pd[feature].tolist()
            GDM_temp, feature_temp, tag = [], [], 0
            for v in feature_values:
                if str(v) != "nan":
                    ftc += 1
                    GDM_temp.append(GDM[tag])
                    feature_temp.append(v)
                tag += 1
            feature_cnt[feature] = ftc
            if len(feature_temp) > 1:
                pc = pearsonr(np.array(feature_temp), np.array(GDM_temp))
                if str(pc[0]) != "nan":
                    ca = pc[0]
                    if ca < -0.0001:
                        ca = ca*-1
                        coefficient_of_association[feature] = ca
                        significance_level[feature] = pc[1]
                    elif ca > 0.0001:
                        coefficient_of_association[feature] = ca
                        significance_level[feature] = pc[1]
    dp_ca = sorted(
        coefficient_of_association.items(),
        key=lambda x: x[1],
        reverse=True)
    print("pearsonr-相关系数:",dp_ca)
   
    dp_ca_Nempty=[(i[0], feature_cnt[i[0]]) for i in dp_ca]
    print("非空值的数量:",dp_ca_Nempty)

    return dp_ca

import matplotlib.pyplot as plt
def plot1(dp_ca):
    # 将元组列表转换为字典
    dp_ca_dict = dict(dp_ca)

    # 创建子图
    # fig, ax = plt.subplots()

    fig = plt.figure(figsize=(16, 10))
    ax = fig.add_subplot(1, 1, 1)

    # 绘制相关性系数柱状图
    ax.bar(dp_ca_dict.keys(), dp_ca_dict.values())
    ax.set_title('Correlation between Feature and 目标变量')
    ax.set_xlabel('Features')
    ax.set_ylabel('Correlation Coefficient')

    # 调整布局并显示图形
    plt.xticks(rotation=45,ha='right') ## # 将x轴标签旋转45度,并以最后一个字符为旋转中心
    # 设置x轴刻度标签字体大小为8
    ax.tick_params(axis='x', labelsize=10)

    plt.tight_layout()
    plt.savefig("./Pearson.jpeg")
    plt.show()

if __name__ == '__main__':

    file = pd.read_excel("./filename.xlsx")
    dp_ca=calculate_pearsonr(file)
    plot1(dp_ca)

pearson相关可视化图,基础知识,python,numpy,机器学习

3.plot绘图(相关性系数柱状图、绘制非空值数量柱状图)

import matplotlib.pyplot as plt

# 获取数据
dp_ca = [('feature1', 0.8), ('feature2', 0.6), ('feature3', 0.4),('feature4', 0.77), ('feature5', 0.2), ('feature6', 0.4)]
dp_ca_Nempty = [('feature1', 100), ('feature3', 50), ('feature2', 20),('feature4', 70), ('feature5', 10), ('feature6', 26)]

# 将元组列表转换为字典
dp_ca_dict = dict(dp_ca)
dp_ca_Nempty_dict = dict(dp_ca_Nempty)

# 创建子图
fig, axs = plt.subplots(1, 2, figsize=(10, 5))

# 绘制相关性系数柱状图
axs[0].bar(dp_ca_dict.keys(), dp_ca_dict.values())
axs[0].set_title('Pearson correlation coefficients')
axs[0].set_xlabel('Features')
axs[0].set_ylabel('Correlation coefficient')

# 绘制非空值数量柱状图
axs[1].bar(dp_ca_Nempty_dict.keys(), dp_ca_Nempty_dict.values())
axs[1].set_title('Number of non-empty values')
axs[1].set_xlabel('Features')
axs[1].set_ylabel('Count')

# 调整布局并显示图形
plt.xticks(rotation=45,ha='right') ## # 将x轴标签旋转45度,并以最后一个字符为旋转中心

# 设置x轴刻度标签字体大小为10
axs[0].tick_params(axis='x', labelsize=10)
axs[1].tick_params(axis='x', labelsize=10)

# 调整布局并显示图形
plt.tight_layout()
plt.show()

pearson相关可视化图,基础知识,python,numpy,机器学习文章来源地址https://www.toymoban.com/news/detail-707803.html

到了这里,关于Pearson相关性分析& plot绘图(相关性系数柱状图、绘制非空值数量柱状图)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据挖掘01-相关性分析及可视化【Pearson, Spearman, Kendall】

    ​ 有这么一句话在业界广泛流传: 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 ​ 因此,数据挖掘在人工智能和大数据的时代下显得尤为重要。本人在工作中也会经常为数据挖掘方面的任务头疼,所以想将所见、所学、所整理的数据挖掘学习资

    2024年02月02日
    浏览(24)
  • 【python】求多变量/样本(矩阵)之间的相关性系数

    创作日志: Pearson或Spearson代表的是两个变量之间的相关性,因此一般输入是两个向量(vector),那么当我们有多个变量时,怎样计算他们两两之间的相关性系数呢?得到的correlation matrix各元素代表的又是什么意思呢? 举例: 矩阵A有两个样本:a1 与 a2,矩阵B有两个样本:b1 与

    2024年02月06日
    浏览(19)
  • Matlab进阶绘图第14期—相关性方块热图

    相关性方块热图 是一种特殊的方块热图。 与一般的方块热图相比, 其数值位于[-1 1]区间,其颜色用于表示正负,而其方块的大小用于表示数值绝对值的大小 ,可以十分直观地对两个变量的相关性进行分析。 由于Matlab中未收录相关性方块热图的绘制函数,因此需要大家自行

    2023年04月12日
    浏览(18)
  • FigDraw 12. SCI 文章绘图之相关性矩阵图(Correlation Matrix)

    桓峰基因公众号推出基于R语言绘图教程并配有视频在线教程,目前整理出来的教程目录如下: FigDraw 1. SCI 文章的灵魂 之 简约优雅的图表配色 FigDraw 2. SCI 文章绘图必备 R 语言基础 FigDraw 3. SCI 文章绘图必备 R 数据转换 FigDraw 4. SCI 文章绘图之散点图 (Scatter) FigDraw 5. SCI 文章绘

    2023年04月08日
    浏览(18)
  • 【hive】相关性函数进行相关性分析

    在Hive SQL中,使用类似的相关性函数进行相关性分析。常见的相关性函数包括CORR、COVAR_POP、COVAR_SAMP、STDDEV_POP、STDDEV_SAMP等。 举个例子,假设有一个表格sales,其中包含两列数据 sales_amt 和 advertising_amt ,我们可以使用CORR函数来计算这两列数据的相关性: 这将返回一个值,表示

    2024年02月21日
    浏览(21)
  • 表达矩阵任意两个基因相关性分析 批量相关性分析 tcga geo 矩阵中相关性强的基因对 基因相关性 ecm matrisome与gpx3

    使用场景 1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的功能,这种方法在英语中称为 guilt of association,协同犯罪 。 2.我们的注释方法依赖于TCGA大样本,既然他可以注释基因,那么任何跟肿瘤相关的基因都可以被注释,

    2024年02月01日
    浏览(32)
  • 常见的相关性分析

    方差分析和相关性分析都是描述特征之间的关系的统计方法,但它们关注的方面略有不同。 方差分析主要用于研究一个或多个自变量对因变量的影响,即研究因素之间的差异性。通过比较不同组之间的方差,可以确定哪些因素对结果变量的影响比较重要,以及不同组之间的显

    2024年02月11日
    浏览(22)
  • 数学建模:相关性分析

    🔆 文章首发于我的个人博客:欢迎大佬们来逛逛 Pearson Spearman Kendall tua-b t检验(t-test)临界值表-t检验表.xls T检验代码: myTtest005.m 相关性分析及SPSS软件操作.pdf

    2024年02月09日
    浏览(21)
  • 相关性分析和热图绘制

    一、什么是相关性分析? 相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。在组学测序(如转录组)中需设置多个生物学重复,而对多个生物学重复

    2024年02月10日
    浏览(23)
  • 原生语言操作和spring data中RestHighLevelClient操作Elasticsearch,索引,文档的基本操作,es的高级查询.查询结果处理. 数据聚合.相关性系数打分

    ​ Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。Elasticsearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasti

    2024年02月05日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包