【数学建模美赛M奖速成系列】数据可视化(二)

这篇具有很好参考价值的文章主要介绍了【数学建模美赛M奖速成系列】数据可视化(二)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

写在前面

上一篇文章为大家分享了山脊图和气泡图的绘图方法与代码,这里学姐为继续为大家分享百分比堆叠线条图和火山图,包含matlab和python的完整代码,需要完整代码的同学看文章最后,另外,如果没有美赛经验想要获奖,欢迎咨询哦~

百分比堆叠线条图

百分比堆叠线条图是一种数据可视化工具,它结合了堆叠面积图和线条图的特点。在这种图表中,时间序列数据被分成几个部分,每个部分代表一个类别,所有类别的值加起来总和为100%。这种图的每个点的堆叠区域代表不同类别在特定时间点的百分比贡献。

优点

  1. 展示趋势和组成: 百分比堆叠线条图可以同时显示各个组成部分随时间变化的趋势以及它们对总量的相对贡献。
  2. 比较容易: 由于总量始终为100%,用户可以很容易地比较不同类别在不同时间点的相对大小。
  3. 节省空间:相比于多个分开的图表,一个百分比堆叠线条图能在单一视图中显示多个类别的信息。
  4. 视觉连续性:这种图表类型利用颜色和堆叠区域的连续性,有助于观察者追踪随时间变化的趋势。

缺点

  1. 局限性: 只能显示部分总和恒等于100%的数据,不适合绝对值变化很大的数据。
  2. 误导性: 如果某个类别的变化很大,可能会造成视觉上的误导,观察者可能认为其他类别也有相同比例的变化。
  3. 难以精确读取: 对于堆叠的中间部分,很难从图表中读取精确的数值,尤其是当多个类别颜色相似或者区域较小的时候。
  4. 顺序敏感性: 类别的堆叠顺序可能会影响读图的难易程度,一般来说,底部的类别最容易读取,而上层的则较难。

实现

在实际应用中,选择使用百分比堆叠线条图还是其他类型的图表应该基于数据的特点以及想要传达的信息。如果目标是展示多个类别随时间的相对变化,并且每个类别的总和固定,则百分比堆叠线条图是一个很好的选择。如果数据中的类别总和不是固定的,或者需要展示绝对值的变化,则可能需要选择其他类型的图表。

【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

python

import matplotlib.pyplot as plt
import numpy as np

# Create sample data
categories = ['Category 1', 'Category 2', 'Category 3', 'Category 4']
months = ['January', 'February', 'March', 'April', 'May', 'June']
data = np.array([
    [20, 30, 35, 35, 30, 25], # Category 1
    [25, 25, 25, 20, 20, 25], # Category 2
    [30, 25, 20, 25, 30, 30], # Category 3
    [25, 20, 20, 20, 20, 20]  # Category 4
])

# Normalize data to sum to 1 (100%)
data_perc = data / data.sum(axis=0)

# Plot stackplot
fig, ax = plt.subplots(figsize=(10, 6))
ax.stackplot(months, data_perc, labels=categories)

# Add legend
ax.legend(loc='upper left')

# Add titles and labels
ax.set_title('Percentage Stacked Line Bar Chart Example')
ax.set_ylabel('Percentage')
ax.set_xlabel('Month')

# Display the plot
plt.tight_layout()
plt.show()

为了对百分比堆叠线条图进行了美化,使用了一组更鲜明的颜色来区分不同的类别。
在每个类别的边缘添加了更清晰的界限,添加了网格线以提高可读性,旋转了X轴标签,使它们更易读,增加了标题和轴标签的字体大小,并使标题加粗, 改进了图例的显示位置,并调整了字体大小,设置Y轴以显示百分比符号。如下所示
【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

matlab

【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

% Sample data for the four categories over six months
data = [
20 30 35 35 30 25; % Category 1
25 25 25 20 20 25; % Category 2
30 25 20 25 30 30; % Category 3
25 20 20 20 20 20 % Category 4
];

% Normalize the data to sum to 100%
data_perc = bsxfun(@rdivide, data, sum(data)) * 100;

% Create a vector to represent the months as numbers
months_num = 1:6;

% Plot the area
fig = figure;
ax = axes(fig);
stackedarea = area(ax, months_num, data_perc', 'LineStyle', 'none');

% Define the colors for each category
colors = lines(4); % Generate 4 distinct colors

% Apply the colors to the areas
for i = 1:length(stackedarea)
stackedarea(i).FaceColor = colors(i,:);
end

% Customize the axes and the plot
set(ax, 'XTick', months_num, 'XTickLabel', {'January', 'February', 'March', 'April', 'May', 'June'});
ylabel('Percentage');
title('Percentage Stacked Line Bar Chart Example');
legend({'Category 1', 'Category 2', 'Category 3', 'Category 4'}, 'Location', 'EastOutside');
grid on;

% Add Y-axis labels with percentage
yticks = get(ax, 'ytick');
new_labels = strcat(num2str(yticks'), '%');
set(ax, 'yticklabel', new_labels);

【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

火山图

火山图是生物信息学中常用的一种图表,用来显示基因表达数据的变化。它通常将每个点表示为一个基因,x轴显示对数比率(log ratio),表示基因表达的变化大小;y轴显示-log10(p-value),表示变化的统计显著性。在火山图中,通常会看到分布在两侧的点表示表达上升或下降的基因,而分布在中间的点表示没有显著变化的基因。这种图表有助于快速识别在特定条件下显著上调或下调的基因。

火山图是一种功能强大的数据展示方法,它不仅能够显示单个基因或蛋白质的变化,还能在生物学上下文中提供这些变化的全局视图。通过这种方式,火山图帮助研究人员理解实验条件下生物学系统的整体响应。
【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

优点

  1. 差异表达基因的可视化:火山图是用来直观显示成千上万个基因或蛋白质之间表达水平差异显著性的工具。每个点代表一个基因或蛋白质,它的位置基于表达变化的大小(通常是对数变化率)和这种变化的统计显著性。
  2. 筛选重要目标:火山图可以用来快速识别和筛选出那些表达变化最大且统计显著的基因或蛋白质。这些通常是研究中的关键分子,可能是疾病标记物或药物靶标。
  3. 趋势观察:通过观察点的分布,研究人员可以了解基因表达变化的总体趋势,例如是否有很多基因表达上升或下降,以及变化是否集中在某个特定区域。
  4. 数据质量评估:火山图也可以帮助研究人员评估实验数据的质量。理想情况下,大多数基因应该集中在图的中部,表示没有显著差异,而显著差异的基因应该均匀地分布在左右两侧。
  5. 交互式探索:现代生物信息学软件提供的火山图通常是交互式的,允许用户点击特定的点来获取更多关于该基因或蛋白质的信息,如名称、功能以及与其他分子的关联。
  6. 组合其他分析:火山图常与其他生物信息学工具和分析结合使用,比如富集分析、网络分析等,来进一步探索和解释数据中的生物学现象。
  7. 通信工具:作为一种强有力的视觉工具,火山图可以在学术出版物、研究报告和演示中,帮助解释复杂的统计数据,并传达研究的关键发现。

实现

python

import matplotlib.pyplot as plt
import numpy as np

# 生成示例数据
np.random.seed(0)
x = np.random.normal(size=1000)
y = -np.log10(np.random.uniform(low=0.001, high=1.0, size=1000))

# 分类条件,随机分配,仅用于示例
conditions = np.random.choice(['up', 'down', 'nodiff'], size=1000, p=[0.1, 0.1, 0.8])

# 创建火山图
plt.figure(figsize=(8, 6))
plt.scatter(x[conditions == 'up'], y[conditions == 'up'], color='r', label='up')
plt.scatter(x[conditions == 'down'], y[conditions == 'down'], color='b', label='down')
plt.scatter(x[conditions == 'nodiff'], y[conditions == 'nodiff'], color='grey', alpha=0.5, label='nodiff')

# 添加必要的标签和标题
plt.title('Volcano Plot')
plt.xlabel('Log2 Fold Change')
plt.ylabel('-Log10 p-value')

# 添加图例
plt.legend()

# 显示图表
plt.show()

matlab

【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

% 假设数据
logFoldChange = randn(1000,1); % 随机生成对数变化倍数
pValues = rand(1000,1); % 随机生成p值

% 设置阈值
pValueThreshold = 0.05; % p值显著性阈值
logFoldChangeThreshold = 1; % 对数变化倍数阈值

% 计算统计显著性
negLogPValues = -log10(pValues); % 计算负对数p值

% 分类基因表达变化
upRegulated = logFoldChange > logFoldChangeThreshold & pValues < pValueThreshold;
downRegulated = logFoldChange < -logFoldChangeThreshold & pValues < pValueThreshold;
notRegulated = ~upRegulated & ~downRegulated;

% 绘制火山图
figure;
hold on;
scatter(logFoldChange(upRegulated), negLogPValues(upRegulated), 40,'blue', 'filled');
scatter(logFoldChange(downRegulated), negLogPValues(downRegulated), 40, 'red', 'filled');
scatter(logFoldChange(notRegulated), negLogPValues(notRegulated), 10, 'black');

% 标注显著的点
significantPoints = find(pValues < pValueThreshold);
for i = 1:length(significantPoints)
text(logFoldChange(significantPoints(i)), negLogPValues(significantPoints(i)), ...
num2str(significantPoints(i)), 'FontSize', 8);
end

% 增加参考线
line(xlim(), [-log10(pValueThreshold) -log10(pValueThreshold)], 'Color', 'green', 'LineStyle', '--');
line([-logFoldChangeThreshold -logFoldChangeThreshold], ylim(), 'Color', 'green', 'LineStyle', '--');
line([logFoldChangeThreshold logFoldChangeThreshold], ylim(), 'Color', 'green', 'LineStyle', '--');

% 添加轴标签和标题
xlabel('Log2 Fold Change');
ylabel('-Log10 p-Value');
title('Volcano Plot');

% 添加图例
legend({'Up-regulated', 'Down-regulated', 'Not significant'}, 'Location', 'northeastoutside');

% 格式化图像
set(gca, 'FontSize', 12);
grid on;
hold off;

为了进一步美化,我们可以添加一些额外的格式设置,例如自定义颜色,透明度,以及改进的标注。如下所示,
【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

最后

【数学建模美赛M奖速成系列】数据可视化(二),数学建模,数学建模,python,matlab

更多完整绘图代码可以看下面哦,可免费获取。文章来源地址https://www.toymoban.com/news/detail-803299.html

到了这里,关于【数学建模美赛M奖速成系列】数据可视化(二)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数学建模-动态规划&遗传算法(美赛运用)

    动态规划模型的要素是对问题解决的抽象,其可分为: 阶段。指对问题进行解决的自然划分。例如:在最短线路问题中,每进行走一步的决策就是一个阶段。 状态。指一个阶段开始时的自然状况。例如:在最短线路问题中,每进行走一步后,对所走的点进行标注。 决策。当

    2024年03月13日
    浏览(38)
  • 数学建模美赛到底要注意什么?

    论文本质上是一种解答 页数限制是刚性! 假设要具有合理性,同时简化问题 ,比如:绕行星转的时候将行星看作球体,如果下落且行星很大,则下落时行星表面可视为平面地面。 先算出结果,判断是否能接受,接受的话再去保留原始假设。 假设的理由!!!假设的合理性

    2024年02月03日
    浏览(25)
  • 2023美赛ABCDEF题思路获取/2023美赛思路ABCDEF题/美赛数学建模思路

    美赛、数学建模、美国大学生数学建模、美赛思路、美国大学生数学建模思路、2023美赛、2023美国大学生数学建模竞赛、2023美赛思路、2023美赛数据、2023美赛A题、2023美赛B题、2023美赛C题、2023美赛D题、2023美赛E题、2023美赛F题、 2023美赛数据、2023美赛论文、2023美赛解析、2023美

    2024年02月13日
    浏览(28)
  • 数学建模美赛资料(赛题+获奖论文更新)

    数学建模美赛历年真题可以帮助我们了解比赛的出题思路,对建模比赛有一个大致的了解。 在备赛过程中,通过往年真题,我们可以了解考试的范围和重点,做到心中有数,可以有的放矢。 通过真题,我们可以感受到各个模型的应用范围和问题的难度,使我们在备赛过程中

    2024年01月19日
    浏览(37)
  • 数学建模美赛O奖、国赛国一队伍经验分享

    前言:本团队成员来自某985院校,均成功保研,有多次数学建模参赛经验,对数模有一定自己的理解和体会。本人有幸汇集了三支分别获2023美赛O奖、F奖、M奖、2022美赛F奖、国赛国一、国二的队伍经验,现整理成文章,供大家参考,内容将持续更新。 本博主参加数学建模赛事

    2024年02月08日
    浏览(47)
  • 美赛BOOM数学建模BOOM1-4多目标规划

    既要XXX,又要XXX ❑ 回顾:(非)线性规划都是一个目标函数,例如工业生产产品,追求最大化利润等等。 ❑ 例如:某工厂生产产品Ⅰ和产品Ⅱ,有关数据如下,若只追求最大化利润,得到模型: 现在设有 3个目标 : • 1.尽量使产品Ⅰ的产量不超过产品Ⅱ的产量; • 2.尽可能

    2024年02月16日
    浏览(27)
  • 数学建模——数据可视化seaborn

    数学建模——数据可视化seaborn 写作由来: 最近在准备数学建模美赛,在画图表的时候,之前一直用的是matplotlib,但是画出来总感觉不是很好看,而美赛挺注重文章的美观,所以找到了另一个实用的高级的Python包——seaborn。 概括 风格(style) 有5种风格 white,whitegrid,dark,darkgri

    2024年02月13日
    浏览(27)
  • 2023年美赛数学建模E题思路模型分析(光污染)

    光污染用于描述人造光的任何过度或不良使用。一些我们所说的光污染现象包括光侵入、过度照明和光杂乱。这些现象最容易被观察到,就像太阳落山后天空中的辉光一样。设置在大城市:但是,它们也可能发生在更偏远的地区。光污染改变了我们对夜空的看法,对环境产生

    2024年02月10日
    浏览(26)
  • 美赛BOOM数学建模4-2微分方程传染病预测模型

    注明:本文根据数学建模BOOM网课简单整理,自用 ❑从最简单的指数传播模型说起 • 不同类型传染病的发病机理和传播途径各有特点 • 有的传染病,在得过一次后可获得 免疫力 ,但有的则不会 • 有的传染病具有 潜伏期 ,有的则没有 • 需要对不同类型的传染病建立相应

    2024年02月08日
    浏览(35)
  • 2023年美赛数学建模F题思路模型分析(绿色GDP)

    国内生产总值(GDP)可以说是衡量一个国家经济健康状况的最著名和最常用的指标之一。它通常用于确定一个国家的购买力和获得贷款的机会,为各国提出提高其GDP的政策和项目提供动力。GDP“衡量一个国家在给定时间段内生产的最终商品和服务的货币价值;它计算一个国家

    2024年02月14日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包