数据可视化练习1:描述与相关

任务

2025 年 10 月 31 日,交通运输部公布了2025年1-9月全国城市客运量,请尝试用课程所学知识,对该数据进行可视化,以方便读者快速理解。

描述性分析

  1. 可视化各省市的客运总量的排名,以及各省市之间总量的差异。(条形图)

  2. 可视化显示每个省市不同出行方式(公共汽电、出租车、轨道交通和轮渡)的对比。(分组柱状图)

  3. 可视化对比北京、上海、江苏、广东、山东和河南的出行方式的结构差异(可用雷达图表示形状的差异,用 plotly 来绘制)

相关性分析

  1. 分析客运总量与公共汽电、出租车、轨道交通和轮渡这四种出行方式的相关性:

    1. 绘制成对关系图

    2. 绘制所有变量的相关性热力图;

  2. 找到2025前三季度的各省市的GDP数据、各省市人口数据,然后分析GDP总量、人口总量和客运总量的相关性:

    • 输出客运量、GDP和人口之间的关系热力图

    • 使用 scikit-learn 以 GDP 和人口为自变量,预测客运总量,并输出模型系数、R² 值

    • 输出GDP与客运量的散点图(需要绘制回归线、图例中标示 r 值和 p 值)

要求

  1. 大家完成过程中,请主要使用本课程所介绍的工具链;

  2. 在完成任务的过程,请尽可能使用各类AI工具协助处理数据、生成绘图代码和排除故障灯;

  3. 如不能获取最新数据,可使用2025 年的上半年数据作为替代:客运量GDP2020 年人口