数据可视化练习1:描述与相关¶
任务¶
2025 年 10 月 31 日,交通运输部公布了2025年1-9月全国城市客运量,请尝试用课程所学知识,对该数据进行可视化,以方便读者快速理解。
描述性分析¶
可视化各省市的客运总量的排名,以及各省市之间总量的差异。(条形图)
可视化显示每个省市不同出行方式(公共汽电、出租车、轨道交通和轮渡)的对比。(分组柱状图)
可视化对比北京、上海、江苏、广东、山东和河南的出行方式的结构差异(可用雷达图表示形状的差异,用 plotly 来绘制)
相关性分析¶
分析客运总量与公共汽电、出租车、轨道交通和轮渡这四种出行方式的相关性:
绘制成对关系图
绘制所有变量的相关性热力图;
找到2025前三季度的各省市的GDP数据、各省市人口数据,然后分析GDP总量、人口总量和客运总量的相关性:
输出客运量、GDP和人口之间的关系热力图
使用 scikit-learn 以 GDP 和人口为自变量,预测客运总量,并输出模型系数、R² 值
输出GDP与客运量的散点图(需要绘制回归线、图例中标示 r 值和 p 值)