- 添加 .idea 目录和相关配置文件,设置项目忽略文件、编码、模块管理等 - 创建商务大数据分析目录和子目录,准备数据和任务笔记本 - 添加示例数据文件:中国城市人口数据.csv - 创建任务笔记本文件,进行数据处理和分析示例
14 KiB
14 KiB
None
<html lang="en">
<head>
</head>
</html>
In [1]:
import pandas as pd
In [4]:
data = pd.read_csv('data/某地区房屋销售数据 (1).csv', encoding='gbk')
data['new_postcode'] = data['地区邮编'].apply(lambda x: str(x)[:2])
data.head(3)
Out[4]:
In [5]:
# 1、求出不同地区和不同房间数的房价,使用pivot_table函数
data.pivot_table(values='房屋价格', index='new_postcode', columns='配套房间数', aggfunc='mean')
Out[5]:
In [7]:
# 2、不同地区哪种类型的房产房价最贵,使用pivot_table函数
data.pivot_table(values='房屋价格', index='new_postcode', columns='房屋类型', aggfunc='max')
Out[7]:
In [8]:
# 3、不同类型房产和不同房间数的房价之间的比较,使用pivot_table函数
data.pivot_table(values='房屋价格', index='房屋类型', columns='配套房间数', aggfunc='mean')
Out[8]:
In [10]:
# 4、不同地区不同房间数房屋销售情况交叉表,使用crosstab函数,参考例3-61
pd.crosstab(data['new_postcode'], data['配套房间数'])
Out[10]: