- 添加 .idea 目录和相关配置文件,设置项目忽略文件、编码、模块管理等 - 创建商务大数据分析目录和子目录,准备数据和任务笔记本 - 添加示例数据文件:中国城市人口数据.csv - 创建任务笔记本文件,进行数据处理和分析示例
20 KiB
20 KiB
None
<html lang="en">
<head>
</head>
</html>
In [113]:
import pandas as pd
In [114]:
data = pd.read_csv('data/某地区房屋销售数据 (1).csv', encoding='gbk')
data.head(5)
Out[114]:
In [115]:
data['new_postcode'] = data['地区邮编'].apply(lambda x: str(x)[:2])
data.head(5)
Out[115]:
In [116]:
data.groupby('new_postcode').agg({'房屋出售时间':'count'})
Out[116]:
In [117]:
housesale1 = data.groupby(['房屋类型', 'new_postcode']).apply(lambda x:x).reset_index()
housesale1
Out[117]:
In [118]:
data['平均价格'] = data.groupby(['房屋类型', 'new_postcode'])['房屋价格'].transform('mean')
In [125]:
data2 = data.drop_duplicates(['房屋类型','new_postcode'],inplace=False)
data2
Out[125]:
In [126]:
data2[['房屋类型','new_postcode','平均价格']]
Out[126]: