python pandas练习

网友投稿 608 2022-11-26

python pandas练习

python pandas练习

问题1:获取电影数据中评分的平均分,导演的人数等信息 问题2:获取rating,runtime分布情况 问题3:统计电影分类(genre)情况

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfilePath = "C:\\Users\\dell\\Desktop\\a.csv"movie = pd.read_csv(filePath)# 问题1-----------------------# 获取平均分movie['Rating'].mean()# 获取导演人数信息np.unique(movie['Director']).shape[0]# 问题2-----------------------# Rating分布plt.figure(figsize=(20,8), dpi=100)plt.hist(movie['Rating'].values, bins=20)max_ = movie['Rating'].max()min_ = movie['Rating'].min()t1 = np.linspace(min_, max_, num=21)plt.xticks(t1)plt.grid()plt.show()# 问题3-----------------------# 1、创建一个全为0的DataFrame,列索引置为电影的分类temp_list = [i.split(',') for i in movie['Genre']]genre_list = np.unique([i for j in temp_list for i in j])zeros = np.zeros([movie.shape[0], genre_list.shape[0]])temp_movie = pd.DataFrame(zeros, columns=genre_list)# 2、遍历每一部电影,把分类出现的列置为1for i in range(1000): temp_movie.loc[i, temp_list[i]] = 1# 3、求和genre = temp_movie.sum().sort_values(ascending=False)genre.plot(kind='bar', figsize=(20,8), fontsize=16)

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:大文件如何打开?解决方案,附下载地址
下一篇:spring @Scheduled注解的使用误区及解决
相关文章

 发表评论

暂时没有评论,来抢沙发吧~