数据分析之从100万条数据中筛选出前100热门电影

用户102

2023年10月12日修改

⏳

Written 10-07-2020 BY Java_S

写在前面

经过前面几天对Numpy和Pandas的学习,我感觉我变秃了,也变强了😜​

对于学习,我们都知道仅仅Input是没有任何效果的,在掌握了基础知识后,还需要Output​

这次我到国外的Grouplens网站找来一份百万电影数据,你可以点击我进行下载

我们通过这份数据就可以简单的进行数据分析,筛选出前100的热门电影​

话不多说,我们直接开肝 😜

导入第三方库和所需文件

代码块

import pandas as pd​
​
unames = ['user_id','gender','age','occupation','zip']​
users = pd.read_table('file/users.dat',​
                      sep='::',header=None,​
                      names=unames)​
users.head()​

用户数据

代码结果

评分数据

代码块

rating_names = ['user_id','movie_id','rating','timestamp']​
ratings = pd.read_table('file/ratings.dat',​
                         sep='::',header=None,​
                         names = rating_names)​
ratings.head()​

代码结果

数据分析之从100万条数据中筛选出前100热门电影​

数据分析之从100万条数据中筛选出前100热门电影