分享
数据分析之从100万条数据中筛选出前100热门电影
输入“/”快速插入内容
数据分析
之从100万条数据中筛选出前100热门电影
用户102
用户102
2023年10月12日修改
⏳
Written 10-07-2020 BY Java_S
写在前面
经过前面几天对
Numpy
和
Pandas
的学习,我感觉我变秃了,也变强了😜
对于学习,我们都知道仅仅Input是没有任何效果的,在掌握了基础知识后,还需要
Output
这次我到国外的Grouplens网站找来一份百万电影数据,
你可以点击我进行下载
我们通过这份数据就可以简单的进行
数据分析
,筛选出前100的热门电影
话不多说,我们直接开肝 😜
导入第三方库和所需文件
代码块
Python
import pandas as pd
unames = ['user_id','gender','age','occupation','zip']
users = pd.read_table('file/users.dat',
sep='::',header=None,
names=unames)
users.head()
用户数据
代码结果
评分数据
代码块
Python
rating_names = ['user_id','movie_id','rating','timestamp']
ratings = pd.read_table('file/ratings.dat',
sep='::',header=None,
names = rating_names)
ratings.head()
代码结果