基于爬虫技术豆瓣的电影数据分析小程序设计文献综述

 2023-06-03 02:06

文献综述

文 献 综 述 1.1 选题的背景、目的和意义 1.1.1选题的背景在大数据时代,人们对于互联网的应用已经贯彻到生活的方方面面,电影排行榜作为电影质量内容评比的呈现方式,已经广泛进入大众的视野中。

国内具有代表性的电影评分平台是豆瓣网和猫眼电影[1],豆瓣网是一个社区网站,创立于2005年。

该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供,是Web 2.0网站中具有特色的一个网站。

猫眼电影是美团旗下的一家集媒体内容、在线购票、用户互动社交、电影衍生品销售等服务的一站式电影互联网平台。

其中猫眼电影收录了许多影片和票房的数据,极大了方便了人们的对日后票房分析的预测。

猫眼电影中的电影榜单则是在映电影项目的核心呈现[2]。

用户通过观看电影后对其做出评价和判断,除了能够表明自己的喜好,还可以对电影形成口碑效应,所以如果能够对电影的评分和票房进行统计,就可以帮助观众在观影的选择上提供偏好和选择,也可以为影院的排片计划、视频网站的营销等提供参考[3]。

但由于在当今时代数据量十分惊人,想要从海量数据中获得有用信息是十分困难的,所以需要通过一些技术手段来获得自己所需要的信息,因此网络爬虫开始被人们熟知。

网络爬虫技术实际上就是一种互联网处理数据的机器人,它通过爬取互联网上网站上的内容来工作,采用计算机编写的语言或者脚本,有既定的目标,有选择地去访问网 页,并建立链接,自动地从网页上爬取所需要信息。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。