数据分析十年来电影票房数据

时间:2024-04-04 10:56:53

2019年除夕夜的到来已经进入倒计时,在这家庭团圆的时刻,除了全家一起看春节联欢晚会外,一起去电影院看部电影也是极好的选择。每年的贺岁档也是各大影片相互角逐、吸金的重要时刻,很多影片提前几个月就开始宣传,而对贺岁片的吐槽也为过年增添不少气氛。

十年,对于任何人来说都是一个巨大的变化。十年的电影无论题材、拍摄技术和资金都发生了很大的变化,所以找了一下近十年来的电影票房数据,用数据来分析一下电影十年来的变化。

数据爬取

在中国票房网站上提供了近十年来各大电影的票房数据信息,包括影片名、影片类型、票房、上座率、国家以及上映日期,我们爬取十年来每年票房前25的影片数据,这些优质影片可以称得上是每年电影市场的代表。

数据信息:

数据分析十年来电影票房数据

完整代码:

import requests
from bs4 import BeautifulSoup
import xlwt

def pachong(url,c):
    res = requests.get(url)
    res.encoding = "utf-8"
    soup = BeautifulSoup(res.text,"lxml")
    html = soup.select(".date > tr > td")
    for i in range(25):
        worksheet.write(i+25*c, 0, label = html[0+7*i].text)
        worksheet.write(i+25*c, 1, label = html[1+7*i].text)
        worksheet.write(i+25*c, 2, label = html[2+7*i].text)
        worksheet.write(i+25*c, 3, label = html[3+7*i].text)
        worksheet.write(i+25*c, 4, label = html[4+7*i].text)
        worksheet.write(i+25*c, 5, label = html[5+7*i].text)
        worksheet.write(i+25*c, 6, label = html[6+7*i].text)



if __name__ == '__main__':
    workbook = xlwt.Workbook(encoding = 'utf-8')
    worksheet = workbook.add_sheet('My Worksheet')
    for i in range(10):
        lianjie = "http://www.cbooo.cn/year?year="+str(2009+i)
        pachong(lianjie,i)
    workbook.save('Excel_Workbook.xls')

年度票房冠军

能够在每年几百部电影中脱颖而出自然说明影片的水平,票房数据也能说明经济发展状况。所以我们对十年来的影片年度票房冠军数据进行比较。

数据分析十年来电影票房数据

从票房来看,近年来票房一路上升,说明国家经济发展让大家提高生活水平,去影院观影人数明显增多。一部好的影片都是几十亿的票房啊!

这十年中,2009、2010、2011和2014年是美国电影,其余都是国产电影,这说明国产电影的崛起,尤其是战狼2和红海行动两部爱国题材的电影票房都十分突出。犹记那个夏天,各类新闻和朋友圈都被一个叫吴京的男人和他的战狼刷屏。

影片类型

影片一般为动作、爱情、科幻和动画等几大类,所以我们看一下近十年的250部优秀影片中的不同题材所占比例,也反映十年来电影市场的变化。

数据分析十年来电影票房数据

从中我们可以看到,动作片可谓是一骑绝尘,遥遥领先其他题材影片,排在其后的是喜剧、科幻和爱情片。动作片比较典型的有《战狼2》、《红海行动》以及美国大片《速度与激情系列》,喜剧片就小编了解的有开心麻花系列的几部片子。爱情片影响比较深的是场景固定、剧情单一的,不过国产的大多是校园爱情虐恋的,看起来比较狗血。

国产片VS外国片

数据分析十年来电影票房数据

影片总量

不仅是影片票房出现明显上升的趋势,每年的影片数量也是不断增加,下面是统计十年来影片数量。

数据分析十年来电影票房数据

平均票价

数据分析十年来电影票房数据

十年来,任物价起起伏伏,电影票价依然稳定。票价比较集中在30-40元之间,所以没事去看看电影还是比较实惠的。不过也不排除有的地方票价高,有的地方票价低的情况,毕竟每个城市消费水平不同。

上座率

数据分析十年来电影票房数据

场均人次比较集中在30-40的区间内,而且近年来上座率呈下降趋势,可能是现在电影院比较多,而且网络发展让大家可以在家上网就可观看。说到这里小编有点伤感,上次去电影院早已不记得是什么时候了。哎,可能太爱学习,哈哈哈

画图及文章边框全部采用红色,希望我的公众号也能沾点春节的福气,来年读者人数节节高。以上就是本期的票房数据分析内容,由于春节置办年货,所以文章总结比较简单,更多信息欢迎大家留言讨论。2019年贺岁档多部影片,你会看哪一部呢?欢迎关注我的公众号《深度学习与python》