基于R语言的影视评分影响因素实证分析(一)

这篇具有很好参考价值的文章主要介绍了基于R语言的影视评分影响因素实证分析(一)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

电影票房
电影自从1895年在法国巴黎公开售票放映以来,至今已有百余年的历史。电影以其独特的艺术魅力和无与伦比的视听效果,深深地吸引了亿万观众。在各种文化娱乐、艺术样式中,电影是最受人民群众欢迎的。

近年来,我国的电影市场总的趋势是疲软的,虽然靠进口大片与国产大片、新片赢得一时的热闹景象,但这只是虚假的繁荣。那什么样的电影才深受人们喜爱?是喜剧片、惊悚片、谍战片、家庭伦理片,亦或其他?

  在某网站抓取了千条数据,试图通过对这些数据的分析,找出电影受欢迎的因素。本案例共获取1810条数据。数据详情如下:

基于R语言的影视评分影响因素实证分析(一),R语言模型,r语言,开发语言,数据分析,机器学习,数据挖掘

1.数据处理及变量描述

  通过初次观察可知,许多变量的值为空值,于是首先对数据进行筛选处理,将缺失变量进行剔除。
  影视类型,因为考虑到影视都有剧情,所以选择除掉剧情之后的第一个选项为主要影视类型,即《你好,疯子!》的影视类型有剧情、喜剧、悬疑,我们选择除掉剧情后第一个类型为主要影视类型,即为喜剧影视。
  制片国家或地区,由数据可知,此变量由单一中国大陆和大陆与其他地区合拍,于是采用单一地区或多地区。
  语言,由数据可知,此变量由单一汉语普通话和普通话与其他语言均有,于是采用单一语言或多语言
  各个变量的具体取值及描述如下。
  (1)因变量
  影视评分:用comment表示,为数值变量,取值为0-10;
  (2)自变量
  上映时间:用years表示,为分类变量,取值为0=“<2000”,1=[2000,2010],2=“>2010”;
  影视类型:用types表示,为分类变量,取值为爱情、传记、动作、短片、家庭、喜剧、悬疑、其他,分别用1、2、3、4、5、6、7、8表示;
  影视评价人数:用ncomment表示,为数值变量,取值为0- 584163;
  导、编是否一致:用same表示,为分类变量,取值为0=“否”,1=“是”;
  是否合拍:用cooperation表示,为分类变量,取值为0=“否”,1=“是”;
  是否多语言:用mlanguage表示,为分类变量,取值为0=“否”,1=“是”。
  处理完的数据如下:

基于R语言的影视评分影响因素实证分析(一),R语言模型,r语言,开发语言,数据分析,机器学习,数据挖掘文章来源地址https://www.toymoban.com/news/detail-846663.html

2.描述分析

2.1 变量描述性分析</

到了这里,关于基于R语言的影视评分影响因素实证分析(一)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python数据分析案例20——我国家庭资产影响因素分析

    本次案例较为简单,符合人文社科、经济学管理学等专业本科生适用。 本文的数据来源于 中国家庭金融调查( China Household Finance Survey , CHFS )是西南财经大学中国家庭金融调查与研究中心(下称中心)在全国范围内开展的抽样调查项目,由甘犁教授于 2009 年发起并领导,收

    2024年02月09日
    浏览(46)
  • Python数据分析案例05——影响经济增长的因素(随机森林回归)

    在计量经济学里面的研究,围绕着影响GDP的因素的研究有很多,基本都是做回归,拿GDP作为被解释变量y,其他因素作为解释变量x。然后做线性回归,时间序列就做自回归,面板数据就做固定效应等等。本次案例采用机器学习里面的随机森林回归来研究影响经济增长的因素,

    2024年02月09日
    浏览(43)
  • 【Elasticsearch专栏 16】深入探索:Elasticsearch的Master选举机制及其影响因素分析

    Elasticsearch,作为当今最流行的开源搜索和分析引擎,以其分布式、可扩展和高可用的特性赢得了广大开发者的青睐。在Elasticsearch的分布式架构中,集群的稳健性和高可用性很大程度上依赖于其Master节点的选举机制。本文将深入剖析Elasticsearch的Master选举过程,帮助读者更好地

    2024年04月17日
    浏览(42)
  • Explainable AI (XAI) 帮助机器学习模型理解外部世界,并找出影响预测结果的最重要因素

    作者:禅与计算机程序设计艺术 Explainable Artificial Intelligence (XAI)是一种通过可解释的方式来帮助机器学习系统理解自身运作方式,进而更好地被人类所理解的领域。其发展历史可以追溯到1987年IBM Watson团队发表的一篇文章《The Vision of AI: A Cognitive View of the Future》中提出的概

    2024年02月06日
    浏览(43)
  • 基于Lasso回归的实证分析(Python实现代码)

    基于Lasso回归的实证分析 一、背景 随着信息化时代的到来,对如证券市场交易数据、多媒体图形图像视频数据、航天航空采集数据、生物特征数据等数据维度远大于样本量个数的高维数据分析逐渐占据重要地位。而在分析高维数据过程中碰到最大的问题就是维数膨胀,也就是

    2024年02月01日
    浏览(51)
  • 【论文速读】| 对大语言模型解决攻击性安全挑战的实证评估

    本次分享论文为:An Empirical Evaluation of LLMs for Solving Offensive Security Challenges 原文作者: Minghao Shao, Boyuan Chen, Sofija Jancheska, Brendan Dolan-Gavitt, Siddharth Garg, Ramesh Karri, Muhammad Shafique 作者单位: 纽约大学、纽约大学阿布扎比分校 : 大语言模型,网络安全,攻击性挑战,CTF竞赛

    2024年04月10日
    浏览(80)
  • 机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)

    数据集和源码请点赞关注收藏后评论区留下QQ邮箱或者私信 线性回归是利用最小二乘函数对一个或多个因变量之间关系进行建模的一种回归分析,这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个变量的称为一元回归,大于一个变量的情况叫做多元回归。

    2024年01月21日
    浏览(51)
  • 2019年亚太杯APMCM数学建模大赛B题区域经济活力及其影响因素的分析与决策求解全过程文档及程序

    原题再现    区域(或城市或省级)经济活力是区域综合竞争力的重要组成部分。近年来,为了提高经济活力,一些地区推出了许多刺激经济活力的优惠政策,如减少招商审批环节、为创业提供资金支持、降低落户门槛以吸引人才。然而,由于资源禀赋不同,这些政策在不

    2024年02月08日
    浏览(55)
  • 基于Hadoop的豆瓣影视数据分析

           网络电影平台拥有大量的影片库资源,每天数千万用户活跃在平台上,拥有数亿人次的用户点击试看、收藏等行为。在影视作品方面,更是拥有数万的影视作品形成作品库,如此庞大的数据资源库对于电影及电视剧流行趋势的把握有着极为重要的指引作用。通过设计

    2024年02月01日
    浏览(57)
  • R语言数据分析笔记——方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作)

    前言:本文为个人学习笔记,为各大网站上的教学内容之综合整理,综合整理了①方差分析的基础知识、②方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作),尽量标明出处。另因能力所限或有纰漏之处,故仅供参考,欢迎交流指正。 基本概念 指

    2024年02月05日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包