“针对江苏卫视品牌综艺节目《非诚勿扰》的大数据选题,是尼尔森网联(Nielsenccdata)在尼尔森研究思想下,在媒介研究中所做的实践”,尼尔森网联首席咨询顾问孙洪海表示,“尼尔森网联针对电视媒体的服务之一,就是将结构性数据和非结构性数据相结合这一研究思想的实践”。
两个小时的交流中,不断出现这样几个高频词——大数据,结构性数据,非结构性数据,抽样数据,海量数据,媒介研究,四轮驱动……
促成这次采访的起因,是中广互联近期对大数据在大视频应用的关注。尼尔森网联针对《非诚勿扰》所做的大数据选题就是与之相关的典型案例。既然单独看这次交流中涉及的若干专业词汇未免太过枯燥,那就从尼尔森中国和尼尔森网联的故事展开吧。
尼尔森中国和尼尔森网联的故事
创立于上世纪二十年代的尼尔森公司总部位于美国纽约,是全球著名的市场调研公司。自八十年代起,尼尔森进入中国。
图为:尼尔森网联首席咨询顾问孙洪海
“在中国市场最为人所熟知的是尼尔森的零售研究。商场,超市等各个渠道,每天卖了什么,多少钱,这是非常庞大的研究,以亿来计算,零售研究是尼尔森在中国的大部类。此外还有网标尼尔森”,孙洪海说,“我所在的尼尔森网联,英文简称Nielsenccdata,主要做以收视率为核心的媒介研究。我们提出的战略是‘四轮驱动大数据,建立受众货币新秩序’”。
据了解,尼尔森在五十年代建立了全球的收视率标准,八十年代进入中国之后,推动了整个中国收视率从问卷式向机顶盒数据采集的进化。此后尼尔森由于“资本的安排”等原因退出了中国收视率市场,2009年,以中传网联为前身的尼尔森网联重新回归中国收视率市场。
孙洪海告诉中广互联,“四轮驱动”的战略是尼尔森网联执行总裁张余博士提出,并直接领导建立的。
“四轮”,第一个轮子指的是海量样本收视率监测(TAM);第二个轮子是全媒体广告监测(AIS);第三个轮子是测量仪式收听率监测(RAM);第四个轮子是媒体价值综合评估(CP)四大产品线。
数据!数据!
在交流中,中广互联向孙洪海提出两个问题:“大数据”这个概念这几年提得很多,是否可以理解为,“大数据”是相对于过去的采样“数据”而言的?大数据和海量数据是什么关系呢?
孙洪海表示,每个人对大数据的认识不同。他个人的理解是,“海量”数据不等于大数据;大数据是“全”数据;而抽样数据则是“推及数据”,先抽出一些,然后猜。“海量数据”是抽样数据量大,但仍然是抽样数据。
他有一个很有哲学意味的表述是,“每个数据,只看一个点上的行为,充满了偶然性。但是,时间积累得越长,就把偶然性归类,变成了必然性”。
孙洪海认为,判断大数据的数据质量有多好,第一要看数据全,第二是时间长,这两个维度共同构成了大数据。
尼尔森全球首席研究官(CRO)Paul Donato先生不久前在一个公开论坛上谈到,要将大数据与尼尔森的数据相结合,更好地分析和预测不断变化的消费需求和各地区市场未来的消费趋势。他具体谈到了三点:
第一,没有结构性的数据(即“非结构性数据”)和有结构性的传统样板框数据(即“结构性数据”)密不可分。
第二,要想充分利用大数据,需具备三个能力:1.数据处理能力;2. 数据存储能力;3.用户界面。
第三,通过结合尼尔森样板框数据,大数据和小数据二者实现有机结合,从而激发大数据更大的潜力。
Paul强调的一点是,“大数据需要与尼尔森传统的样板框数据相结合,才能发挥更大潜力”。
孙洪海进一步作了解释,所有大数据讲究三个元素:第一,要全体,不要抽样;第二,要效率,不要精准,比如很多网络俚语有误差,这是小数据的偶然性,而大数据就可以忽略偶然性;第三要相关,不要因果,时间越长,样本越来越大,偶然性就会越来越小。
“大数据是非定性研究,是没有访问大纲的,采集得到的是非结构数据;而定性研究则需要一个访问大纲,比如调研‘你是否喜欢这个主持人’,‘是否满意节目编排的方式’,即使是漫谈访问,最后也会把数据编码,归拢到结构型数据上来”。
孙洪海做了一个通俗的比喻,“Paul讲的概念是,把结构性数据的样本框当一个‘筛子’,然后把大数据过这个‘筛子’,“筛”出有用的东西。我们针对江苏卫视的大数据选题就是这么做的”。
针对《非诚勿扰》的大数据选题
长期以来,《非诚勿扰》这类优质的综艺节目已经形成了极强的品牌影响力,受众固定。与时俱进地对节目做调整和优化提上议事日程,尽管想法很多,但行动起来必须慎之又慎。这就需要一个更“大”的数据,更长久积累的数据,来论证和支持哪个想法是对的——这涉及到如何用大数据来支持决策。
据孙洪海介绍,此次尼尔森网联为江苏卫视《非诚勿扰》提供的“大数据选题研究”主要包括几方面的重点内容:
第一,从宏观和微观两个视角整合节目影响力研究、节目健康度研究以及广告效果研究,深入挖掘受众对节目的真实态度;
第二,根据对研究成果的解读和分析,建立节目健康景气监测、节目题材快速优选等多个“节目健康管理模型”以及“受众互动方案”;
第三,通过电视及网络终端建立全视野、大数据采集系统,嫁接“节目健康管理模型”,按照“受众互动方案”即时采集受众对节目的收视评价、因素选择等重要数据。
《非诚勿扰》已经有十分广泛的受众。如果仅仅采用结构性的样本研究,比如2000样本已经是不小的数据量,但仍然有明显不足。其中一个不足就是太慢!出一份报告,几个月的时间过去了,受众的口味已发生变化,很难对一个节目改版提供及时的支持——这也是所有主观研究的尴尬之处——似乎研究很深入,似乎给了很多建议,但是却难以采用。此外,有些样本支持改版建议,有些样本不支持,难以给出明确判断。
尼尔森网联的UMA(节目与频道综合评估,Unified Media Assessment)服务体系针对数据做了一个工作,叫做“同量化”——把主观数据和客观数据融合在一起。孙洪海对客观数据和主观数据做了简单说明:所谓客观数据,就是采集来的数据;所谓主观数据,就是调查得到的数据,比如说我问你答,主观性很强。
具体到《非诚勿扰》的大数据选题研究的做法是,将“所有大的研究变成一个筛子。把这个筛子放在大数据的出入口,所有大数据从这个筛子过滤进来”。此处所说的“筛子”,就是事先定义好的访问大纲,让“大数据”定性进来。
还有一个简单的表述是,“结构性数据做‘筛子’,去采集非结构性数据(就是大数据),这样可以快速提供支持。”
孙洪海告诉中广互联,“理论上,数据可以一天一报。比如,这个入口,有1万人投票;那个口,有5万人投票。我把‘筛子’放在大数据入口那儿,总会有数据回来”。
这当中非常重要的一步是——建立“筛子”。据孙洪海介绍,通过庞大的研究,建立起的这个“筛子”包括:健康度监测,影响力监监测,广告力监测,受众收视迁徙监测。
那么哪些地方放“筛子”呢?孙洪海表示,要放在所有大数据采集的入口,比如屏幕,可以利用手机二维码与用户互动,并“筛”得有效数据;再比如,一些评论网站、微博、微信、节目报名的地方等等,都可以放‘筛子’”。
比如,这种方式还可以用于电视台的“优化排播”。过去,电视台是根据收视率高低来决定各个节目放在哪儿,但这种方式过于片面,因为收视率不应是唯一指标,还需要关注是,到底某个节目对观众的影响力是什么,收视态度如何界定。UMA服务建立了4个象限,把主客观放在同一平面上,对节目的“优化排播”进行指导。
殊途同归
“尼尔森的标准很简单,就是watch to buy”,孙洪海表示,作为具有创新思想的研究人,非常高兴看到的是,按照这一标准,尼尔森网联针对电视媒体的核心服务与大尼尔森殊途同归。
他非常笃定的一点是,“大数据到来之际,我们一定要将结构性的主观研究和大数据的非结构性研究,进行融合。换句话说,就是用结构性数据建‘筛子’,筛选大数据。尼尔森网联针对电视媒体的核心服务,是将结构性数据和非结构型数据相结合的研究”。
他强调,自己的研究方向是,“主客观数据的统一,结构性的小样本和非结构性的大样本的融合”。
推荐阅读
专栏作者
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。