问卷调查是游戏用户研究中常用的方法,可以在收集大样本(大多数情况下)的数据情况下进行分析,去找寻我们想要的答案。虽然问卷中要设置的问题数量和问题类型是由研究目的和需求决定的,但建议应该把问题数量控制在20个左右,最多不超过30个,主要是考虑到平衡信息收集的深度和玩家的耐心,确保回答质量、提高问卷回收率,同时降低因问卷太长而导致的注意力分散和数据处理复杂性。
话虽如此,一份包含20个问题的问卷是否只能提供20条信息?在分析时,交叉分析可以使有限的问题提供更多的信息,取得更大的研究效果。从纯数学的角度来看,交叉分析20个问题可以产生超过760个结果。为什么是760呢,这就要用到数学问题:
假设每个问题有两个回答选项(“是”或“否”),可以通过组合数学计算出,共有190种组合,而每个组合有4种结果(因为每个问题有两个选项),所以总结果数为 190×4=760。
1.什么是交叉分析?
交叉分析是一种用于分析两个变量之间关系的数据分析方法。这种分析方法跨越两个或两个以上的指标,寻找变量之间的关系,发现更多的数据特征。
下面的例子说明了什么是交叉分析。常见到一份游戏研究问卷里有两个问题:
1.根据您最近的游戏体验,您对游戏的满意度如何?
- a.非常不满意
- b.有点不满意
- c.中立的
- d.有点满意
- e.非常满意
2.你的性别是?
- a.男性
- b.女性
假设共收集了200份问卷,每个问题的数据结果如下(非真实数据,无统计学意义):
此时,我们从数据分析中可以看到的结果是,游戏的性别比例接近1:1,整体满意度高于不满意率。当我们对性别和满意度这两个变量进行交叉分析时,就会得到交叉分析的结果,也就是把这两个变量结合起来后的分析。
2.从辛普森悖论看交叉分析的意义
从上述案例中不难看出交叉分析的意义。单变量分析会得出玩家对游戏更满意而不是不满意的结论。但是通过交叉分析发现,男女玩家对游戏的评价完全不同。男性玩家大多对游戏整体不满意,而来自女性玩家的正面感受提升了整体满意度水平。
交叉分析的意义在于,通过这种分析方法,可以更清晰地了解不同类型的玩家/用户对游戏/产品的看法,防止数据的过度整合掩盖真实数据。所谓真实数据的隐藏和丢失,通过‘辛普森悖论’可以更清晰地感知。
辛普森悖论(Simpson’s Paradox)是统计学中的一个现象,指的是在分组数据中观察到的趋势,在合并数据后可能反转或消失。具体来说,当数据被分组并分别分析时,一组数据可能显示出某种趋势(如一个变量在另一个变量上的影响),但当这些分组数据被合并后,原先的趋势可能会完全相反。
我们做一个假设,分析如《王者荣耀》。在游戏中,有两种角色:射手和坦克。在比赛模式A中,坦克的胜率(70%)高于射手(60%);在比赛模式B中,射手的胜率(80%)高于坦克(40%)。将所有数据合并射手胜率66.7%,坦克胜率 60%。两种角色在不同模式下的表现各有优劣,但合并数据后,射手的总体胜率反而高于坦克。这个例子说明,尽管在特定模式中,坦克的表现优于射手,但合并数据可能掩盖了某些趋势,导致分析结果出现反转,提醒玩家在评价角色性能时要综合考虑不同模式和上下文。
3.游戏研究中如何做交叉分析?
理论上来说,任何两个变量都是可以交叉分析的,一份问卷可以产生上百个交叉分析关系,很多做过数据分析的人应该能理解,其中很多可能没有实际意义。交叉分析的关键其实是用不同的标准对玩家进行分类,然后对不同类型玩家的数据进行分析。所以一般游戏用户方面研究里交叉分析首先考虑的是怎么对玩家进行分类。
我们可以将游戏问卷交叉分析的分类方法分为三类。
3.1基于用户属性的交叉分析
最常见的用户分类方法是基于用户属性统计,包括性别、年龄、收入、职业和地区等。
大多数调研问卷在一开始就会出这种题。在收集到调研的样本后,进行数据分析,包括性别和年龄细分的比例,但用户属性数据提供价值的远不止这些。
如何在游戏中利用用户属性进行交叉分析?
性别是游戏交叉分析中使用最常用的因素。男性和女性玩家对游戏类型选择、美术偏好和对游戏乐趣的追求表现态度是不一样的。比如,按性别对玩家进行分类,女性玩家尤其关注美术的风格和游戏节奏,而男性玩家可能更关注游戏主题以及金钱和时间的投入(即游戏的性价比),男性在游戏时是更加理性的。
此前笔者也看过一篇关于现在媒体(抖音、快手、B站等)相关的文章,里面研究说明女性更喜欢社交媒体,而男性则倾向于直播平台。玩家对媒体偏好,为我们游戏进行投放买量做选择时,增加更多参考,在不同的平台应该使用适当的营销素材,并在适当的平台上吸引你想要的玩家。
以前在游戏问卷的交叉分析中经常会看到玩家的年龄、收入等属性,但地域等属性则较为少去调研,当然地域属性在很多后台就已经具备功能。一般地区与收入密切相关,能够整体反应你的用户整体经济水平,以及你的产品的用户价值。
3.2游戏信息问卷
除了问卷中的用户属性外,在设计问卷时一般还会加入一些其他有意义的问题,比如用户来源、游戏吸引力、竞品等,便于数据收集后进行有用的交叉分析。比如以下是一组关于游戏预约阶段调研,主要是调研玩家受什么因素影响而预约游戏。
尤其是当你还不清楚,或者无法定位你的竞品是什么的时候,你去通过问卷能很快了解清楚,从而去分析竞品,寻找差异化产品设计和游戏打发。比如下面这个二次元品类的一个用户调研数据,分别针对放置和二次元两个标签进行打点去挖掘竞品。
3.3对应于问卷收集的玩家游戏数据的分类
上面提到的用户属性息和预先设定的玩家分类问题,都是根据问卷收集的结果对玩家进行分类。其实在数据收集之后,我们还可以根据玩家体验游戏之后针对等级、系统、美术、玩法、操作等游戏相关数据对玩家进行划分,了解这些玩家的整体游戏体验状况。因为每一个游戏都不太一样,这部分在这里就不做详细的讲解了,或许后面可以针对性做以往我做过的案例作说明。
4.交叉分析中的常用指标
交叉分析中有两种常见的指标类型:行/列百分比和TGI指数。
4.1行/列百分比
以“性别-满意度”的交叉分析为例,如前所述:
行百分比是指跨越两个变量的样本数除以相应行中的样本数,比如非常不满意8/100=8%(2/100=2%)。它反映了行变量在列变量上分类的数据差异,以行变量为主要变量(如男女满意度差异)。
列百分比是指跨越两个变量的样本数除以相应列中的样本数,如非常不满意8/10=80%。它反映了行变量上不同列变量之间的数据差异。
分析时,行百分比和列百分比的选择主要看指标是否有实际意义。在一些变量的交叉分析里,行/列百分比都有一定的含义,但在其他情况下并不相同。在上面提到的案例中,行百分比反映的是性别差异下玩家满意度的差异,而列百分比没有实际意义。
4.2 TGI指数
TGI代表目标群体指数,它反映了目标群体在特定范围内的优势/劣势。TGI =具有某一特征的群体在目标群体中的比例/具有相同特征的群体在总人口中的比例* 100%。
- 当TGI = 100%时,表明具有某一特征的群体与总人口没有差异;
- 当TGI> 100%时,说明具有某一特征的群体比总人口更占优势,且随着人数的增加,实力增强;
- 当TGI <100%时,说明具有某一特征的群体弱于总人口。
我在另一篇数据分析的文章中有提到过这种分析方法,也是属于常见的一种游戏内数据分析方法,感兴趣可以去看看。
案例:游戏内设计了一个元旦活动
总体游戏用户中20%参加了元旦活动,女性玩家中35%参加了元旦活动,元旦活动在女性玩家中TGI指数=35%/20%*100=175。18-30岁群体40%参加了元旦活动,元旦活动在18-30岁群体中TGI指数=40%/20%*100=200。说明元旦活动在女性、年轻群体(18-30)中偏好/喜好度高。后续其他产品中,针对这类群体,复用此类效果好的活动,提高收益。
事实上,在数据分析过程中,我们可以使用交叉分析的场景有很多。很多人都知道什么是交叉分析,但一般不会用在具体场景中,尤其是游戏数据分析中,希望这篇内容对某些人能够有用吧。
点击下方阅读原文可以获得更多有价值的内容哟!
欢迎阅读笔者其他内容
未经授权请勿用于任何商业用途
发表评论