当前所在位置:
主页 > 头条 > 极乐实验室

极乐实验室

发布日期: 2020-10-18 00:20 来源:未知 作者:admin   点击率:

  有评价指标,就有人虚构这个指标去迎合。评价指标越单一,虚构的成本越低,被欺诈的风险就越大。一个表面繁荣的结果是很容易虚构的,但只要深入数据的内在,作假就很容易发现。

  本文探讨B站的宏观流量分布情况:哪些分区比较火,哪些分区流量更集中,哪些分区比较适合新人或者腰尾部博主发展。

  这里介绍一种权重分配的方法:根据互动的“稀缺度”来确定互动指标的权重。所谓“稀缺度”,举例来说,如果收藏数普遍比点赞数少,那么收藏就比点赞更加稀缺,也就是说收藏数的价值更大,权重也要更高。

  评论是社交媒体上的内容给用户留下强印象的证明,且造假难度大,是区分优质博主与假博主的最重要的抓手。

  我们可以用评论数占比、评论字数的中位数、评论内互动、评论信息量等指标来量化评论的质量,进而分析内容和博主的质量。

  不同平台的外链,在不同分区之间与视频播放量的相关性差别很大,需要区分对待。淘宝链接的存在与视频播放量呈现负相关,但是“淘宝”字样却与播放量呈现正相关。

  互动可以反映用户对于视频的投入程度。发评论和弹幕都是视频内容给用户留下强印象的证明。正式用户一般一天只获得一个硬币,投币更是代表了用户强烈的认可。

  我们使用了按“标签+子分区”的形式对播放量进行归类,并且使用播放量的中位数来排除个别爆款的影响,从而反映流量在各分区标签之间的普遍分配状况。这个结果由于视角的不同可能与地方看到的热点排名有很多差异,希望对大家有所启发。

  B站各个分区的视频有各自合适的时长,头部视频的中位时长每个月都有变化,趋势也各不相同。我们可以通过统计目标分区整体时长上的变化,来辅助判断内容创作的趋势。

  从几百粉丝的初出茅庐的UP主,成长为百万粉丝的头部UP主,需要经历哪几个阶段?每个阶段晋级的概率有多大?本文基于抽样统计进行一些分析。

  B站有两大基本的信息分类结构,分区结构和标签结构。无论是普通用户日常查找内容,还是做专业的数据分析,可利用的信息分类结构主要是这两种。

  社交媒体时代的品牌与产品名,要能够让用户拼写出来,并且拼写的方式要唯一。这样用户才能顺利地完成搜索,关键词才能在各个平台顺利穿梭,并且在推荐算法中获得更好的权重。

  社交媒体的各个圈层中有很多独特的词汇,通用的词库难以将其正确识别。需要根据各个圈层独特的内容来提取关键词,形成专用的动态生长的词库,这样才能将信息准确归类,减少混淆,这也是内容热点趋势分析的基础。

  基尼指数可以衡量流量分配不均匀的具体程度。这样使得不同类型的内容之间可以对比,比如我们可以发现时尚这个分区之下“健身”比“美妆”头部效应更加明显。

  社交媒体上,幂率分布占主导地位,马太效应普遍存在。我们不能以日常生活中习惯性经验来看待社交媒体,要时刻注意幂率分布的极端性所带来的影响。

  好的生态:博主生产个性化的原创内容,用户与博主存在羁绊并且积极互动,品牌方能找到精准匹配的细分群体,大家各得其所。

  坏的生态:博主媚俗虚假,用户娱乐至死,品牌方担心被骗,最终用户和品牌都会离开,虚假繁荣也难以维系。

  任何一个生态,如果没有持续的正能量注入其中,一定只会变坏,这是熵增定律的体现,社交媒体的生态也不例外。

  我们的一切数据统计都基于抽样调查,数据样本的构成会受到抽样规模、抽样方法、抽样时间等因素的影响,有较强的局限性和时效性。每个数据样本都只针对特定课题,不能在不同课题与数据源之间横向对比。

  我们致力于推动行业理性认知,提高整体运行效率,提升各方参与者的信心。我们不会因为任何一方的要求篡改数据,也不会通过损害他人的合法利益来获取商业收益。