视频网站展示规则研究

作者: Ginson 分类: 随笔 发布时间: 2017-03-28 14:33

播放来源

国内目前主流在线视频播放网站,按市场份额排序分别是爱奇艺、优酷、腾讯视频,其中只有优酷后台提供了较为详细的视频播放来源数据,如下图

优酷视频播放来源

以优酷的数据为基础,再结合其他视频网站的情况,可以得知视频发布到这些平台后,主要播放来源为以下四类:

搜索、推荐、站外、用户渠道

 

搜索

1.搜索规则

通过观察多个关键词的搜索结果反向推论排序规则,目前影响搜索结果中视频排序最主要的因素有2类:文本得分和质量得分。
文本得分主要因素为视频标题,质量得分主要因素为发布时间、播放量、视频清晰度、分类、视频发布站点等。
以下以优酷为示范,其他视频网站规则大同小异,不展开。

视频标题,与搜索词匹配程度越高排序越前。

匹配程度区分如,是否分词,匹配到的字数占标题总字数的比例。
例:清晰度、发布时间、播放数量相同,第三个视频由于标题多了个顿号,文本得分低于第一个视频,所以排在后面。
视频标题

发布时间,发布时间越新排序越前

例:其他条件相同情况下,发布时间新的视频排序靠前
发布时间

播放量,播放量越大排序越前

例:其他条件相同,播放数多的视频排序靠前

视频清晰度,越清晰排序越前

标题相同、播放量相同、发布时间相同、清晰度不同的例子不好找,但整体是这个趋势

其他因素如分类、视频发布站点等比较直观,而且示例难找,不特别说明了。简单概括就是,搜索词对应分类的视频排序靠前、在站点本身发布的视频排序靠前。

2.优化办法

搜索部分最具优化空间的就是视频标题

标题
• 保证信息度情况下尽量去掉噪声词,即用户不会搜索的词
• 尽量覆盖更多搜索词,匹配更多用户需求,建议使用爱奇艺下拉框推荐词做参考
• 平衡以上2点写标题

例:土巴兔新发布的视频名为《90平米清新简欧风样板房展示》

这个标题没有噪声词,但是关键词覆盖度不够。

将标题拆分为词组去爱奇艺参考下拉框推荐词可知,搜索“清新”的大部分搜的是“小清新”,搜索“简欧”的大部分包含了“风格”二字,搜索“样板房”而且与我们视频内容契合的有“设计”、“展示”(“揭秘”与视频内容契合度不高,“图片”拉低了视频内容高度也不适合)。

综合起来,可以将视频标题修改为“90平米小清新简欧风格样板房设计展示”,语义相对流畅而且覆盖搜索词更广泛。

考虑标题需要吸引眼球的情况,建议折衷处理,或者发布时不同平台不同标题

发布时间
• 根据不同时间播放热度,在合适的时间发布视频。

因为现在移动端播放量超出PC N倍,通常来说用户播放、搜索高峰是晚间。

可参考土巴兔网站的日流量趋势,选择19点之后发布视频,这样在面对当日的搜索高峰时,视频发布时间为最新。

播放量
• 有必要的话,刷一点视频播放量

通过搜索结果可以得知,视频播放量是影响搜索排序很重要的一个因素。必要情况下可考虑刷一点视频播放量,保证略领先于其他装修相关视频一点即可,这样在搜索中可获得更多收益。

 

推荐

推荐规则

通过观察视频网站内部推荐视频之间的共性,得出影响相关推荐的主要因素有3个:视频描述、标签、用户行为。

不同视频网站侧重点不同,但基本都是这3个因素。原因是,现有技术无法直接判断视频本身的内容,在进行相关推荐时,只能通过外部因素来判断多个视频的内容是否有相关性。外部因素就包括我们上传视频是填写的信息以及用户行为。

下面引用优酷土豆大数据博客的文章段落,可以看出视频网站推荐规则的主要方向

直接使用包含标签的视频作为候选集,一来质量较差,二来可召回的内容太多,计算复杂度较高,不利于后一步的排序工作的可扩展性。为此,我们需要对候选集进行过滤筛选,生成“优质视频”候选池。
考虑的因素包含:用户观看量、播放完成率、评论量、点击量等综合考虑的视频质量分;视频上传的时间;上传者的历史播放情况;是否包含敏感词等众多因素。”
视频描述

经分析,视频网站会通过对视频描述进行分词、匹配标签等方式来判断视频内容,再结合其他算法进行推荐。

标签

与视频描述相同,视频网站通过众多视频标签之间的关联性来判断两个视频的相关性。

如果两个视频有多个标签相同,那么这两个视频的内容就是相关的。这点在在腾讯视频表现得特别明显,比如土巴兔近期发布的视频《90平米清新简欧风样板房展示》,右侧相关视频中,虽然很多标题完全不相关,但是标签有很多都是重复的。

用户行为

除了以上两点,视频网站还会根据用户的搜索行为、浏览路径、关注情况、评论、赞、收藏等数据来判断视频之间的相关性。
简单举例如,100个用户中,80个看完视频A之后看了视频B,20个看了视频A之后看了视频C,那么网站就会觉得,视频A与视频B的相关性更强。

优化办法

视频描述&标签
• 尽量多地覆盖关键词,有助于参与更多视频的匹配
用户行为

用户行为难以控制,只能引导

• 视频内多引导用户进行互动,不仅对相关推荐有帮助,对搜索排序也有帮助
• 必要情况下可以伪造一些数据,比如自评自赞等

 

站外与用户渠道

这两类来源最主要因素其实也是用户行为

用户渠道即用户后台,收藏、订阅、播放记录都算,站外就是从视频网站外面来的播放。

其中站外来源是一个下限很低、上限很高的渠道,从已有数据可以看出,播放量大涨时来源基本都是站外。说明站外是提升播放量最有效的手段,只是操作有难度。
此处只讨论针对视频网站内部的操作办法,故站外不在范围之内。

 

结语

关于这次视频网站规则的研究,还有几点想要说明一下

• 以上所有结论基于结果和逻辑推理,进行了一定程度的验证,但是必定会存在未考量到的因素
• 视频网站展示规则不像百度、淘宝体量那么大,研究的人少,可参考的资料少
• 视频网站站内展现的提升对结果的提升可能有限,更多站外的传播才是提升播放量的最好方式,但这不在我能力之内了

发表评论

电子邮件地址不会被公开。 必填项已用*标注