6.7.3 后置型策略设计
后置型策略是指已经产生了劣质评论之后的策略。让我们回到理想态的定义:希望收到他们认为专业的、轻松有趣的评论内容。但接下来的问题是,每个人认为的“专业、轻松有趣”的评论内容的标准是一致的吗?如果每个人对于“优质”的标准是不一致的,那如何进行价值观层面的个性化预测呢?
对于用户价值观的“优质”,笔者的项目经验中有三点产品洞察。
现象1:大多数用户在“劣质内容”上有共性认知,在“优质内容”上缺乏共性认知。
每个人的价值观是不同的,历史数据表明用户对于“优质”的判断是不同的,即不同的两个用户认为的优质内容很大概率完全不同,而对于劣质内容的判断则有较大的趋同性,即不同的两个用户在什么是劣质内容上往往更容易达成一致。
举例来说,假设所有线上的用户我们都能随时采访到,随机采访10个用户,他们告诉你的好评论内容(不是描述,而是具体的例子)往往随机性非常大。这件事情本身不难理解,体育爱好者用户甲可能更喜欢对体育比赛评论,而文学爱好者用户乙不这么认为,这是由于不同用户的信息量是不同的,所以对于优质内容的标准也是不同的。
但是大多数用户对于劣质内容,比如低俗色情、没营养、病句的内容有较多共鸣,这是由于社会整体语境对于劣质内容有比较明确的定义。
现象2:模型不擅长识别优质内容,更擅长识别劣质内容。
第二个现象是模型并不擅长识别优质内容。有监督模型的训练样本对于优质内容和劣质内容的判断难度是不同的,标注优质内容的样本比标注劣质内容的样本难度大很多。优质内容的识别不仅在模型训练上更难,在模型结果主观评估上也更难。“优质内容认知迥异,劣质内容认知趋同”的现象导致标注员对于劣质内容的评估更能达成一致意见,从而项目迭代速度会更快。
另外,劣质内容分类器起步较早,因为劣质内容识别的场景更多、需求强度更高。比如在PC搜索时代就有基于机器学习的反垃圾模型,在行业内有许多成型的模型可以参考,并形成了规模效应。
现象3:只要对极端实例做处理,即可满足需求。
现象3主要是基于产品洞察,由于现象1和现象2同时存在,模型在识别劣质内容上更为得心应手,标注员在劣质内容上也更能达成一致意见,这是一个重要的先决条件。
基于用户访谈和对人性的理解,大部分用户并非是“广域敏感”的人,只需要排除掉极端劣质的共性评论内容。对于其他的评论内容而言,大多数用户内心还是希望评论数量越多越好。这对平台而言也是需要的,只有大多数的评论都展现,可阅读消费的内容才更多,更容易形成评论区调性。
基于以上原因,我们做了充分的用户调研,对于用户发布内容后收到的评论采取的可行后置型策略有用户删除策略和评论折叠策略。用户删除策略包括“允许用户删除部分评论”,以及“允许用户举报部分评论并经过平台审核后再予以删除”。这两种方式主要取决于平台的顶层设计,在作者侧更重要的产品阶段(比如内容量较少),建议选择前者,在消费侧更重要的产品阶段(比如内容量重组),建议选择后者。评论折叠策略指的是可以对一部分极其劣质的评论进行折叠,当前知乎社区采用了这一策略设计,用来维护社区内容健康发展。