三、定期回顾进展并更新方案 到具体执行后,随着进展需进一步补充相关策略,另外在回顾策略和数据观测过程中往往会发现新的问题,也需及时调整。 、算法与人工审核的配合 在项目前期,除了命中敏感词库的内容直接被系统驳回,其他的内容均需要经过人工逐个审核,审核除了判定内容是否通过以外,还需勾选相关内容标签、评估内容等级,人力成本较高,且响应速度有限。 随着内容量的增多,在积累了足够训练样本后,项目引入了算法模型。
涉及: 低质量内容直接判定,人工抽检反馈badcase调优; 一般内容到优质内容的初步判定,人工复审,算法再根 卡塔尔手机号码列表 据复审结果训练模型; 自动生成内容标签,人工抽检反馈badcase调优。 低质量内容之所以直接由算法判定,一是因为低质量的识别难度最小,测试集准确率最高;二是从平台的角度,误判低质量所带来的损失低于误判高质量的损失。 、更丰富的激励方式 除了流量扶持以外,针对高质量内容的创作者,平台还进行了: 成就激励。
包括创作者排行榜、创作者等级标识、创作者周报、创作者证书、颁奖典礼等; 物质激励。满足相关条件的创作者可以获得平台补贴。 、抄袭驳回 由于创作者激励活动对存在金钱补贴,部分创作者为了最大化得获得补贴,出现了抄袭现象。抄袭对象为平台内的其他优质原创内容,并且往往通过缝合拼接多个其他创作者的优质内容实现。 在此背景下,平台上线了内容管理端的抄袭识别功能。其中抄袭识别功能是通过高亮存在抄袭的内容,并且由算法计算出整体抄袭率,超过某一阈值,系统直接驳回。
|