第111章 系统改造(2 / 3)

收益也没有兑现,陆道升手里的可用资金并不多,招不起人。

也不是说招不起几个临时工,或者找几个网管就当给他们个机会赚赚外快,但是这样的人的责任心很难保障,钱不怕多花,事儿不能做岔了,宁可等手头充裕了挑几个合用的。

现阶段,就只能依靠技术优势暂时压住增长的运营人力开销了。

另一个在线的评审系统,则是陆道升在浦外听到人议论自己时临时想到的,那就是能不能把hao123的审核工作给改造一下,然后变成可以分发的小块任务,通过邮件分发给不同的人来处理,处理完成后进行结果的集中处理。

联想的过程大概如下,听到有人议论自己,觉得自己好厉害,心中先暗爽一会儿。

接着想到议论自己的可都是素质极高的大学生,个人素质过硬,这要是能凭自己现在的校内名气给请来帮自己分担一些hao123的人工审核工作,自己可能就不用天天担心对hao123的精力投入不足,有一天会被竞争对手干掉了。

而想到这种多人分担工作任务的情景,陆道升立马回想起前世出现的一种人工标注平台的业务模式(比如)。

在大数据时代,为了使一些机器学习算法取得良好的效果,就需要大量的样本数据供算法进行模型训练。但有时候搜集不到那么多的有效样本数据,就需要人工进行诸如文章分类、图片标注等工作,来人力产生足够多的样本数据。

也有一些靠机器学习算法解决不了的问题,比如色情图片,恶意评论等等,也需要人力审核来进行捕获。

以上这些事情,大大小小的互联网公司都有需求,但是绝大多数公司都不会亲自雇人来做这个事情,而是会转交给专门从事标注工作的第三方公司来完成。

标注工作在参与人员上也有讲究,那就是不能人员数量太少且固定。如果就是雇佣几十上百个人,然后去标注百千万的数据,那么很可能会出现认知偏见。最好是能有更多的不相关的人来参与标注,这样累积出来的数据才不会出现明显的偏向性,才能让机器学习算法训练出适用性最强的预估模型。

为此,这些标注公司演化出了一种分派式的业务模式。

即先从需要对数据进行标注的公司那里获取待标注的数据合集,然后将数据合集分割成一个个数量很少适用于单人的问卷,再将这些问卷通过自己构建的平台分发给平台上的答题人。

一份问卷会多次分配给不同的答题人,以降低回答结果因为个人偏见而离实际太远的概率。

这些答题

-->>(本章未完,请点击下一页继续阅读)