在数据方面,通过寰宇集团旗下的众多应用,一直在为人工智能提供数据,进行“投喂”,不断的使其迭代。
同时,人工智能研究中心还雇佣了不少外包公司,对他们所“训练”的人工智能,进行人工标注。
以原时空后来名气极大的chatgpt为例,这样的语言模型,如果没有人工标注来筛除一些不恰当的内容,那么它不仅会给出一些错误的信息,更会对用户造成心理不适。
更何况,类似chatgpt这样的预训练模型在训练过程中需使用的数据样本较多,数据标注的需求较高。
那么如何规避上述问题,筛查出有害内容呢?
openai效彷了facebook等社交媒体公司的做法——构建一个额外的ai模型,向它提供暴力、仇恨等带有攻击性的言论,从而让它学会识别相应内容。
这样的模型会被内置到chatgpt中,帮助后者过滤掉一些有害的文本。
在这个过程中,需要大量的人力来给攻击性言论做标注。
这种工作,也只能够在初期通过人工来完善审核模型,直到这个模型完善之后,置入到人工智能之中,才能够让人工智能产品达到市场化的需求。
目前这个审核模型已经应用在了寰宇集团各个内容媒体平台的审核之中,大大减轻了人工审核的工作量。
投推荐票
上一章
章节目录
下一章
加入书签
返回书架
喜欢重生从中奖开始请大家收藏:(www.shuhaige.tw)重生从中奖开始书海阁小说网更新速度全网最快。