当前位置: 网站首页 > 新闻中心
新闻中心
今日头条升级灵犬反低俗助手 新增图片识别功能
时间:2020-03-17  来源:www.oaled.com

[TechWeb] 7月30日,今天的标题宣布正式推出新版反流氓助手(以下简称“灵狗”),同时支持图像和文字识别。这是半年后“灰狗”的另一次重要升级。用户现在可以在今天的头条新闻中搜索“精神犬”以供试用。

据了解,“灰狗”诞生于今天的标题反庸俗模型,是检测内容健康的辅助小工具。 Byte Beat人工智能实验室主任王长虎说,自2012年以来,今天的头条新闻已经建成了数百种模式,包括反色情,反俗,反头条,防伪信息,反低质量,投资近万人。审核小组。

王长虎说,新版“灰狗”扩大了其反俗识别型和模型能力。它现在涵盖了图像识别(反色情粗俗,反血腥暴力)和文本识别(反色情粗俗,反暴力,反头衔)。稍后还将支持语音识别和视频识别。

在过去的一年中,“灰狗”已经完成了两次迭代。在2018年3月28日,今天的头条新闻首次在“灰狗”上发布,支持测试文本和文章的链接。 2018年5月16日,“灰狗”完成了服务容量升级,增加了反色情短文型和谣言模式,准确率从73%提高到82%。 2019年2月20日,“Greyhound 2.0”正式上线。除了反色情粗俗模式外,还增加了反暴力和反标题党模式,以涵盖主要的粗俗和低质量内容类型,整体识别准确率接近85%。

用户只需要在“灰狗”中输入文本或文章链接,“灰狗”可以帮助他检测内容健康指数并返回识别结果。对于用户输入的内容,“灰狗”将首先提取,分段和语义识别,然后根据相关规则输出相应的分数,等级和结论。这一切都在几秒钟内完成。图片和图片链接检测相同,用户可以通过上传“灰狗”中的图片或图片链接快速获取识别结果。

据王长虎介绍,“灰狗”背后的文本分类模型已经历了三次迭代。与旧版本相比,每个新版本的技术和数据集级别都有显着提升。这一代“灰狗”训练的总数据集为1.2T,相当于百度百科全书的20倍或维基百科的总数据的100倍,其中包括920万个样本,并且准确率提高到91%。

在图像识别层面,“灰狗”使用深度学习作为解决方案,并在数据,模型和计算能力方面进行了有针对性的优化。在数据层面,“灰狗”已经积累了数千万的训练数据。在模型层面,“灰狗”优化了许多困难样本的模型结构,并试图解决复杂问题,如多尺寸,多尺度和小目标。在计算层面,“灰狗”使用分布式训练算法和GPU训练集群来加速模型的训练和调试。

截至2019年6月,反流氓助手的使用已超过300万。