随着互联网的飞速发展,我们进入了一个信息爆炸的时代。图文、视频、聊天、直播等互动内容已经成为人们日常工作、生活不可或缺的部分。然而,在这些日益增长的内容中却充斥着各种不良言论、垃圾广告、涉黄等网络垃圾。这些流窜在互联网中的垃圾内容,不仅极大程度影响了用户体验,也让不少企业倍感困扰。
面对日益复杂的安全形势,企业该如何“祛污”,守护内容安全?在11月6日至7日举办的首届腾讯 Techo 开发者大会云安全技术与应用专场上,腾讯安全业务安全总监杨红围绕《新时代的内容风控实践与创新》,针对文本、图片、音频等载体的内容安全,从现状分析、算法选择、对抗过程及实践效果等方面着手,全景呈现了腾讯安全天御在守护内容安全上的实践经验。
色情AI识别模型,毫秒级识别不良音频
音频是现阶段网络上发展最快的信息载体。当下,游戏内语音交流已成常态,无论是手机游戏中的音频传输,还是通过语音及时通讯工具传输的音频内容,都是音频垃圾内容的灾区,但音频内容时间短、信道复杂,难以识别,成为内容安全监管中的难点。
在海量的音频识别中,“鉴黄”无疑挑战巨大。相较标准AV音频的识别,色情音频在内容、时长和信道维度都有其特点网图搜索识别,比如存在静音、噪声干扰大,存在较大的背景音乐,而且时间较短,编码格式多样和采样率不统一等特点,这都为识别造成一定困难。针对这一问题,腾讯安全基于AI设计了一套色情音频识别流程,通过相应技术去掉静音内容,对音频进行分段识别,最后根据每个片段的得分和时长汇总得到整条语音内容的识别结果。针对音频样本搜集与标注的难点,腾讯安全天御大量综合网友举报,通过多类型、多标签标注,已实现音频鉴黄的准确率达到82%、召回率达到90%以上。
而针对网络谩骂网图搜索识别,腾讯安全天御构建了高性能多语种语音关键词系统,通过特征提取、声学建模和解码等技术加持,可毫秒级识别不良音频。
线上打击+离线主动收集标注,恶意文本无处藏身
网络文本是网络中最大的信息载体,几乎所有互联网平台都面临文本安全问题。网络文本类垃圾消息通常含有特殊符号、变异字、多音字、形近字干扰,而传统的文本策略抗干扰能力弱,常常会导致误杀。
腾讯安全天御对此专门建立了一套垃圾文本识别模型——TextCNN文本分类算法,通过在线实时打击和离线主动收集标注让恶意文本无处藏身。在线模型训练中,补充了拼音和结构信息用于训练,对训练数据添同音字和拆字,提升抗干扰性。对于线上模型不能覆盖的新类型恶意垃圾,腾讯安全天御设计了离线样本主动收集流程,让学习算法主动提出要对哪些数据进行标注,增量训练分类模型进行实时打击。
在这套算法的支撑下,腾讯安全天御提升了至少50%以上的识别覆盖范围,准确率和召回率分别达到90%和80%以上。
多标签学习+细粒度识别,扫荡网图黑暗角落
图片是仅次于文本的第二大信息载体,其面临的识别挑战比文本更大,腾讯安全天御针对性地提出了多标签的图像识别算法,支持多标签输出、多种标签预测,这意味着在一定颗粒度下,给图片配上“身份证”以便识别。
腾讯安全天御丰富的数据积累是这套算法得以运行的关键。目前腾讯安全天御积累了各种涉黄图片数据500多万,每张图片有5个主要标签和10个细粒度标签。在标签识别中,不同的标签数量差距大、样本不平衡,各维度标签响应不同、统一阈值召回低的情况普遍存在,这也成为图片识别中的难点,腾讯安全天御采取标签级动态采样,使低频标签召回率提升15%;对维度标签问题,则使用验证集进行阈值搜索,设置多阈值。
与此同时,腾讯安全天御自研的logo元素识别算法,能够做到做到不同位置、尺度、分辨率、透视视角、遮挡干扰情况下具备良好的识别效果,准确率和召回率分别达到90%以上。
企业在接入腾讯安全天御内容风控的能力上非常便捷。腾讯安全天御不仅提供API接口,还可以协同腾讯云等产品接入企业的内容风控系统,帮助企业零开发、快速识别平台中可能存在的违规内容。
目前,腾讯安全天御的内容风控通过腾讯云和微信小程序已服务超过5万家开发者。行业渗透率达90%,审核效率提升20倍以上,业务健康程度达到99.89%,守护数万家客户的内容安全,保障业务健康开展,守卫互联网的清朗绿色。
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击网站首页每天更新
站 长 微 信: aiwo51889
有小伙伴常会遇到这样一个问题:Word的默认设置情况下,封面的页眉页脚与正文相同,如下所示。
但在很多文档中,如,论文、报告等,我们会看到首页的页眉页脚,与正文不同,或首页(封面)不需要设置页眉页脚,这是怎么实现的呢?这时,你可以通过下面的方法来设置。
方法:设置完页眉页脚后,选择【设计】选项卡,勾选“首页不同”选项,删除首页页眉页脚内容即可。
(3)奇数页和偶数页不同
在书籍的排版或企业合同等文档中,常会发现,奇数页和偶数页的页眉页脚显示不同。如,奇数页页眉显示书名,偶数页的页眉显示章节名。
这是怎么实现的?这看似复杂其实非常简单从任意页开始设置页码,你只需在【设计】选项卡中勾选“奇偶页不同”选项即可。
注:页脚的操作与页眉相似。
(4)删除页眉横线
在添加页眉的时候,文字下方自动生成有一根横线。但是呢,文档中要求没有横线?我们又该如何删除掉呢?
方法:双击页眉处,进入页眉编辑状态。选择【开始】选项卡,单击【样式】旁边的下拉按钮,然后在弹出的下拉选项中选择“清除格式”即可轻松搞定。
效果如下图所示:
页码设置
无论是在论文排版或编写书籍,我们都需要在Word文档中每一页插入该页面的数目,用于统计书籍的面数从任意页开始设置页码,同时可以更好的方便用户阅读和查阅。那么,如何插入页码呢?
(1)插入页码
在Word中如果我们只是想插入一些普通页码,方法非常简单:选择【插入】-【页眉页脚】组,单击“页码”按钮,在弹出的下拉列表中选择一种页码样式,双击即在文档每一页插入连续的页。
(2)页码从第N页开始
我们在用Word排版论文、书籍、杂专等文档时,一般前几页需要做成其他内容(如,封面,前言、摘要、目录等),这些内容页一般是不需要编排页码的。但是,插入页码都会默认从第一页开始,到了正文部分都已经是第N页了,这个问题相信不少小伙伴都遇见过,那我们应该如何解决呢?
(1)首先插入页码。点击【插入】-【页眉和页脚】-【页码】-【页面底端】,选择一种样式的页码。
下面重点来了:这里需要使用分节符,将你要重新编页码的部分独立分出来。这里我们在目录与正文的绪论之间插入分节符,将文档分成两个部分。
(2)将光标定位到目录页末尾处,点击【布局】-【页面设置】-【分页符】-【下一页】。
提示:Word默认状态下,插入分页符后的页面我们看不到任何变化。可在【开始】-【段落】组中点击“显示/隐藏编辑标记”按钮,将插入的分节符(下一页)显示出来。
(3)然后双击“绪论”正文页(即第4页)页码处,进入页码编辑状态。此时,在【页眉和页脚工具】-【设计】-【导航】选项卡中,单击“链接到前一条页眉”按钮,取消各节的关联,以便对每节进行单独页码编写。
(4)选择第4页的页码,将其删除。由于前面我们取消了各节关联,此时,你就会发现,第4页及后面的页码被全部删除了。而第4页前面的页码均未受到影响。
(5)然后选择【插入】-【页眉和页脚】-【页码】,选择“设置页码格式”命令,打开“页码格式”对话框,设置“起始页码”为“1”,单击“确定”按钮。
(6)再次选择【插入】-【页眉和页脚】-【页码】-【页面底端】,选择一种样式的页码。
现在你会发现,从第4页开始页码已变为1、2、3的形式。
(3)设置页码格式
设置好页码之后,如果想更改页码的样式及页码开始的数字等格式。
只需点击【插入】-【页眉和页脚】-【页码】,选择“设置页码格式”命令,打开“页码格式”对话框,在“编号格式”下拉列表中可选择编号的样式(如,阿拉伯数字、大写数字等);如果在“页码编号”栏中选中“续前节”选项,那么,页码将顺延累计;如果设定起始页码为X,那么该页将从X页开始编号。
想学更多Word实用技巧
《Word长文档高效排版实战》视频课
让你即学即用,升职加薪快人一步
视频+素材+辅导答疑
限时特价
18元
长按下方二维码购买
如有问题
请戳客服
你若喜欢,别忘了点个在看哦
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击网站首页每天更新
站 长 微 信: aiwo51889