v3/csec/word_filter

目录

1 /v3/csec/word_filter

检查文本中是否存在敏感词,并进行相应的处理:
(1)如果文本中含有高度敏感词汇的时候,则直接返回"文本中有敏感词",不返回被*替代后的文本;
(2)如果文本中含有其它级别的敏感词汇,则将敏感词替换成*,然后将文本返回。

注:
(1)文本必须是utf-8编码,否则会导致敏感词不能被过滤。
(2)文本urlencode后的长度不能超过9000,否则会报错。
(3)文本参加签名的时候使用原始参数,避免出现重复urlencode的情况。尤其中文不能出现两次urlencode,不然会导致签名错误。

1.1 URL

http://[域名]/v3/csec/word_filter

正式环境域名或测试环境IP详见:API3.0文档#请求URL说明

1.2 格式

json

1.3 HTTP请求方式

GET, POST

1.4 IP限制

TRUE

1.5 输入参数说明

各个参数请进行URL 编码,编码时请遵守 RFC 1738

(1)公共参数
发送请求时必须传入公共参数,详见公共参数说明

(2)私有参数

参数名称 是否必须 类型 描述
content 必须 string 待检查是否存在敏感词的文本。

必须是utf-8编码,否则会导致敏感词不能被过滤。文本的urlencode的长度不能超过9000,否则会报错。
文本参加签名的时候使用原始参数,避免出现重复urlencode的情况。尤其中文不能出现两次urlencode,不然会导致签名错误。

以中文“阿斯利康庸6”为例(测试时可直接用该示例词,可用测试词汇详见1.10节):
utf-8的urlencode结果:%E9%98%BF%E6%96%AF%E5%88%A9%E5%BA%B7%E5%BA%B86 ;
如果采用了gbk的urlencode结果(%B0%A2%CB%B9%C0%FB%BF%B5%D3%B96),则不符合要求。

opuid string 操作用户的UID。UID为应用自身的帐号体系中用户的ID,没有则不传。

例如:用户A对B发起了留言,这里填A的uid。

touid string 被操作用户的uid。UID为应用自身的帐号体系中用户的ID,没有则不传。

例如:用户A对B发起了留言,这里填B的uid。

toopenid string 被操作用户的openid。

例如:用户A对B发起了留言,这里填B的openid。

msgid 必须 string 留言编号ID。最大长度64字节。务必保证msgid能唯一对应一条消息,该字段属于保留字段,用于后续程序扩展。

示例:12bbccddeeaabbccddeeaabbccddeeaabbccddee22

actionid string 操作类型。

6:表示留言; 7:表示留言回复; 8:表示其他。

1.6 请求示例

http://113.108.20.23/v3/csec/word_filter?
openid=B624064BA065E01CB73F835017FE96FA&
openkey=5F154D7D2751AEDC8527269006F290F70297B7E54667536C&
appid=2&
sig=9999b41ad0b688530bb1b21c5957391c&
pf=qzone&
format=json&
userip=112.90.139.30&
content=thisiscontent&
opuid=xxx&
touid=xxx&
toopenid=xxx&
msgid=12bbccddeeaabbccddeeaabbccddeeaabbccddee22&
actionid=6

1.7 返回参数说明

参数名称 描述
ret 返回码。其中:

0: 正确返回
其他:错误返回,详见公共返回码说明#OpenAPI V3.0 返回码

is_lost 判断是否有数据丢失。如果应用不使用cache,不需要关心此参数。

0或者不返回:没有数据丢失,可以缓存。
1:有部分数据丢失或错误,不要缓存。

is_dirty 判断文本中是否有敏感词。0:没有; 1:有。
msg 如果错误,返回错误信息。

如果成功:
(1)如果文本中含有高度敏感词汇的时候,则直接返回"文本中有敏感词",不返回被*替代后的文本;
(2)如果文本中含有其它级别的敏感词汇,则将敏感词替换成*,然后将文本返回。

1.8 正确返回示例

JSON示例:
(1)文本中没有敏感词时

Content-type: text/thml;charset=utf-8
{
"ret": 0,
"is_lost": 0,
"is_dirty": 0,
"msg": "words no dirty"
}


(2)文本中有敏感词时,敏感词会被替换为“ * ”号

Content-type: text/thml;charset=utf-8
{
"ret": 0,
"is_lost": 0,
"is_dirty": 1,
"msg": "*****已经******"
}


1.9 错误返回示例

Content-type: text/html; charset=utf-8
{
"ret":1002,
"msg":"请先登录"
}

1.10 测试用词汇说明

1. 高度敏感词:阿斯利康庸1 阿斯利康庸2 阿斯利康庸3 阿斯利康庸4
2. 其他敏感词:阿斯利康庸5 阿斯利康庸6

以上信息是否解决您的问题?

Copyright © 1998 - 2019 Tencent. All Rights Reserved.

腾讯公司 版权所有

有问必答 返回顶部