一路 BBS

 找回密码
 注册
搜索
查看: 1250|回复: 6
打印 上一主题 下一主题

是不是需要这么一种标记敏感词的小软件

[复制链接]
跳转到指定楼层
楼主
发表于 2-10-2009 14:23:23 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本文通过一路BBS站telnet客户端发布


在盾下的论坛发贴时,有时候帖子受到论坛限制,直接发不出去,
手动检查关键词费时费力。

能不能编个小软件,检查文本,而这个软件则包含有盾系统的常见敏感词汇,经常更新
文本自动检查标记所有的可能被盾的敏感词汇,用不同颜色标记敏感程度
发帖子时先自己校验一下,保持原意的基础上替换一些词汇,这样可以尽量不触发网监系统,提高帖子存活率。



--
回复

使用道具 举报

沙发
发表于 2-10-2009 14:23:52 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布


有,google“竖排软件”

【 在 jprp (极品人品) 的大作中提到: 】
: 在盾下的论坛发贴时,有时候帖子受到论坛限制,直接发不出去,
: 手动检查关键词费时费力。
: 能不能编个小软件,检查文本,而这个软件则包含有盾系统的常见敏感词汇,经常更新
: 文本自动检查标记所有的可能被盾的敏感词汇,用不同颜色标记敏感程度
: 发帖子时先自己校验一下,保持原意的基础上替换一些词汇,这样可以尽量不触发网监系统,提高帖子存活率。
: ...................

--
回复 支持 反对

使用道具 举报

板凳
发表于 2-10-2009 14:25:33 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布


CSW中文分词组件也可以
http://www.sharebank.com.cn/soft/SoftView_12543.htm

【 在 jprp (极品人品) 的大作中提到: 】
: 在盾下的论坛发贴时,有时候帖子受到论坛限制,直接发不出去,
: 手动检查关键词费时费力。
: 能不能编个小软件,检查文本,而这个软件则包含有盾系统的常见敏感词汇,经常更新
: 文本自动检查标记所有的可能被盾的敏感词汇,用不同颜色标记敏感程度
: 发帖子时先自己校验一下,保持原意的基础上替换一些词汇,这样可以尽量不触发网监系统,提高帖子存活率。
: ...................

--
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2-10-2009 14:35:12 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布

这个是可以 就是太大了,只需要其中的一部分功能就可以了

而且这个小软件应该完全免费,还需要跟随网监系统即时更新



【 在 bridged (断桥:随时收消息,有信必复,谢谢大家) 的大作中提到: 】
: CSW中文分词组件也可以
: http://www.sharebank.com.cn/soft/SoftView_12543.htm
: 【 在 jprp (极品人品) 的大作中提到: 】
: : 在盾下的论坛发贴时,有时候帖子受到论坛限制,直接发不出去,
: : 手动检查关键词费时费力。
: : 能不能编个小软件,检查文本,而这个软件则包含有盾系统的常见敏感词汇,经常更新
: ...................

--
回复 支持 反对

使用道具 举报

5#
发表于 2-10-2009 14:52:08 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布


呵呵,等这边站大了,有钱了,我找人做。
这个软件太简单了。估计是大家都不屑于做。都是体力活。

【 在 jprp (极品人品) 的大作中提到: 】
: 这个是可以 就是太大了,只需要其中的一部分功能就可以了
: 而且这个小软件应该完全免费,还需要跟随网监系统即时更新
: 【 在 bridged (断桥:随时收消息,有信必复,谢谢大家) 的大作中提到: 】
: : CSW中文分词组件也可以
: : http://www.sharebank.com.cn/soft/SoftView_12543.htm
: ...................

--
回复 支持 反对

使用道具 举报

6#
发表于 2-10-2009 14:52:50 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布



把附件 bbs-filter.zip 解压缩到一个文件夹中,然后打开 !readme.txt 看看用法。你可以看到,
我从 sopai 时期就采用这个简单的预过滤办法。

过滤的关键词可以看 yjrg.sed 文件,很简单的 sed 字符串替换命令格式。敏感词库则需要你自己逐步探索积累,
大家可以私下交换,不要公开。公开了网狗就知道你替换后的字符串而加以过滤。

其中还有很多是用于将网站上的同主题讨论和用户评论的文字加以重新排版,删除无关内容的 perl 脚本。
需要事先安装 Perl,推荐用 ActiveState Perl [1]。安装好 perl 以后,用法类似。运行文件为 .bat 文件。

大家可以搜集一个敏感词表和替换词表,格式简单为:
s/敏感词/替换词/g

附加到我提供的 .sed 文件后面,就可以了。针对不同的网站,用一套 .bat, .sed 文件。比如 yjrg 就采用 yjrg.bat 调用 sed.exe 去运行 yjrg.sed 。

[1] http://www.activestate.com/store/activeperl/download

【 在 jprp 的大作中提到: 】
: 这个是可以 就是太大了,只需要其中的一部分功能就可以了
: 而且这个小软件应该完全免费,还需要跟随网监系统即时更新
: 【 在 bridged (断桥:随时收消息,有信必复,谢谢大家) 的大作中提到: 】
: : CSW中文分词组件也可以
: (以下引言省略...)

※ 修改:.lihlii 于 Feb 10 18:10:59 修改本文.[FROM: 82.210.0.0]
回复 支持 反对

使用道具 举报

7#
发表于 2-10-2009 15:34:29 | 只看该作者

Re: 是不是需要这么一种标记敏感词的小软件

本文通过一路BBS站telnet客户端发布

这个及时更新的数据好像不好弄到吧。
【 在 bridged (断桥:随时收消息,有信必复,谢谢大家) 的大作中提到: 】
: 呵呵,等这边站大了,有钱了,我找人做。
: 这个软件太简单了。估计是大家都不屑于做。都是体力活。
: 【 在 jprp (极品人品) 的大作中提到: 】
: : 这个是可以 就是太大了,只需要其中的一部分功能就可以了
: : 而且这个小软件应该完全免费,还需要跟随网监系统即时更新
: ...................

--
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表