能不能开放个数据接口抓历史帖供研究用?
目前想到能做的几件事:
1. 用BERT查重,禁发重复内容的主题贴,以鼓励第一时间转发新闻的第一个id
2. 用版主事先选定好的若干样本学习,自动禁止/标记人身攻击贴
BERT模型计算量不大,可以在10年以前的旧笔记本上完全离线跑起来
本站有没有兴趣引入AI过滤机制
版主: wh
#2 Re: 本站有没有兴趣引入AI过滤机制
谢谢建议。
不知道重复内容情况有多严重,也没见大家反馈。另外,转帖功能是很多人提出来为了把重复内容的帖子转到不同版。
现在没有帖子没有标记是不是人身攻击。现在的人工智能应该不需要论坛数据就可以判断是不是人身攻击内容。
不知道重复内容情况有多严重,也没见大家反馈。另外,转帖功能是很多人提出来为了把重复内容的帖子转到不同版。
现在没有帖子没有标记是不是人身攻击。现在的人工智能应该不需要论坛数据就可以判断是不是人身攻击内容。
+2.00 积分 [版主 wh 发放的奖励]