我两年前提过,联邦宇宙的一个主要弱点就是会被过量信息瘫痪( mstdn.one/@lgE/108209164375377 )。在上次DDCC风波时我有推演过可能的攻击手段,目前已有的spam花样比我想象得要简单、来的也更晚。批量垃圾信息是一个“成长的烦恼”。我过去以为邮件系统是一个反spam技术门槛导致重返中心化的反面教材,但进一步了解发现当前独立、健康运行的各种规模的邮件系统其实有很多,风险是可以被管控的。期待未来mastodon可以做得更好。

@lgE 邮件协议历史上没考虑过安全性,才导致了这么多麻烦事。现代邮件协议终于实现了各种反垃圾协议所以现在还挺好:write.c7.io/snullp/liao-jie-xi

而ActivityPub一开始就自带认证,其实和邮件比起来反垃圾要容易得多。就是需要在程序实现就行。协议都不用动。

Follow

@snullp @lgE 主要问题还是在于分散的小服务器几乎很难实现反垃圾,一是用于标记的数据量和算力不够,二是很难进行一刀切式的实例级封禁

· · Web · 3 · 0 · 0

@mashiro @lgE 垃圾数据库是可以分享的。反垃圾也不应当作用在实例层面(可以有反推,比如已知某实例90%+都是垃圾再封禁)。

@snullp @lgE 分享垃圾数据库就有点偏离去中心化的思想了,另外如果有人恶意利用这个数据库去控制用户能看到的内容又该如何应对呢

@mashiro @lgE 数据库是开放可审查的就行。说起中心化,大家不还都用着CF和Mailgun之类的?

@mashiro @lgE 去中心化的意思是Authority去中心化,也就是每个站有自己的决策权力。去中心化不等于selfhost。只要站点有选择和审核的权力,使用商业服务也是很正常的操作。

@snullp @lgE 对,我也是同样的观点,但以目前的水平看,一个 Mastodon 可用的、中立的 spam 平台/数据库短期内不太可能出现

@mashiro @lgE Akismet. 就是贵了点。反垃圾也不是新鲜事,人家email, wordpress反垃圾十几年了。尤其是wordpress,和长毛象的垃圾pattern几乎是一致的。

@mashiro @lgE 我反而觉得钱能解决的问题都是小事。。本来开网站就要花钱。

@snullp @lgE 只能说羡慕了,我是不能白嫖就算了不要了的那种 :ac_classic01:

@mashiro @lgE 弱弱的说一声……如果这样自己玩可以,最好不要host someone else's data.

@snullp @mashiro 基于当前的烈度,只要大站写一个自动化脚本统计乱at账户所属域名,共享出来就能解决不少问题。其他很多spam类型也有相对低成本的识别方法。我担心的是如果有一天自然语言AI的成本降低到攻击者可用的地步会发生什么。

@lgE @snullp 唉,估计也不远了,搞不好到时候连推特和微博这种级别的平台也无力应对了吧 :pio_hematemesis:

@mashiro @snullp 我倒没这么悲观,ai问题就要用ai解决。如果攻击者的成本降低,那防御者的成本也会降低,应该不至于一边倒。

@lgE @mashiro 俺的一个朋友就在做AI anti AI spam startup。等我哪天想换工作了打算去当运维。

@snullp @lgE cf 和 mailgun 不会直接触及核心业务,并且相对来说更具有中立性,共享规则这种就不一样了,之前印象最深刻的就是发现自己用的开源 ss 规则,出于作者/贡献者的个人喜好屏蔽了几个国内手机厂商的服务域名

@mashiro @lgE 用开源不等于伸手主义,用之前不检查不测试那是使用者的责任。CF默认ban botnet,也是共享规则(甚至不开源)呢。

@snullp @lgE 想来想去,似乎目前最好的解决办法还真是只有实例级别屏蔽了😔

@mashiro @lgE 每个实例的思路似乎都不太一样。达成目的就行。

@snullp @lgE 统计垃圾的占比正需要算力和数据量啊,小实例很难做到

@mashiro @snullp 如果未来对抗烈度上升,可能会发展到需要反垃圾合作组织,通过多样的提供商来实现去中心化。其中的关键是:允许快速迭代、程序规则开源、广泛的包括AI的兼容性。

@mashiro @snullp 我想了下,长毛象注册账号几乎没成本,注册域名有成本。如果博弈激烈,封禁的粒度确实比较可能稳定在域名上,根据成本区分级别。

@lgE @mashiro 注册账号的那个人有时间成本。只要不让机器人注册(非常容易)就行。

@snullp @mashiro 这个判断标准取决于实例的注册政策,实际上还是以域名为粒度判定的。

@lgE @mashiro 所以如果一个实例被发现超过比如90%都是垃圾账号,是可以被封禁。但这是第二位的。第一位仍然是跨站inbox的spam API。

@snullp @mashiro spam API 当然需要。我的意思是说,自动封禁机制不仅要判定账号,判定域名也是必要的。

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。