王小美: "@snullp@c7.io @lgE@mstdn.one 主要问题还是在于分散的小服务器几乎很难实…" - 小森林

Feb 19, 2024, 17:03

ImmunoglobulinE @[email protected]

我两年前提过，联邦宇宙的一个主要弱点就是会被过量信息瘫痪（ https://mstdn.one/@lgE/108209164375377962 ）。在上次DDCC风波时我有推演过可能的攻击手段，目前已有的spam花样比我想象得要简单、来的也更晚。批量垃圾信息是一个“成长的烦恼”。我过去以为邮件系统是一个反spam技术门槛导致重返中心化的反面教材，但进一步了解发现当前独立、健康运行的各种规模的邮件系统其实有很多，风险是可以被管控的。期待未来mastodon可以做得更好。

Feb 19, 2024, 18:05 *

大松鼠 @[email protected]

@lgE 邮件协议历史上没考虑过安全性，才导致了这么多麻烦事。现代邮件协议终于实现了各种反垃圾协议所以现在还挺好：https://write.c7.io/snullp/liao-jie-xian-dai-smtp-he-dian-you-anti-spam-xie-yi-spf-dkim-dmarc

而ActivityPub一开始就自带认证，其实和邮件比起来反垃圾要容易得多。就是需要在程序实现就行。协议都不用动。

王小美 @[email protected]

@snullp @lgE 主要问题还是在于分散的小服务器几乎很难实现反垃圾，一是用于标记的数据量和算力不够，二是很难进行一刀切式的实例级封禁

Feb 19, 2024, 19:16 · · Web · · ·

Feb 19, 2024, 19:19

大松鼠 @[email protected]

@mashiro @lgE 垃圾数据库是可以分享的。反垃圾也不应当作用在实例层面（可以有反推，比如已知某实例90%+都是垃圾再封禁）。

Feb 19, 2024, 19:21

王小美 @[email protected]

@snullp @lgE 分享垃圾数据库就有点偏离去中心化的思想了，另外如果有人恶意利用这个数据库去控制用户能看到的内容又该如何应对呢

Feb 19, 2024, 19:23

大松鼠 @[email protected]

@mashiro @lgE 数据库是开放可审查的就行。说起中心化，大家不还都用着CF和Mailgun之类的？

Feb 19, 2024, 19:27

大松鼠 @[email protected]

@mashiro @lgE 去中心化的意思是Authority去中心化，也就是每个站有自己的决策权力。去中心化不等于selfhost。只要站点有选择和审核的权力，使用商业服务也是很正常的操作。

Feb 19, 2024, 19:30

王小美 @[email protected]

@snullp @lgE 对，我也是同样的观点，但以目前的水平看，一个 Mastodon 可用的、中立的 spam 平台/数据库短期内不太可能出现

Feb 19, 2024, 19:32 *

大松鼠 @[email protected]

@mashiro @lgE Akismet. 就是贵了点。反垃圾也不是新鲜事，人家email, wordpress反垃圾十几年了。尤其是wordpress，和长毛象的垃圾pattern几乎是一致的。

Feb 19, 2024, 19:35

王小美 @[email protected]

@snullp @lgE 确实，要钱就是个大问题了🥲

Feb 19, 2024, 19:36

大松鼠 @[email protected]

@mashiro @lgE 我反而觉得钱能解决的问题都是小事。。本来开网站就要花钱。

Feb 19, 2024, 19:43

王小美 @[email protected]

@snullp @lgE 只能说羡慕了，我是不能白嫖就算了不要了的那种

Feb 19, 2024, 19:49

大松鼠 @[email protected]

@mashiro @lgE 弱弱的说一声……如果这样自己玩可以，最好不要host someone else's data.

Feb 19, 2024, 19:43

ImmunoglobulinE @[email protected]

@snullp @mashiro 基于当前的烈度，只要大站写一个自动化脚本统计乱at账户所属域名，共享出来就能解决不少问题。其他很多spam类型也有相对低成本的识别方法。我担心的是如果有一天自然语言AI的成本降低到攻击者可用的地步会发生什么。

Feb 19, 2024, 19:46

王小美 @[email protected]

@lgE @snullp 唉，估计也不远了，搞不好到时候连推特和微博这种级别的平台也无力应对了吧

Feb 19, 2024, 19:48

大松鼠 @[email protected]

@mashiro @lgE 鄙人认为Fediverse正是对抗AI spam的解决方案：
https://write.c7.io/snullp/guan-yu-hu-lian-wang-xin-zao-bi-chi-dao-di-ceng-xia-chatgpt-de-re-du

Feb 19, 2024, 19:49

ImmunoglobulinE @[email protected]

@mashiro @snullp 我倒没这么悲观，ai问题就要用ai解决。如果攻击者的成本降低，那防御者的成本也会降低，应该不至于一边倒。

Feb 19, 2024, 19:50 *

大松鼠 @[email protected]

@lgE @mashiro 俺的一个朋友就在做AI anti AI spam startup。等我哪天想换工作了打算去当运维。

Feb 19, 2024, 19:28 *

王小美 @[email protected]

@snullp @lgE cf 和 mailgun 不会直接触及核心业务，并且相对来说更具有中立性，共享规则这种就不一样了，之前印象最深刻的就是发现自己用的开源 ss 规则，出于作者/贡献者的个人喜好屏蔽了几个国内手机厂商的服务域名

Feb 19, 2024, 19:29 *

大松鼠 @[email protected]

@mashiro @lgE 用开源不等于伸手主义，用之前不检查不测试那是使用者的责任。CF默认ban botnet，也是共享规则（甚至不开源）呢。

Feb 19, 2024, 19:34

王小美 @[email protected]

@snullp @lgE 想来想去，似乎目前最好的解决办法还真是只有实例级别屏蔽了😔

Feb 19, 2024, 19:35

大松鼠 @[email protected]

@mashiro @lgE 每个实例的思路似乎都不太一样。达成目的就行。

Feb 19, 2024, 19:22

王小美 @[email protected]

@snullp @lgE 统计垃圾的占比正需要算力和数据量啊，小实例很难做到

Feb 19, 2024, 19:23

ImmunoglobulinE @[email protected]

@mashiro @snullp 如果未来对抗烈度上升，可能会发展到需要反垃圾合作组织，通过多样的提供商来实现去中心化。其中的关键是：允许快速迭代、程序规则开源、广泛的包括AI的兼容性。

Feb 19, 2024, 20:16

ImmunoglobulinE @[email protected]

@mashiro @snullp 我想了下，长毛象注册账号几乎没成本，注册域名有成本。如果博弈激烈，封禁的粒度确实比较可能稳定在域名上，根据成本区分级别。

Feb 19, 2024, 20:16

大松鼠 @[email protected]

@lgE @mashiro 注册账号的那个人有时间成本。只要不让机器人注册（非常容易）就行。

Feb 19, 2024, 20:18

ImmunoglobulinE @[email protected]

@snullp @mashiro 这个判断标准取决于实例的注册政策，实际上还是以域名为粒度判定的。

Feb 19, 2024, 20:20

大松鼠 @[email protected]

@lgE @mashiro 所以如果一个实例被发现超过比如90%都是垃圾账号，是可以被封禁。但这是第二位的。第一位仍然是跨站inbox的spam API。

Feb 19, 2024, 20:34

ImmunoglobulinE @[email protected]

@snullp @mashiro spam API 当然需要。我的意思是说，自动封禁机制不仅要判定账号，判定域名也是必要的。

Sign in to participate in the conversation