我会用google collab做一些比较小的数据小项目。
在chrome里装了一个chatgpt for google collab插件后,真的好爽啊。
代码有问题的话就让它fix,或者给一些error message和更多info,直接给出正确的代码,再也不用stack overflow搜半天了 好适合我这种平时就是复制粘贴拼拼凑凑写代码的人。
插件链接: https://chrome.google.com/webstore/detail/chatgpt-for-google-colab/dfhfeifekpgapdlhfakecbbinnnfoohh
开源~Mastodon S3文件同步程序,基于数据库里面的记录同步文件,不用遍历对象储存,保护你的👛,还可以顺便清理数据库中已经没有记录的失效文件(Mastodon在一两年前加入了一个cache文件夹、一年前加了一个storage policy version,产生了一些失效但未删除的文件)
mastodon(或者说gem paperclip)一个恶心的地方是储存媒体文件时要把activity record id拆分成了一大串子目录:如图1的文件,其原本的id是104530971904218116,最后被拆成了104/530/971/904/218/116 (:id_partition部分)
我想不出这样设计有什么意义,但是最终的结果是list对象储存时会产生大量性格最贵的C类请求。misskey是将所有文件储存在根目录,list n个文件产生n次C类请求,这是最理想的情况,但是同样的n个文件mastodon要产生n*(6+2)次C类请求,+2是因为104/530/971/904/218/116 下面还有original和small两个子文件夹。
打算趁这次重构的机会把这个地方改一下,直接把所有内容写在文件名上不就行了:
':prefix_url:class/:attachment/:id_partition/:style/:filename' -> ':prefix_url:class/:attachment/:id-:style-:filename'
Chinese 🇨🇳 / Dictatorial Admin / Mastodon Code Contributor / 摸鱼技术布道师
Steam: https://steamcommunity.com/id/MashiroBest
Epic: https://store.epicgames.com/en-US/u/d211c824cbd94aaeba898db6bb823ff7
原批交流群:966322309