我会用google collab做一些比较小的数据小项目。
在chrome里装了一个chatgpt for google collab插件后,真的好爽啊。
代码有问题的话就让它fix,或者给一些error message和更多info,直接给出正确的代码,再也不用stack overflow搜半天了 好适合我这种平时就是复制粘贴拼拼凑凑写代码的人。
插件链接: https://chrome.google.com/webstore/detail/chatgpt-for-google-colab/dfhfeifekpgapdlhfakecbbinnnfoohh
@mashiro 一时间没找到之前看的一篇文章,不过保持一个目录下面的文件数量小于256(或者附近)是可以让这个目录只需要一个独立的 iNode 不用扩展。而大多数时候,磁盘上的 inode 访问后会缓存在内存,速度非常快。
开源~Mastodon S3文件同步程序,基于数据库里面的记录同步文件,不用遍历对象储存,保护你的👛,还可以顺便清理数据库中已经没有记录的失效文件(Mastodon在一两年前加入了一个cache文件夹、一年前加了一个storage policy version,产生了一些失效但未删除的文件)
mastodon(或者说gem paperclip)一个恶心的地方是储存媒体文件时要把activity record id拆分成了一大串子目录:如图1的文件,其原本的id是104530971904218116,最后被拆成了104/530/971/904/218/116 (:id_partition部分)
我想不出这样设计有什么意义,但是最终的结果是list对象储存时会产生大量性格最贵的C类请求。misskey是将所有文件储存在根目录,list n个文件产生n次C类请求,这是最理想的情况,但是同样的n个文件mastodon要产生n*(6+2)次C类请求,+2是因为104/530/971/904/218/116 下面还有original和small两个子文件夹。
打算趁这次重构的机会把这个地方改一下,直接把所有内容写在文件名上不就行了:
':prefix_url:class/:attachment/:id_partition/:style/:filename' -> ':prefix_url:class/:attachment/:id-:style-:filename'
minio的gateway模式已经废弃了啊。。。
https://blog.min.io/deprecation-of-the-minio-gateway/
RT yely⁷
Ryuichi Sakamoto was battling cancer and his one of the last days was documented on Yoongi's upcoming documentary according to him. We will see two legends meeting each other when Yoongi went to Tokyo in September, 2022 https://t.co/gEOloTNIR3
Chinese 🇨🇳 / Dictatorial Admin / Mastodon Code Contributor / 摸鱼技术布道师
Steam: https://steamcommunity.com/id/MashiroBest
Epic: https://store.epicgames.com/en-US/u/d211c824cbd94aaeba898db6bb823ff7
原批交流群:966322309