Show newer

GitHub 上看到一个比较实用的笔记插件:Better Notes,需搭配文献管理工具 Zotero 使用。

该插件开箱即用,集成了论文阅读、段落注释、做笔记、元数据分析、知识输出、AI 写作等功能。

GitHub: github.com/windingwind/zotero-

插件完全开源、免费,支持双链笔记、Markdown 与标记语言,并深度集成了文献管理与阅读功能。

:icon_weibo: weibo.com/5722964389/N6XqG6Z8F

GitHub 上一个简单的 AI 入门项目。

实现了 AIGC 中常用的图像/文本模型、向量存储、身份验证、项目部署等一整套流程,可作为开发 AI 应用时的项目参考。

GitHub: github.com/a16z-infra/ai-getti

:icon_weibo: weibo.com/5722964389/N6VXUbzqH

GitHub 上一个增长颇为迅猛的国产运维工具:JumpServer,符合 4A 规范的专业运维安全审计系统,于 2014 年开源,至今仍在持续迭代更新。

项目界面简洁、功能强大,对于初学者来说也十分容易上手,适合各种规模的运维团队使用。

GitHub: github.com/jumpserver/jumpserv

项目主要拥有以下功能:

- 开源: 零门槛,线上快速获取和安装;

- 无插件: 仅需浏览器,极致的 Web Terminal 使用体验;

- 分布式: 支持分布式部署和横向扩展,轻松支持大规模并发访问;

- 多云支持: 一套系统,同时管理不同云上面的资产;

- 多租户: 一套系统,多个子公司或部门同时使用;

- 云端存储: 审计录像云端存储,永不丢失。

此次之外,JumpServer 还可以帮助企业以更安全的方式管控和登录各种类型的资产。

包括 Linux/SSH、Windows、数据库、Kubernetes、远程应用在内的一切资产皆可连接,同时还支持事前授权、事中监察、事后审计,符合 4A 规范,满足了等保合规的要求。

项目开源已有 9 年,代码仍在持续迭代与更新,技术生态建设也颇为完善,感兴趣的同学可以关注下。

:icon_weibo: weibo.com/5722964389/N690IFVdX

Roop,可以一键实现 AI 换脸功能的开源项目,基于 Python 开发。

仅需一张换脸图像,无需数据集,无需训练,自带敏感图像检测功能。

GitHub: github.com/s0md3v/roop

:icon_weibo: weibo.com/5722964389/N63U7sEzT

Vercel 在 GitHub 开源的一个 AI SDK,可帮你快速构建 AI 应用,包括 AI 对话、聊天界面、流式文本输出等功能。

现已集成 OpenAI、Hugging Face、LangChain 等知名 AI 开发工具。未来 AI 应用的开发效率将越来越快,成本越来越低。

GitHub: github.com/vercel-labs/ai

目前已支持 React/Next.js、Svelte/SvelteKit,下一步将支持 Nuxt/Vue。

:icon_weibo: weibo.com/5722964389/N61N34NeN

最近看到一个非常巧妙的 ChatGPT 攻击手段,跟大家分享一下,也算是做个提醒。

简单来说,黑客会利用 LLM 幻觉(Hallucination),在 AI 生成的答案中,找到一些不存在的安装包地址,并将其偷偷替换为自己的木马程序,让 ChatGPT 引导用户安装与下载,进而盗取用户数据。

整个操作手法以及复现过程,可看下面这篇文章的具体介绍。

详细介绍: 如何利用 ChatGPT,盗取用户数据?

不论你是否懂技术,我都建议你了解一下这种攻击手段,有备无患。

:icon_weibo: weibo.com/5722964389/N5zjTtJPy

发现 GitHub 上一个特别好用的 Linux 服务器运维管理面板:1Panel。

开箱即用,通过可视化界面与丰富的开发组件,提供快速建站、一键备份、文件管理等功能,让你能更方便地管理 Linux 服务器。

GitHub: github.com/1Panel-dev/1Panel

另外,项目还提供了以下功能:

- 快速建站:深度集成 Wordpress 和 Halo,域名绑定、SSL 证书配置等一键搞定;

- 高效管理:通过 Web 端轻松管理 Linux 服务器,包括主机监控、文件管理、数据库管理、容器管理等;

- 安全可靠:基于容器来管理和部署应用,最小漏洞暴露面,提供防火墙和日志审计等功能;

- 一键备份:支持一键备份和恢复,备份数据到各类云端存储,永不丢失。

目前项目代码已开源至 GitHub,并提供中文版教程,帮助开发者快速上手使用。

:icon_weibo: weibo.com/5722964389/N5nSfknVe

pixian.ai,能够利用 AI 一键移除各种图像背景,并支持在线调整图片分辨率、背景颜色等等。

目前在 Web 端可免费使用,效果不错。抠出来的图结合 AI 绘画和图像编辑工具,可以做出不少有意思的场景。

:icon_weibo: weibo.com/5722964389/N5hJ6bIQ5

推荐 GitHub 上一款开源的数据分析引擎:esProc SPL。

该工具拥有低代码、高性能、轻量级和全功能的特点,相较于传统 SQL 技术,使用 esProc SPL 可以显著降低整体应用成本。

GitHub: github.com/SPLWare/esProc

由于 SPL 面向结构化和半结构化数据,因此还可用作分析型数据库和数据计算中间件,应用于线下跑批和在线查询场景。

其独创的 SPL 语法使编码更简单且运行效率更高。技术特性包括:算法引擎、存储引擎、多源混算、并行框架、敏捷语法、嵌入集成、数据固化和实时数据。

SPL 支持多数据源混合计算,可无缝集成到应用中,具备良好的集成性和轻量级特性。在性能、开发效率、灵活性和资源节约等方面具有显著优势。

:icon_weibo: weibo.com/5722964389/N4ZUEkDpT

这个项目挺有意思的,让 AI 对你进行技术面试,并给出能力评估,帮助你改善不足之处,提高面试通过率。

用户可根据自身能力来选择面试题难度,项目支持自部署。

GitHub: github.com/Tameyer41/liftoff

:icon_weibo: weibo.com/5722964389/N4Ykbek0d

英特尔在 GitHub 开源了 One Mono 字体。

这是一种富有表现力的等宽字体系列,在构建时考虑到了清晰度、易读性和开发人员的扩展需求。

GitHub: github.com/intel/intel-one-mon

Frere-Jones Type 与 Intel 品牌团队和 VMLY&R 合作,确定了印刷服务不足的低视力开发者受众,设计了 One Mono 字体,以最大程度地提高易读性,解决开发者的疲劳和眼睛疲劳问题,并减少编码错误。

Intel One Mono 涵盖了 200 多种使用拉丁文字的语言,提供四种粗细 — Light、Regular、Medium 和 Bold — 并带有匹配的斜体,项目里面提供了官方发布的可供使用的字体以及可编辑的源代码。

:icon_weibo: weibo.com/5722964389/N4WI7kJxS

国内一位开发者基于 Stable Diffusion + ControlNet 设计出来的二维码。

可以在保留图像编码信息的同时,让二维码结合 AI 绘画,拥有更为丰富的呈现方式。

不过该库暂时没有开源,对二维码设计感兴趣的同学,可以看下作者早期在 GitHub 开源的这个艺术二维码生成器。

GitHub: github.com/ciaochaos/qrbtf

在线体验: 网页链接

:icon_weibo: weibo.com/5722964389/N4ws6bUh6

Diffusers v0.17.0 正式发布,改进了 LoRA、Kandinsky 2.1、Torch 编译加速等特性。

Diffusers 是一个预训练扩散模型的首选库,可用于生成图像、音频,甚至分子的 3D 结构。

GitHub: github.com/huggingface/diffuse

无论你是在寻找简单的推理解决方案还是训练自己的扩散模型,Diffusers 均可作为模块化工具箱提供支持。

该库设计重在可用性与可定制性,主要提供以下 3 个核心组件:

- 最先进的扩散管道,只需几行代码即可在推理中运行;

- 可互换的噪声调度器,用于不同的扩散速度和输出质量;

- 预训练模型可用作构建块,并与调度程序结合使用,用于创建自己的端到端扩散系统。

:icon_weibo: weibo.com/5722964389/N4uZGp1CF

GitHub 上一个强大的图像标记基础模型:Recognize Anything Model (RAM)。

RAM 采用一种新的图像标记范例,可高精度地识别任何常见类别,并利用大规模图像文本对进行训练,而不是手动注释。

GitHub: github.com/xinyu1205/Recognize

RAM 的开发包括四个关键步骤:

  1. 通过自动文本语义解析大规模获取无注释图像标签;

  2. 使用统一标题和标记任务,训练初步模型进行自动注释,分别由原始文本和解析标签监督;

  3. 利用数据引擎生成额外注释并清除不正确的注释;

  4. 利用处理后的数据对模型进行再训练,并使用更小但质量更高的数据集进行微调。

经过众多基准测试评估,RAM 的标记能力颇为优秀,效果明显优于 CLIP 和 BLIP。值得注意的是,RAM 甚至超越了完全监督的方式,甚至可媲美 Google API。

:icon_weibo: weibo.com/5722964389/N4n1FdB8q

微软在 GitHub 开源的 5 个面向初学者的技术教程,包括机器学习、Web 开发、物联网、数据科学、人工智能。

详细介绍: 网页链接

这些教程有着以下特点:

- 总课时均为期 12 周,共 24 节,让你可以合理安排学习计划;

- 每个课程均附有项目实战开发讲解,强调实践出真知;

- 每节课均附有测验说明、草图笔记、作业任务等内容,助你更系统、更全面的掌握课程内容。

目前教程所有资源均已开源至 GitHub,大家可以好好学习一下。

:icon_weibo: weibo.com/5722964389/N4bdelu6A

给大家分享一下 Apple 研究人员 Sterling Crispin 关于 Vision Pro 产品的交流与探讨。

通篇文章科幻感爆棚,你可以从中看到未来一些科技趋势的应用与发展。

比如,利用科技手段实现读心术,根据用户身体和大脑的数据来检测用户的心理状态。基于眼睛的瞳孔反应,对 UI 进行实时性的重新设计,从而创建用户大脑的生物反馈等等。

下面是正文:

当我在 Apple 担任技术开发组的神经技术原型研究员时,我花了 10% 的时间为 的开发做出贡献。这是我做过的最长的一次努力。我为它终于宣布而感到自豪和欣慰。我已经在 AR 和 VR 领域工作了 10 年,在很多方面,这是整个行业在单一产品中的结晶。我很感激我帮助实现了它,如果你想进入这个领域或改进你的策略,我愿意接受任何咨询。

我所做的工作支持了 Vision Pro 的基础开发、正念体验、▇▇▇▇▇▇ 产品,以及更雄心勃勃的神经技术登月研究。比如,预测你会在你点击某物之前点击,基本上是读心术。我在那里工作了 3.5 年,并于 2021 年底离开,所以我很高兴能体验过去两年是如何将一切结合在一起的。我真的很好奇是什么做了剪辑以及稍后将发布什么。

具体来说,我很自豪能够为 Vision Pro 的 ▇▇▇▇▇▇ 计划的初始愿景、战略和方向做出贡献。我在一个小团队中所做的工作帮助为该产品类别开了绿灯,我认为它有一天可能会产生重大的全球影响。

我在 Apple 所做的大部分工作都在 NDA 之下,并且涉及广泛的主题和方法。但是有些事情已经通过专利公开,我可以在下面引用和解释。

总的来说,我做的很多工作都涉及到在沉浸式体验中,根据用户身体和大脑的数据来检测用户的心理状态。

因此,用户处于混合现实或虚拟现实体验中,人工智能模型试图预测你是否感到好奇、走神、害怕、注意力集中、回忆过去的经历或其他一些认知状态。这些可以通过眼动追踪、大脑电活动、心跳和节律、肌肉活动、大脑血液密度、血压、皮肤电导率等测量来推断。

要使特定预测成为可能,涉及很多技巧,我提到的少数专利对此进行了详细说明。最酷的结果之一是预测用户会在他们实际点击之前点击某些东西。这是一项艰巨的工作,也是我引以为豪的事情。你的瞳孔在你点击之前做出反应,部分原因是你预计在你点击之后会发生一些事情。因此,你可以通过监视用户的眼睛行为,并实时重新设计 UI 以创建更多这种预期的瞳孔反应,从而创建用户大脑的生物反馈。这是一个通过眼睛进行的粗糙的脑机接口,但非常酷。而且我随时都会接受侵入性脑部手术。

其他推断认知状态的技巧包括以用户可能察觉不到的方式向用户快速闪烁视觉效果或声音,然后测量他们对此的反应。

另一项专利详细介绍了如何使用机器学习以及来自身体和大脑的信号来预测你的注意力、放松程度或学习情况。然后更新虚拟环境以增强这些状态。因此,想象一个自适应沉浸式环境,它可以通过改变你在背景中看到和听到的内容来帮助你学习、工作或放松。

所有这些细节都可以在专利中公开获得,并且经过精心编写,不会泄露任何内容。我还参与了很多其他事情,希望最终能看到更多。

很多人对这个产品已经等了很长时间了。但这仍然是通往 VR 的道路上的一步。该行业要到本世纪末才能完全赶上这项技术的宏伟愿景。

同样,如果你的企业希望进入该领域或改进你的战略,我愿意接受咨询工作和接听电话。大多数情况下,我感到自豪和欣慰的是,这终于被宣布了。自从我开始从事这项工作已经五年多了,我的大部分时间都花在了上面,其他设计师和工程师也是如此。我希望整体大于部分之和,Vision Pro 让你大吃一惊。

via:twitter.com/sterlingcrispin/status/1665792422914453506

:icon_weibo: weibo.com/5722964389/N41EriX33

经常用 Stable Diffusion 进行 AI 绘图的,可以看下这个开源速查表。

里面拥有超过 700 种经过测试的艺术风格,可快速搜索查找各类艺术家,并支持一键复制 Prompt。

GitHub: github.com/SupaGruen/StableDif

每张图像均有提供 Prompt、Seed、Size、Model 等数据,查找和使用挺方便。

:icon_weibo: weibo.com/5722964389/N3Qqdubhy

一个开发者创业失败之后,把项目开源出来了。

这个项目叫 QR Designer,从名字可以看出,这是一个可用于二维码设计的项目。

通过作者提供的在线工具,我们可以给二维码添加各种图案、文字、图像、更改背景颜色等操作。

GitHub: github.com/kochrt/qr-designer

在线体验: 网页链接

这个工具会在保留二维码图像的原有信息同时,对图案进行重新设计,让二维码识别准确率不会降低。

:icon_weibo: weibo.com/5722964389/N3aW86E0t

看到 GitHub 上一个挺不错的企业任务管理工具:Plane,免费开源,样式大气美观,支持自部署。

你可以将其视为 Jira 的开源替代品,用于各种任务管理、产品路线规划等场景。

GitHub: github.com/makeplane/plane

另外该产品还集成了 GPT,让你更快的处理各种项目文档问题、迭代周期、模块细节等。

:icon_weibo: weibo.com/5722964389/N39lKh74l

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。