Show newer

推荐 GitHub 上一款开源的数据分析引擎:esProc SPL。

该工具拥有低代码、高性能、轻量级和全功能的特点,相较于传统 SQL 技术,使用 esProc SPL 可以显著降低整体应用成本。

GitHub: github.com/SPLWare/esProc

由于 SPL 面向结构化和半结构化数据,因此还可用作分析型数据库和数据计算中间件,应用于线下跑批和在线查询场景。

其独创的 SPL 语法使编码更简单且运行效率更高。技术特性包括:算法引擎、存储引擎、多源混算、并行框架、敏捷语法、嵌入集成、数据固化和实时数据。

SPL 支持多数据源混合计算,可无缝集成到应用中,具备良好的集成性和轻量级特性。在性能、开发效率、灵活性和资源节约等方面具有显著优势。

:icon_weibo: weibo.com/5722964389/N4ZUEkDpT

这个项目挺有意思的,让 AI 对你进行技术面试,并给出能力评估,帮助你改善不足之处,提高面试通过率。

用户可根据自身能力来选择面试题难度,项目支持自部署。

GitHub: github.com/Tameyer41/liftoff

:icon_weibo: weibo.com/5722964389/N4Ykbek0d

英特尔在 GitHub 开源了 One Mono 字体。

这是一种富有表现力的等宽字体系列,在构建时考虑到了清晰度、易读性和开发人员的扩展需求。

GitHub: github.com/intel/intel-one-mon

Frere-Jones Type 与 Intel 品牌团队和 VMLY&R 合作,确定了印刷服务不足的低视力开发者受众,设计了 One Mono 字体,以最大程度地提高易读性,解决开发者的疲劳和眼睛疲劳问题,并减少编码错误。

Intel One Mono 涵盖了 200 多种使用拉丁文字的语言,提供四种粗细 — Light、Regular、Medium 和 Bold — 并带有匹配的斜体,项目里面提供了官方发布的可供使用的字体以及可编辑的源代码。

:icon_weibo: weibo.com/5722964389/N4WI7kJxS

国内一位开发者基于 Stable Diffusion + ControlNet 设计出来的二维码。

可以在保留图像编码信息的同时,让二维码结合 AI 绘画,拥有更为丰富的呈现方式。

不过该库暂时没有开源,对二维码设计感兴趣的同学,可以看下作者早期在 GitHub 开源的这个艺术二维码生成器。

GitHub: github.com/ciaochaos/qrbtf

在线体验: 网页链接

:icon_weibo: weibo.com/5722964389/N4ws6bUh6

Diffusers v0.17.0 正式发布,改进了 LoRA、Kandinsky 2.1、Torch 编译加速等特性。

Diffusers 是一个预训练扩散模型的首选库,可用于生成图像、音频,甚至分子的 3D 结构。

GitHub: github.com/huggingface/diffuse

无论你是在寻找简单的推理解决方案还是训练自己的扩散模型,Diffusers 均可作为模块化工具箱提供支持。

该库设计重在可用性与可定制性,主要提供以下 3 个核心组件:

- 最先进的扩散管道,只需几行代码即可在推理中运行;

- 可互换的噪声调度器,用于不同的扩散速度和输出质量;

- 预训练模型可用作构建块,并与调度程序结合使用,用于创建自己的端到端扩散系统。

:icon_weibo: weibo.com/5722964389/N4uZGp1CF

GitHub 上一个强大的图像标记基础模型:Recognize Anything Model (RAM)。

RAM 采用一种新的图像标记范例,可高精度地识别任何常见类别,并利用大规模图像文本对进行训练,而不是手动注释。

GitHub: github.com/xinyu1205/Recognize

RAM 的开发包括四个关键步骤:

  1. 通过自动文本语义解析大规模获取无注释图像标签;

  2. 使用统一标题和标记任务,训练初步模型进行自动注释,分别由原始文本和解析标签监督;

  3. 利用数据引擎生成额外注释并清除不正确的注释;

  4. 利用处理后的数据对模型进行再训练,并使用更小但质量更高的数据集进行微调。

经过众多基准测试评估,RAM 的标记能力颇为优秀,效果明显优于 CLIP 和 BLIP。值得注意的是,RAM 甚至超越了完全监督的方式,甚至可媲美 Google API。

:icon_weibo: weibo.com/5722964389/N4n1FdB8q

微软在 GitHub 开源的 5 个面向初学者的技术教程,包括机器学习、Web 开发、物联网、数据科学、人工智能。

详细介绍: 网页链接

这些教程有着以下特点:

- 总课时均为期 12 周,共 24 节,让你可以合理安排学习计划;

- 每个课程均附有项目实战开发讲解,强调实践出真知;

- 每节课均附有测验说明、草图笔记、作业任务等内容,助你更系统、更全面的掌握课程内容。

目前教程所有资源均已开源至 GitHub,大家可以好好学习一下。

:icon_weibo: weibo.com/5722964389/N4bdelu6A

给大家分享一下 Apple 研究人员 Sterling Crispin 关于 Vision Pro 产品的交流与探讨。

通篇文章科幻感爆棚,你可以从中看到未来一些科技趋势的应用与发展。

比如,利用科技手段实现读心术,根据用户身体和大脑的数据来检测用户的心理状态。基于眼睛的瞳孔反应,对 UI 进行实时性的重新设计,从而创建用户大脑的生物反馈等等。

下面是正文:

当我在 Apple 担任技术开发组的神经技术原型研究员时,我花了 10% 的时间为 的开发做出贡献。这是我做过的最长的一次努力。我为它终于宣布而感到自豪和欣慰。我已经在 AR 和 VR 领域工作了 10 年,在很多方面,这是整个行业在单一产品中的结晶。我很感激我帮助实现了它,如果你想进入这个领域或改进你的策略,我愿意接受任何咨询。

我所做的工作支持了 Vision Pro 的基础开发、正念体验、▇▇▇▇▇▇ 产品,以及更雄心勃勃的神经技术登月研究。比如,预测你会在你点击某物之前点击,基本上是读心术。我在那里工作了 3.5 年,并于 2021 年底离开,所以我很高兴能体验过去两年是如何将一切结合在一起的。我真的很好奇是什么做了剪辑以及稍后将发布什么。

具体来说,我很自豪能够为 Vision Pro 的 ▇▇▇▇▇▇ 计划的初始愿景、战略和方向做出贡献。我在一个小团队中所做的工作帮助为该产品类别开了绿灯,我认为它有一天可能会产生重大的全球影响。

我在 Apple 所做的大部分工作都在 NDA 之下,并且涉及广泛的主题和方法。但是有些事情已经通过专利公开,我可以在下面引用和解释。

总的来说,我做的很多工作都涉及到在沉浸式体验中,根据用户身体和大脑的数据来检测用户的心理状态。

因此,用户处于混合现实或虚拟现实体验中,人工智能模型试图预测你是否感到好奇、走神、害怕、注意力集中、回忆过去的经历或其他一些认知状态。这些可以通过眼动追踪、大脑电活动、心跳和节律、肌肉活动、大脑血液密度、血压、皮肤电导率等测量来推断。

要使特定预测成为可能,涉及很多技巧,我提到的少数专利对此进行了详细说明。最酷的结果之一是预测用户会在他们实际点击之前点击某些东西。这是一项艰巨的工作,也是我引以为豪的事情。你的瞳孔在你点击之前做出反应,部分原因是你预计在你点击之后会发生一些事情。因此,你可以通过监视用户的眼睛行为,并实时重新设计 UI 以创建更多这种预期的瞳孔反应,从而创建用户大脑的生物反馈。这是一个通过眼睛进行的粗糙的脑机接口,但非常酷。而且我随时都会接受侵入性脑部手术。

其他推断认知状态的技巧包括以用户可能察觉不到的方式向用户快速闪烁视觉效果或声音,然后测量他们对此的反应。

另一项专利详细介绍了如何使用机器学习以及来自身体和大脑的信号来预测你的注意力、放松程度或学习情况。然后更新虚拟环境以增强这些状态。因此,想象一个自适应沉浸式环境,它可以通过改变你在背景中看到和听到的内容来帮助你学习、工作或放松。

所有这些细节都可以在专利中公开获得,并且经过精心编写,不会泄露任何内容。我还参与了很多其他事情,希望最终能看到更多。

很多人对这个产品已经等了很长时间了。但这仍然是通往 VR 的道路上的一步。该行业要到本世纪末才能完全赶上这项技术的宏伟愿景。

同样,如果你的企业希望进入该领域或改进你的战略,我愿意接受咨询工作和接听电话。大多数情况下,我感到自豪和欣慰的是,这终于被宣布了。自从我开始从事这项工作已经五年多了,我的大部分时间都花在了上面,其他设计师和工程师也是如此。我希望整体大于部分之和,Vision Pro 让你大吃一惊。

via:twitter.com/sterlingcrispin/status/1665792422914453506

:icon_weibo: weibo.com/5722964389/N41EriX33

经常用 Stable Diffusion 进行 AI 绘图的,可以看下这个开源速查表。

里面拥有超过 700 种经过测试的艺术风格,可快速搜索查找各类艺术家,并支持一键复制 Prompt。

GitHub: github.com/SupaGruen/StableDif

每张图像均有提供 Prompt、Seed、Size、Model 等数据,查找和使用挺方便。

:icon_weibo: weibo.com/5722964389/N3Qqdubhy

一个开发者创业失败之后,把项目开源出来了。

这个项目叫 QR Designer,从名字可以看出,这是一个可用于二维码设计的项目。

通过作者提供的在线工具,我们可以给二维码添加各种图案、文字、图像、更改背景颜色等操作。

GitHub: github.com/kochrt/qr-designer

在线体验: 网页链接

这个工具会在保留二维码图像的原有信息同时,对图案进行重新设计,让二维码识别准确率不会降低。

:icon_weibo: weibo.com/5722964389/N3aW86E0t

看到 GitHub 上一个挺不错的企业任务管理工具:Plane,免费开源,样式大气美观,支持自部署。

你可以将其视为 Jira 的开源替代品,用于各种任务管理、产品路线规划等场景。

GitHub: github.com/makeplane/plane

另外该产品还集成了 GPT,让你更快的处理各种项目文档问题、迭代周期、模块细节等。

:icon_weibo: weibo.com/5722964389/N39lKh74l

EasySpider:一个在 GitHub 开源的可视化爬虫软件。使用图形化界面,无代码设计和执行爬虫任务。

开发者只需在网页上选择爬取内容,并根据提示框操作,即可完成爬虫设计和执行。

GitHub: github.com/NaiboWang/EasySpide

同时,软件还可以单独以命令行的方式进行执行,快速嵌入到其他系统中。

:icon_weibo: weibo.com/5722964389/N1K0G2vP5

LaWGPT:一个基于中文法律知识的大语言模型,你可以用它来打造一个 AI 专属法律顾问。

基于现有的中文 LLM,LaWGPT 扩充了法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。

GitHub: github.com/pengxiao-song/LaWGP

在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。

:icon_weibo: weibo.com/5722964389/N1J1ioVGI

ChatGPT 的 Code interpreter 插件,至今依旧没有对所有 Plus 用户开放。

国外一位开发者苦等无果,憋不住动手做了简化版解决方案:GPT Code UI,并将代码开源到了 GitHub。

GitHub: github.com/ricklamers/gpt-code

该项目可利用大语言模型能力,自动生成与执行代码。另外还支持文件上传、下载,上下文理解,可选 GPT-3.5 和 GPT-4 模型。

不仅如此,作者还分享了整个技术方案的实现细节,感兴趣的也可以学习一下。

技术实现:ricklamers.io/posts/gpt-code/

:icon_weibo: weibo.com/5722964389/N1o8NyGcw

今天凌晨,OpenAI 正式发布了 iOS 客户端!

这代表你可以直接在 iPhone 和 iPad 上直接使用 ChatGPT 进行聊天了,Plus 用户支持 GPT-4,并且没有 25 条消息的限制!这意味着Plus 用户可以无限次数的使用 GPT-4!

详细介绍: 网页链接

不知道这个是新特性还是 Bug,大家可以赶紧去试下。

:icon_weibo: weibo.com/5722964389/N1fLIh6Gd

Transformers 2.0 版本发布,现在,你可以直接在 Web 浏览器上运行 HuggingFace Transformers,实现各种 AI 功能了。

仅需 3 行 JavaScript 代码,即可快速集成使用。

该项目现已支持执行以下 AI 任务:

📝 NLP:文本分类、摘要、翻译和文本生成

🖼️ 视觉:图像分类、对象检测和分割

🗣️ 音频:自动语音识别

🐙 多模态:零示例图像分类

GitHub: github.com/xenova/transformers

:icon_weibo: weibo.com/5722964389/N1dxiEyyx

ChatGPT 的数值计算能力在其发布之初,一直饱受用户诟病。虽然随着 GPT-4 的发布,计算能力明显上升,但偶尔还是会出现计算错误。

为了解决这个问题,GitHub 研究人员做了一个很有意思的研究。

虽然大语言模型的数值计算能力弱,但是它却很擅长写数值逻辑计算代码。

那么,能不能让 GPT-4 来编写计算代码,让 Python 对其进行评估,进而提升大语言模型的数值计算准确度?

简而言之,就是为 GPT-4 装备一个数字计算器,以增强它的能力。

在实验时,还能将计算代码、结果一并输出给用户,让他们可以基于这些数据进行检查、校对、保存。

通过多次对比记录,最终实验结果表明,在给 GPT-4 装备上计算器后,其计算结果的准确度明显上升了不少,不过对于日期计算的能力提升有限。

具体结果对比,可看我这篇帖子中的配图,其中红色部分为未装备计算器,绿色部分则是装备了计算器。

一些原本有着高达 50% 错误率的问题,直接下降到了 0%,着实恐怖。

该计算器代码已开源至 GitHub,技术团队对其进行了封装,在填入 API Key 之后,即可通过脚本运行使用。

GitHub: github.com/githubnext/gpt4-wit

详细介绍: 网页链接

这个项目对于一些基于 ChatGPT 搞数学研究,或者需要出具更为准确的产品分析、市场调研报告等场景将十分有用,建议大家关注一下。

:icon_weibo: weibo.com/5722964389/N1cABnS55

刚刚试着跑了一下,直接配置 DreamStudio API Key 就能用,10 刀可生成 5000 次图像 查看图片 // @National_Security_Council :是要部署到本地吗?

- 转发 @GitHubDaily : Stability AI 正式开源 StableStudio!

这是一个开源的 AI 图像生成平台,作为 DreamStudio 的开源版实现,StableStudio可在线完成 AI 图像生成、编辑、修复等工作。

未来还将加入 AI 聊天机器人、插件系统、桌面应用、WebGPU 本地推理、ControlNet 工具等新特性!

GitHub: github.com/Stability-AI/Stable

:icon_weibo: weibo.com/5722964389/N158sEBeF

Stability AI 正式开源 StableStudio!

这是一个开源的 AI 图像生成平台,作为 DreamStudio 的开源版实现,StableStudio可在线完成 AI 图像生成、编辑、修复等工作。

未来还将加入 AI 聊天机器人、插件系统、桌面应用、WebGPU 本地推理、ControlNet 工具等新特性!

GitHub: github.com/Stability-AI/Stable

:icon_weibo: weibo.com/5722964389/N14VOFWKZ

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。