Show newer

在 GitHub 上有这么一份精心整理的数据库学习合集 Awesome Database Learning。

里面内容非常丰富,涵盖了课程、书籍、讲座、论文等数据库相关的学习资料。

GitHub: github.com/pingcap/awesome-dat

通过这份合集你将了解数据库内部工作原理。

:icon_weibo: weibo.com/5722964389/NCg9h4lyk

在 GitHub 上有一个称之为 “AI Gateway(AI 网关)” 的工具。

通过统一简单的 API,让你轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等。

GitHub: github.com/Portkey-AI/gateway

具有如下特点:

- 占用空间极小,仅仅约 45kb,但其处理速度极快,达到快 9.9 倍。

- 可以同时连接多个模型,并能处理多个模型、服务提供商和密钥之间的负载平衡。

- 设置故障转移机制,当一个模型出现无法使用情况,可自动切换到可用模型,确保你的应用持续稳定运行。

- 默认配置自动重试,并采用指数回退策略,进一步提高请求的稳定性。

- 可根据需求添加中间件,满足你个性化需求。

- 已经在超过 100B Tokens 上进行了实战测试。

:icon_weibo: weibo.com/5722964389/NC6ILzu2Q

GitHub 上一个简单快速的分词、命名实体识别工具:cutword。

这是一个中文分词库,字典文件根据最新数据统计得到,词频更加合理。

GitHub: https:// 网页链接

其分词速度是知名“结巴”中文分词的两倍。

:icon_weibo: weibo.com/5722964389/NC3YicKMg

GitHub 上一个开源的多语言文档 OCR 工具包:Surya。

这是一个专注于文档的 OCR,能够准确的逐行文本检测和识别,并且支持任何语言。

GitHub: https:// 网页链接

未来还会支持具体文本识别以及表格和图像的检测。

:icon_weibo: weibo.com/5722964389/NBZEoA5OP

GitHub 上一款可实现照片级真实感的图像着色工具:DDColor。

它不仅可以为历史黑白老旧照片提供生动自然的着色,还可以对动漫游戏中的风景进行着色或重新着色,变为逼真的现实生活风格!

GitHub: github.com/piddnad/DDColor

又是一款 AI 老旧照片智能上色的工具,可开源免费使用。

:icon_weibo: weibo.com/5722964389/NBYtl76nL

炸裂!阿里发布了一个可替换万物工具 ReplaceAnything。

它能够准确保留你指定的任何物体,如人脸、人物、服装、物品等等,并通过输入提示词,实现超高质量内容替换。

可用于多种场景,如人物替换、服装替换、背景替换等,商用场景有 AI 模特、商品宣传图、艺术写真照等。

GitHub: github.com/AIGCDesignGroup/Rep

其使用步骤很简单:

1、上传图像

2、鼠标轻松点击选择图像保留部分

3、输入提示词,点击生成

4、支持上传参考风格背景图像(可选)

:icon_weibo: weibo.com/5722964389/NBXz9pRhx

前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。

但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。

因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。

GitHub: github.com/hpcaitech/SwiftInfe

:icon_weibo: weibo.com/5722964389/NAS7K9B1u

在 GitHub 上开源维护的中国节假日补班日历。

为 2022-2024 年中国节假日、调休、补班日历,提供 ICS 格式,同时提供 API 获取。

支持 iPhone、Google Calendar、Outlook 等客户端订阅。

GitHub: github.com/lanceliao/china-hol

具有如下特点:

- 节假日信息来自官方,一手信息、权威准确;

- 包含最近 3 年的节假日信息,机器人自动维护,更新及时;

- 日历标题包含放假、补班的天数信息;

- 日历标题包含放假、补班等关键字,方便脚本开发。例如使用iPhone的快捷指令应用编写工作日闹钟;

- 每个补班日程自动设置上班提醒,默认时间为09:00~18:00、提前一个小时提醒;

- 支持个性化定制补班日程的开始、结束时间和提醒时间(例如提前一天提醒);

- 没有广告!!!

:icon_weibo: weibo.com/5722964389/NAK3ybJ3l

OpenVoice:多功能即时声音克隆技术。

这是由 MyShell 团队开发的一项技术,只需提供一段简短的音频样本,就能克隆出原发言者的声音,并能以此生成各种语言的语音。

它具有如下优势:

1)高精度音色克隆

能够高度还原参考音色,支持多语种和多种口音的语音生成。

2)灵活的声音风格调控

可以对声音的情感、口音进行精细调整,还可以控制节奏、停顿和语调等多种声音风格。

3)无需样本的跨语言声音克隆

无论是参考声音还是生成的声音,都可以是大型多语种数据集之外的任何语言。

GitHub: github.com/myshell-ai/OpenVoic

测试了下,中文效果不是很好, 对此 MyShell 团队也清楚并表示正在优化处理。

:icon_weibo: weibo.com/5722964389/NAiw7rRNh

一个自动投简历助手,实现一键自动寻找工作!

结合 GPT 与 RPA 技术制作,通过 GPT 基于你的简历内容和对方的职位要求,自动在招聘平台上匹配合适的职位。

且由 GPT 生成自我介绍以及求职信,并自动发送给 HR,全流程自动操作!

GitHub: github.com/Frrrrrrrrank/auto_j

大家可基于这个脚本进行扩展支持更多招聘平台,但同时需要注意平台机制,以及由 GPT 为你生成的内容。

:icon_weibo: weibo.com/5722964389/NAimK7naB

在 GitHub 上开源的一个文档管理系统 Paperless-ngx。

它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。

GitHub: github.com/paperless-ngx/paper

主要有如下特性:

- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。

- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。

- 文档保存为 PDF 格式,并同时保留未更改的原始文件。

- 支持识别超过 100 多种语言。

- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。

- 界面美观、提供全文搜索功能、邮件处理功能。

- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。

:icon_weibo: weibo.com/5722964389/NA8okDwjM

在 GitHub 上开源的一个极简且易用的电影网站 movie-web。

你可以在上面搜索想看的电影,有点像电影搜索引擎,出来结果后,还可直接点击播放观看。

其特点有:

- 可自动保存播放进度。

- 可收藏想看的电影或节目。

- 界面简洁且易于使用。

- 搜索响应的速度非常快。

- 支持本地部署使用。

GitHub: github.com/movie-web/movie-web

在线体验: 网页链接

测试了下,支持中文输入,也能搜索出最近新上映的电影或电视剧,但有些播放不了。

播放界面支持自动选择分辨率、控制播放速度、视频下载以及上传字幕。

目前项目在 GitHub 上已有 11.7k Star,值得试试,不错的话可收藏。

:icon_weibo: weibo.com/5722964389/NzZ064MGc

推荐 GitHub 上这款开源版的 Spotify 客户端 Spotube,不再需要 Premium 订阅。

GitHub: github.com/KRTirtho/spotube

具有如下特点:

- 无广告,利用公开且免费的 Spotify 与 YT Music API。

- 支持多平台,如 Windows、Mac、Android 等。且安装包体积小。

- 支持下载音乐到本地,可离线播放。

- 支持歌词与播放时间同步。

- 注重用户隐私,不收集用户数据及诊断信息。

- 用的是 Flutter 开发,提供了流畅的原生体验。

- 应用开源免费。

:icon_weibo: weibo.com/5722964389/NzXjp0nQ2

推荐 GitHub 上一份专为首席技术官(CTO )设计的资源清单:awesome-cto。

这份清单是由国外一位 CTO Dima 精心收集整理分享出来的,并称非常适用于初创公司和快速成长的企业。

内容含有 CTO 角色介绍、招聘技巧、团队管理、职业发展、项目管理实践、开发流程、初创公司指南、产品开发、市场营销等等。

GitHub: github.com/kuchin/awesome-cto

这些都是 Dima 收集的各种指南、使用到的工具以及相关技巧,值得看看。

:icon_weibo: weibo.com/5722964389/NzmZDfDhj

Stirling-PDF:一款强大的本地网页版 PDF 文件处理工具,可 Docker 部署。

提供了丰富的 PDF 文件操作功能,包括拆分、合并、格式转换、内容排列、添加图片、旋转、压缩等。

其安全私密性非常高,不会对外发送任何数据,所有文件和 PDF 操作都是在客户端进行,或者仅在服务器内存中临时处理,任务完成后即刻删除。

一旦用户下载了文件,该文件就会从服务器上删除。

GitHub: github.com/Frooodle/Stirling-P

整体大功能:

- 支持暗黑模式。

- 提供自定义下载选项(可参考这里的示例)。

- 支持多文件并行处理和下载,提高效率。

- 提供 API 接口,方便与外部脚本进行集成。

- 可选择是否开启登录和认证功能(详细文档见此)。

详细列举 PDF 文件操作功能如图 2,分为页面操作、转换操作、安全与权限和其他操作几大部分。

值得一说,该项目最初是完全由 GPT 开发的,后面才逐步加入更多 PDF 处理功能,成为这款强大工具。

:icon_weibo: weibo.com/5722964389/Nz3Yy5Stj

clone-voice:一个带 Web 界面简单易用的声音克隆工具。

可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

支持中、英、日、韩、法、德、意等 16 种语言,另外还可以在线从麦克风录制声音。

使用非常简单,提供 exe 整合包,开箱即用。

GitHub: github.com/jianchang512/clone-

该项目所有模型均源于 Coqui AI 的 TTS,只可用于学习研究,不可商用。

表现方面英文效果很不错,但中文效果还可凑合使用。

:icon_weibo: weibo.com/5722964389/NyUSJm4Zu

Amphion:一个开源的音频、音乐和语音生成整合工具包。

支持如下功能:

- 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。

- 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。

- 文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。

GitHub: github.com/open-mmlab/Amphion

以上功能均可在 HuggingFace 上使用。

地址: huggingface.co/spaces/amphion/

:icon_weibo: weibo.com/5722964389/NyBlizeys

TikTokDownloader:一款完全免费开源的 抖音/TikTok 采集工具。

主要功能清单如下:

- 下载 抖音/TikTok 无水印 视频/图集

- 批量下载 抖音/TikTok 账号 发布/喜欢 作品

- 可采集 抖音/TikTok 详细数据,如作品评论数据、账号数据、热榜数据等

- 多账号批量下载作品

- 获取抖音直播推流地址,可下载直播视频

- 支持部署至 私有/公开 服务器

GitHub: github.com/JoeanAmier/TikTokDo

Windows 10 以上的用户可直接下载开箱即用的整合包,而 Mac 用户可通过源码运行使用。

该作者还有另一个开源项目:XHS-Downloader 是小红书的 图文/视频 作品采集工具。

主要功能清单:

- 采集小红书图文/视频作品信息

- 提取小红书图文/视频作品下载地址

- 下载小红书无水印图文/视频作品文件

- 自动跳过已下载的作品文件

- 作品文件完整性处理机制

- 持久化储存作品信息至文件

GitHub: github.com/JoeanAmier/XHS-Down

这两款开源免费工具,基本能平替市场大部分的收费软件,有需要的收藏使用。

:icon_weibo: weibo.com/5722964389/Ny9wDsfl6

微软出了一期学习 GitHub Copilot 教程。

一共有 6 节课程,共 10 个小时。旨在教授如何有效使用 GitHub Copilot 并用于辅助编程。

本教程适合那些想了解 GitHub,并想使用 GitHub Copilot 辅助自己编程的人学习。

课程如下:

1)GitHub 介绍

快速开始使用 GitHub,介绍仓库、分支、提交和拉取请求的基础知识。

2)GitHub Codespaces 介绍

使用 GitHub Codespaces 和 Visual Studio Code 开发代码,学习如何创建 codespace、从 codespace 推送代码、选择自定义镜像,以及自定义 codespace 的方法。

3)GitHub Copilot 介绍

学习 GitHub Copilot 如何通过在 VS Code 和 Codespaces 中提供自动完成式建议帮助编码。

4)JavaScript 编程搭配使用 GitHub Copilot

利用 GitHub Copilot 这个 AI 配对程序员,为编写 JavaScript 提供自动完成式建议。

5)Python 编程搭配使用 GitHub Copilot

利用 GitHub Copilot 这个 AI 配对程序员,为编写 Python 提供自动完成式建议。

6)使用 GitHub Copilot 创建迷你游戏

利用 GitHub Copilot 协助构建基于 Python 的迷你游戏。

课程地址: github.com/microsoft/Mastering

通过该课程,你将学会:

- GitHub 基础使用,包括理解和操作仓库、分支、提交和拉取请求。

- 了解 GitHub Codespaces 和 GitHub Copilot。

- 学会 GitHub Copilot 的自动完成功能、自定义选项和高级编程技巧。

:icon_weibo: weibo.com/5722964389/NxFSGaC1l

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。