Show newer

网易有道开源了一款名为 QAnything 的知识库问答引擎,可实现一键部署!

不仅可调用云端大模型服务,还可实现纯本地部署。但官方建议在配备 NVIDIA 3090 16GB 显存以上的电脑上进行本地部署。

支持导入 PDF、Word(doc/docx)、PPT、Markdown 等多种格式的文档,即可像与 GPT 对话那样,提供准确、快速、可靠的问答体验。

GitHub: github.com/netease-youdao/QAny

主要有如下特点:

- 数据安全:支持全程断网安装与使用。

- 跨语种问答:无缝切换中英文问答,不限文件语种。

- 海量数据处理:采用两阶段向量排序,有效解决大规模数据检索问题,数据越多效果越好。

- 高性能生产级系统:适用于企业应用的直接部署。

- 易用性:无需繁琐的配置,一键安装部署,拿来就用。

- 多知识库问答:支持选择多个知识库进行问答。

:icon_weibo: weibo.com/5722964389/NCivo7c6k

GitHub 上一个能够让 PDF 看起来像是扫描过的小众实用工具 Look Scanned。

一个能够让 PDF 看起来就像是扫描件一样的纯前端网站!不需要打印机和扫描仪,只需要点几下即可完成转换。

GitHub: github.com/rwv/lookscanned.io

具有如下特点:

- 隐私:所有数据均在自己本地浏览器进行处理。

- 速度:无需繁琐过程,只需点击几下按钮,几秒间得到所需要的扫描件。

- 个性化:提供调整参数让生成的扫描件看起来更真实。同时可实时预览效果,所见即所得。

- 跨平台:不仅能在所有浏览器上使用,在手机上也能用!

- 开源免费且可离线使用。

:icon_weibo: weibo.com/5722964389/NChkklg4i

在 GitHub 上有这么一份精心整理的数据库学习合集 Awesome Database Learning。

里面内容非常丰富,涵盖了课程、书籍、讲座、论文等数据库相关的学习资料。

GitHub: github.com/pingcap/awesome-dat

通过这份合集你将了解数据库内部工作原理。

:icon_weibo: weibo.com/5722964389/NCg9h4lyk

在 GitHub 上有一个称之为 “AI Gateway(AI 网关)” 的工具。

通过统一简单的 API,让你轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等。

GitHub: github.com/Portkey-AI/gateway

具有如下特点:

- 占用空间极小,仅仅约 45kb,但其处理速度极快,达到快 9.9 倍。

- 可以同时连接多个模型,并能处理多个模型、服务提供商和密钥之间的负载平衡。

- 设置故障转移机制,当一个模型出现无法使用情况,可自动切换到可用模型,确保你的应用持续稳定运行。

- 默认配置自动重试,并采用指数回退策略,进一步提高请求的稳定性。

- 可根据需求添加中间件,满足你个性化需求。

- 已经在超过 100B Tokens 上进行了实战测试。

:icon_weibo: weibo.com/5722964389/NC6ILzu2Q

GitHub 上一个简单快速的分词、命名实体识别工具:cutword。

这是一个中文分词库,字典文件根据最新数据统计得到,词频更加合理。

GitHub: https:// 网页链接

其分词速度是知名“结巴”中文分词的两倍。

:icon_weibo: weibo.com/5722964389/NC3YicKMg

GitHub 上一个开源的多语言文档 OCR 工具包:Surya。

这是一个专注于文档的 OCR,能够准确的逐行文本检测和识别,并且支持任何语言。

GitHub: https:// 网页链接

未来还会支持具体文本识别以及表格和图像的检测。

:icon_weibo: weibo.com/5722964389/NBZEoA5OP

GitHub 上一款可实现照片级真实感的图像着色工具:DDColor。

它不仅可以为历史黑白老旧照片提供生动自然的着色,还可以对动漫游戏中的风景进行着色或重新着色,变为逼真的现实生活风格!

GitHub: github.com/piddnad/DDColor

又是一款 AI 老旧照片智能上色的工具,可开源免费使用。

:icon_weibo: weibo.com/5722964389/NBYtl76nL

炸裂!阿里发布了一个可替换万物工具 ReplaceAnything。

它能够准确保留你指定的任何物体,如人脸、人物、服装、物品等等,并通过输入提示词,实现超高质量内容替换。

可用于多种场景,如人物替换、服装替换、背景替换等,商用场景有 AI 模特、商品宣传图、艺术写真照等。

GitHub: github.com/AIGCDesignGroup/Rep

其使用步骤很简单:

1、上传图像

2、鼠标轻松点击选择图像保留部分

3、输入提示词,点击生成

4、支持上传参考风格背景图像(可选)

:icon_weibo: weibo.com/5722964389/NBXz9pRhx

前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。

但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。

因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。

GitHub: github.com/hpcaitech/SwiftInfe

:icon_weibo: weibo.com/5722964389/NAS7K9B1u

在 GitHub 上开源维护的中国节假日补班日历。

为 2022-2024 年中国节假日、调休、补班日历,提供 ICS 格式,同时提供 API 获取。

支持 iPhone、Google Calendar、Outlook 等客户端订阅。

GitHub: github.com/lanceliao/china-hol

具有如下特点:

- 节假日信息来自官方,一手信息、权威准确;

- 包含最近 3 年的节假日信息,机器人自动维护,更新及时;

- 日历标题包含放假、补班的天数信息;

- 日历标题包含放假、补班等关键字,方便脚本开发。例如使用iPhone的快捷指令应用编写工作日闹钟;

- 每个补班日程自动设置上班提醒,默认时间为09:00~18:00、提前一个小时提醒;

- 支持个性化定制补班日程的开始、结束时间和提醒时间(例如提前一天提醒);

- 没有广告!!!

:icon_weibo: weibo.com/5722964389/NAK3ybJ3l

OpenVoice:多功能即时声音克隆技术。

这是由 MyShell 团队开发的一项技术,只需提供一段简短的音频样本,就能克隆出原发言者的声音,并能以此生成各种语言的语音。

它具有如下优势:

1)高精度音色克隆

能够高度还原参考音色,支持多语种和多种口音的语音生成。

2)灵活的声音风格调控

可以对声音的情感、口音进行精细调整,还可以控制节奏、停顿和语调等多种声音风格。

3)无需样本的跨语言声音克隆

无论是参考声音还是生成的声音,都可以是大型多语种数据集之外的任何语言。

GitHub: github.com/myshell-ai/OpenVoic

测试了下,中文效果不是很好, 对此 MyShell 团队也清楚并表示正在优化处理。

:icon_weibo: weibo.com/5722964389/NAiw7rRNh

一个自动投简历助手,实现一键自动寻找工作!

结合 GPT 与 RPA 技术制作,通过 GPT 基于你的简历内容和对方的职位要求,自动在招聘平台上匹配合适的职位。

且由 GPT 生成自我介绍以及求职信,并自动发送给 HR,全流程自动操作!

GitHub: github.com/Frrrrrrrrank/auto_j

大家可基于这个脚本进行扩展支持更多招聘平台,但同时需要注意平台机制,以及由 GPT 为你生成的内容。

:icon_weibo: weibo.com/5722964389/NAimK7naB

在 GitHub 上开源的一个文档管理系统 Paperless-ngx。

它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。

GitHub: github.com/paperless-ngx/paper

主要有如下特性:

- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。

- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。

- 文档保存为 PDF 格式,并同时保留未更改的原始文件。

- 支持识别超过 100 多种语言。

- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。

- 界面美观、提供全文搜索功能、邮件处理功能。

- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。

:icon_weibo: weibo.com/5722964389/NA8okDwjM

在 GitHub 上开源的一个极简且易用的电影网站 movie-web。

你可以在上面搜索想看的电影,有点像电影搜索引擎,出来结果后,还可直接点击播放观看。

其特点有:

- 可自动保存播放进度。

- 可收藏想看的电影或节目。

- 界面简洁且易于使用。

- 搜索响应的速度非常快。

- 支持本地部署使用。

GitHub: github.com/movie-web/movie-web

在线体验: 网页链接

测试了下,支持中文输入,也能搜索出最近新上映的电影或电视剧,但有些播放不了。

播放界面支持自动选择分辨率、控制播放速度、视频下载以及上传字幕。

目前项目在 GitHub 上已有 11.7k Star,值得试试,不错的话可收藏。

:icon_weibo: weibo.com/5722964389/NzZ064MGc

推荐 GitHub 上这款开源版的 Spotify 客户端 Spotube,不再需要 Premium 订阅。

GitHub: github.com/KRTirtho/spotube

具有如下特点:

- 无广告,利用公开且免费的 Spotify 与 YT Music API。

- 支持多平台,如 Windows、Mac、Android 等。且安装包体积小。

- 支持下载音乐到本地,可离线播放。

- 支持歌词与播放时间同步。

- 注重用户隐私,不收集用户数据及诊断信息。

- 用的是 Flutter 开发,提供了流畅的原生体验。

- 应用开源免费。

:icon_weibo: weibo.com/5722964389/NzXjp0nQ2

推荐 GitHub 上一份专为首席技术官(CTO )设计的资源清单:awesome-cto。

这份清单是由国外一位 CTO Dima 精心收集整理分享出来的,并称非常适用于初创公司和快速成长的企业。

内容含有 CTO 角色介绍、招聘技巧、团队管理、职业发展、项目管理实践、开发流程、初创公司指南、产品开发、市场营销等等。

GitHub: github.com/kuchin/awesome-cto

这些都是 Dima 收集的各种指南、使用到的工具以及相关技巧,值得看看。

:icon_weibo: weibo.com/5722964389/NzmZDfDhj

Stirling-PDF:一款强大的本地网页版 PDF 文件处理工具,可 Docker 部署。

提供了丰富的 PDF 文件操作功能,包括拆分、合并、格式转换、内容排列、添加图片、旋转、压缩等。

其安全私密性非常高,不会对外发送任何数据,所有文件和 PDF 操作都是在客户端进行,或者仅在服务器内存中临时处理,任务完成后即刻删除。

一旦用户下载了文件,该文件就会从服务器上删除。

GitHub: github.com/Frooodle/Stirling-P

整体大功能:

- 支持暗黑模式。

- 提供自定义下载选项(可参考这里的示例)。

- 支持多文件并行处理和下载,提高效率。

- 提供 API 接口,方便与外部脚本进行集成。

- 可选择是否开启登录和认证功能(详细文档见此)。

详细列举 PDF 文件操作功能如图 2,分为页面操作、转换操作、安全与权限和其他操作几大部分。

值得一说,该项目最初是完全由 GPT 开发的,后面才逐步加入更多 PDF 处理功能,成为这款强大工具。

:icon_weibo: weibo.com/5722964389/Nz3Yy5Stj

clone-voice:一个带 Web 界面简单易用的声音克隆工具。

可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

支持中、英、日、韩、法、德、意等 16 种语言,另外还可以在线从麦克风录制声音。

使用非常简单,提供 exe 整合包,开箱即用。

GitHub: github.com/jianchang512/clone-

该项目所有模型均源于 Coqui AI 的 TTS,只可用于学习研究,不可商用。

表现方面英文效果很不错,但中文效果还可凑合使用。

:icon_weibo: weibo.com/5722964389/NyUSJm4Zu

Amphion:一个开源的音频、音乐和语音生成整合工具包。

支持如下功能:

- 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。

- 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。

- 文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。

GitHub: github.com/open-mmlab/Amphion

以上功能均可在 HuggingFace 上使用。

地址: huggingface.co/spaces/amphion/

:icon_weibo: weibo.com/5722964389/NyBlizeys

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。