分享过很多开源 AI 项目,常见会提供一个 Docker 部署方法。
如果你对 Docker 不了解,推荐你看下这份《Docker 从入门到实践》学习指南。
该指南涵盖了 Docker 的各个方面知识,如基本安装、镜像使用、容器操作、数据管理、网络配置等等,旨在教会新手小白有效使用 Docker。
GitHub: https://github.com/yeasy/docker_practice
看了下内容,虽然教程很早就出了,但基础知识依然还是值得学习,新手入门完全没问题。
网易有道开源了一款名为 QAnything 的知识库问答引擎,可实现一键部署!
不仅可调用云端大模型服务,还可实现纯本地部署。但官方建议在配备 NVIDIA 3090 16GB 显存以上的电脑上进行本地部署。
支持导入 PDF、Word(doc/docx)、PPT、Markdown 等多种格式的文档,即可像与 GPT 对话那样,提供准确、快速、可靠的问答体验。
GitHub: https://github.com/netease-youdao/QAnything
主要有如下特点:
- 数据安全:支持全程断网安装与使用。
- 跨语种问答:无缝切换中英文问答,不限文件语种。
- 海量数据处理:采用两阶段向量排序,有效解决大规模数据检索问题,数据越多效果越好。
- 高性能生产级系统:适用于企业应用的直接部署。
- 易用性:无需繁琐的配置,一键安装部署,拿来就用。
- 多知识库问答:支持选择多个知识库进行问答。
GitHub 上一个能够让 PDF 看起来像是扫描过的小众实用工具 Look Scanned。
一个能够让 PDF 看起来就像是扫描件一样的纯前端网站!不需要打印机和扫描仪,只需要点几下即可完成转换。
GitHub: https://github.com/rwv/lookscanned.io
具有如下特点:
- 隐私:所有数据均在自己本地浏览器进行处理。
- 速度:无需繁琐过程,只需点击几下按钮,几秒间得到所需要的扫描件。
- 个性化:提供调整参数让生成的扫描件看起来更真实。同时可实时预览效果,所见即所得。
- 跨平台:不仅能在所有浏览器上使用,在手机上也能用!
- 开源免费且可离线使用。
在 GitHub 上有这么一份精心整理的数据库学习合集 Awesome Database Learning。
里面内容非常丰富,涵盖了课程、书籍、讲座、论文等数据库相关的学习资料。
GitHub: https://github.com/pingcap/awesome-database-learning
通过这份合集你将了解数据库内部工作原理。
在 GitHub 上有一个称之为 “AI Gateway(AI 网关)” 的工具。
通过统一简单的 API,让你轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等。
GitHub: https://github.com/Portkey-AI/gateway
具有如下特点:
- 占用空间极小,仅仅约 45kb,但其处理速度极快,达到快 9.9 倍。
- 可以同时连接多个模型,并能处理多个模型、服务提供商和密钥之间的负载平衡。
- 设置故障转移机制,当一个模型出现无法使用情况,可自动切换到可用模型,确保你的应用持续稳定运行。
- 默认配置自动重试,并采用指数回退策略,进一步提高请求的稳定性。
- 可根据需求添加中间件,满足你个性化需求。
- 已经在超过 100B Tokens 上进行了实战测试。
GitHub 上一个简单快速的分词、命名实体识别工具:cutword。
这是一个中文分词库,字典文件根据最新数据统计得到,词频更加合理。
GitHub: https:// 网页链接
其分词速度是知名“结巴”中文分词的两倍。
GitHub 上一个开源的多语言文档 OCR 工具包:Surya。
这是一个专注于文档的 OCR,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub: https:// 网页链接
未来还会支持具体文本识别以及表格和图像的检测。
GitHub 上一款可实现照片级真实感的图像着色工具:DDColor。
它不仅可以为历史黑白老旧照片提供生动自然的着色,还可以对动漫游戏中的风景进行着色或重新着色,变为逼真的现实生活风格!
GitHub: https://github.com/piddnad/DDColor
又是一款 AI 老旧照片智能上色的工具,可开源免费使用。
炸裂!阿里发布了一个可替换万物工具 ReplaceAnything。
它能够准确保留你指定的任何物体,如人脸、人物、服装、物品等等,并通过输入提示词,实现超高质量内容替换。
可用于多种场景,如人物替换、服装替换、背景替换等,商用场景有 AI 模特、商品宣传图、艺术写真照等。
GitHub: https://github.com/AIGCDesignGroup/ReplaceAnything
其使用步骤很简单:
1、上传图像
2、鼠标轻松点击选择图像保留部分
3、输入提示词,点击生成
4、支持上传参考风格背景图像(可选)
前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。
但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。
因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。
在 GitHub 上开源维护的中国节假日补班日历。
为 2022-2024 年中国节假日、调休、补班日历,提供 ICS 格式,同时提供 API 获取。
支持 iPhone、Google Calendar、Outlook 等客户端订阅。
GitHub: https://github.com/lanceliao/china-holiday-calender
具有如下特点:
- 节假日信息来自官方,一手信息、权威准确;
- 包含最近 3 年的节假日信息,机器人自动维护,更新及时;
- 日历标题包含放假、补班的天数信息;
- 日历标题包含放假、补班等关键字,方便脚本开发。例如使用iPhone的快捷指令应用编写工作日闹钟;
- 每个补班日程自动设置上班提醒,默认时间为09:00~18:00、提前一个小时提醒;
- 支持个性化定制补班日程的开始、结束时间和提醒时间(例如提前一天提醒);
- 没有广告!!!
OpenVoice:多功能即时声音克隆技术。
这是由 MyShell 团队开发的一项技术,只需提供一段简短的音频样本,就能克隆出原发言者的声音,并能以此生成各种语言的语音。
它具有如下优势:
1)高精度音色克隆
能够高度还原参考音色,支持多语种和多种口音的语音生成。
2)灵活的声音风格调控
可以对声音的情感、口音进行精细调整,还可以控制节奏、停顿和语调等多种声音风格。
3)无需样本的跨语言声音克隆
无论是参考声音还是生成的声音,都可以是大型多语种数据集之外的任何语言。
GitHub: https://github.com/myshell-ai/OpenVoice
测试了下,中文效果不是很好, 对此 MyShell 团队也清楚并表示正在优化处理。
一个自动投简历助手,实现一键自动寻找工作!
结合 GPT 与 RPA 技术制作,通过 GPT 基于你的简历内容和对方的职位要求,自动在招聘平台上匹配合适的职位。
且由 GPT 生成自我介绍以及求职信,并自动发送给 HR,全流程自动操作!
GitHub: https://github.com/Frrrrrrrrank/auto_job__find__chatgpt__rpa
大家可基于这个脚本进行扩展支持更多招聘平台,但同时需要注意平台机制,以及由 GPT 为你生成的内容。
在 GitHub 上开源的一个文档管理系统 Paperless-ngx。
它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
GitHub: https://github.com/paperless-ngx/paperless-ngx
主要有如下特性:
- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。
- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。
- 文档保存为 PDF 格式,并同时保留未更改的原始文件。
- 支持识别超过 100 多种语言。
- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。
- 界面美观、提供全文搜索功能、邮件处理功能。
- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。
在 GitHub 上开源的一个极简且易用的电影网站 movie-web。
你可以在上面搜索想看的电影,有点像电影搜索引擎,出来结果后,还可直接点击播放观看。
其特点有:
- 可自动保存播放进度。
- 可收藏想看的电影或节目。
- 界面简洁且易于使用。
- 搜索响应的速度非常快。
- 支持本地部署使用。
GitHub: https://github.com/movie-web/movie-web
在线体验: 网页链接
测试了下,支持中文输入,也能搜索出最近新上映的电影或电视剧,但有些播放不了。
播放界面支持自动选择分辨率、控制播放速度、视频下载以及上传字幕。
目前项目在 GitHub 上已有 11.7k Star,值得试试,不错的话可收藏。
推荐 GitHub 上这款开源版的 Spotify 客户端 Spotube,不再需要 Premium 订阅。
GitHub: https://github.com/KRTirtho/spotube
具有如下特点:
- 无广告,利用公开且免费的 Spotify 与 YT Music API。
- 支持多平台,如 Windows、Mac、Android 等。且安装包体积小。
- 支持下载音乐到本地,可离线播放。
- 支持歌词与播放时间同步。
- 注重用户隐私,不收集用户数据及诊断信息。
- 用的是 Flutter 开发,提供了流畅的原生体验。
- 应用开源免费。
GitHubDaily 2023 年在微博所分享的开源项目,已分类整理到 GitHub 上,大家可自行查找学习。
GitHub: https://github.com/GitHubDaily/GitHubDaily
过去一年,感谢大家的陪伴,希望我们曾经分享过的项目,能对你有所帮助
。
推荐 GitHub 上一份专为首席技术官(CTO )设计的资源清单:awesome-cto。
这份清单是由国外一位 CTO Dima 精心收集整理分享出来的,并称非常适用于初创公司和快速成长的企业。
内容含有 CTO 角色介绍、招聘技巧、团队管理、职业发展、项目管理实践、开发流程、初创公司指南、产品开发、市场营销等等。
GitHub: https://github.com/kuchin/awesome-cto
这些都是 Dima 收集的各种指南、使用到的工具以及相关技巧,值得看看。
Stirling-PDF:一款强大的本地网页版 PDF 文件处理工具,可 Docker 部署。
提供了丰富的 PDF 文件操作功能,包括拆分、合并、格式转换、内容排列、添加图片、旋转、压缩等。
其安全私密性非常高,不会对外发送任何数据,所有文件和 PDF 操作都是在客户端进行,或者仅在服务器内存中临时处理,任务完成后即刻删除。
一旦用户下载了文件,该文件就会从服务器上删除。
GitHub: https://github.com/Frooodle/Stirling-PDF
整体大功能:
- 支持暗黑模式。
- 提供自定义下载选项(可参考这里的示例)。
- 支持多文件并行处理和下载,提高效率。
- 提供 API 接口,方便与外部脚本进行集成。
- 可选择是否开启登录和认证功能(详细文档见此)。
详细列举 PDF 文件操作功能如图 2,分为页面操作、转换操作、安全与权限和其他操作几大部分。
值得一说,该项目最初是完全由 GPT 开发的,后面才逐步加入更多 PDF 处理功能,成为这款强大工具。
clone-voice:一个带 Web 界面简单易用的声音克隆工具。
可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。
支持中、英、日、韩、法、德、意等 16 种语言,另外还可以在线从麦克风录制声音。
使用非常简单,提供 exe 整合包,开箱即用。
GitHub: https://github.com/jianchang512/clone-voice
该项目所有模型均源于 Coqui AI 的 TTS,只可用于学习研究,不可商用。
表现方面英文效果很不错,但中文效果还可凑合使用。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报