推荐 GitHub 上一个功能丰富的开源 AI 语音工具箱:Easy Voice Toolkit。
工具箱包括音频处理、语音识别、语音转录、数据集制作和语音合成等多种音频工具,形成了一套完整语音模型训练的工作流。
GitHub: https://github.com/Spr-Aachen/Easy-Voice-Toolkit
并且各个工具均支持中文、英文和日文三种语言,提供 Windows 开箱即用的安装包,支持本地部署以及 Google Colab 云端部署。
分享一份从零开始成为一名软件工程师的详细学习指南。
涵盖了理解计算机基础知识、掌握软件开发工具和流程、了解数据库、面向对象编程以及 DevOps 工具等内容。
学习地址: https:// 网页链接
指南从学习 Python 语言开始,结束时还给大家提供一些建议,包括如何准备编码面试、如何选择工作以及如何持续学习和开发个人项目。
推荐 GitHub 上一款可以让小爱音箱播放本地音乐的开源免费工具:xiaomusic。
当通过语音控制播放的音乐不存在时,能自动使用 yt-dlp 搜索匹配的歌曲并下载到本地播放。
GitHub: https://github.com/hanxi/xiaomusic
具有如下特点:
- 支持多种音乐格式,如 mp3、flac、wav 以及 m4a 等;
- 支持口令控制,例如播放歌曲、下一首、全部循环等;
- 支持多设备,基本兼容所有小爱音箱型号;
- 支持配置网络歌单,支持电台和歌曲;
- 支持将 M3U 歌单电台转为网络歌单;
- 支持通过 Docker 部署,也可以部署到 NAS 上;
- 同时还提供简单易用的后台控制面板;
推荐 GitHub 上一个功能强大的数据库图表编辑器:ChartDB。
基于 Web 的数据库图表编辑器,支持多种数据库,包括 PostgreSQL、MySQL、SQL Server、MariaDB 和 SQLite 等。
GitHub: https://github.com/chartdb/chartdb
此外,提供了一个基于 AI 的导出功能,可以生成特定数据库的 DDL 脚本,以便于数据库迁移。
可无需安装,在云端版本上在线使用,当然也可以选择本地部署,数据隐私更安全。
分享一个收集了大量免费 API 的网站:Free Public APIs。
与其他 API 列表区别在于,该网站收集的 API 会每天定时测试一次每个 API 是否可用,确保网站上收集的 API 均可用。
地址: https:// 网页链接
目前已分类整理了 248 个 API,涵盖金融、娱乐、音乐、旅行、交通等类别,可供学生和开发者使用。
推荐 GitHub 上一个开源且强大的 Web 爬虫工具:FireCrawl。
可以爬取任何网站的内容并将其转换为 Markdown 或结构化数据,为大语言模型训练、检索增强生成(RAG)提供数据。
GitHub: https://github.com/mendableai/firecrawl
另外,还提供了易于使用且统一的 API,支持本地部署或在线使用,同时还支持与各种工具集成使用,如 Langchain、Dify、Flowise 等。
而且,项目一直在快速迭代更新增加很多实用的功能,有需求的可以关注并尝试下。
分享 GitHub 上一份从零开始学习机器学习算法教程:Machine-Learning。
包含了神经网络和 Transformer 模型的详细解释,以及关键的 Python 实现代码,如 Neuron、Layer 和 NeuralNetwork 类。
GitHub: https://github.com/DorsaRoh/Machine-Learning
此外,还提供了关于机器学习的视频格式内容和相关的 Jupyter Notebook 文件。
分享一个开源的现代文转古文大模型:ancient_text_generation_LLM。
基于荀子基座大模型微调训练,通过输入现代汉语句子,能够转化为古汉语风格的句子。
GitHub: https://github.com/JianXiao2021/ancient_text_generation_LLM
推荐 GitHub 上一款简单易用、快速且免费的文件翻译工具:DeeplxFile。
基于 Deeplx/playwright 实现,不限制文件大小,支持超长文本翻译,使用 DeepL 作为翻译源,
能够翻译超长且复杂的文档,如超大的 Excel 文件,甚至还能正确显示复杂的引用公式。
GitHub: https://github.com/infrost/DeeplxFile
工具提供 Windows 一键安装包,也支持 macOS 运行使用。
推荐 GitHub 上一款特别好用的 AI 开源工具:MaxKB,让普通人也能快速搭建一个 AI 知识库问答系统。
项目简单易用、界面简洁,支持本地部署,即便是刚刚接触知识库应用的新人小白,也能在 5 分钟内为自己的网站增加一个 AI 助手。
GitHub: https://github.com/1Panel-dev/MaxKB
项目由国人开发,中文文档齐全,并拥有以下特点:
- 开箱即用:直接上传文档、自动爬取在线文档、智能问答交互体验好;
- 模型中立:支持对接各种现有的主流大语言模型(如 Llama3、OpenAI、通义千问等);
- 灵活编排:内置强大的工作流引擎,支持编排 AI 工作过程,满足各种复杂业务需求;
- 无缝嵌入:开箱即用,可快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力。
项目仅发布不到 5 个月,就在 GitHub 上斩获了超过 9,000 个 Star,项目的版本迭代、社区交互、issue 提交都非常活跃。
分享 GitHub 上一份精心收集整理的系统设计面试资源列表:system-design。
旨在帮助大家通过系统设计面试,并提供很多知名科技公司的实战案例,如实时游戏排行榜、缓存一致性、实时协作、数据库迁移策略等。
GitHub: https://github.com/systemdesign42/system-design
另外,还收集了有关系统设计的基础知识,以助大家学习。
推荐 GitHub 上一个轻量级的 AI 证件照制作工具:HivisionIDPhoto。
实现了对多种用户拍照场景的识别、抠图与证件照生成,并提供不同尺寸规格的标准证件照。
GitHub: https://github.com/Zeyi-Lin/HivisionIDPhotos
在线使用: 网页链接
感兴趣的,可先收藏以备应急使用。
推荐 GitHub 上开源的一款全自动视频翻译的 AI 工具:VideoLingo。
能够一键全自动对视频进行字幕切割、翻译、精准对齐和个性化配音,最终生成 Netifx 级别的字幕和配音。
GitHub: https://github.com/Huanshere/VideoLingo
具有如下特点:
- 使用 NLP 和 LLM 进行字幕分割;
- 智能术语知识库,实现上下文感知翻译;
- 三步翻译过程:直接翻译 - 反思 - 改进;
- 精确的单词级字幕对齐;
- 使用 GPT-SoVits 克隆音色并生成高质量的配音。
最近很火的 Cursor 代码编辑神器,不少朋友放弃 GitHub Copilot ,转投 Cursor。
在这里,给大家分享一份收集了各种开发语言最佳的 Cursor 配置提示词 cursor.directory。
涵盖 Python、Next.js、TypeScript、Swift、Node.js 等多种主流语言,旨在通过这些配置使 Cursor 提供更好的代码补全、错误修复等功能。
GitHub: https://github.com/pontusab/cursor.directory
在线访问: 网页链接
另外,项目还收集了 Cursor 从入门到实践的使用教程,助大家快速学习并使用它。
推荐 GitHub 上一款一站式自动化影视解说的 AI 视频剪辑工具:NarratoAI。
基于 LLM 实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,影视解说剪辑神器,高效内容创作。
GitHub: https://github.com/linyqh/NarratoAI
支持 Windows 10 或 MacOS 11.0 以上系统,显卡非必须。
GitHub 上开源的一款界面简洁且功能强大的跨平台 IPTV 播放器:IPTVnator。
允许通过文件系统或远程 URL 导入 IPTV 播放列表,具备自动更新播放列表、频道搜索、电视存档、分组频道列表、多种主题等功能。
支持外部播放器,如 mvp 和 VLC,并提供 HTML 视频播放器选项;支持包括中文在内的八种多语言。
GitHub: https://github.com/4gray/iptvnator
提供了 macOS、Windows 和 Linux 安装包,感兴趣的可以下载安装试试。
分享一个开源免费且实用的浏览器插件: code-box。
可以用于目前主流的技术社区网站(如下图),实现无需登录一键复制代码、阅读全文、去除登录弹窗等功能。
GitHub: https://github.com/027xiguapi/code-box
作为一名技术开发者,该插件值得安装一试。
一个基于 LLM 的 OCR 扫描 PDF 开源工具 LLM-Aided OCR。
旨在通过利用多模态大语言模型(LLM)将原始的 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。
GitHub: https://github.com/Dicklesworthstone/llm_aided_ocr
首先将 PDF 文件转图像,进行 OCR 扫描处理提取文本,再利用本地 LLM 或 API(如 OpenAI、Anthropic)纠正 OCR 错误,最后转换成高准确度、高质量的 Markdown 文本。
分享一份精选机器学习系统的入门资料集合:awesomeMLSys。
收集了一系列有关注意力机制、性能优化、量化、长上下文长度和稀疏性等方面的论文、视频和代码库。
推荐 GitHub 上一款开源免费的 PPT 制作工具: moffee。
能够将 Markdown 文档一键转换为干净、专业的幻灯片,提供 web 界面可实时预览效果。
GitHub: https://github.com/BMPixel/moffee
可让 ChatGPT/Claude 生成定义好的 Markdown 格式,然后再一键转 PPT。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报