分享一个简单但颇有意思的开源免费工具:Text Behind Image。
用它可以轻松将文本添加至图片中指定对象的背后,如图像中的动物、人类、物品等,并且支持保存到本地。
推荐 GitHub 上一款开源免费的下载工具:AB下载管理器。
能够提升高达 500% 的下载速度,批量管理下载队列中的任务,自定义下载速度,以及提供浏览器扩展自动获取下载链接。
GitHub: https://github.com/amir1376/ab-download-manager
目前支持 Windows 和 Linux 用户安装使用,提供深浅两种主题,完全开源免费。
推荐 GitHub 上一款颜值颇高且功能强大的文件管理器:Files。
基于 Windows 设计的工具,支持使用标签页管理多个文件夹,双面板查看和对比两个文件夹内容,还支持云端储存、压缩文件以及直接管理 Git 项目。
GitHub: https://github.com/files-community/Files
主要功能:
- 标签式界面:像浏览器一样管理多个文件夹,告别凌乱桌面;
- 双面板:并排查看和管理两个文件夹,提高工作效率;
- 彩色标签:为文件和文件夹添加标签,轻松分类和查找;
- 列表视图:快速浏览文件系统的不同层级;
- 压缩文件处理:支持创建和解压多种格式的压缩包;
- 预览功能:无需打开即可预览照片、视频和文档;
- 支持多种云存储:无缝对接 OneDrive、Google Drive 和 iCloud 等;
- Git 集成:在文件管理器中直接管理 Git 项目。
推荐 GitHub 上一款能突破 123 云盘下载速度限制的工具:123pan。
使用 Python 编写的脚本,能够绕过 123 云盘的自用下载流量限制,并提供了多种操作功能,如列出文件、下载文件、上传文件、分享文件等。
GitHub: https://github.com/Bao-qing/123pan
为 Windows 用户提供了开箱即用的安装包,其他系统用户可运行脚本使用。
此外,还提供了油猴脚本安装,使用脚本可以直接在 123 云盘官网不限流量下载文件。
分享一个交互式编程语言编译器探索工具:Compiler Explorer。
在网页浏览器中交互式地运行和探索多种编程语言编译器,支持超过 30 种语言,包括 C、C++、Rust、Go、Python、Java、Swift 等。
GitHub: https://github.com/compiler-explorer/compiler-explorer
在线体验:godbolt.org
并且,提供了多种编辑器、工具和可视化选项,可以在线编辑代码并实时查看编译后的汇编代码。
推荐 GitHub 上一款开源免费的轻松备份 iOS 设备工具:BBackupp。
支持备份到外置硬盘、监控备份进度、加密备份更安全,可以无缝迁移到新设备。
GitHub: https://github.com/Lakr233/BBackupp
最近换了新 iOS 设备的同学,需要备份的可以试试这款工具。
推荐 GitHub 上一款能实时渲染、简洁又好用的微信 Markdown 编辑器。
GitHub: https://github.com/doocs/md
主要功能:
- 支持自定义 CSS 样式
- 支持 Markdown 所有基础语法、代码块、LaTeX 公式
- 支持浅色、深色两种编辑器外观
- 支持 Alt + Shift + F 快速格式化文档
- 支持色盘取色,快速替换文章整体色调
- 支持多图上传,可自定义配置图床
- 支持自定义上传逻辑
- 支持在编辑框右键弹出功能选项卡
- 支持批量转换本地图片为线上图片
如果你讨厌那些样式繁杂、功能笨重的编辑器,不妨试试这款,完全开源且免费。
推荐 GitHub 上一款颇为实用的 AI 文件整理器:Local File Organizer。
通过扫描输入指定目录中的文件,理解文件内容(包括文本、图片等),生成相关的描述、文件夹名称以及文件名,然后将文件整理到新目录结构中。
GitHub: https://github.com/QiuYannnn/Local-File-Organizer
具有如下特点:
- 自动文件整理:基于 AI 生成的文件夹分类,自动将文件分类到相应文件夹中。
- 智能元数据生成:使用先进的 AI 模型生成描述和文件名。
- 支持多种文件格式:能够处理图像、文本文件和 PDF 文件。
- 并行处理:利用多进程技术加快文件处理速度,提升性能。
- 定制提示词:与 AI 模型交互的提示词可以根据需求自定义。
- 操作系统:兼容 Windows、macOS 和 Linux。
使用了可在本地运行的开源大语言模型,项目完全开源免费,数据隐私安全,有需求的不妨试试。
推荐 GitHub 上一款简洁且功能强大的笔记管理工具:FSNotes。
主要功能:
- 支持 Markdown 以及任何纯文本文件。
- 快速且轻量,能够流畅处理 10k+ 个文件。
- 支持与 iCloud Drive 或 Dropbox 同步,可随时随地访问。
- 支持多文件夹存储。
- 支持代码块内语法高亮,兼容超过 170 种编程语言。
- 支持内联图片。
- 支持外部编辑器(更改会与 UI 实时同步)。
- 支持置顶重要笔记。
- 使用标签进行组织。
- 使用 [[双括号]] 进行跨笔记链接。
- 弹性两窗格视图。选择垂直或水平布局。
- 支持暗黑主题切换。
- 支持 Mermaid 和 MathJax。
- 支持文件进行 Git 版本控制和备份。
- 支持对文件 AES-256 加密。
GitHub: https://github.com/glushchenko/fsnotes
该工具基于 Swift 5 开发,适用于 macOS 和 iOS,完全开源且免费,感兴趣的可以试试。
推荐 GitHub 上一个基于 Cloudflare Workers 的真实地址生成器:Real-Address-Generator。
可以生成不同国家地图上真实的随机地址,包含了姓名、性别、电话号码、地址等信息。
GitHub: https://github.com/Adonis142857/Real-Address-Generator
分享一本得到吴恩达老师推荐过的书籍《大语言模型实战》。
共十二章,涵盖了语言模型的基础知识、文本分类、提示工程、语义搜索、多模态语言模型以及如何创建和微调文本嵌入模型等内容。
每个章节涉及到的案例代码均已开源到 GitHub,可通过 Google Colab 直接运行。
GitHub: https://github.com/handsOnLLM/Hands-On-Large-Language-Models
此外,书籍通过定制 250+ 精美插图,并辅以可运行的代码、时间线以及引用关键论文,帮助读者更深入理解并使用大语言模型。
推荐 GitHub 上一款快速、易于使用且开源免费的文档扫描工具:OpenScanner。
GitHub: https://github.com/pencilresearch/OpenScanner
具有如下特点:
- 自动文本识别生成页面抄本;
- 自动文档命名;
- 扫描件按当前地理位置标记;
- 添加从其他设备导入的签名;
- 原生支持 Vision Pro;
- 将扫描的文档保存在 Open Scanner 库中;
- 编辑并重新排序扫描文档页面;
- iCloud 同步您的库至所有设备;
- 注释并编辑扫描件;
- 使用 Apple Pencil 在 iPad 上标记扫描件;
- 轻松分享和导出扫描文档为 PDF;
- 100% 原生 iOS 应用,完全不依赖第三方账户;
- 开源免费,无广告无需订阅。
分享一个颇为实用的 AI 扩图工具 Diffusers Image Outpaint。
在 HuggingFace 上可以免费使用,直接上传图片,选择扩展比例,一键即可完成扩图。
在线使用: 网页链接
推荐 GitHub 上一款高颜值、功能强大的桌面快速启动管理工具:GeekDesk。
集成了强大的文件搜索功能,可快速搜索全盘文件,以及提供丰富的自定义选项,旨在为我们打造一个高效且个性化的极客桌面。
GitHub: https://github.com/BookerLiu/GeekDesk
主要功能:
- Everything 搜索集成:快速搜索全盘文件,提高文件查找效率。
- 自定义快捷键:允许设置全局热键呼出工具。
- 自定义壁纸:可以自由选择和更换自己喜欢的桌面壁纸。
- 界面效果调整:支持调整背景图片的毛玻璃效果、界面透明度和圆角。
- 多种系统图标选择:提供超过 80 个系统图标供我们选择。
- 定时提醒功能:可通过快捷键新建待办事项,并设置定时提醒。
分享一个端到端的开源 OCR 模型,号称 OCR 2.0!
支持场景文本、文档、乐谱、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
GitHub: https://github.com/Ucas-HaoranWei/GOT-OCR2.0
模型下载:huggingface.co/ucaslcl/GOT-OCR2_0
从给出的演示图来看,一些非常复杂的数学公式都能正确的识别,颇为强大。
模型大小仅 1.43GB,感兴趣的可以试试。
推荐 GitHub 上一款开源的、轻量级、功能齐全的提示词工具:ell。
由 OpenAI 研究科学家 William 开源,为了更好地管理和优化 AI 模型的提示词。
GitHub: https://github.com/MadcowD/ell
具有如下特点:
- 提示是程序:William 认为提示词不是简单的文字,而应该像程序一样可控和管理;
- 提示是模型参数:提供了丰富的工具来优化提示,支持自动版本控制和序列化,以及自动生成的提交信息;
- 监控、版本控制和可视化工具:内置 Ell Studio
工具,用于版本控制、监控和可视化提示;
- 多模态支持:支持文本、图像、音频和视频等多种数据类型的处理,使得多模态的提示工程像处理文本一样简单。
分享 GitHub 上一份整理了与大语言模型相关的优秀资源:awesome-LLM-resourses。
涵盖了数据集、微调、推理、评估、RAG(检索增强生成)、Agents(智能体)、书籍、教程、论文等资源。
GitHub: https://github.com/WangRongsheng/awesome-LLM-resourses
项目在不断持续更新,致力于收集最全面最新的大语言模型资源,值得关注下。
分享 GitHub 上一款自动化剪辑长视频精彩部分并生成短视频的工具:AI Youtube Shorts Generator。
主要功能是从长视频中提取有趣的、吸引人的片段,通过剪辑、添加配乐、生成标题和描述,最终生成全新的短视频。
GitHub: https://github.com/SamurAIGPT/AI-Youtube-Shorts-Generator
工作流程:
视频下载:给定一个 YouTube 视频链接,工具自动下载视频;
转录功能:使用 Whisper 进行视频内容转录;
精彩片段提取:利用 GPT-4 识别视频中最吸引人的部分;
说话人检测:检测视频中的说话人;
垂直剪辑:将精彩片段进行竖向视频裁剪,并制作成短视频。
个人觉得比较适用于自动化剪辑一些名人演讲视频,感兴趣的同学可以研究看看。
推荐 GitHub 上一款功能强大的待办任务清单工具:Super Productivity。
它不仅提供了任务计划和分类的功能,还支持时间跟踪和时间盒技术,帮助我们更好地管理时间,制定好工作计划。
GitHub: https://github.com/johannesjo/super-productivity
支持从日历、Jira、GitHub 等平台导入任务,提供休息提醒、番茄钟计时器和反拖延症等功能。
兼容 Windows、macOS 和 Android 等操作系统。工具完全开源免费,不收集用户任何数据,感兴趣的可以下载看看。
分享一个适合初学者的代码可视化学习工具:Python Tutor。
通过输入一段 Python 代码,在线可视化执行过程,帮助初学者更好学习并理解和调试代码。
网址: 网页链接
此外,除了 Python 外,还支持 Java、C、C++ 和 JavaScript 等编程语言。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报