推荐 GitHub 上一个强大的全文件格式 Markdown 转换工具:E2M。
支持任何文件类型,如 doc、epub、html、url、pdf、mp3 等等格式的文件,一键转换为 Markdown 结构化数据,
GitHub: https:// 网页链接
提供 Python 依赖库,可快速导入使用,为检索增强生成(RGA)和模型训练或微调提供高质量的数据。
有需要的同学不妨试下。 #AI创造营
分享 GitHub 上一个开源的 API 测试工具:Bruno。
可作为 Postman 的开源平替,功能强大且轻量,简单易上手,使用纯文本标记语言 Bru 来保存有关 API 信息。
GitHub: https://github.com/usebruno/bruno/
除此之外,还支持使用 Git 对 API 信息进行版本控制和协作,同时仅限离线使用,数据安全隐私。
支持 macOS、Windows 系统安装使用,有需要的同学可以试下。
分享 GitHub 上一个简单、安全、高效的在线剪贴板:netcut。
支持密码保护、阅后即焚、自定义过期时间等功能,提供简洁易用界面,并兼容移动端访问、响应快速。
GitHub: https://github.com/zxcv0221/netcut
值得一提,作者是基于 Cursor 辅助开发的,无论是 Cursor、Copilot、Bolt,还是国内豆包 Marscode 等等 AI 编程工具。
如果我们是作为一名程序员,个人认为应趁早去尝试使用这些 AI 工具,提升自己开发效率。
推荐 GitHub 上一款高颜值的远程服务器管理工具:XPipe。
支持在本地统一管理所有远程连接,包括 SSH、Docker 等等多种连接方式,同时不需要在远程服务器安装任何东西。
GitHub: https:// 网页链接
除此之外,还提供了可视化远程文件操作界面,可直接打开和编辑,并内置了众多常用操作指令。
工具兼容 Windows、Linux 和 macOS 系统安装,有需要的同学不妨试下。
推荐 GitHub 上一款可离线使用的实时翻译 AI 工具:RTranslator。
支持将对方说的话实时翻译成你听懂的语言,实现同声传译效果。
GitHub: https://github.com/niedev/RTranslator
提供对话、对讲以及文本翻译三种使用方式,同时可离线使用,模型存储在本地。
有了它,可以轻松应对国际会议、出国旅行或日常交流等等场景。
目前仅支持 Android 系统,有需要的同学可以看下。 #AI创造营
推荐 GitHub 上一个能大规模提取文档信息及结构化数据的工具:NVIDIA-Ingest。
支持解析 PDF、Word 和 PPT 等文件格式,可提取文本、表格、图表以及图像等内容,并提供了多种提取方法。
GitHub: https://github.com/NVIDIA/nv-ingest
对提取到的内容通过 OCR 转换为结构化 JSON 格式,同时存储到向量数据库 Milvus。
唯一不好就是对硬件要求颇高,有需求的同学可以看下。 #AI创造营
推荐 GitHub 上一款开源免费的 Markdown 编辑器:MarkEdit。
类似 Typora,界面简洁直观,专注于 Markdown 编辑,支持分屏实时预览、代码语法高亮、自定义主题等功能。
GitHub: https://github.com/MarkEdit-app/MarkEdit
安装包大小不到 3MB 非常轻量,还能轻松处理大文件,编辑无卡顿,支持 CodeMirror 插件和自定义脚本等。
有需要的同学不妨试下。 #AI创造营
分享 GitHub 上一个集记单词与打字练习为一体的工具:Qwerty Learner。
内置 GET-4、GMAT、GRE、考研英语以及程序员常见的英语单词等词库,通过键盘输入,在背诵单词的同时还能练习打字。
GitHub: https://github.com/RealKai42/qwerty-learner
包含了音标显示、发音功能,提供默写模式,同时可统计我们的打字书读以及正确率等数据。
在线体验:qwerty.kaiyi.cool
可通过在线体验或者自部署使用,此外,还提供 VSCode 插件,随时开始练习。
界面极其简洁易用,有需要的同学可以体验下。 #AI创造营
分享 GitHub 上一个可助开发者快速掌握 Rust 语言的开源项目: 100-exercises-to-learn-rust。
通过 100 道练习题练习,学习 Rust 编程语言的语法、系统类型、标准库使用以及生态系统等。
GitHub: https://github.com/mainmatter/100-exercises-to-learn-rust
中文版:colobu.com/rust100
准备学习 Rust 的同学,该项目值得看下,学完之后,从一无所知到能够使用 Rust 独立编写自己的程序。
推荐 GitHub 上一个开源的视频号下载工具:wx_channels_download。
不仅支持直接在视频页面一键下载,还能够下载不同清晰度的视频,甚至支持下载直播回放内容。
GitHub: https://github.com/ltaoo/wx_channels_download
提供 Windows 和 macOS 系统安装包,直接开箱即用,不需要繁琐的配置。
有需要的同学可以试下。 #AI创造营
推荐 GitHub 上一个颇为强大的 PDF 文档处理工具:PDF Guru。
不仅能解决各种 PDF 处理需求,还能帮助我们高效制作 Anki 卡片,还支持视频笔记功能,一个工具解决众多问题。
GitHub: https://github.com/kevin2li/PDF-Guru
主要功能如下:
- PDF 工具箱:批量去除水印、添加书签、自动识别和导入、批量 OCR 识别、PDF 格式转换等;
- Anki 制卡工具:支持从 PDF、Word、Xmind 等素材快速制作 Anki 卡片,微信读书笔记一件导入等;
- 视频笔记功能:支持边看视频边记笔记,快速插入视频截图、笔记一键导入 Anki,形成学习闭环。
该工具几大实用功能整合在一起,相信对我们的工作学习效率有所提高,有需要的同学可以看下。
分享 GitHub 上一份收集整理 Adobe 全家桶的平替列表 Adobe-Alternatives。
涵盖了大家熟悉的 Photoshop、Illustrator、Lightroom、Premiere 以及 After Effects 等热门软件的平替。
GitHub: https://github.com/KenneyNL/Adobe-Alternatives
并使用图标标记这些平替的软件是开源的、免费的、还是需要订阅购买,方便大家自由选择。
- ✨ = 免费且开源
- ⭐️ = 免费
- 💵 = 一次性购买
- 🔒 = 需订阅获得更多功能
分享一份生成式人工智能学习路线的手册:Generative AI Handbook。
一共有 9 大章节,提供了系统化的学习路径,可帮助我们系统地学习和理解生成式 AI 的相关知识。
涵盖了基础知识、实践应用、以及最新的研究进展,其中还包括相关学习资源,如教程、文章、工具和案例研究。
学习手册:genai-handbook.github.io/
适合具有一定编程基础及高中数学水平的同学学习,有需要的可以看看。
分享 GitHub 上一个高保真的 AI 虚拟试穿开源模型:FitDiT。
支持控制上半身、下半身或者全身虚拟更换服装,可自动给加上区域蒙版,一键试穿。
GitHub: https://github.com/BoyuanJiang/FitDiT
在线体验:demo.fitdit.byjiang.com/
体验了下,服装细节保留的不错,感兴趣的同学可以体验下看看。
推荐 GitHub 上一款强大且可离线使用的 OCR 工具:Ollama OCR。
通过搭配 Ollama 在本地使用,支持多种视觉模型,包括 LLaVA 7B、Llama 3.2 Vision 等。
GitHub: https://github.com/imanoop7/Ollama-OCR
支持多种文件格式输出,如 Markdown、纯文本、JSON 等,同时支持并行处理多个图像。
分享一篇从零开始手把手教你构建一个微型操作系统的教程:《OS in 1,000 Lines》。
基于 C 语言,仅用 1000 行代码,实现了 上下文切换、分页、用户模式、命令行 shell、磁盘设备驱动程序和文件读/写操作等等功能。
教程地址: https://operating-system-in-1000-lines.vercel.app/en/
教程分为 17 个章节,一步一步带我们实现如上提到的一个微型操作系统基本的功能。
GitHub: https://github.com/nuta/operating-system-in-1000-lines
教程中所涉及到的代码均已开源,感兴趣的同学可看下。
分享一套关于如何对齐小型语言模型的使用教程:《a smol course》。
来自 HuggingFace 官方出品,涵盖了从基础知识到实际应用的全面内容,课程大纲如下:
- 指令调优(Instruction Tuning):学习监督微调、聊天模板和基本指令遵循。
- 偏好调整(Preference Alignment):探索 DPO 和 ORPO 技术,使模型与人类偏好保持一致。
- 参数高效的微调(Parameter-efficient Fine-tuning):学习 LoRA、快速调优和高效适配方法。
- 评估(Evaluation):使用自动基准测试并创建自定义域评估。
- 视觉语言模型(Vision-language Models):适应视觉语言任务的多模态模型。
- 合成数据集(Synthetic Datasets):创建并验证用于训练的合成数据集。
- 推理(Inference):有效地推断模型。
- 顶点项目(Capstone Project):使用所学知识攀登排行榜。
GitHub: https://github.com/huggingface/smol-course
课程基于 SmolLM2 系列模型教学,目前已更新到最后两节,适合希望将语言模型微调训练到特定领域的同学学习。
分享一篇关于 AI 智能体(Agents)的详细介绍文章,值得一看。
文章深入介绍了 AI Agents 的核心概念、关键组成部分以及实践经验,包括如下内容:
- AI Agents 的详细介绍:一个能感知环境并采取行动的智能系统;
- Agents 两大核心能力支柱:工具集(知识增强、能力扩展、操作能力)和规划能力(执行、反思、纠错);
- Agents 三大失败模式:规划失败、工具失败和效率问题。
文章地址: https:// 网页链接
与此前 Anthropic 发布关于 Agents 相关的文章对比,这一篇更注重解释 Agents 的工作原理,并深入探讨了规划、工具选择和失败模式。
Anthropic 文章地址: https:// 网页链接
如果你想深入了解 AI Agents,那么这两篇文章都推荐看一下,相信会有所收获。
推荐 GitHub 上一款高颜值的浏览器书签查看工具:Bookmarkds Artist。
相比浏览器内置的书签管理器,它采用的网格布局文件夹划分,更加简洁,文件夹层级更加清晰,一目了然。
GitHub: https://github.com/liujuntao123/bookmarks-artist
还未上架到 Chrome 扩展商店,感兴趣的可以在 GitHub 上下载压缩包进行安装体验。
分享 GitHub 上一个颇有趣的开源项目:City Roabs。
输入你喜欢的城市名称,即可将该城市的主要道路渲染成黑白色的线路图。
GitHub: https://github.com/anvaka/city-roads
数据来源于 OpenStreetMap,输入一个城市名很快就能将该城市的道路信息获取下来。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报