Show newer

推荐 GitHub 上一个强大的全文件格式 Markdown 转换工具:E2M。

支持任何文件类型,如 doc、epub、html、url、pdf、mp3 等等格式的文件,一键转换为 Markdown 结构化数据,

GitHub: https:// 网页链接

提供 Python 依赖库,可快速导入使用,为检索增强生成(RGA)和模型训练或微调提供高质量的数据。

有需要的同学不妨试下。

:icon_weibo: weibo.com/5722964389/P9FCjePN4

分享 GitHub 上一个开源的 API 测试工具:Bruno。

可作为 Postman 的开源平替,功能强大且轻量,简单易上手,使用纯文本标记语言 Bru 来保存有关 API 信息。

GitHub: github.com/usebruno/bruno/

除此之外,还支持使用 Git 对 API 信息进行版本控制和协作,同时仅限离线使用,数据安全隐私。

支持 macOS、Windows 系统安装使用,有需要的同学可以试下。

:icon_weibo: weibo.com/5722964389/P9E2TfCqe

分享 GitHub 上一个简单、安全、高效的在线剪贴板:netcut。

支持密码保护、阅后即焚、自定义过期时间等功能,提供简洁易用界面,并兼容移动端访问、响应快速。

GitHub: github.com/zxcv0221/netcut

值得一提,作者是基于 Cursor 辅助开发的,无论是 Cursor、Copilot、Bolt,还是国内豆包 Marscode 等等 AI 编程工具。

如果我们是作为一名程序员,个人认为应趁早去尝试使用这些 AI 工具,提升自己开发效率。

:icon_weibo: weibo.com/5722964389/P9zJ4oXES

推荐 GitHub 上一款高颜值的远程服务器管理工具:XPipe。

支持在本地统一管理所有远程连接,包括 SSH、Docker 等等多种连接方式,同时不需要在远程服务器安装任何东西。

GitHub: https:// 网页链接

除此之外,还提供了可视化远程文件操作界面,可直接打开和编辑,并内置了众多常用操作指令。

工具兼容 Windows、Linux 和 macOS 系统安装,有需要的同学不妨试下。

:icon_weibo: weibo.com/5722964389/P9yxW1b7X

推荐 GitHub 上一款可离线使用的实时翻译 AI 工具:RTranslator。

支持将对方说的话实时翻译成你听懂的语言,实现同声传译效果。

GitHub: github.com/niedev/RTranslator

提供对话、对讲以及文本翻译三种使用方式,同时可离线使用,模型存储在本地。

有了它,可以轻松应对国际会议、出国旅行或日常交流等等场景。

目前仅支持 Android 系统,有需要的同学可以看下。

:icon_weibo: weibo.com/5722964389/P9xz2EJjz

推荐 GitHub 上一个能大规模提取文档信息及结构化数据的工具:NVIDIA-Ingest。

支持解析 PDF、Word 和 PPT 等文件格式,可提取文本、表格、图表以及图像等内容,并提供了多种提取方法。

GitHub: github.com/NVIDIA/nv-ingest

对提取到的内容通过 OCR 转换为结构化 JSON 格式,同时存储到向量数据库 Milvus。

唯一不好就是对硬件要求颇高,有需求的同学可以看下。

:icon_weibo: weibo.com/5722964389/P9wbOhceO

推荐 GitHub 上一款开源免费的 Markdown 编辑器:MarkEdit。

类似 Typora,界面简洁直观,专注于 Markdown 编辑,支持分屏实时预览、代码语法高亮、自定义主题等功能。

GitHub: github.com/MarkEdit-app/MarkEd

安装包大小不到 3MB 非常轻量,还能轻松处理大文件,编辑无卡顿,支持 CodeMirror 插件和自定义脚本等。

有需要的同学不妨试下。

:icon_weibo: weibo.com/5722964389/P9p7r9235

分享 GitHub 上一个集记单词与打字练习为一体的工具:Qwerty Learner。

内置 GET-4、GMAT、GRE、考研英语以及程序员常见的英语单词等词库,通过键盘输入,在背诵单词的同时还能练习打字。

GitHub: github.com/RealKai42/qwerty-le

包含了音标显示、发音功能,提供默写模式,同时可统计我们的打字书读以及正确率等数据。

在线体验:qwerty.kaiyi.cool

可通过在线体验或者自部署使用,此外,还提供 VSCode 插件,随时开始练习。

界面极其简洁易用,有需要的同学可以体验下。

:icon_weibo: weibo.com/5722964389/P9o8yfpRG

分享 GitHub 上一个可助开发者快速掌握 Rust 语言的开源项目: 100-exercises-to-learn-rust。

通过 100 道练习题练习,学习 Rust 编程语言的语法、系统类型、标准库使用以及生态系统等。

GitHub: github.com/mainmatter/100-exer

中文版:colobu.com/rust100

准备学习 Rust 的同学,该项目值得看下,学完之后,从一无所知到能够使用 Rust 独立编写自己的程序。

:icon_weibo: weibo.com/5722964389/P9mLjfa3F

推荐 GitHub 上一个开源的视频号下载工具:wx_channels_download。

不仅支持直接在视频页面一键下载,还能够下载不同清晰度的视频,甚至支持下载直播回放内容。

GitHub: github.com/ltaoo/wx_channels_d

提供 Windows 和 macOS 系统安装包,直接开箱即用,不需要繁琐的配置。

有需要的同学可以试下。

:icon_weibo: weibo.com/5722964389/P9fLF80Ej

推荐 GitHub 上一个颇为强大的 PDF 文档处理工具:PDF Guru。

不仅能解决各种 PDF 处理需求,还能帮助我们高效制作 Anki 卡片,还支持视频笔记功能,一个工具解决众多问题。

GitHub: github.com/kevin2li/PDF-Guru

主要功能如下:

- PDF 工具箱:批量去除水印、添加书签、自动识别和导入、批量 OCR 识别、PDF 格式转换等;

- Anki 制卡工具:支持从 PDF、Word、Xmind 等素材快速制作 Anki 卡片,微信读书笔记一件导入等;

- 视频笔记功能:支持边看视频边记笔记,快速插入视频截图、笔记一键导入 Anki,形成学习闭环。

该工具几大实用功能整合在一起,相信对我们的工作学习效率有所提高,有需要的同学可以看下。

:icon_weibo: weibo.com/5722964389/P9eJn1exO

分享 GitHub 上一份收集整理 Adobe 全家桶的平替列表 Adobe-Alternatives。

涵盖了大家熟悉的 Photoshop、Illustrator、Lightroom、Premiere 以及 After Effects 等热门软件的平替。

GitHub: github.com/KenneyNL/Adobe-Alte

并使用图标标记这些平替的软件是开源的、免费的、还是需要订阅购买,方便大家自由选择。

- ✨ = 免费且开源

- ⭐️ = 免费

- 💵 = 一次性购买

- 🔒 = 需订阅获得更多功能

:icon_weibo: weibo.com/5722964389/P9dkOAcEN

分享一份生成式人工智能学习路线的手册:Generative AI Handbook。

一共有 9 大章节,提供了系统化的学习路径,可帮助我们系统地学习和理解生成式 AI 的相关知识。

涵盖了基础知识、实践应用、以及最新的研究进展,其中还包括相关学习资源,如教程、文章、工具和案例研究。

学习手册:genai-handbook.github.io/

适合具有一定编程基础及高中数学水平的同学学习,有需要的可以看看。

:icon_weibo: weibo.com/5722964389/P97rUrx9Y

分享 GitHub 上一个高保真的 AI 虚拟试穿开源模型:FitDiT。

支持控制上半身、下半身或者全身虚拟更换服装,可自动给加上区域蒙版,一键试穿。

GitHub: github.com/BoyuanJiang/FitDiT

在线体验:demo.fitdit.byjiang.com/

体验了下,服装细节保留的不错,感兴趣的同学可以体验下看看。

:icon_weibo: weibo.com/5722964389/P95hyqKtg

推荐 GitHub 上一款强大且可离线使用的 OCR 工具:Ollama OCR。

通过搭配 Ollama 在本地使用,支持多种视觉模型,包括 LLaVA 7B、Llama 3.2 Vision 等。

GitHub: github.com/imanoop7/Ollama-OCR

支持多种文件格式输出,如 Markdown、纯文本、JSON 等,同时支持并行处理多个图像。

:icon_weibo: weibo.com/5722964389/P93Ujya6m

分享一篇从零开始手把手教你构建一个微型操作系统的教程:《OS in 1,000 Lines》。

基于 C 语言,仅用 1000 行代码,实现了 上下文切换、分页、用户模式、命令行 shell、磁盘设备驱动程序和文件读/写操作等等功能。

教程地址: operating-system-in-1000-lines

教程分为 17 个章节,一步一步带我们实现如上提到的一个微型操作系统基本的功能。

GitHub: github.com/nuta/operating-syst

教程中所涉及到的代码均已开源,感兴趣的同学可看下。

:icon_weibo: weibo.com/5722964389/P92kU0GlQ

分享一套关于如何对齐小型语言模型的使用教程:《a smol course》。

来自 HuggingFace 官方出品,涵盖了从基础知识到实际应用的全面内容,课程大纲如下:

- 指令调优(Instruction Tuning):学习监督微调、聊天模板和基本指令遵循。

- 偏好调整(Preference Alignment):探索 DPO 和 ORPO 技术,使模型与人类偏好保持一致。

- 参数高效的微调(Parameter-efficient Fine-tuning):学习 LoRA、快速调优和高效适配方法。

- 评估(Evaluation):使用自动基准测试并创建自定义域评估。

- 视觉语言模型(Vision-language Models):适应视觉语言任务的多模态模型。

- 合成数据集(Synthetic Datasets):创建并验证用于训练的合成数据集。

- 推理(Inference):有效地推断模型。

- 顶点项目(Capstone Project):使用所学知识攀登排行榜。

GitHub: github.com/huggingface/smol-co

课程基于 SmolLM2 系列模型教学,目前已更新到最后两节,适合希望将语言模型微调训练到特定领域的同学学习。

:icon_weibo: weibo.com/5722964389/P8Y10o1ev

分享一篇关于 AI 智能体(Agents)的详细介绍文章,值得一看。

文章深入介绍了 AI Agents 的核心概念、关键组成部分以及实践经验,包括如下内容:

- AI Agents 的详细介绍:一个能感知环境并采取行动的智能系统;

- Agents 两大核心能力支柱:工具集(知识增强、能力扩展、操作能力)和规划能力(执行、反思、纠错);

- Agents 三大失败模式:规划失败、工具失败和效率问题。

文章地址: https:// 网页链接

与此前 Anthropic 发布关于 Agents 相关的文章对比,这一篇更注重解释 Agents 的工作原理,并深入探讨了规划、工具选择和失败模式。

Anthropic 文章地址: https:// 网页链接

如果你想深入了解 AI Agents,那么这两篇文章都推荐看一下,相信会有所收获。

:icon_weibo: weibo.com/5722964389/P8VQQsZC0

推荐 GitHub 上一款高颜值的浏览器书签查看工具:Bookmarkds Artist。

相比浏览器内置的书签管理器,它采用的网格布局文件夹划分,更加简洁,文件夹层级更加清晰,一目了然。

GitHub: github.com/liujuntao123/bookma

还未上架到 Chrome 扩展商店,感兴趣的可以在 GitHub 上下载压缩包进行安装体验。

:icon_weibo: weibo.com/5722964389/P8SUpxPEU

分享 GitHub 上一个颇有趣的开源项目:City Roabs。

输入你喜欢的城市名称,即可将该城市的主要道路渲染成黑白色的线路图。

GitHub: github.com/anvaka/city-roads

数据来源于 OpenStreetMap,输入一个城市名很快就能将该城市的道路信息获取下来。

:icon_weibo: weibo.com/5722964389/P8OAw7wsb

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。