Show newer

推荐 GitHub 上一款强大且可离线使用的 OCR 工具:Ollama OCR。

通过搭配 Ollama 在本地使用,支持多种视觉模型,包括 LLaVA 7B、Llama 3.2 Vision 等。

GitHub: github.com/imanoop7/Ollama-OCR

支持多种文件格式输出,如 Markdown、纯文本、JSON 等,同时支持并行处理多个图像。

:icon_weibo: weibo.com/5722964389/P93Ujya6m

分享一篇从零开始手把手教你构建一个微型操作系统的教程:《OS in 1,000 Lines》。

基于 C 语言,仅用 1000 行代码,实现了 上下文切换、分页、用户模式、命令行 shell、磁盘设备驱动程序和文件读/写操作等等功能。

教程地址: operating-system-in-1000-lines

教程分为 17 个章节,一步一步带我们实现如上提到的一个微型操作系统基本的功能。

GitHub: github.com/nuta/operating-syst

教程中所涉及到的代码均已开源,感兴趣的同学可看下。

:icon_weibo: weibo.com/5722964389/P92kU0GlQ

分享一套关于如何对齐小型语言模型的使用教程:《a smol course》。

来自 HuggingFace 官方出品,涵盖了从基础知识到实际应用的全面内容,课程大纲如下:

- 指令调优(Instruction Tuning):学习监督微调、聊天模板和基本指令遵循。

- 偏好调整(Preference Alignment):探索 DPO 和 ORPO 技术,使模型与人类偏好保持一致。

- 参数高效的微调(Parameter-efficient Fine-tuning):学习 LoRA、快速调优和高效适配方法。

- 评估(Evaluation):使用自动基准测试并创建自定义域评估。

- 视觉语言模型(Vision-language Models):适应视觉语言任务的多模态模型。

- 合成数据集(Synthetic Datasets):创建并验证用于训练的合成数据集。

- 推理(Inference):有效地推断模型。

- 顶点项目(Capstone Project):使用所学知识攀登排行榜。

GitHub: github.com/huggingface/smol-co

课程基于 SmolLM2 系列模型教学,目前已更新到最后两节,适合希望将语言模型微调训练到特定领域的同学学习。

:icon_weibo: weibo.com/5722964389/P8Y10o1ev

分享一篇关于 AI 智能体(Agents)的详细介绍文章,值得一看。

文章深入介绍了 AI Agents 的核心概念、关键组成部分以及实践经验,包括如下内容:

- AI Agents 的详细介绍:一个能感知环境并采取行动的智能系统;

- Agents 两大核心能力支柱:工具集(知识增强、能力扩展、操作能力)和规划能力(执行、反思、纠错);

- Agents 三大失败模式:规划失败、工具失败和效率问题。

文章地址: https:// 网页链接

与此前 Anthropic 发布关于 Agents 相关的文章对比,这一篇更注重解释 Agents 的工作原理,并深入探讨了规划、工具选择和失败模式。

Anthropic 文章地址: https:// 网页链接

如果你想深入了解 AI Agents,那么这两篇文章都推荐看一下,相信会有所收获。

:icon_weibo: weibo.com/5722964389/P8VQQsZC0

推荐 GitHub 上一款高颜值的浏览器书签查看工具:Bookmarkds Artist。

相比浏览器内置的书签管理器,它采用的网格布局文件夹划分,更加简洁,文件夹层级更加清晰,一目了然。

GitHub: github.com/liujuntao123/bookma

还未上架到 Chrome 扩展商店,感兴趣的可以在 GitHub 上下载压缩包进行安装体验。

:icon_weibo: weibo.com/5722964389/P8SUpxPEU

分享 GitHub 上一个颇有趣的开源项目:City Roabs。

输入你喜欢的城市名称,即可将该城市的主要道路渲染成黑白色的线路图。

GitHub: github.com/anvaka/city-roads

数据来源于 OpenStreetMap,输入一个城市名很快就能将该城市的道路信息获取下来。

:icon_weibo: weibo.com/5722964389/P8OAw7wsb

今天无意间发现一个宝藏网站:Artvee。

该网站上面收集了全球著名艺术家的古典与现代艺术图片资源,分为抽象的、具体的、插画、海报、风景、植物、动物等等类别。

网站: 网页链接

更重要的是,资源可以免费下载高清大图,用来做手机电脑的壁纸或屏保,颇具有艺术感。

:icon_weibo: weibo.com/5722964389/P8Nps2SxY

推荐 GitHub 上一个开源的会议效率 AI 工具:Amurex。

支持无缝集成到现有的工作流程中,提供实时建议、会议摘要、会议转录、会议内容总结,一键发送邮件等功能。

GitHub: github.com/thepersonalaicompan

可通过 Chrome 应用商店安装 Amurex 插件使用,目前仅支持 Google Meet 会议平台。

:icon_weibo: weibo.com/5722964389/P8Mxvaa7D

分享 GitHub 上一款高颜值的微信 Markdown 编辑器。

支持实时将 Markdown 文档渲染为微信图文,一键解决文章排版的问题,只需复制粘贴即可使用。

GitHub: github.com/doocs/md

具有如下特性:

- 支持 Markdown 所有基础语法、数学公式;

- 提供对 Mermaid 图表的渲染和 GFM 警告块的支持;

- 丰富的代码块高亮主题,提升代码可读性;

- 允许自定义主题色和 CSS 样式,灵活定制展示效果;

- 提供多图上传功能,并可自定义配置图床;

- 便捷的文件导入、导出功能,提升工作效率;

- 内置本地文章管理功能,支持草稿自动保存。

:icon_weibo: weibo.com/5722964389/P8JtVmPF1

推荐 GitHub 上一款高颜值的第三方 B 站客户端:PiliPala。

已实现的功能颇为丰富,包括视频推荐/热门列表、番剧列表、热门直播、用户登录、视频播放/暂停/全屏/字幕、热搜、点赞评论等等。

GitHub: github.com/guozhigq/pilipala

目前主要适配 Android 和 iOS 设备,感兴趣的同学可以下载看看。

:icon_weibo: weibo.com/5722964389/P8DYXyVQR

来自清华团队开源的一个 AI 项目:PRIME。

通过强化学习技术,仅用 8 张显卡,短时间内就训练出一个 7B 模型,而且在数学推理能力上超越 GPT-4o 以及 Llama-3.1 70B。

GitHub: github.com/PRIME-RL/PRIME

还提出一个算法,能够在不依赖高质量数据的情况下,显著提升训练模型的推理能力。

在 X(Twitter)上,引起不少开发者转发分享讨论,甚至得到 ChatGPT 此前联合创始人 John Schulman 的点赞。

有模型训练需求的同学,值得关注下。

:icon_weibo: weibo.com/5722964389/P8A3pCyeU

推荐 GitHub 上一款高效的文件共享开源工具:Transok。

允许在局域网内,通过唯一密码分享文件,不限制文件的数量以及大小,简单易用,拖拽上传,一键下载。

GitHub: github.com/bent2685/transok-wa

另外,还支持纯文字共享、深色主题以及多语言切换等等功能,兼容 Windows 以及 macOS 系统安装使用。

:icon_weibo: weibo.com/5722964389/P8vmUAuVN

推荐 GitHub 上一个开源免费的 AI 换脸工具:MagicMirror。

无需复杂的配置参数,只需拖放照片即可一键换脸、发型、穿搭。

GitHub: https:// 网页链接

同时完全本地离线运行,对电脑性能配置要求较低,不用 GPU 也能运行。

此外,还提供大小不到 10MB 的安装包,直接开箱即用,非常适合小白上手体验。

:icon_weibo: weibo.com/5722964389/P8sckD2oY

在过往分享的项目中,常常提及到可使用 Docker 一键部署使用。

如果我们对 Docker 并不了解,可以看一下这份《Docker 入门教程》。

该教程涵盖了基础介绍、安装使用、服务/镜像/容器管理、私有仓库搭建以及使用实践等等内容。

GitHub: github.com/jaywcjlove/docker-t

相信大家看完后,对 Docker 定有基本的认识,可以查找过往感兴趣的项目进行实战下。

:icon_weibo: weibo.com/5722964389/P8qCVhDSS

分享 GitHub 上一个基于 Klee One 改造的开源繁体中文字体:芫荽 / iansui。

收录众多汉字,支持汉语、白话、客语等拼音,支持中文全角标点符号。

GitHub: github.com/ButTaiwan/iansui

此外,还支持多种字重和样式,支持商用,整体看起来非常舒服。

有需求的同学可以试下。

:icon_weibo: weibo.com/5722964389/P8l7Y6u0n

推荐 GitHub 上一个开箱即用的图片添加水印工具:Image Watermark Tool。

可离线使用,完全在本地浏览器上处理,支持调整水印的颜色、透明度、间距、大小等内容。

GitHub: github.com/unilei/image-waterm

非常适合用在身份证、驾照、护照等重要证件添加水印场景,极大保护我们的隐私。

感兴趣的同学可通过 Docker 一键部署使用。

:icon_weibo: weibo.com/5722964389/P8kbRvhgs

分享 GitHub 上一个可帮助我们快速了解开源项目的工具:GitIngest。

只需输入 GitHub 链接,即可自动总结并提供易于 LLM 读取的 Markdown 文本,包含概括、目录结构、README 内容等。

GitHub: github.com/cyclotruc/gitingest

接着,我们复制发送给 AI,就能快速让 AI 帮我们介绍一个开源项目。

可以在线使用,也可以安装浏览器插件使用,有需要的同学可以安装试试。

:icon_weibo: weibo.com/5722964389/P8iLQ1DkN

分享 GitHub 上一份很不错的 AI 智能体构建学习指南:GenAI Agents。

提供了从基础到复杂的各种场景生成式 AI 智能体构建案例,如简单问答、旅程计划、合同分析以及联网查询总结等等,数量高达 40+。

GitHub: github.com/NirDiamant/GenAI_Ag

除此之外,还有详细的文档以及实现教程,提供了 .ipynb 文件,可直接在 Google Colab运行体验。

:icon_weibo: weibo.com/5722964389/P8hcq3w5u

推荐 GitHub 上一个强大且易于查看的付费订阅管理工具:Wapy.dev.

不仅能帮我们跟踪和管理定期付费订阅的内容,还能在到期时通过电子邮件或推送通知提醒续费。

GitHub: github.com/meceware/wapy.dev

除此之外,还支持划分不同类别,自定义颜色,筛选过滤等,以及提供 Docker 一键部署方式。

:icon_weibo: weibo.com/5722964389/P8cSwxsNx

推荐 GitHub 上一个轻量级且功能强大的视频播放器:plyr。

界面简洁易用,兼容各种屏幕尺寸,而且功能颇为全面,满足我们对前端视频播放器的各种需求。

GitHub: github.com/sampotts/plyr

主要功能:

- 支持快速播放 YouTube、Vimeo 等主流平台视频;

- 支持多语言字幕切换;

- 支持自定义个性化播放器外观;

- 支持清晰度切换、视频预览、画中画等;

- 支持为视频插入广告,助力变现;

- 提供了丰富的 API 接口,可以随意扩展功能。

如果网站有插入视频播放器的需求,该框架是我们不错的选择。

:icon_weibo: weibo.com/5722964389/P8bHsxcBS

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。