分享 GitHub 上一个简洁的 IP 信息查询工具:IP Helper。
支持通过 Web、命令行、Telnet 和 FTP 等多种方式查询,并提供 IP 地理位置查询、Token 认证 和 自定义域名等功能。
GitHub: https://github.com/soulteary/ip-helper
值得一提,这个工具是利用 Claude 和 Midjourney 等 AI 辅助快速开发完成的。
作者还写了一篇文章详细的介绍其开发过程,推荐大家一看学习。
文章地址: https:// 网页链接
分享一本专注于大语言模型实践应用的开源书籍:中文版《Large Language Model in Action》。
通过丰富的工具介绍和具体案例实践,带大家快速上手大模型应用开发,并在实际项目中灵活运用各类开发框架和工具。
在线阅读:github.com/wangwei1237/LLM_in_Action
内容分为三大部分:
1、基本概念篇
介绍大语言模型相关的核心概念和基础知识,帮助大家建立对大模型的基本认知。
2、相关工具篇
讲解大模型开发中常用的工具框架,如 LangChain、Semantic Kernel,Langflow、AutoGen 等。
3、具体实践篇
通过实际案例展示大模型的应用开发过程,提供可复现的开发经验和最佳实践指南。
如果大家想要了解并实践大模型应用开发,这本书比较适合你,但该中文版还没有完全翻译完,感兴趣的可以去看英文版。
推荐 GitHub 上一个开源免费的点对点文件传输工具:FastSend。
基于 WebRTC 技术,支持快速的目录同步和文件传输,只需要有浏览器即可实现安全高效的文件共享。
GitHub: https://github.com/ShouChenICU/FastSend
具有如下特性:
- 点对点加密传输,确保数据安全;
- 支持文件和文件夹传输;
- 局域网自动优化,传输更快;
- 简单易用的界面设计;
- 支持中英文界面;
- 支持PWA轻量安装。
此外,还提供了 Docker 一键快速部署方式,在使用时需确保浏览器打开 WebRTC 功能。
吴恩达老师新推出一门免费 AI 短课程:《Reasoning with o1》
由 OpenAI AI 解决方案主管 Colin Jarvis 亲自主讲,教授如何有效使用 OpenAI 最新发布的高级推理模型 o1。
通过实践项目强化学习,包括多步骤任务规划、代码开发与编辑、图像理解等,帮助学习者掌握 o1 模型的高级推理能力。
课程地址: https:// 网页链接
课程时长约 1 小时,共 8 节,包含 6 个代码示例,主要分为四部分:
1、o1 模型基础
了解 o1 的特点和工作原理,掌握其”思考后回答”的推理机制,学习在何种场景下使用 o1 以及如何与其他模型结合。
2、高效提示工程
掌握推理模型的新提示原则:保持简单直接、使用结构化提示、展示而非告知,以及元提示技术的应用。
3、实践应用开发
通过多个实践项目,学习如何让 o1 制定计划并交由小模型执行、如何进行代码开发与测试、如何处理图像理解任务等。
4、性能优化策略
学习如何在 AI 准确性和成本之间找到平衡,掌握”层次推理”方法,了解如何优化模型性能并提高响应效率。
前几天 OpenAI 刚开放 o1 模型 API 给大家使用,正好可以边看课程边实践,比较适合有 Python 基础和 LLM 应用开发经验的学习者。
推荐 GitHub 上一个可将任何文件转换为 Markdown 的工具:MarkltDown。
来自微软团队开源,支持将常见的文件,如 Word、Excel、PPT 等文档,一键转换为 Markdown。
GitHub: https://github.com/microsoft/markitdown
甚至还支持通过 OCR 以及 AI 模型对图片、音频这类多媒体文件进行处理。
提供了命令行、Python API 以及 Docker 三种使用方式,有需要的可以试下。
推荐 GitHub 上一个 PDF 文档翻译及双语对照工具:PDFMathTranslate。
它能够非常好的保留文档中的公式、图表、目录和注释等排版,支持多种语言,以及支持 Google、DeepL 以及 OpenAI 等众多翻译服务。
GitHub: https://github.com/Byaidu/PDFMathTranslate
此外,可通过命令行工具、可视化交互界面、Docker 一键部署等方式使用。
推荐 GitHub 一个颇为完善的学术论文项目页面模板:academic-project-page-template-vue。
基于 Vue 开发,支持轮播图、嵌入视频、数据可视化等丰富功能,还能一键复制引用格式,甚至还内置了评论系统。
GitHub: https://github.com/JunyaoHu/academic-project-page-template-vue
并且提供详细安装教程,非常适合研究人员用来快速直观地呈现论文的基本信息,有需要的可以看下。
给玩小红书的同学,推荐一款小红书笔记 AI 生成器:XHS Note Generator。
支持快速批量将视频或直播内容,一键转换为符合小红书风格的爆款笔记,并自动优化内容和配图。
GitHub: https://github.com/whotto/Video_note_generator
从自动下载视频,到使用 Whisper 语音转录文字,再到 AI 生成笔记,最后从 Unsplash 完成配图,全过程自动化完成。
并提供三种使用方式:单个视频、批量 URL 处理 和 Markdown 文件。感兴趣的可以试试。
跟大家分享一个实用的微信聊天记录导出工具:wechatDataBackup。
提供类似微信简易操作界面,可一键导出聊天记录,支持图片、视频、链接、语音、文件、表情等类型的信息保存。
GitHub: https://github.com/git-jiadong/wechatDataBackup
此外,还支持按类型、日期、群成员进行检索,以及多开账号选择导出和数据切换。
有需求的同学不妨试试。
推荐 GitHub 上一个开源免费的跨平台电子书阅读器:Koodo Reader。
支持导入多种格式,如 EPUB、PDF、Kindle 等,有双页、单页、滚动等阅读模式,同时提供听书、翻译、词典等功能。
GitHub: https://github.com/koodo-reader/koodo-reader
另外,还可以进行自定义字体、字号、间距等个性化排版,而且还有完整的笔记、书签、高亮等标注功能。
支持跨平台,兼容 Windows、macOS、Linux 和 网页版,有需求的同学不妨试下。
跟大家分享一款效果非常好的背景移除工具:RMBG-2.0。
支持处理各种类型的图像,一键移除背景,效果不错且处理速度很快,非常适合电商、广告等应用场景。
在线使用:huggingface.co/spaces/briaai/BRIA-RMBG-2.0
模型下载:huggingface.co/briaai/RMBG-2.0
此外,模型是开源的,但不能商用。对于我们这些普通用户来说,足够用了。
分享一套较稳定的服装迁移 ComfyUI 工作流:Comfyui_Object_Migration。
只需提供一张服装照片,即可迁移到一个模特身上,服装保持一致性,自然真实且细节还原度较高,可用于虚拟试穿。
GitHub: https://github.com/TTPlanetPig/Comfyui_Object_Migration
此外,还可以进行风格迁移,由动漫转现实风格的服装穿着,看演示图效果很不错。
分享 GitHub 上一个开源免费的 NSFW 内容检测器:NSFW Detector。
使用的是 Google 模型,准确度高,支持检测图片、PDF 文件、视频、压缩包中的文件等类型文件。
GitHub: https://github.com/tmplink/nsfw_detector
支持纯 CPU 推理,能运行在大部分服务器上,同时提供 API 服务,可以方便的集成到应用中。
通过 Docker 一键快速启动 API 服务,有需求的同学不妨试下。
在 GitHub 上发现一款颇为实用的开源 AI 书签管理工具:Hoarder。
通过浏览器插件一键保存,AI 自动提取网页标题、描述和图片信息,轻松构建个人内容收藏库。
同时,支持链接、笔记、图片和 PDF 等多种格式一站式管理。
GitHub: https://github.com/hoarder-app/hoarder
此外,还集成了基于 ChatGPT 的智能标签分类、全文检索、多端同步、完整页面存档等实用功能。
目前已提供 Chrome、Firefox 插件和 iOS、Android 应用,并且支持 Docker 一键私有化部署,感兴趣的同学可以尝试下。
推荐 GitHub 上一款功能强大的视频字幕翻译助手:VideoCaptioner。
提供可视化操作界面,无需复杂配置,支持字幕智能断句、校正、优化、翻译,一键生成效果惊艳的双字幕视频。
GitHub: https://github.com/WEIFENG2333/VideoCaptioner
具有如下特征:
- 无需GPU即可使用强大的语音识别引擎,生成精准字幕;
- 基于 LLM 的智能分割与断句,字幕阅读更自然流畅;
- AI字幕多线程优化与翻译,调整字幕格式、表达更地道专业;
- 支持批量视频字幕合成,提升处理效率;
- 直观的字幕编辑查看界面,支持实时预览和快捷编辑;
- 消耗模型 Token 少,且内置基础 LLM 模型,保证开箱即用;
- 支持国内外主流视频平台视频下载,如 B站、Youtube 等;
- 提供丰富的字幕样式模板,以及支持导出多种格式字幕,如SRT、ASS、TXT 等。
推荐 GitHub 上一款高颜值且功能强大的跨平台终端工具:WindTerm。
具有如下主要功能:
- 支持多种协议连接,如 SSh、Shell、TeInet、Tcp 等;
- 集成了 SFTP、SCP 客户端,支持文件上传下载操作;
- 支持多语言界面,支持命令行自行补全;
- 内置文件管理器,可以方便地进行文件操作;
- 支持分屏显示,提高工作效率;
- 具有高性能、低延迟以及占用内存极低等特点。
GitHub: https://github.com/kingToolbox/WindTerm
工具支持 Windows、macOS 和 Linux 系统安装使用,感兴趣的不妨试下。
分享 GitHub 上一款高颜值的 Markdown 编辑器:MarkText。
类似于 Typora,简洁干净的编辑界面,提供实时预览,多种主题,以及多种编辑模式等实用功能。
GitHub: https://github.com/marktext/marktext
具有如下特征:
- 实时预览:所见即所得的编辑模式,流畅写作体验;
- 支持数学公式(KaTeX)、丰富的表情符号支持;
- 支持多种编辑模式,如源代码、打字机、专注模式;
- 支持导出 HTML 和 PDF 文件;
- 拥有丰富快捷键,提升写作效率。
工具支持 Windows、macOS 和 Linux 系统使用,感兴趣的同学不妨试下。
推荐 GitHub 上一款颇为实用的 Finder 右键菜单增强工具:RightMenu Master。
内置了多个实用的预设操作,支持移动和复制文件、创建新文档、预览支持代码高亮、常用文件夹、一键新建终端窗口等。
GitHub: https://github.com/jaywcjlove/rightmenu-master
如果你是 Mac 用户,不妨试下,希望它能进一步提升你的工作效率。
推荐 GitHub 上一款功能强大的文件上传/下载管理器:File Centipede。
支持几乎所有常见的协议,如 HTTPS、BT/磁力链接、FTP、WebDAV、m3u8 等,还内置了许多实用的辅助功能。
GitHub: https://github.com/filecxx/FileCentipede
此外,还提供了浏览器插件,可抓取网站上的音频和视频,甚至加密的视频。
在 GitHub 上发现一款功能强大的文档管理系统 Paperless-ngx。
它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
GitHub: https://github.com/paperless-ngx/paperless-ngx
主要有如下特性:
- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。
- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。
- 文档保存为 PDF 格式,并同时保留未更改的原始文件。
- 支持识别超过 100 多种语言。
- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。
- 界面美观、提供全文搜索功能、邮件处理功能。
- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报