分享 GitHub 上一本通俗易读的开源书籍《大模型基础》。
涵盖了大语言模型基础、模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等内容。
GitHub: https://github.com/ZJU-LLMs/Foundations-of-LLMs
共有 6 个章节,每章围绕一种动物展开讲解,并通过举例说明具体技术,让我们更容易读懂。
推荐 GitHub 上一款功能强大的跨平台 m3u8 下载工具:Fluent M3U8。
支持 AES-1280-CBC 解密、多线程并发极速下载、自定义请求头、监控下载进度等等特性。
GitHub: https://github.com/zhiyiYo/Fluent-M3U8
界面简洁、直观易用,支持 Windows、macOS 系统安装使用,有需求的不妨试下。
分享 GitHub 上一份收集整理了关于人工智能和机器学习的相关学习资源列表:Awesome AI/ML Resources。
涵盖了相关的关键概念、所需的数学基础、相关的职业、学习路线图、学习课程以及书籍等内容。
GitHub: https://github.com/armankhondker/awesome-ai-ml-resources
学习资料颇为全面,并为初学者提供了学习路线以及相关的免费资源。
同时也适合正准备面试 AI 相关岗位的同学学习。 #AI创造营
推荐 GitHub 上一款开源的实时键盘鼠标输入可视化工具:Keyviz。
安装该工具,可在电脑上直观显示到我们按下的键盘和鼠标,支持个性化定义显示效果。
GitHub: https://github.com/mulaRahul/keyviz
如果你经常需要录屏或者演讲,需要给大家展示你的操作过程,那么这款工具很实用。
分享 GitHub 上一个开源的 AI 语音面试官工具:Foloup。
根据职位描述自动生成相关的面试问题,并提供一个专属链接与面试者分享,进行自然的语音面试。
GitHub: https://github.com/FoloUp/FoloUp
面试结束后,AI 还会对面试者的表现,做出一份详细分析报告,并给予评分。
甚至提供了一个综合的仪表板,可用于跟踪所有候选人的表现和整体统计数据。
分享 GitHub 上一个去除图片上水印的开源解决方案:Watermark-Removal。
基于机器学习的图像修复方法,实现一键去除图片上的水印,从给出处理后的图像效果来看,与原图几乎一致。
GitHub: https://github.com/zuruoke/watermark-removal
有需求的,可通过 Google Colab,或者本地部署使用,此外本地部署对电脑有一定性能要求。
推荐 GitHub 上一款功能丰富的 Markdown 笔记编辑器:妙言。
无需联网,纯本地使用,支持语法高亮、深浅主题、多语言、演示模式、专注模式、PPT 模式、图床、LaTeX 等等功能。
GitHub: https://github.com/tw93/MiaoYan
类似 Typora,采用三栏极简的设计风格,目前仅支持 macOS 系统。
感兴趣的同学不妨试下。 #AI创造营
推荐 GitHub 上一款能从任何文档中提取文本的开源工具:Kreuzberg。
支持 PDF、图像、Word 文档等各种文件格式,自动化提取文本,以便用于检索增强生成(RAG)。
GitHub: https://github.com/Goldziher/kreuzberg
使用简单,且对 GPU 无要求,并提供了一个统一的异步接口,更高效地提取。
DeepSeek 官方给出本地部署 R1 模型的最佳相关设置。
- 不设定系统提示词
- Temperature(温度值):推荐 0.6
除此之外,还提供了所用到的提示词:
文件上传
file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""
搜索:
# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
\- 今天是{cur_date}。
\- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
\- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
\- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
\- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
\- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
\- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
\- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
\- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}
同时,还给出防止模型绕过推理思考的建议。
在每个输出的开头强制要求模型以"<think>\n"开始其响应。
在 GitHub 上发现一个 Deep Research 开源版:DeeSearcher。
结合了大模型和向量数据库,为个人/企业知识管理、智能问答、信息搜索等场景提供高度准确的答案和全面分析。
GitHub: https://github.com/zilliztech/deep-searcher
支持本地文件导入,以及网络数据爬取等文档加载,支持 DeepSeek、OpenAI 等大模型。
微软出了一期学习 GitHub Copilot 的入门教程。
一共有 9 节课程,将教授我们如何有效使用 GitHub Copilot 并用于辅助编程。
通过该课程,将学会:
- GitHub 基础使用,包括理解和操作仓库、分支、提交和拉取请求。
- 了解 GitHub Codespaces 和 GitHub Copilot。
- 学会 GitHub Copilot 的自动完成功能、自定义选项和高级编程技巧。
GitHub: https://github.com/microsoft/Mastering-GitHub-Copilot-for-Paired-Programming
比较适合想了解 GitHub,并想使用 GitHub Copilot 辅助自己编程的我们学习。
推荐 GitHub 上一个基于 AI 强大的有声书工具集:LiberSonora。
包含了音频字幕提取、标题生成、多语言翻译等功能,支持离线使用,GPU 加速以及自定义大模型。
GitHub: https://github.com/LiberSonora/LiberSonora
提供 Docker 快速部署方式,支持通过 API 接口集成到现有工作流中使用。
推荐 GitHub 上一个简单易用的视频字幕翻译开源工具:Video Subtitle Master。
不仅能批量生成视频字幕,还支持将字幕批量翻译多语言,并提供可视化操作客户端,开箱即用,轻松上手。
GitHub: https://github.com/buxuku/video-subtitle-master
支持 DeepSeek、DeepLX、百度翻译、Ollama、火山引擎等等翻译服务。
兼容 Windows、macOS 系统,下载安装包,配置所需翻译服务,即可使用。
分享 GitHub 上一份精选模型上下文协议(MCP) 服务器列表:awesome-mcp-servers。
涵盖了浏览器自动化、云平台、命令行、社交平台、数据库、开发者工具、文件系统、搜索以及旅行交通等方面内容。
GitHub: https://github.com/punkpeye/awesome-mcp-servers
小科普:MCP 是一种开放协议,通过标准化的服务器实现,使 AI 模型能够安全地与本地和远程资源进行交互。
推荐 GitHub 上一个开源好用的 OpenAI 接口管理和分发系统:One Hub。
基于 One API 进行开发,新增了支持更多模型,加入了统计页面,以及完善非 OpenAI 模型的函数调用。
GitHub: https://github.com/MartialBE/one-hub
同时还带来全新的 UI 界面、用户仪表盘,以及管理员分析数据统计界面。
如果该项目对 One API 修改优化的内容,刚好是大家的需求,不妨试下它。
分享一份由 Hugging Face 出品关于智能体(Agent)的课程:Agents Course。
共有五个章节,涵盖了从智能体基础介绍到使用各种框架的构建实际应用案例,最终以构建一个基准测试项目结束。
GitHub: https://github.com/huggingface/agents-course
课程内容目前还没有完成,从往期 Hugging Face 出品的课程来看质量都是相当不错的。
如果感兴趣的同学,值得关注一下。不过需要一些基础的 Python 以及 LLMs 知识。
分享 GitHub 上一个能够快速且准确地将 PDF 转换为 Markdown 格式的工具:Marker。
不仅能将 PDF 文件,还能将图像以高精度快速转换为 Markdown、JSON 和 HTML 等格式。
GitHub: https://github.com/VikParuchuri/marker
支持处理表格、表单、数学方程式、链接以及代码块等内容,支持多种语言。
除此之外,还可以自动去除文档中非主要内容,如页眉和页脚等。
分享 GitHub 上一个能在苹果手机上使用 AI 聊天快捷指令:Siri Ultra。
无需下载任何 App,只需配置一个 API,即可通过 Siri 实时语音对话,体验到最新的大模型。
GitHub: https://github.com/fatwang2/siri-ultra
除此之外,还支持联网搜索以及网页总结。目前已支持 DeepSeek R1 + 联网。
也可以配置其他服务商,比如 OpenAI、Groq、Gemini、OpenRouter等。
并且提供了详细的使用指南,轻松把手上的 Siri 升级体验。 #AI创造营
推荐 GitHub 上一款开源的全能 AI 助理客户端:Cherry Studio。
内置 300+ 预配置 AI 助手,可多个模型同时对话,支持上传 png、docs、pdf 等文件格式,代码高亮显示等功能。
GitHub: https://github.com/CherryHQ/cherry-studio
除此之外,还集成了全局搜索、对话管理、多语言翻译、拖拽排序等等实用功能。
同时支持主流 LLM 云服务,以及集成流行 AI Web 服务,还支持 Ollama 本地部署模型。
提供开箱即用的安装包,支持 Windows、macOS 以及 Linux 系统。值得大家安装一试。
分享 GitHub 上一个使用 DeepSeek 构建微信聊天机器人的开源方案:deepseek_project。
通过对接 DeepSeek API 与微信接口实现的智能聊天机器人,支持实时监听消息并自动化响应。
GitHub: https://github.com/1692775560/deepseek_project
除此之外,还支持上下文敏感型回复生成,以及异常流量熔断机制。
感兴趣的同学,建议使用小号尝试,谨防被封。 #AI创造营
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报