GitHub 上一份开源免费大语言模型课程。
本课程旨在介绍大语言模型,含有详细的学习路线和 Colab 实践笔记。
课程分为三个部分:
1)LLM 基础教程,涵盖数学、Python 和 审计网络的基础知识;
2)LLM 深入探索,使用最新技术构建尽可能最好的 LLM;
3)LLM 应用与部署,开发基于 LLM 的应用,并完成部署。
哈佛大学免费开放的一门计算机科学和编程入门课程 CS50。
不仅仅教会你如何使用某种编程语言,更重要的是教你掌握编程的基本原理,以及如何自学新的编程语言。核心在于教会你如何解决问题。
课程内容涵盖了计算思维(computational thinking)、抽象(abstraction)、算法(algorithms)、数据结构(data structures)等计算机科学的基础知识。
课程安排如下:
1)先从 C 语言开始,学会函数、变量、条件语句、循环等基础概念;
2)随后,转向更高级的 Python 语言(大家听到最多的编程语言);
3)再学习 SQL 语言,学会如何在数据库中存储数据;
4)再学习 HTML、CSS 和 JavaScript 语言,将学会创建网页和移动应用程序。
5)最后以一个终极项目作为收官。
学习地址: https://cs50.harvard.edu/x/2024/
注意:学习地址需要魔法才能访问。分享给有需要的人学习,课程适合所有人,无论你是否有编程基础。
分享 GitHub 上的一份英语学习指南,助你系统化学习并提升英语水平。
作者将其高效学习英语的小技巧整理成这份指南,希望能让你学习英语就像我们自然而然地学会汉语那样。
主要分为七大章节:认知篇、单词篇、听力篇、阅读篇、口语篇、写作篇和扯淡篇。
同时带你多维度、结构化、阶段化、针对化的高效学习英语。
GitHub 上一个极简风格的三栏式个人主页网站 onur.dev。
使用了 Next.js、Tailwind CSS、shadcn/ui、Contentful、Raindrop、Supabase 构建并部署在 Vercel 上。
GitHub: https://github.com/suyalcinkaya/onur.dev
如果你喜欢可以自己部署一个,另外,它还兼容移动端的。
推荐 GitHub 上一款独一无二的免费开源简历生成器:Reactive Resume。
可通过各种配置,让创建、更新、共享简历的过程变得更加简单便捷。支持中文,可同时创建多份简历,并快速打印成 PDF。
GitHub: https://github.com/AmruthPillai/Reactive-Resume
简历的主题、外观、颜色、布局也可随意个性化更改,并可实时更新到简历中。
此外,还集成了 GPT 可辅助你编写和修改简历。
在 GitHub 上发现一款有趣的命令行工具 cmd-wrapped。
它可以让你了解过去一年中你在终端上使用的命令行情况,如每日最活跃时段,以及常用命令统计。
并生成类 GitHub 的年度命令分布图。感兴趣的可以去试试。
分享过很多开源 AI 项目,常见会提供一个 Docker 部署方法。
如果你对 Docker 不了解,推荐你看下这份《Docker 从入门到实践》学习指南。
该指南涵盖了 Docker 的各个方面知识,如基本安装、镜像使用、容器操作、数据管理、网络配置等等,旨在教会新手小白有效使用 Docker。
GitHub: https://github.com/yeasy/docker_practice
看了下内容,虽然教程很早就出了,但基础知识依然还是值得学习,新手入门完全没问题。
网易有道开源了一款名为 QAnything 的知识库问答引擎,可实现一键部署!
不仅可调用云端大模型服务,还可实现纯本地部署。但官方建议在配备 NVIDIA 3090 16GB 显存以上的电脑上进行本地部署。
支持导入 PDF、Word(doc/docx)、PPT、Markdown 等多种格式的文档,即可像与 GPT 对话那样,提供准确、快速、可靠的问答体验。
GitHub: https://github.com/netease-youdao/QAnything
主要有如下特点:
- 数据安全:支持全程断网安装与使用。
- 跨语种问答:无缝切换中英文问答,不限文件语种。
- 海量数据处理:采用两阶段向量排序,有效解决大规模数据检索问题,数据越多效果越好。
- 高性能生产级系统:适用于企业应用的直接部署。
- 易用性:无需繁琐的配置,一键安装部署,拿来就用。
- 多知识库问答:支持选择多个知识库进行问答。
GitHub 上一个能够让 PDF 看起来像是扫描过的小众实用工具 Look Scanned。
一个能够让 PDF 看起来就像是扫描件一样的纯前端网站!不需要打印机和扫描仪,只需要点几下即可完成转换。
GitHub: https://github.com/rwv/lookscanned.io
具有如下特点:
- 隐私:所有数据均在自己本地浏览器进行处理。
- 速度:无需繁琐过程,只需点击几下按钮,几秒间得到所需要的扫描件。
- 个性化:提供调整参数让生成的扫描件看起来更真实。同时可实时预览效果,所见即所得。
- 跨平台:不仅能在所有浏览器上使用,在手机上也能用!
- 开源免费且可离线使用。
在 GitHub 上有这么一份精心整理的数据库学习合集 Awesome Database Learning。
里面内容非常丰富,涵盖了课程、书籍、讲座、论文等数据库相关的学习资料。
GitHub: https://github.com/pingcap/awesome-database-learning
通过这份合集你将了解数据库内部工作原理。
在 GitHub 上有一个称之为 “AI Gateway(AI 网关)” 的工具。
通过统一简单的 API,让你轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等。
GitHub: https://github.com/Portkey-AI/gateway
具有如下特点:
- 占用空间极小,仅仅约 45kb,但其处理速度极快,达到快 9.9 倍。
- 可以同时连接多个模型,并能处理多个模型、服务提供商和密钥之间的负载平衡。
- 设置故障转移机制,当一个模型出现无法使用情况,可自动切换到可用模型,确保你的应用持续稳定运行。
- 默认配置自动重试,并采用指数回退策略,进一步提高请求的稳定性。
- 可根据需求添加中间件,满足你个性化需求。
- 已经在超过 100B Tokens 上进行了实战测试。
GitHub 上一个简单快速的分词、命名实体识别工具:cutword。
这是一个中文分词库,字典文件根据最新数据统计得到,词频更加合理。
GitHub: https:// 网页链接
其分词速度是知名“结巴”中文分词的两倍。
GitHub 上一个开源的多语言文档 OCR 工具包:Surya。
这是一个专注于文档的 OCR,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub: https:// 网页链接
未来还会支持具体文本识别以及表格和图像的检测。
GitHub 上一款可实现照片级真实感的图像着色工具:DDColor。
它不仅可以为历史黑白老旧照片提供生动自然的着色,还可以对动漫游戏中的风景进行着色或重新着色,变为逼真的现实生活风格!
GitHub: https://github.com/piddnad/DDColor
又是一款 AI 老旧照片智能上色的工具,可开源免费使用。
炸裂!阿里发布了一个可替换万物工具 ReplaceAnything。
它能够准确保留你指定的任何物体,如人脸、人物、服装、物品等等,并通过输入提示词,实现超高质量内容替换。
可用于多种场景,如人物替换、服装替换、背景替换等,商用场景有 AI 模特、商品宣传图、艺术写真照等。
GitHub: https://github.com/AIGCDesignGroup/ReplaceAnything
其使用步骤很简单:
1、上传图像
2、鼠标轻松点击选择图像保留部分
3、输入提示词,点击生成
4、支持上传参考风格背景图像(可选)
前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。
但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。
因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。
在 GitHub 上开源维护的中国节假日补班日历。
为 2022-2024 年中国节假日、调休、补班日历,提供 ICS 格式,同时提供 API 获取。
支持 iPhone、Google Calendar、Outlook 等客户端订阅。
GitHub: https://github.com/lanceliao/china-holiday-calender
具有如下特点:
- 节假日信息来自官方,一手信息、权威准确;
- 包含最近 3 年的节假日信息,机器人自动维护,更新及时;
- 日历标题包含放假、补班的天数信息;
- 日历标题包含放假、补班等关键字,方便脚本开发。例如使用iPhone的快捷指令应用编写工作日闹钟;
- 每个补班日程自动设置上班提醒,默认时间为09:00~18:00、提前一个小时提醒;
- 支持个性化定制补班日程的开始、结束时间和提醒时间(例如提前一天提醒);
- 没有广告!!!
OpenVoice:多功能即时声音克隆技术。
这是由 MyShell 团队开发的一项技术,只需提供一段简短的音频样本,就能克隆出原发言者的声音,并能以此生成各种语言的语音。
它具有如下优势:
1)高精度音色克隆
能够高度还原参考音色,支持多语种和多种口音的语音生成。
2)灵活的声音风格调控
可以对声音的情感、口音进行精细调整,还可以控制节奏、停顿和语调等多种声音风格。
3)无需样本的跨语言声音克隆
无论是参考声音还是生成的声音,都可以是大型多语种数据集之外的任何语言。
GitHub: https://github.com/myshell-ai/OpenVoice
测试了下,中文效果不是很好, 对此 MyShell 团队也清楚并表示正在优化处理。
一个自动投简历助手,实现一键自动寻找工作!
结合 GPT 与 RPA 技术制作,通过 GPT 基于你的简历内容和对方的职位要求,自动在招聘平台上匹配合适的职位。
且由 GPT 生成自我介绍以及求职信,并自动发送给 HR,全流程自动操作!
GitHub: https://github.com/Frrrrrrrrank/auto_job__find__chatgpt__rpa
大家可基于这个脚本进行扩展支持更多招聘平台,但同时需要注意平台机制,以及由 GPT 为你生成的内容。
在 GitHub 上开源的一个文档管理系统 Paperless-ngx。
它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
GitHub: https://github.com/paperless-ngx/paperless-ngx
主要有如下特性:
- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。
- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。
- 文档保存为 PDF 格式,并同时保留未更改的原始文件。
- 支持识别超过 100 多种语言。
- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。
- 界面美观、提供全文搜索功能、邮件处理功能。
- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报