带你系统深入了解大语言模型。
在 GitHub 上发现一本《大语言模型》电子书籍。
本书籍主要为大模型的入门读者提供详细讲解,同时展现一个整体的大模型技术框架和路线图。
GitHub: https://github.com/LLMBook-zh/LLMBook-zh.github.io
主要有五部分内容,分别如下:
- 基础:讲解了大模型的基本理论,包括架构和基础技术。
- 预训练:详细介绍数据处理和模型架构设计,以及如何进行模型的预训练。
- 微调与对齐:探讨如何根据具体需求调整模型,并通过对齐技术优化模型性能。
- 大模型使用:说明模型在实际环境中的部署和提示学习的策略。
- 评测与应用:讨论如何评估模型的效果和在不同领域的应用案例。
提供了从理论到实践的全方位理解和入门指南,适合有一定深度学习基础的同学学习
分享 GitHub 上一个开源免费的潦草头像生成器 ugly-face。
最近看到很多网友喜欢用一些极具特性的头像,查找了下,原来均来自 ugly-avatar 开源项目生成。
GitHub: https://github.com/txstc55/ugly-avatar
感兴趣的可以看下。
推荐 GitHub 上一款专为英语学习打造的视频播放器 DashPlayer。
旨在方便你观看英文视频,助你通过观看视频、沉浸真实语境,轻松提升英语水平。
GitHub: https://github.com/solidSpoon/DashPlayer
主要特性:
- 双语字幕:支持机器翻译字幕。只展示中文/英文,或者全部隐藏都可以。
- 按字幕跳转: 重复当前句,或者跳到上一句,怎么跳都可以。
- 查词查询:鼠标悬停生词可快速查询,不打断学习进程。
- 可调整界面尺寸: 界面尺寸可调,适应不同屏幕和学习场景。
- 记录播放位置: 自动记录上次播放位置,方便下次接着学习。
- 蓝牙遥控操作: 支持蓝牙遥控,让你随时调整音量、跳转视频,学习更轻松!
- 夜间模式:内置暗色/亮色主题,适配您的学习环境。
- AI 字幕:可以使用 AI 为视频生成字幕。
- 长视频切分:看一段删一段,没有压力。
- 视频下载:粘贴视频链接,下载视频。
软件完全开源免费,同时支持 Windows、macOS 系统安装使用。
分享 GitHub 上一份精心收集了各种人工智能领域的资源集合 awesome-artificial-intelligence。
涵盖了机器学习、深度学习、自然语言处理等基础知识学习,再到实际应用的各个方面,包括常用工具、学习教程、书籍、讲座视频 以及相关论文等内容。
GitHub: https://github.com/owainlewis/awesome-artificial-intelligence
推荐 GitHub 上一款开源免费的网页资源嗅探插件 cat-catch(猫抓)。
它能够帮你筛选列出当前页面的资源,同时提供嗅探 缓存捕捉 视频录制等各种工具帮助抓取资源。
并且,可以在设置内添加想要抓取的资源类型,包括视频、图片等资源。
GitHub: https://github.com/xifangczy/cat-catch
支持 Chrome、Edge 以及 Firefox 浏览器安装使用。
分享 GitHub 上一个专为开发人员打造的实用在线工具库 IT-Tools。
涵盖了 Token 生成器、大小写转换器、进制转换器、二维码生成器、Git 备忘录等等更多实用的工具。
另外,你也可以通过 Docker 一键部署到自己服务器上。
推荐 GitHub 上一款开源免费的网络资源嗅探下载器 res-downloader。
操作简单易用,可获取包括视频、音频、图片 以及 m3u8 等不同类型的资源。
支持微信视频号、抖音、快手、小红书、 QQ 音乐等主流平台的资源拦截下载。
推荐 GitHub 上一个可自动录制各直播平台的开源免费工具 Stream-rec。
GitHub: https://github.com/hua0512/stream-rec
功能列表如下:
- 目前已支持录制的直播平台有虎牙、抖音、斗鱼以及 Twitch。
- 自动录播,可自由配置录制质量、路径、格式等。
- 自动弹幕录制,可进行弹幕转换,以及实现弹幕自动挂载。
- 使用 SQLite 持久化存储录播和上传信息。
- 支持 Rclone 上传到云存储。
- 提供可视化 Web 界面进行配置。
- 提供 Docker 一键部署使用。
分享 GitHub 上一份《动手学大模型》系列编程实战教程。
教程内容由上海交通大学《人工智能安全技术》课程讲义拓展而来,通过简单的实践,帮助同学快速入门大模型。
涵盖模型微调与部署、提示学习与思维链、知识编辑、模型水印 以及大模型智能体与安全等相关内容。
GitHub: https://github.com/Lordog/dive-into-llms
目前还在持续更新当中,感兴趣的同学可以看看。
分享 GitHub 上一份收集 Raycast 第三方插件集合 categorized-raycast-extensions。
已收集超过 1498 个插件,涵盖了商业、设计、音视频、社交媒体、教育、娱乐、AI、自动化、实用工具等等类别。
GitHub: https://github.com/marekbrze/categorized-raycast-extensions
推荐 GitHub 上一个模仿抖音的移动端短视频项目 Douyin-Vue。
使用最新的 Vue 技术栈开发,实现媲美原生 App 丝滑流畅的使用体验。
GitHub: https://github.com/zyronon/douyin
可以作为你学习 Vue 最佳实践的项目。
给前端开发者推荐一款开源的 Chrome 浏览器插件 Reponsive Viewer。
它可以在一个界面中展示多个屏幕尺寸,能够很好帮助到你在开发响应式网站或应用时测试多屏幕尺寸显示效果。
提供多种设备尺寸选择,横竖屏显示,一键截图分享等功能。
推荐 GitHub 上一款多功能、轻量化、高性能的 macOS 屏幕工具 QuickRecorder。
具有如下特性:
- 软件大小仅 4MB 左右,体积小巧轻量化;
- 支持窗口录制, App 录制等模式;
- 支持窗口声音内录,鼠标高亮,隐藏桌面文件等功能;
- QuickRecorder 启动后直接显示主功能面板,关闭后可以点击 Dock 栏图标再次呼出;
- 开始录制后 QuickRecorder 会在菜单栏显示录制指示器,可随时暂停或查看录制时长。
GitHub: https://github.com/lihaoyun6/QuickRecorder
工具完全开源免费,隐私安全,但仅支持 macOS 13 及以上系统使用。
GitHub 上最大的开源算法库 The Algorithms,值得每位算法工程师收藏!
该库收录了 Python、Java、C++、JavaScript、Go 等多种主流编程语言的算法实现代码。
其中包含二分查找、快速排序、斐波那契数列等众多热门算法,可以说是应用尽有。
此外,通过其网站,你可以轻松地使用搜索功能、浏览热门分类或选择编程语言来学习各种算法代码。
GitHub: https://github.com/TheAlgorithms
AI 生成视频的热度一直在技术圈中递增不减,此前,Colossal-AI 团队在 GitHub 全面开源了全球首个类 Sora 架构视频生成模型 「Open-Sora」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重。
近日,Open-Sora 在开源社区悄悄更新了,现已支持长达单镜头 16 秒的视频生成,分辨率最高可达 720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。
GitHub: https://github.com/hpcaitech/Open-Sora
本次更新内容依旧全部开源,包含最新的模型架构、最新的模型权重、多时间/分辨率/长宽比/帧率的训练流程、数据收集和预处理的完整流程、所有的训练细节、demo 示例和详尽的上手教程。
另外,团队在 GitHub 上正式发布了 Open-Sora 技术报告,本次更新主要包括以下几项关键特性:
- 支持长视频生成;
- 视频生成分辨率最高可达 720p;
- 单模型支持任何宽高比,不同分辨率和时长的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求;
- 提出了更稳定的模型架构设计,支持多时间 / 分辨率 / 长宽比 / 帧率训练;
- 开源了最新的自动数据处理全流程。
所有代码均已开源至 GitHub,对 AI 文生视频感兴趣的同学,可以体验一下。
分享 GitHub 上一份精心收集和梳理中文 LLM 相关集合 Awesome Chinese LLM。
不仅包含了多个垂直领域(如医疗、法律、金融、教育、科技、电商、网络安全和农业)的开源微调中文模型。
而且还涵盖了底层模型、数据集、微调框架、推理部署框架、评测方法和相关教程。
GitHub: https://github.com/HqWu-HITCS/Awesome-Chinese-LLM
如果你在找垂直领域的中文 LLM 或想深入学习 LLM 的相关技术,这个开源库值得一看!
推荐一款开源免费的封面图片制作工具 PicProse。
该工具能帮助你轻松为 Medium、Wordpress、微信等平台的文章制作精美封面。
GitHub: https://github.com/gezhaoyou/picprose
图片素材均来自 Unsplash,可免费商用且无需版权。
分享 GitHub 上一个开源好用的汉字笔画书写练习库 Hanzi Writer。
这是一个开源免费的 JavaScript 库,通过它,可以根据汉字书写时按照笔画顺序的特征,播放正确笔画顺序的描边动画和练习测试。
提供 9000 多常用的简体字和繁体字,库大小仅 30kb,可以嵌入到任何平台应用,如 Web、iOS 或 Android 等。
GitHub: https://github.com/chanind/hanzi-writer
看了下,开源这库是国外一名全栈程序员,大概率是因为在学习汉字时而开发的一个库。
有开发能力的同学可以考虑下,将其封装成一款应用,提供给国外友人或小孩学习汉字使用。
分享一份较为全面的机器学习教程 machine-learning-list。
从基础到高级再到实践与应用,涉及到基本简介、训练和微调、推理和执行策略、数据集处理以及实际应用等内容。
GitHub: https://github.com/elicit/machine-learning-list
适合机器学习的新手,或想更深入了解机器学习的同学。
推荐 GitHub 上一款开源免费的工具 Reader,专门用于将网页内容转换为 Markdown 格式。
使用这个工具非常简单,只需要将任意 URL 粘贴到指定的前缀后,即可一键抓取网页内容并转换为 Markdown 格式。
GitHub: https://github.com/jina-ai/reader
当你需要将网页内容整合到知识库中时,大部分 AI 工具是不支持直接使用的,而将它们转换为 Markdown 格式则更方便你打造知识库。
有这方面需求的同学不妨尝试下这款工具。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报