Show newer

分享 GitHub 上一份从零开始学习机器学习算法教程:Machine-Learning。

包含了神经网络和 Transformer 模型的详细解释,以及关键的 Python 实现代码,如 Neuron、Layer 和 NeuralNetwork 类。

GitHub: github.com/DorsaRoh/Machine-Le

此外,还提供了关于机器学习的视频格式内容和相关的 Jupyter Notebook 文件。

:icon_weibo: weibo.com/5722964389/OuNwC1Hgi

分享一个开源的现代文转古文大模型:ancient_text_generation_LLM。

基于荀子基座大模型微调训练,通过输入现代汉语句子,能够转化为古汉语风格的句子。

GitHub: github.com/JianXiao2021/ancien

:icon_weibo: weibo.com/5722964389/OuHDi78MC

推荐 GitHub 上一款简单易用、快速且免费的文件翻译工具:DeeplxFile。

基于 Deeplx/playwright 实现,不限制文件大小,支持超长文本翻译,使用 DeepL 作为翻译源,

能够翻译超长且复杂的文档,如超大的 Excel 文件,甚至还能正确显示复杂的引用公式。

GitHub: github.com/infrost/DeeplxFile

工具提供 Windows 一键安装包,也支持 macOS 运行使用。

:icon_weibo: weibo.com/5722964389/OuCIS74zL

推荐 GitHub 上一款特别好用的 AI 开源工具:MaxKB,让普通人也能快速搭建一个 AI 知识库问答系统。

项目简单易用、界面简洁,支持本地部署,即便是刚刚接触知识库应用的新人小白,也能在 5 分钟内为自己的网站增加一个 AI 助手。

GitHub: github.com/1Panel-dev/MaxKB

项目由国人开发,中文文档齐全,并拥有以下特点:

- 开箱即用:直接上传文档、自动爬取在线文档、智能问答交互体验好;

- 模型中立:支持对接各种现有的主流大语言模型(如 Llama3、OpenAI、通义千问等);

- 灵活编排:内置强大的工作流引擎,支持编排 AI 工作过程,满足各种复杂业务需求;

- 无缝嵌入:开箱即用,可快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力。

项目仅发布不到 5 个月,就在 GitHub 上斩获了超过 9,000 个 Star,项目的版本迭代、社区交互、issue 提交都非常活跃。

:icon_weibo: weibo.com/5722964389/Oux1JkeSB

分享 GitHub 上一份精心收集整理的系统设计面试资源列表:system-design。

旨在帮助大家通过系统设计面试,并提供很多知名科技公司的实战案例,如实时游戏排行榜、缓存一致性、实时协作、数据库迁移策略等。

GitHub: github.com/systemdesign42/syst

另外,还收集了有关系统设计的基础知识,以助大家学习。

:icon_weibo: weibo.com/5722964389/OuuQGiHAC

推荐 GitHub 上一个轻量级的 AI 证件照制作工具:HivisionIDPhoto。

实现了对多种用户拍照场景的识别、抠图与证件照生成,并提供不同尺寸规格的标准证件照。

GitHub: github.com/Zeyi-Lin/HivisionID

在线使用: 网页链接

感兴趣的,可先收藏以备应急使用。

:icon_weibo: weibo.com/5722964389/Outin1JV2

推荐 GitHub 上开源的一款全自动视频翻译的 AI 工具:VideoLingo。

能够一键全自动对视频进行字幕切割、翻译、精准对齐和个性化配音,最终生成 Netifx 级别的字幕和配音。

GitHub: github.com/Huanshere/VideoLing

具有如下特点:

- 使用 NLP 和 LLM 进行字幕分割;

- 智能术语知识库,实现上下文感知翻译;

- 三步翻译过程:直接翻译 - 反思 - 改进;

- 精确的单词级字幕对齐;

- 使用 GPT-SoVits 克隆音色并生成高质量的配音。

:icon_weibo: weibo.com/5722964389/Ouarniyk4

最近很火的 Cursor 代码编辑神器,不少朋友放弃 GitHub Copilot ,转投 Cursor。

在这里,给大家分享一份收集了各种开发语言最佳的 Cursor 配置提示词 cursor.directory。

涵盖 Python、Next.js、TypeScript、Swift、Node.js 等多种主流语言,旨在通过这些配置使 Cursor 提供更好的代码补全、错误修复等功能。

GitHub: github.com/pontusab/cursor.dir

在线访问: 网页链接

另外,项目还收集了 Cursor 从入门到实践的使用教程,助大家快速学习并使用它。

:icon_weibo: weibo.com/5722964389/Ou3LmbyQh

推荐 GitHub 上一款一站式自动化影视解说的 AI 视频剪辑工具:NarratoAI。

基于 LLM 实现文案撰写、自动化视频剪辑、配音和字幕生成的一站式流程,影视解说剪辑神器,高效内容创作。

GitHub: github.com/linyqh/NarratoAI

支持 Windows 10 或 MacOS 11.0 以上系统,显卡非必须。

:icon_weibo: weibo.com/5722964389/OtVxY92hM

GitHub 上开源的一款界面简洁且功能强大的跨平台 IPTV 播放器:IPTVnator。

允许通过文件系统或远程 URL 导入 IPTV 播放列表,具备自动更新播放列表、频道搜索、电视存档、分组频道列表、多种主题等功能。

支持外部播放器,如 mvp 和 VLC,并提供 HTML 视频播放器选项;支持包括中文在内的八种多语言。

GitHub: github.com/4gray/iptvnator

提供了 macOS、Windows 和 Linux 安装包,感兴趣的可以下载安装试试。

:icon_weibo: weibo.com/5722964389/Ot0KLqZ3w

分享一个开源免费且实用的浏览器插件: code-box。

可以用于目前主流的技术社区网站(如下图),实现无需登录一键复制代码、阅读全文、去除登录弹窗等功能。

GitHub: github.com/027xiguapi/code-box

作为一名技术开发者,该插件值得安装一试。

:icon_weibo: weibo.com/5722964389/OsYoDBw9t

一个基于 LLM 的 OCR 扫描 PDF 开源工具 LLM-Aided OCR。

旨在通过利用多模态大语言模型(LLM)将原始的 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。

GitHub: github.com/Dicklesworthstone/l

首先将 PDF 文件转图像,进行 OCR 扫描处理提取文本,再利用本地 LLM 或 API(如 OpenAI、Anthropic)纠正 OCR 错误,最后转换成高准确度、高质量的 Markdown 文本。

:icon_weibo: weibo.com/5722964389/OsRkgr9JW

分享一份精选机器学习系统的入门资料集合:awesomeMLSys。

收集了一系列有关注意力机制、性能优化、量化、长上下文长度和稀疏性等方面的论文、视频和代码库。

GitHub: github.com/cuda-mode/awesomeML

:icon_weibo: weibo.com/5722964389/OsOY94wud

推荐 GitHub 上一款开源免费的 PPT 制作工具: moffee。

能够将 Markdown 文档一键转换为干净、专业的幻灯片,提供 web 界面可实时预览效果。

GitHub: github.com/BMPixel/moffee

可让 ChatGPT/Claude 生成定义好的 Markdown 格式,然后再一键转 PPT。

:icon_weibo: weibo.com/5722964389/OsFxEhRIP

麻省理工出品的一本《决策算法》书籍,可免费下载阅读!

内容涵盖了概率推理、序列决策问题、模型/状态不确定性以及多 Agent 系统,并使用大量示例和练习帮助大家理解不同算法的直觉和应用场景。

在线阅读: 网页链接

通过学习这本书讲解的数学原理和概率算法,希望能帮助到你在学习、工作以及生活等复杂场景下做出科学的决策。

:icon_weibo: weibo.com/5722964389/OsEapfo3p

GitHub 上一份颇为全面的检索增强生成(RAG)技术的学习集合:RAG_Techniques。

涵盖了从基础到高级的 22 种 RAG 技术,并且为每项技术提供了详细的文档、实现指南和示例代码,帮助大家更好理解和应用它们。

GitHub: github.com/NirDiamant/RAG_Tech

包括上下文丰富技术、多方面过滤、融合检索、语义分块、知识图谱整合、多模态检索等等。

:icon_weibo: weibo.com/5722964389/OszElm1oI

前几天,百度正式开源了深度学习框架飞桨 3.0 版本,主要面向大模型,适配异构多芯,一体化支撑大模型的训练、推理。

新框架具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力,全面地提升了服务产业的能力。

为了帮助大家更好的掌握该技术,开发团队将在 7-10 月对外开放《飞桨框架 3.0 全面解析》教程,包括技术解析加代码实战。

带大家掌握核心框架、分布式计算、产业级大模型套件及低代码工具、前沿科学计算技术案例等多个方面的框架技术及大模型训推优化经验,实打实地帮助大家用飞桨 3.0 在实际开发工作中提效创新。

目前该教程已正式开放报名,感兴趣的同学,可以参与一下。

地址: https:// 网页链接

详细教程内容,可见附图1。

:icon_weibo: weibo.com/5722964389/Osytoqa0d

推荐一款开源且强大的视频多语言 AI 配音/翻译工具:Linly-Dubbing。

能够一键自动下载全平台视频,对视频字幕进行翻译,还能对原视频进行人声分离,克隆音色并重新配音,再对视频进行合成,全过程自动化。

GitHub: github.com/Kedreamix/Linly-Dub

具有如下特点:

- 多语言支持:支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。

- AI 智能语音识别:使用 WhisperX/FunASR 进行语音识别,提供精确的语音到文本转换和说话者识别。

- 大型语言模型翻译:使用大语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。

- AI 声音克隆:使用 GPT-SoVITS,对原视频配音进行克隆生成高度相似的语音,保持情感和语调的连贯性。

- 数字人对口型技术:通过对口型技术 Linly-Talker,使配音与视频画面高度契合,提升真实性和互动性。

- 自动下载视频:利用 yt-dlp 强大的开源命令行工具,一键自动下载几乎全平台视频。

:icon_weibo: weibo.com/5722964389/Osw79mpN5

分享 GitHub 上一份较全面的 ComfyUI 工作流合集 ComfyUI-Yolain-Workflows。

从基础到进阶再到落地应用,涵盖了图生图、细节修复、背景去除、重绘/扩图、人脸迁移、重绘光影、电商产品主图等工作流。

GitHub: https:// 网页链接

:icon_weibo: weibo.com/5722964389/Osp2NhomB

一份精心收集机器人领域相关的 3D 视觉论文合集 Awesome-Robotics-3D。

包括政策学习、预训练、VLM 和 LLM、数据集和基准等相关论文、代码和相关网站。

GitHub: github.com/zubair-irshad/Aweso

如果你是相关研究人员和实践者,该库值得一看希望对你有用。

:icon_weibo: weibo.com/5722964389/Oso3ThlVS

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。