百度技术团队在 GitHub 开源的一套丰富且实用的 OCR 工具库:PaddleOCR,可帮助开发者快速集成 OCR 功能。
近期该项目发布了功能更新,主要如下:
- 优化了超轻量 OCR 系统 PP-OCR 效果;
- 新增表格文字、不规则文字等复杂 OCR 任务的标注工具;
- 打通 22 种 OCR 不同训练部署软硬件环境与方式;
- 发布首本交互式 OCR 全栈电子书《动手学 OCR》。
GitHub: https://github.com/PaddlePaddle/PaddleOCR
针对此项目,开发者将开放 3 场公开课,主讲 OCR 技术解析、AI 模型训练部署实践、OCR 技术产业应用案例、落地方案分享等内容。
直播时间:5.11 - 5.13,每晚 20:30
报名地址: https:// 网页链接
Modren,一个开源的 Linux 应用商店。安装成功后,便可通过该商店下载、安装各类 Linux 应用。
支持 APT、Snap、Flatpaks、DEB 等多种格式的安装包,可用于 Ubuntu、Debian 衍生发行版等系统。
GitHub 上一个开源的绘图画布应用:PointLess,开发者可以基于该项目,制作出一些绘画、白板、笔记等应用。
Windmill.dev,一个开源的 OSS 开发者平台。通过编写少量 Python 和 Typescript 脚本,便可快速构建出生产级、多步骤的自动化应用。
PyScript,简单添加几行代码,便能在 HTML 中内嵌 Python 代码,并在浏览器上运行。
Byzer,一门面向 Data 和 AI 的低代码、云原生的开源编程语言。
易于使用,拥有类 SQL 的语法。单一底层引擎支持分布式操作海量数据,玩转数据于弹指之间。
GitHub: https://github.com/byzer-org/byzer-lang
引擎支持 K8s 等云上部署,充分利用云上算力和存储。同时也支持 Yarn 等部署模式。
GitHub 上一个可帮助国内用户写作的托盘助手:BlogHelper。
支持将本地文章一键发布到主流博客平台,剪贴板图片一键上传至图床(新浪、GitHub、图壳、腾讯云、阿里云、又拍云、七牛云)。
GitHub 上一款开源的低代码工具:Obsei,基于 AI 驱动,可应用于各种开发及业务场景。
通过这个工具,可实现社交平台舆论监控、客户投诉预警、自动生成工单、市场调查分析、为 AI 任务生成数据集等功能。
GitHub: https://github.com/obsei/obsei
推荐 GitHub 上一个易用友好的云监控系统:HertzBeat。无需 Agent,拥有强大自定义的监控能力。
支持网站监测,PING 连通性,端口可用性,数据库,操作系统,API 监控,阈值告警,告警通知等功能。
BallCat,GitHub 上一个支持快速开发的后端脚手架,可快速搭建企业级后台管理系统,并提供多种便捷 starter 进行功能扩展。
主要包括前后台用户分离、菜单权限、数据权限、定时任务、访问日志、操作日志、异常日志、统一异常处理、XSS 过滤、SQL 防注入、国际化等多种功能。
GitHub Education 开放了 2022 届的「GitHub 毕业年鉴」仓库。
通过向该仓库发送 Pull Request,待审核通过后,管理员便会将你的请求合并到 2022 届的 GitHub 毕业班级中。
5 月 27 号前,成功合并到该仓库的前 7500 个 Pull Request,将会收到一封来自 GitHub 官方邮件,里面包含 GitHub 定制礼品卡、贴纸、信件等诸多礼品。
GitHub: https://github.com/education/GitHubGraduation-2022
如果你满足以下条件,则可以申请参与本次活动:
- 已通过 GitHub Student Developer Pack 认证为学生;
- 没有参与过往年的 GitHub 毕业活动;
- 属于 2022 年的毕业生。
SVG Silh,一个基于 CC0 协议开放的 SVG 素材网站,上面收录了诸多 SVG 图像与图标,所有素材均可免费商用。
地址: https:// 网页链接
StreamX,一个神奇的开源框架,让流处理更简单。
该框架规范了项目配置,鼓励函数式编程,定义了最佳的编程方式,提供了一系列开箱即用的 Connectors。
GitHub: https://github.com/streamxhub/streamx
标准化了配置、开发、测试、部署、监控、运维的整个过程,提供了 Scala/Java 两套 API,最终目的是打造一个一站式大数据平台,流批一体,湖仓一体的解决方案。
Actual,一个在 GitHub 开源的金融系统,强调「本地优先」原则,可用于管理个人财务,注重安全性和私密性。
拥有交易管理、预算跟踪、财务报告生成、交易拆分、跨设备同步、数据导入与迁移、端到端加密等功能。
GitHub: https://github.com/actualbudget/actual
该工具适用于 macOS、Windows、Linux、iOS、Android 等主流操作系统。
字节跳动工程师在 GitHub 上整理的 NLP 论文列表(附阅读笔记),收录了一些比较经典或思路新奇的论文。
其中包含 NLP 领域下的对话语音领域,复现模型以及数据处理等(代码含 TensorFlow 和 PyTorch 两版本)。
GitHub 上开源的 Python 调试工具:GDB dashboard,为 Python GDB 提供了可视化界面,更清晰的显示了程序调试信息,使开发者能专注于 Python 控制流。
国外有位开发者基于 GPT-3 做了一款 AI 搜索引擎:Goopt,通过该搜索引擎检索到的所有内容,全部都是由 AI 和算法合成的。
GitHub: https://github.com/jokenox/Goopt
你可以在上面搜索任意术语,以获取相关结果与内容。通过这种方式,进一步模拟网页浏览体验。
推荐一个实用的 JSON 工具:JSON Hero,提供了简洁直观的 UI 界面,让查阅和理解 JSON 数据变得更为轻松便捷。
开发者借助这一工具,能以列表视图、树状视图、编辑器视图等多种方式来查看 JSON 文件,并自动识别数据内容,展示数据预览。
GitHub: https://github.com/jsonhero-io/jsonhero-web
此外,工具还内置了 JSON 验证、内容搜索、生成可分享的 URL 路径等功能。
GitHub 上一个开源的个人博客系统:Bolo Solo,简单易部署,自带精致主题、数据统计表、邮件提醒、自定义图床、功能丰富的 Markdown 编辑器,专为程序员设计。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报