推荐 GitHub 上一款强大且可离线使用的 OCR 工具:Ollama OCR。
通过搭配 Ollama 在本地使用,支持多种视觉模型,包括 LLaVA 7B、Llama 3.2 Vision 等。
GitHub: https://github.com/imanoop7/Ollama-OCR
支持多种文件格式输出,如 Markdown、纯文本、JSON 等,同时支持并行处理多个图像。
#AI创造营
https://weibo.com/5722964389/P93Ujya6m
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。