最近刷 GitHub刷到几个眼熟的开源项目
1.PageLM
它本质就是一个 NotebookLM 的开源平替,但我反而觉得它比官方版本更对开发者胃口。你把一堆资料、文档、课程丢进去,它不只是帮你总结,而是能反向生成学习内容:测验、Flashcards、甚至类似播客对那种形式。
NotebookLM 火就火在“把死资料变成活的学习过程”,PageLM 把这个思路完整抄过来,而且能私有部署。这一点对我来说加分非常大——不被平台锁数据,也方便按自己需求魔改,尤其适合做知识库、学习工具或者企业内训系统。
2.Awesome Web Agents
http://Steel.dev 自己就是做 AI 浏览器 / Web Agent 基础设施的,他们把自己踩过的坑、看过的工具、靠谱的论文,全都整理成了一个清单。
从底层的 Puppeteer、Playwright,到上层 Agent 框架,再到学术界的新进展,基本把 Web Agent 这个方向的家底翻了一遍。
这种列表最大的价值不是“新”,而是帮你避免浪费时间。现在 Agent 领域更新太快,很容易被噪音带着跑,有一个行业内玩家帮你筛过一轮,直接 Star 就完事了。
3.PDFCraft
这是一个完全本地运行的 PDF 工具箱,所有操作都在浏览器里完成,文件不出本地,对隐私极其友好。
功能也不是做做样子那种,而是实打实的 90+ 工具:合并、拆分、OCR、格式转换、水印、元数据编辑,甚至还能拖拽节点搞工作流。
我特别喜欢它的一点是:它不是“给你用一下就走”的在线工具,而是可以部署成你自己的 PDF 服务。
支持 Docker、支持静态导出,丢到 Vercel / Netlify 就能跑。对不想装巨型桌面软件、又不信任在线 PDF 网站的人来说,这种方案真的很香。
@https1024
1.PageLM
它本质就是一个 NotebookLM 的开源平替,但我反而觉得它比官方版本更对开发者胃口。你把一堆资料、文档、课程丢进去,它不只是帮你总结,而是能反向生成学习内容:测验、Flashcards、甚至类似播客对那种形式。
NotebookLM 火就火在“把死资料变成活的学习过程”,PageLM 把这个思路完整抄过来,而且能私有部署。这一点对我来说加分非常大——不被平台锁数据,也方便按自己需求魔改,尤其适合做知识库、学习工具或者企业内训系统。
2.Awesome Web Agents
http://Steel.dev 自己就是做 AI 浏览器 / Web Agent 基础设施的,他们把自己踩过的坑、看过的工具、靠谱的论文,全都整理成了一个清单。
从底层的 Puppeteer、Playwright,到上层 Agent 框架,再到学术界的新进展,基本把 Web Agent 这个方向的家底翻了一遍。
这种列表最大的价值不是“新”,而是帮你避免浪费时间。现在 Agent 领域更新太快,很容易被噪音带着跑,有一个行业内玩家帮你筛过一轮,直接 Star 就完事了。
3.PDFCraft
这是一个完全本地运行的 PDF 工具箱,所有操作都在浏览器里完成,文件不出本地,对隐私极其友好。
功能也不是做做样子那种,而是实打实的 90+ 工具:合并、拆分、OCR、格式转换、水印、元数据编辑,甚至还能拖拽节点搞工作流。
我特别喜欢它的一点是:它不是“给你用一下就走”的在线工具,而是可以部署成你自己的 PDF 服务。
支持 Docker、支持静态导出,丢到 Vercel / Netlify 就能跑。对不想装巨型桌面软件、又不信任在线 PDF 网站的人来说,这种方案真的很香。
@https1024