我们提供了两种方式供您体验:
通过 Google AI Studio 托管,直接使用,无需任何配置。
如果您有自己的 Google Gemini API Key,可以使用此部署版本。
InsightPDF 不仅仅是一个聊天机器人,它是一个视觉化的阅读助手:
- 🎯 视觉定位 (Visual Grounding) AI 不仅回答问题,还会自动跳转到 PDF 对应页面,并用红框高亮显示答案来源(支持文本段落、图表、数据表格)。
- 🧠 多模态智能 基于 Gemini 2.0 Flash / Pro 原生多模态能力,无需传统 OCR,直接理解文档的视觉结构。
- ⚡️ 极速响应 支持流式传输,大文件通过 Files API 优化处理,秒级响应。
- 🎨 优雅体验
- 深色模式:自动适配系统或手动切换。
- 拖拽上传:支持桌面端全屏拖拽。
- 移动端适配:手机上也能流畅阅读和对话。
- 🛡️ 隐私优先 聊天记录和设置均存储在浏览器本地(LocalStorage/IndexedDB),只需配置 Key,无需担心数据泄露。
- 前端框架: React 19 + Vite
- 语言: TypeScript
- 样式: Tailwind CSS
- PDF 渲染: React-PDF
- AI 模型: Google Gemini API (
gemini-2.0-flash,gemini-1.5-pro)
如果你想在本地运行该项目:
-
克隆仓库
git clone https://github.com/yeahhe365/InsightPDF.git cd InsightPDF -
安装依赖
npm install
-
配置环境 在项目根目录创建
.env.local文件,填入你的 API Key:GEMINI_API_KEY=your_api_key_here
(或者启动后在网页设置面板中输入)
-
启动服务
npm run dev
访问
http://localhost:3000即可使用。
MIT License © 2024 yeahhe365