AI公式扫描器是一款桌面端 AI 公式识别、分析与管理工具
亮点与场景
解决痛点:公式图片难以快速准确转 LaTeX;识别后缺少校验与结构化整理;变量含义查询繁琐。
主要技术:Tauri + Rust(截图/系统集成);SvelteKit + TypeScript(前端)。
核心功能:三阶段识别:LaTeX 提取 → 智能分析(标题/摘要/变量/术语/建议)→ 核查与置信度。
适用场景:
科研写作与论文公式录入
教材与讲义排版
课堂/会议拍照后快速转录
学习笔记整理
技术博客与知识库维护
软件原理
三阶段识别流水线
应用程序使用 3 次 LLM 调用进行全面分析:
LaTeX 提取:仅从图片提取 LaTeX 文本
智能分析:与第一次并发。基于图片生成标题、简介、变量表、术语表与建议
核查与置信度:在第一次调用返回LaTeX后开始。对比"提取到的 LaTeX + 原图",产出状态(ok/warning/error)、问题列表、覆盖率与 0–100 的置信度
处理策略
并发执行:第1次(LaTeX)与第2次(分析)会并发触发
顺序核查:第3次(核查)在拿到 LaTeX 后开启
实时反馈:识别过程以阶段指示的方式推送到界面,失败可单独重试对应阶段
本地留存:识别记录(含原图路径、LaTeX、分析结果与置信度)保存到本机,支持搜索、排序、收藏与详情抽屉查看
模型调用:识别依赖联网的 LLM 服务(如 Gemini)。首次使用需在"设置"里填入可用的 API Key 并通过"测试"验证连接
注意事项
模型推荐
注意:目前只支持 Google Gemini API。
建议的模型选择与典型耗时(参考值,取决于网络与图片复杂度):
Gemini-2.5-flash:综合准确率与速度较优。常见公式约 10s 左右,复杂场景(含核查)整体体验约 20s
Gemini-2.5-flash-lite:更快更省,但在复杂公式上准确性略逊,可作轻量场景的备选
使用流程
1. 初次设置
打开应用 → 进入"设置"页
填写 API Key,点击"测试"确保连通
可按需调整:语言(中/英)、截图快捷键、公式渲染引擎(MathJax/KaTeX)与默认 LaTeX 包裹格式
2. 开始识别(任选其一)
截图识别:点击"截图识别"或使用快捷键 Ctrl + Shift + A 拉框,松开即可开始处理
导入图片:点击"导入图片",选择待识别的 PNG/JPG/JPEG 文件
3. 查看与编辑
进度指示:依次显示 LaTeX → 分析 → 核查(可对任一阶段"重试")
基础页:预览公式、复制或编辑 LaTeX、展开原图对照
分析页:查看摘要、变量(含符号/单位)、术语、建议,以及核查报告与置信度
4. 历史与收藏
识别结果会自动入库
在"历史记录/收藏夹"中可搜索、排序、查看详情(抽屉式),支持收藏与删除
AI Formula Scanner v0.1.0 | 8/11/2025 Latest
亮点
三阶段识别(共 3 次 LLM 调用)
提取 LaTeX:从图片中提取核心 LaTeX 代码。
分析内容:基于图片生成标题、简介、变量、术语和建议(与第1次并发执行)。
核查校对:核查 LaTeX 与原图的匹配度,并计算置信度(在第1次完成后启动)。
交互功能:
实时阶段指示与分阶段重试功能。
LaTeX 预览与一键复制。
公式标题可编辑。
管理与查阅:
提供历史记录与收藏夹。
支持搜索与排序。
详情抽屉可进行原图对照。
高度可定制:
设置项:中/英语言切换、MathJax/KaTeX 渲染引擎、默认 LaTeX 包裹格式、全局截图快捷键(默认 Ctrl+Shift+A)。
提示词管理:支持 LaTeX/分析/核查三类提示词的自定义与一键恢复默认。
使用须知
API Key:首次使用需在“设置”中填入可用的 LLM API Key(推荐 Gemini 系列),并点击“测试”确保连通性。
模型建议与耗时参考:
Gemini-2.5-flash:常见公式约 10 秒;开启核查后,整体约 20 秒。
Gemini-2.5-flash-lite:更快更省,但处理复杂场景的准确性可能略逊一筹。
已知问题
当历史记录达到数百条时,页面加载与滚动性能会下降。
当前版本会在“核查(beta)”返回后,才一并展示“分析”结果。
快速上手
下载安装包并运行程序。
打开“设置”,填入您的 API Key,然后点击“测试”按钮。
使用“截图识别”或“导入图片”开始您的第一次识别(默认快捷键:Ctrl+Shift+A)。
在“基础/分析”页面查看与编辑结果,必要时可以对单个识别阶段进行重试。