Beta v1.0

AI Formula Scanner AI 公式扫描器

AI公式扫描器是一款桌面端 AI 公式识别、分析与管理工具,解决痛点:公式图片难以快速准确转 LaTeX;识别后缺少校验与结构化整理;变量含义查询繁琐。
Windows
网盘下载:

AI公式扫描器是一款桌面端 AI 公式识别、分析与管理工具

亮点与场景

解决痛点:公式图片难以快速准确转 LaTeX;识别后缺少校验与结构化整理;变量含义查询繁琐。

主要技术:Tauri + Rust(截图/系统集成);SvelteKit + TypeScript(前端)。

核心功能:三阶段识别:LaTeX 提取 → 智能分析(标题/摘要/变量/术语/建议)→ 核查与置信度。

适用场景:

科研写作与论文公式录入

教材与讲义排版

课堂/会议拍照后快速转录

学习笔记整理

技术博客与知识库维护

软件原理

三阶段识别流水线

应用程序使用 3 次 LLM 调用进行全面分析:

LaTeX 提取:仅从图片提取 LaTeX 文本

智能分析:与第一次并发。基于图片生成标题、简介、变量表、术语表与建议

核查与置信度:在第一次调用返回LaTeX后开始。对比"提取到的 LaTeX + 原图",产出状态(ok/warning/error)、问题列表、覆盖率与 0–100 的置信度

处理策略

并发执行:第1次(LaTeX)与第2次(分析)会并发触发

顺序核查:第3次(核查)在拿到 LaTeX 后开启

实时反馈:识别过程以阶段指示的方式推送到界面,失败可单独重试对应阶段

本地留存:识别记录(含原图路径、LaTeX、分析结果与置信度)保存到本机,支持搜索、排序、收藏与详情抽屉查看

模型调用:识别依赖联网的 LLM 服务(如 Gemini)。首次使用需在"设置"里填入可用的 API Key 并通过"测试"验证连接

注意事项

模型推荐

注意:目前只支持 Google Gemini API。

建议的模型选择与典型耗时(参考值,取决于网络与图片复杂度):

Gemini-2.5-flash:综合准确率与速度较优。常见公式约 10s 左右,复杂场景(含核查)整体体验约 20s

Gemini-2.5-flash-lite:更快更省,但在复杂公式上准确性略逊,可作轻量场景的备选

使用流程

1. 初次设置

打开应用 → 进入"设置"页

填写 API Key,点击"测试"确保连通

可按需调整:语言(中/英)、截图快捷键、公式渲染引擎(MathJax/KaTeX)与默认 LaTeX 包裹格式

2. 开始识别(任选其一)

截图识别:点击"截图识别"或使用快捷键 Ctrl + Shift + A 拉框,松开即可开始处理

导入图片:点击"导入图片",选择待识别的 PNG/JPG/JPEG 文件

3. 查看与编辑

进度指示:依次显示 LaTeX → 分析 → 核查(可对任一阶段"重试")

基础页:预览公式、复制或编辑 LaTeX、展开原图对照

分析页:查看摘要、变量(含符号/单位)、术语、建议,以及核查报告与置信度

4. 历史与收藏

识别结果会自动入库

在"历史记录/收藏夹"中可搜索、排序、查看详情(抽屉式),支持收藏与删除

AI Formula Scanner v0.1.0 | 8/11/2025 Latest

亮点

三阶段识别(共 3 次 LLM 调用)

提取 LaTeX:从图片中提取核心 LaTeX 代码。

分析内容:基于图片生成标题、简介、变量、术语和建议(与第1次并发执行)。

核查校对:核查 LaTeX 与原图的匹配度,并计算置信度(在第1次完成后启动)。

交互功能:

实时阶段指示与分阶段重试功能。

LaTeX 预览与一键复制。

公式标题可编辑。

管理与查阅:

提供历史记录与收藏夹。

支持搜索与排序。

详情抽屉可进行原图对照。

高度可定制:

设置项:中/英语言切换、MathJax/KaTeX 渲染引擎、默认 LaTeX 包裹格式、全局截图快捷键(默认 Ctrl+Shift+A)。

提示词管理:支持 LaTeX/分析/核查三类提示词的自定义与一键恢复默认。

使用须知

API Key:首次使用需在“设置”中填入可用的 LLM API Key(推荐 Gemini 系列),并点击“测试”确保连通性。

模型建议与耗时参考:

Gemini-2.5-flash:常见公式约 10 秒;开启核查后,整体约 20 秒。

Gemini-2.5-flash-lite:更快更省,但处理复杂场景的准确性可能略逊一筹。

已知问题

当历史记录达到数百条时,页面加载与滚动性能会下降。

当前版本会在“核查(beta)”返回后,才一并展示“分析”结果。

快速上手

下载安装包并运行程序。

打开“设置”,填入您的 API Key,然后点击“测试”按钮。

使用“截图识别”或“导入图片”开始您的第一次识别(默认快捷键:Ctrl+Shift+A)。

在“基础/分析”页面查看与编辑结果,必要时可以对单个识别阶段进行重试。

免责声明
本站提供的所有信息、教程、软件版权归原公司所有,仅供日常学习和研究使用,不得用于任何商业用途,下载试用后请24小时内删除,因下载本站资源造成的损失,全部由使用者本人承担!如有侵权、不妥之处,请第一时间联系我们删除!