AI一键截图做题、解释、翻译

一个方便的AI截图分析工具，可用来做B站转正答题，快速识别屏幕上看到的东西，然后让他帮你解释、答题、翻译。

Windows

网盘下载：( 百度网盘提取码 : xkzw )

百度网盘

夸克网盘

迅雷云盘

一个方便的AI截图分析工具，快速识别屏幕上看到的东西，然后让他帮你解释、答题、翻译。

电脑端，在线限时答题的克星，可用来做B站转正答题~

注意：老版本的默认OCR接口发现有每日使用次数限制（所有人共享），更新并重置配置文件后，即可使用v2.1最新内置的QwenAPI进行OCR和解释

AI截图分析 v2.1

一个方便的AI截图分析工具，快速使用AI解释你在屏幕上看到的东西，或让他帮你解题。

软件目前处于测试版，可能存在Bug，若有问题，欢迎前往 Github 提交 issue。

本软件使用 Trae + Claude 4 编写，然后由我和 Claude 4 共同进行用户体验优化。

功能特点

核心功能：截图后，将图片OCR为文字或直接提交给AI，并自动显示AI回复结果

可扩展性：使用提示词自定义功能，例如一键截图做题、解释、翻译等功能

开箱即用：内置原创 Qwen API 逆向，开箱即用

高度自由：可自行配置使用的AI接口、OCR接口、提示词

更新日志

v2.1

Qwen API 上传图片功能，可使用这个AI上传图片进行OCR

替换限制次数的云智OCR引擎为内置 Qwen API，使用“Qwen-2.5vl-32b-instruct”作为OCR引擎。

老版本用户如果想用这个AI，可以删除配置文件后重启软件，以自动生成新配置。

v2.0

移除可能导致问题的前端配置部分，请自行编辑config.toml文件以自定义配置

新增：内置原创 Qwen API 逆向，允许开箱即用

注意事项

只有多模态模型允许直接提交图片，目前常用的多模态模型为 Claude 3/4 系列，gpt-4o，Qwen-2.5vl。现在常见的Qwen3全系列、Deepseek系列、Kimi-K2都不是多模态模型，需要先OCR后再提交。如果你发现模型报错400，请检查此配置是否正确。

需要联网功能，请使用秘塔API，有赠送额度，且付费很便宜。

技术架构

语言：Python

GUI：PyQt6

截图：PIL

快捷键：pynput

AI引擎：Requests

推荐AI服务商

名称推荐理由链接地址

硅基流动模型齐全，稳定，价格合理 https://cloud.siliconflow.cn/models

魔搭社区 Qwen3全系列，每日2000次免费 https://www.modelscope.cn/my/myaccesstoken

秘塔AI 超强、超快联网搜索 https://metaso.cn/search-api/playground

V3 API 最全中转商，400+模型 https://api.gpt.ge/register?aff=TVyz

腾讯OCR配置步骤

腾讯云OCR每月有1000次OCR调用次数，如果对精度有要求，推荐使用此OCR

登录腾讯云：前往链接，登录控制台。https://console.cloud.tencent.com

开通OCR服务：前往链接，开通OCR服务。https://console.cloud.tencent.com/ocr/overview

获取密钥对：前往链接，获取 SecretID 和 SecretKey ，保存到本地。https://console.cloud.tencent.com/cam/capi

等待额度到账：回到开通服务界面，持续刷新，等待免费的1000额度到账，然后在软件中配置密钥对，开始使用OCR服务。

许可证

本项目仅供学习和个人使用，不得用于任何商业化用途。

图标来源iconfont，链接

更新日志

v1.0.0

初始版本发布

支持基本的截图、OCR和AI分析功能

完整的配置管理系统

多种通知方式

现代化的用户界面

计划添加的功能

多模型同时提问

免责声明

本站提供的所有信息、教程、软件版权归原公司所有，仅供日常学习和研究使用，不得用于任何商业用途，下载试用后请24小时内删除，因下载本站资源造成的损失，全部由使用者本人承担！如有侵权、不妥之处，请第一时间联系我们删除！
本站如果侵犯你的利益，携带权利证明请发送邮箱到 admin@pan.kim，我们会很快的为您处理。

AI一键截图做题、解释、翻译

请使用百度网盘APP 扫码获取

电脑版：( 提取码 : xkzw )

请使用夸克APP 扫码获取

电脑版：

请使用迅雷APP 扫码获取

电脑版：

免责声明

相关资源