Changelog
本文档记录了 NotebookLM2PPT 的所有版本更新历史。
[v0.6.2] - 2026-01-23
🎨 图像修复方法增强与功能优化
本次更新专注于图像修复功能的深度增强和整体用户体验的优化,提供更专业的修复方法和更灵活的使用模式。
核心优化
6 种专业图像修复方法 重构图像修复模块,提供多种修复算法选择:
- 智能平滑(推荐) - 综合效果最佳,适合大多数去除文字、水印的场景
- 边缘均值填充 - 取周围像素平均色填充,适合纯色或简单背景
- 极速纯色填充 - 直接填充单一背景色,仅适合极简底色,速度最快
- 逐层内缩修补 - 由外向内逐层修补,适合细长划痕或线条修复
- 渐变过渡插值 - 计算平滑的曲面过渡,适合带有渐变的背景
- 双调和光影修补 - 计算量大,速度较慢,但能更好保持光影连续性
功能增强
🖼️ 仅图片模式:新增仅图片模式选项,允许用户跳过智能圈选功能
- 直接将去水印后的 PNG 图片插入 PPT
- 生成速度更快,但 PPT 内容不可编辑
- 添加确认对话框,确保用户了解模式特点
📖 修复方法说明窗口:添加详细的图像修复方法说明对话框,帮助用户了解各种方法的特点和适用场景
GUI 布局优化
- 重构图像修复模块的界面布局,提供更直观的方法选择体验
- 所有窗口(主窗口、对话框)默认居中显示,改进用户体验
- 使用英文标识保存修复方法配置,提高兼容性
[v0.6.1] - 2026-01-23
🖼️ 仅图片模式
- 添加新的仅图片模式选项,允许用户跳过智能圈选功能
- 直接将去水印后的 PNG 图片插入 PPT
- 此模式生成速度更快但内容不可编辑
- 添加相关确认对话框和逻辑处理
[v0.6.0] - 2026-01-23
💎 版本核心:迈向极致轻量化
在 v0.6.0 中,我们完成了项目自发布以来最彻底的一次底层重构。通过完全移除 OpenCV 和 Scikit-learn 两大重型依赖,不仅解决了由于二进制包过大导致的启动缓慢问题,更将编译后的程序体积压缩到了极致。
🚀 性能与架构优化
1. 依赖库全量"瘦身"
- 移除 Scikit-learn:将原有的 DBSCAN 边缘多样性检测替换为高性能的 Numpy 原生实现
- 移除 OpenCV:全屏图像显示引擎全面迁移至 Tkinter
- 体积效益:编译后的 .exe 或二进制文件大小大大减小,冷启动速度与内存占用大幅优化
2. 核心算法升级
- 图像修复 2.0:采用全新的 Numpy 向量化逻辑替代聚类算法,在保持精度的同时,显著提升了处理大尺寸图片的效率
- 边缘多样性检测:新增边缘多样性计算工具,专门优化了幻灯片中纯色背景区域的填充效果,过渡更自然
🆕 新增功能与改进
交互逻辑
- 新增"一键强行停止"功能
- 为图片查看器添加 ESC 键全局支持
- 无论是在截图、处理还是转换流程中,均可通过 ESC 键或外部信号即时中断任务
PPT 精炼处理增强
- 优化了对 PPT 文本块与图片块的识别与填充逻辑
- 修复了"双层图片"问题,确保每个元素块在幻灯片中仅生成唯一且正确的层级
GUI 体验调整
- 调整了默认窗口尺寸,使其在各种分辨率的显示器上都能获得最佳的视觉比例
🛠️ 内部维护
- 构建系统更新:同步更新了 pyinstaller 编译指令,移除了不必要的 Hook 和打包路径
- 健壮性提升:新增了边缘多样性检测的专项测试用例,确保算法在各种复杂背景下的稳定性
[v0.5.5] - 2026-01-23
🎯 PPT 文本块处理优化
- 在 PPT 精炼处理中增加对图片块的处理
- 确保所有文本块和图片块都能被正确填充
- 修复"双层图片"问题,现在不会出现双层图片
[v0.5.4] - 2026-01-23
📂 文件对话框记忆功能
- 在文件选择区域添加"打开"按钮,用于快速访问输出目录
- 改进页码范围处理,支持中文标点符号并自动生成带页码的文件名
- 优化 PPT 输出文件名格式,包含页码范围信息
- 添加对上次打开文件目录的记忆功能,提升用户体验
[v0.5.3] - 2026-01-19
📦 依赖补充
- 添加 scikit-learn 到项目依赖中
- 更新 pyproject.toml 中的版本号至 0.5.3
- 取消 build.cmd 中 twine 上传命令的注释
[v0.5.2] - 2026-01-17
🎨 MinerU 优化效果改进
- 使用 DBSCAN 聚类算法替代标准差计算边缘多样性,提高准确性
- 移除不再使用的四点颜色差异计算函数
- 调整文本块背景处理逻辑,基于聚类结果决定是否填充纯色
[v0.5.1] - 2026-01-14
🐛 修复程序崩溃问题
- 处理幻灯片无背景图时的情况
- 添加对无背景图情况的处理,避免程序崩溃
- 当幻灯片无背景图时,跳过背景替换逻辑中的相关操作
[v0.5.0] - 2026-01-14
🆕 基于 MinerU 的 PPT 后处理优化(重大实验性更新)
新增基于 MinerU 的 PPT 后处理优化功能,包括智能文本框筛选、字体统一、高质量图片替换和智能背景处理。
核心功能
- ✨ 智能文本框筛选:基于 IOU 算法自动识别并保留相关文本框,删除冗余文本框
- 🎨 字体统一处理:自动将所有文本框字体统一为"微软雅黑"
- 🖼️ 高质量图片替换:从 MinerU JSON 提取原始高清图片,替换截图图片
- 🎭 智能背景处理:根据内容特征智能处理背景,实现最佳视觉效果
GUI 更新
- 更新 GUI 以支持 MinerU JSON 文件输入
- 添加启动欢迎对话框,显示软件信息和 GitHub 链接,并提供不再显示的选项
文档完善
- 添加相关文档说明
- 新增 compare.png 和 compare2.png 作为示例对比图
- 重构代码结构,将 ppt_combiner.py 移至 utils 目录
- 更新 README 详细说明 MinerU 优化功能的使用方法和优势
- 添加 mineru-technical-details.md 文档详细解释技术实现细节
[v0.4.0] - 2026-01-13
🖥️ 图形用户界面 (GUI) 支持
- 重新设计 GUI 布局,增加配置保存和加载功能
- 移除 CLI 模式,专注 GUI 体验
- 优化按钮偏移校准逻辑,自动保存配置
- 增强日志输出和用户提示信息
- 更新 README 文档,移除过时内容
- 增加版本号到 0.4.0
功能增强
- 添加页范围选择功能
- 改进按钮偏移校准流程
- 在 GUI 界面添加页范围输入和偏移校准选项
[v0.3.0] - 2025-12-31
⚙️ 电脑管家版本和完成按钮偏移功能
- 添加电脑管家版本检测功能
- 新增完成按钮偏移功能,提高自动化准确性
- 更新编译命令和版本号至 0.3.0
[v0.2.0] - 2025-12-22
🖱️ 图形用户界面 (GUI) 支持
- 添加图形用户界面 (GUI) 支持
- 允许用户通过拖拽选择 PDF 文件并设置转换参数
- 修复截图自动化中的按钮位置计算
- 更新 README.md,增加安装和使用指南
- 添加编译指南文档
- 更新依赖项,确保在 Windows 平台上支持拖拽功能
- 修正构建命令中的文件上传格式
[v0.1.0] - 2025-12-22
🎉 初始版本
实现 PDF 到 PPT 转换工具的基础功能:
- 添加 PDF 文件转换为 PNG 图像并处理成 PowerPoint 演示文稿的核心功能
- 集成图像查看器,支持全屏显示图像
- 使用 Microsoft 智能圈选工具实现截图自动化
- 添加图像修复功能,用于去除图像中的水印
- 创建实用工具函数,用于处理图像查看、修复和截图自动化
- 开发 PPT 合并工具,在保留原始设计的同时合并生成的 PPT 文件
- 更新 requirements.txt,包含项目所需的依赖项
- 添加模块文档和版本控制,以提高可维护性
版本说明
本文档遵循 Keep a Changelog 格式, 版本号遵循 语义化版本 规范。
