2 articles
大多数 PDF 转 EPUB 工具会悄悄丢失脚注和尾注。我们构建了一套 6 阶段流水线,实现注释的自动检测、分类、提取和关联,匹配准确率超过 90%——本文是完整的技术拆解。
传统OCR有骨架无灵魂,多模态大模型有灵魂无骨架。我们如何将两者深度融合,打造出阅读级准确率的PDF转EPUB引擎?本文详解混合识别架构的设计与工程实践。