<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>MinerU on 酒中仙</title><link>https://hanguangwu.github.io/blog/tags/mineru/</link><description>Recent content in MinerU on 酒中仙</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><copyright>hanguangwu</copyright><lastBuildDate>Fri, 26 Dec 2025 16:34:25 -0800</lastBuildDate><atom:link href="https://hanguangwu.github.io/blog/tags/mineru/index.xml" rel="self" type="application/rss+xml"/><item><title>PDF文档格式转换处理工具MinerU</title><link>https://hanguangwu.github.io/blog/p/pdf%E6%96%87%E6%A1%A3%E6%A0%BC%E5%BC%8F%E8%BD%AC%E6%8D%A2%E5%A4%84%E7%90%86%E5%B7%A5%E5%85%B7mineru/</link><pubDate>Fri, 26 Dec 2025 16:34:25 -0800</pubDate><guid>https://hanguangwu.github.io/blog/p/pdf%E6%96%87%E6%A1%A3%E6%A0%BC%E5%BC%8F%E8%BD%AC%E6%8D%A2%E5%A4%84%E7%90%86%E5%B7%A5%E5%85%B7mineru/</guid><description>&lt;h1 id="pdf文档格式转换处理工具mineru"&gt;PDF文档格式转换处理工具MinerU
&lt;/h1&gt;&lt;h2 id="前言"&gt;前言
&lt;/h2&gt;&lt;p align="center"&gt;
🚀&lt;a href="https://mineru.net/?source=github"&gt;MinerU 官网入口→✅ 免装在线版 ✅ 全功能客户端 ✅ 开发者API在线调用，省去部署麻烦，多种产品形态一键get，速冲！&lt;/a&gt;
&lt;/p&gt;
&lt;p&gt;&lt;a class="link" href="https://github.com/opendatalab/MinerU" target="_blank" rel="noopener"
&gt;GitHub-Repo-MinerU&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;本项目值得学习一下，特别是文档格式处理功能的实现。未选择的路~&lt;/p&gt;
&lt;h2 id="项目简介"&gt;项目简介
&lt;/h2&gt;&lt;p&gt;MinerU是一款将PDF转化为机器可读格式的工具（如markdown、json），可以很方便地抽取为任意格式。&lt;/p&gt;
&lt;p&gt;MinerU诞生于&lt;a class="link" href="https://github.com/InternLM/InternLM" target="_blank" rel="noopener"
&gt;书生-浦语&lt;/a&gt;的预训练过程中，我们将会集中精力解决科技文献中的符号转化问题，希望在大模型时代为科技发展做出贡献。&lt;/p&gt;
&lt;h2 id="主要功能"&gt;主要功能
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;删除页眉、页脚、脚注、页码等元素，确保语义连贯&lt;/li&gt;
&lt;li&gt;输出符合人类阅读顺序的文本，适用于单栏、多栏及复杂排版&lt;/li&gt;
&lt;li&gt;保留原文档的结构，包括标题、段落、列表等&lt;/li&gt;
&lt;li&gt;提取图像、图片描述、表格、表格标题及脚注&lt;/li&gt;
&lt;li&gt;自动识别并转换文档中的公式为LaTeX格式&lt;/li&gt;
&lt;li&gt;自动识别并转换文档中的表格为HTML格式&lt;/li&gt;
&lt;li&gt;自动检测扫描版PDF和乱码PDF，并启用OCR功能&lt;/li&gt;
&lt;li&gt;OCR支持109种语言的检测与识别&lt;/li&gt;
&lt;li&gt;支持多种输出格式，如多模态与NLP的Markdown、按阅读顺序排序的JSON、含有丰富信息的中间格式等&lt;/li&gt;
&lt;li&gt;支持多种可视化结果，包括layout可视化、span可视化等，便于高效确认输出效果与质检&lt;/li&gt;
&lt;li&gt;支持纯CPU环境运行，并支持 GPU(CUDA)/NPU(CANN)/MPS 加速&lt;/li&gt;
&lt;li&gt;兼容Windows、Linux和Mac平台&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="快速开始"&gt;快速开始
&lt;/h2&gt;&lt;p&gt;如果安装或使用中遇到任何问题，请先查询 &lt;a href="##faq"&gt;FAQ&lt;/a&gt; &lt;/br&gt;
如果遇到解析效果不及预期，参考 &lt;a href="##known-issues"&gt;Known Issues&lt;/a&gt;&lt;/br&gt;&lt;/p&gt;
&lt;h3 id="在线体验"&gt;在线体验
&lt;/h3&gt;&lt;h4 id="官网在线应用"&gt;官网在线应用
&lt;/h4&gt;&lt;p&gt;官网在线版功能与客户端一致，界面美观，功能丰富，需要登录使用&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://mineru.net/OpenSourceTools/Extractor?source=github" target="_blank" rel="noopener"
&gt;&lt;img src="https://img.shields.io/badge/webapp_on_mineru.net-blue?logo=data:image/svg&amp;#43;xml;base64,PHN2ZyB3aWR0aD0iMTM0IiBoZWlnaHQ9IjEzNCIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj48cGF0aCBkPSJtMTIyLDljMCw1LTQsOS05LDlzLTktNC05LTksNC05LDktOSw5LDQsOSw5eiIgZmlsbD0idXJsKCNhKSIvPjxwYXRoIGQ9Im0xMjIsOWMwLDUtNCw5LTksOXMtOS00LTktOSw0LTksOS05LDksNCw5LDl6IiBmaWxsPSIjMDEwMTAxIi8&amp;#43;PHBhdGggZD0ibTkxLDE4YzAsNS00LDktOSw5cy05LTQtOS05LDQtOSw5LTksOSw0LDksOXoiIGZpbGw9InVybCgjYikiLz48cGF0aCBkPSJtOTEsMThjMCw1LTQsOS05LDlzLTktNC05LTksNC05LDktOSw5LDQsOSw5eiIgZmlsbD0iIzAxMDEwMSIvPjxwYXRoIGZpbGwtcnVsZT0iZXZlbm9kZCIgY2xpcC1ydWxlPSJldmVub2RkIiBkPSJtMzksNjJjMCwxNiw4LDMwLDIwLDM4LDctNiwxMi0xNiwxMi0yNlY0OWMwLTQsMy03LDYtOGw0Ni0xMmM1LTEsMTEsMywxMSw4djMxYzAsMzctMzAsNjYtNjYsNjYtMzcsMC02Ni0zMC02Ni02NlY0NmMwLTQsMy03LDYtOGwyMC02YzUtMSwxMSwzLDExLDh2MjF6bS0yOSw2YzAsMTYsNiwzMCwxNyw0MCwzLDEsNSwxLDgsMSw1LDAsMTAtMSwxNS0zQzM3LDk1LDI5LDc5LDI5LDYyVjQybC0xOSw1djIweiIgZmlsbD0idXJsKCNjKSIvPjxwYXRoIGZpbGwtcnVsZT0iZXZlbm9kZCIgY2xpcC1ydWxlPSJldmVub2RkIiBkPSJtMzksNjJjMCwxNiw4LDMwLDIwLDM4LDctNiwxMi0xNiwxMi0yNlY0OWMwLTQsMy03LDYtOGw0Ni0xMmM1LTEsMTEsMywxMSw4djMxYzAsMzctMzAsNjYtNjYsNjYtMzcsMC02Ni0zMC02Ni02NlY0NmMwLTQsMy03LDYtOGwyMC02YzUtMSwxMSwzLDExLDh2MjF6bS0yOSw2YzAsMTYsNiwzMCwxNyw0MCwzLDEsNSwxLDgsMSw1LDAsMTAtMSwxNS0zQzM3LDk1LDI5LDc5LDI5LDYyVjQybC0xOSw1djIweiIgZmlsbD0iIzAxMDEwMSIvPjxkZWZzPjxsaW5lYXJHcmFkaWVudCBpZD0iYSIgeDE9Ijg0IiB5MT0iNDEiIHgyPSI3NSIgeTI9IjEyMCIgZ3JhZGllbnRVbml0cz0idXNlclNwYWNlT25Vc2UiPjxzdG9wIHN0b3AtY29sb3I9IiNmZmYiLz48c3RvcCBvZmZzZXQ9IjEiIHN0b3AtY29sb3I9IiMyZTJlMmUiLz48L2xpbmVhckdyYWRpZW50PjxsaW5lYXJHcmFkaWVudCBpZD0iYiIgeDE9Ijg0IiB5MT0iNDEiIHgyPSI3NSIgeTI9IjEyMCIgZ3JhZGllbnRVbml0cz0idXNlclNwYWNlT25Vc2UiPjxzdG9wIHN0b3AtY29sb3I9IiNmZmYiLz48c3RvcCBvZmZzZXQ9IjEiIHN0b3AtY29sb3I9IiMyZTJlMmUiLz48L2xpbmVhckdyYWRpZW50PjxsaW5lYXJHcmFkaWVudCBpZD0iYyIgeDE9Ijg0IiB5MT0iNDEiIHgyPSI3NSIgeTI9IjEyMCIgZ3JhZGllbnRVbml0cz0idXNlclNwYWNlT25Vc2UiPjxzdG9wIHN0b3AtY29sb3I9IiNmZmYiLz48c3RvcCBvZmZzZXQ9IjEiIHN0b3AtY29sb3I9IiMyZTJlMmUiLz48L2xpbmVhckdyYWRpZW50PjwvZGVmcz48L3N2Zz4=&amp;amp;labelColor=white"
loading="lazy"
alt="OpenDataLab"
&gt;&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 id="基于gradio的在线demo"&gt;基于Gradio的在线demo
&lt;/h4&gt;&lt;p&gt;基于gradio开发的webui，界面简洁，仅包含核心解析功能，免登录&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://www.modelscope.cn/studios/OpenDataLab/MinerU" target="_blank" rel="noopener"
&gt;&lt;img src="https://img.shields.io/badge/Demo_on_ModelScope-purple?logo=data:image/svg&amp;#43;xml;base64,PHN2ZyB3aWR0aD0iMjIzIiBoZWlnaHQ9IjIwMCIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj4KCiA8Zz4KICA8dGl0bGU&amp;#43;TGF5ZXIgMTwvdGl0bGU&amp;#43;CiAgPHBhdGggaWQ9InN2Z18xNCIgZmlsbD0iIzYyNGFmZiIgZD0ibTAsODkuODRsMjUuNjUsMGwwLDI1LjY0OTk5bC0yNS42NSwwbDAsLTI1LjY0OTk5eiIvPgogIDxwYXRoIGlkPSJzdmdfMTUiIGZpbGw9IiM2MjRhZmYiIGQ9Im05OS4xNCwxMTUuNDlsMjUuNjUsMGwwLDI1LjY1bC0yNS42NSwwbDAsLTI1LjY1eiIvPgogIDxwYXRoIGlkPSJzdmdfMTYiIGZpbGw9IiM2MjRhZmYiIGQ9Im0xNzYuMDksMTQxLjE0bC0yNS42NDk5OSwwbDAsMjIuMTlsNDcuODQsMGwwLC00Ny44NGwtMjIuMTksMGwwLDI1LjY1eiIvPgogIDxwYXRoIGlkPSJzdmdfMTciIGZpbGw9IiMzNmNmZDEiIGQ9Im0xMjQuNzksODkuODRsMjUuNjUsMGwwLDI1LjY0OTk5bC0yNS42NSwwbDAsLTI1LjY0OTk5eiIvPgogIDxwYXRoIGlkPSJzdmdfMTgiIGZpbGw9IiMzNmNmZDEiIGQ9Im0wLDY0LjE5bDI1LjY1LDBsMCwyNS42NWwtMjUuNjUsMGwwLC0yNS42NXoiLz4KICA8cGF0aCBpZD0ic3ZnXzE5IiBmaWxsPSIjNjI0YWZmIiBkPSJtMTk4LjI4LDg5Ljg0bDI1LjY0OTk5LDBsMCwyNS42NDk5OWwtMjUuNjQ5OTksMGwwLC0yNS42NDk5OXoiLz4KICA8cGF0aCBpZD0ic3ZnXzIwIiBmaWxsPSIjMzZjZmQxIiBkPSJtMTk4LjI4LDY0LjE5bDI1LjY0OTk5LDBsMCwyNS42NWwtMjUuNjQ5OTksMGwwLC0yNS42NXoiLz4KICA8cGF0aCBpZD0ic3ZnXzIxIiBmaWxsPSIjNjI0YWZmIiBkPSJtMTUwLjQ0LDQybDAsMjIuMTlsMjUuNjQ5OTksMGwwLDI1LjY1bDIyLjE5LDBsMCwtNDcuODRsLTQ3Ljg0LDB6Ii8&amp;#43;CiAgPHBhdGggaWQ9InN2Z18yMiIgZmlsbD0iIzM2Y2ZkMSIgZD0ibTczLjQ5LDg5Ljg0bDI1LjY1LDBsMCwyNS42NDk5OWwtMjUuNjUsMGwwLC0yNS42NDk5OXoiLz4KICA8cGF0aCBpZD0ic3ZnXzIzIiBmaWxsPSIjNjI0YWZmIiBkPSJtNDcuODQsNjQuMTlsMjUuNjUsMGwwLC0yMi4xOWwtNDcuODQsMGwwLDQ3Ljg0bDIyLjE5LDBsMCwtMjUuNjV6Ii8&amp;#43;CiAgPHBhdGggaWQ9InN2Z18yNCIgZmlsbD0iIzYyNGFmZiIgZD0ibTQ3Ljg0LDExNS40OWwtMjIuMTksMGwwLDQ3Ljg0bDQ3Ljg0LDBsMCwtMjIuMTlsLTI1LjY1LDBsMCwtMjUuNjV6Ii8&amp;#43;CiA8L2c&amp;#43;Cjwvc3ZnPg==&amp;amp;labelColor=white"
loading="lazy"
alt="ModelScope"
&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://huggingface.co/spaces/opendatalab/MinerU" target="_blank" rel="noopener"
&gt;&lt;img src="https://img.shields.io/badge/Demo_on_HuggingFace-yellow.svg?logo=data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAF8AAABYCAMAAACkl9t/AAAAk1BMVEVHcEz/nQv/nQv/nQr/nQv/nQr/nQv/nQv/nQr/wRf/txT/pg7/yRr/rBD/zRz/ngv/oAz/zhz/nwv/txT/ngv/0B3&amp;#43;zBz/nQv/0h7/wxn/vRb/thXkuiT/rxH/pxD/ogzcqyf/nQvTlSz/czCxky7/SjifdjT/Mj3&amp;#43;Mj3wMj15aTnDNz&amp;#43;DSD9RTUBsP0FRO0Q6O0WyIxEIAAAAGHRSTlMADB8zSWF3krDDw8TJ1NbX5efv8ff9/fxKDJ9uAAAGKklEQVR42u2Z63qjOAyGC4RwCOfB2JAGqrSb2WnTw/1f3UaWcSGYNKTdf/P&amp;#43;mOkTrE&amp;#43;yJBulvfvLT2A5ruenaVHyIks33npl/6C4s/ZLAM45SOi/1FtZPyFur1OYofBX3w7d54Bxm&amp;#43;E8db&amp;#43;nDr12ttmESZ4zludJEG5S7TO72YPlKZFyE&amp;#43;YCYUJTBZsMiNS5Sd7NlDmKM2Eg2JQg8awbglfqgbhArjxkS7dgp2RH6hc9AMLdZYUtZN5DJr4molC8BfKrEkPKEnEVjLbgW1fLy77ZVOJagoIcLIl&amp;#43;IxaQZGjiX597HopF5CkaXVMDO9Pyix3AFV3kw4lQLCbHuMovz8FallbcQIJ5Ta0vks9RnolbCK84BtjKRS5uA43hYoZcOBGIG2Epbv6CvFVQ8m8loh66WNySsnN7htL58LNp&amp;#43;NXT8/PhXiBXPMjLSxtwp8W9f/1AngRierBkA&amp;#43;kk/IpUSOeKByzn8y3kAAAfh//0oXgV4roHm/kz4E2z//zRc3/lgwBzbM2mJxQEa5pqgX7d1L0htrhx7LKxOZlKbwcAWyEOWqYSI8YPtgDQVjpB5nvaHaSnBaQSD6hweDi8PosxD6/PT09YY3xQA7LTCTKfYX&amp;#43;QHpA0GCcqmEHvr/cyfKQTEuwgbs2kPxJEB0iNjfJcCTPyocx&amp;#43;A0griHSmADiC91oNGVwJ69RudYe65vJmoqfpul0lrqXadW0jFKH5BKwAeCq&amp;#43;Den7s&amp;#43;3zfRJzA61/Uj/9H/VzLKTx9jFPPdXeeP&amp;#43;L7WEvDLAKAIoF8bPTKT0&amp;#43;TM7W8ePj3Rz/Yn3kOAp2f1Kf0Weony7pn/cPydvhQYV&amp;#43;eFOfmOu7VB/ViPe34/EN3RFHY/yRuT8ddCtMPH/McBAT5s&amp;#43;vRde/gf2c/sPsjLK&amp;#43;m5IBQF5tO&amp;#43;h2tTlBGnP6693JdsvofjOPnnEHkh2TnV/X1fBl9S5zrwuwF8NFrAVJVwCAPTe8gaJlomqlp0pv4Pjn98tJ/t/fL&amp;#43;&amp;#43;6unpR1YGC2n/KCoa0tTLoKiEeUPDl94nj&amp;#43;5/Tv3/eT5vBQ60X1S0oZr&amp;#43;IWRR8Ldhu7AlLjPISlJcO9vrFotky9SpzDequlwEir5beYAc0R7D9KS1DXva0jhYRDXoExPdc6yw5GShkZXe9QdO/uOvHofxjrV/TNS6iMJS&amp;#43;4TcSTgk9n5agJdBQbB//IfF/HpvPt3Tbi7b6I6K0R72p6ajryEJrENW2bbeVUGjfgoals4L443c7BEE4mJO2SpbRngxQrAKRudRzGQ8jVOL2qDVjjI8K1gc3TIJ5KiFZ1q&amp;#43;gdsARPB4NQS4AjwVSt72DSoXNyOWUrU5mQ9nRYyjp89Xo7oRI6Bga9QNT1mQ/ptaJq5T/7WcgAZywR/XlPGAUDdet3LE&amp;#43;qS0TI&amp;#43;g&amp;#43;aJU8MIqjo0Kx8Ly&amp;#43;maxLjJmjQ18rA0YCkxLQbUZP1WqdmyQGJLUm7VnQFqodmXSqmRrdVpqdzk5LvmvgtEcW8PMGdaS23EOWyDVbACZzUJPaqMbjDxpA3Qrgl0AikimGDbqmyT8P8NOYiqrldF8rX&amp;#43;YN7TopX4UoHuSCYY7cgX4gHwclQKl1zhx0THf&amp;#43;tCAUValzjI7Wg9EhptrkIcfIJjA94evOn8B2eHaVzvBrnl2ig0So6hvPaz0IGcOvTHvUIlE2&amp;#43;prqAxLSQxZlU2stql1NqCCLdIiIN/i1DBEHUoElM9dBravbiAnKqgpi4IBkw&amp;#43;utSPIoBijDXJipSVV7MpOEJUAc5Qmm3BnUN&amp;#43;w3hteEieYKfRZSIUcXKMVf0u5wD4EwsUNVvZOtUT7A2GkffHjByWpHqvRBYrTV72a6j8zZ6W0DTE86Hn04bmyWX3Ri9WH7ZU6Q7h&amp;#43;ZHo0nHUAcsQvVhXRDZHChwiyi/hnPuOsSEF6Exk3o6Y9DT1eZ&amp;#43;6cASXk2Y9k&amp;#43;6EOQMDGm6WBK10wOQJCBwren86cPPWUcRAnTVjGcU1LBgs9FURiX/e6479yZcLwCBmTxiawEwrOcleuu12t3tbLv/N4RLYIBhYexm7Fcn4OJcn0&amp;#43;zc&amp;#43;s8/VfPeddZHAGN6TT8eGczHdR/Gts1/MzDkThr23zqrVfAMFT33Nx1RJsx1k5zuWILLnG/vsH&amp;#43;Fv5D4NTVcp1Gzo8AAAAAElFTkSuQmCC&amp;amp;labelColor=white"
loading="lazy"
alt="HuggingFace"
&gt;&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="本地部署"&gt;本地部署
&lt;/h3&gt;&lt;blockquote&gt;
&lt;p&gt;[!WARNING]
&lt;strong&gt;安装前必看——软硬件环境支持说明&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;为了确保项目的稳定性和可靠性，我们在开发过程中仅对特定的软硬件环境进行优化和测试。这样当用户在推荐的系统配置上部署和运行项目时，能够获得最佳的性能表现和最少的兼容性问题。&lt;/p&gt;
&lt;p&gt;通过集中资源和精力于主线环境，我们团队能够更高效地解决潜在的BUG，及时开发新功能。&lt;/p&gt;
&lt;p&gt;在非主线环境中，由于硬件、软件配置的多样性，以及第三方依赖项的兼容性问题，我们无法100%保证项目的完全可用性。因此，对于希望在非推荐环境中使用本项目的用户，我们建议先仔细阅读文档以及FAQ，大多数问题已经在FAQ中有对应的解决方案，除此之外我们鼓励社区反馈问题，以便我们能够逐步扩大支持范围。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th rowspan="2"&gt;解析后端&lt;/th&gt;
&lt;th rowspan="2"&gt;pipeline &lt;br&gt; (精度&lt;sup&gt;1&lt;/sup&gt; 82+)&lt;/th&gt;
&lt;th colspan="5"&gt;vlm (精度&lt;sup&gt;1&lt;/sup&gt; 90+)&lt;/th&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;transformers&lt;/th&gt;
&lt;th&gt;mlx-engine&lt;/th&gt;
&lt;th&gt;vllm-engine / &lt;br&gt;vllm-async-engine&lt;/th&gt;
&lt;th&gt;lmdeploy-engine&lt;/th&gt;
&lt;th&gt;http-client&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;th&gt;后端特性&lt;/th&gt;
&lt;td&gt;速度快, 无幻觉&lt;/td&gt;
&lt;td&gt;兼容性好, 速度较慢&lt;/td&gt;
&lt;td&gt;比transformers快&lt;/td&gt;
&lt;td&gt;速度快, 兼容vllm生态&lt;/td&gt;
&lt;td&gt;速度快, 兼容lmdeploy生态&lt;/td&gt;
&lt;td&gt;适用于OpenAI兼容服务器&lt;sup&gt;6&lt;/sup&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;操作系统&lt;/th&gt;
&lt;td colspan="2" style="text-align:center;"&gt;Linux&lt;sup&gt;2&lt;/sup&gt; / Windows / macOS&lt;/td&gt;
&lt;td style="text-align:center;"&gt;macOS&lt;sup&gt;3&lt;/sup&gt;&lt;/td&gt;
&lt;td style="text-align:center;"&gt;Linux&lt;sup&gt;2&lt;/sup&gt; / Windows&lt;sup&gt;4&lt;/sup&gt; &lt;/td&gt;
&lt;td style="text-align:center;"&gt;Linux&lt;sup&gt;2&lt;/sup&gt; / Windows&lt;sup&gt;5&lt;/sup&gt; &lt;/td&gt;
&lt;td&gt;不限&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;CPU推理支持&lt;/th&gt;
&lt;td colspan="2" style="text-align:center;"&gt;✅&lt;/td&gt;
&lt;td colspan="3" style="text-align:center;"&gt;❌&lt;/td&gt;
&lt;td &gt;不需要&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;GPU要求&lt;/th&gt;&lt;td colspan="2" style="text-align:center;"&gt;Volta及以后架构, 6G显存以上或Apple Silicon&lt;/td&gt;
&lt;td&gt;Apple Silicon&lt;/td&gt;
&lt;td colspan="2" style="text-align:center;"&gt;Volta及以后架构, 8G显存以上&lt;/td&gt;
&lt;td&gt;不需要&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;内存要求&lt;/th&gt;
&lt;td colspan="5" style="text-align:center;"&gt;最低16GB以上, 推荐32GB以上&lt;/td&gt;
&lt;td&gt;8GB&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;磁盘空间要求&lt;/th&gt;
&lt;td colspan="5" style="text-align:center;"&gt;20GB以上, 推荐使用SSD&lt;/td&gt;
&lt;td&gt;2GB&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;th&gt;python版本&lt;/th&gt;
&lt;td colspan="6" style="text-align:center;"&gt;3.10-3.13&lt;sup&gt;7&lt;/sup&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;sup&gt;1&lt;/sup&gt; 精度指标为OmniDocBench (v1.5)的End-to-End Evaluation Overall分数，基于&lt;code&gt;MinerU&lt;/code&gt;最新版本测试&lt;br&gt;
&lt;sup&gt;2&lt;/sup&gt; Linux仅支持2019年及以后发行版&lt;br&gt;
&lt;sup&gt;3&lt;/sup&gt; MLX需macOS 13.5及以上版本支持，推荐14.0以上版本使用&lt;br&gt;
&lt;sup&gt;4&lt;/sup&gt; Windows vLLM通过WSL2(适用于 Linux 的 Windows 子系统)实现支持&lt;br&gt;
&lt;sup&gt;5&lt;/sup&gt; Windows LMDeploy只能使用&lt;code&gt;turbomind&lt;/code&gt;后端，速度比&lt;code&gt;pytorch&lt;/code&gt;后端稍慢，如对速度有要求建议通过WSL2运行&lt;br&gt;
&lt;sup&gt;6&lt;/sup&gt; 兼容OpenAI API的服务器，如通过&lt;code&gt;vLLM&lt;/code&gt;/&lt;code&gt;SGLang&lt;/code&gt;/&lt;code&gt;LMDeploy&lt;/code&gt;等推理框架部署的本地模型服务器或远程模型服务&lt;br&gt;
&lt;sup&gt;7&lt;/sup&gt; Windows + LMDeploy 由于关键依赖&lt;code&gt;ray&lt;/code&gt;未能在windows平台支持Python 3.13，故仅支持至3.10~3.12版本&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;[!TIP]
除以上主流环境与平台外，我们也收录了一些社区用户反馈的其他平台支持情况，详情请参考&lt;a class="link" href="https://opendatalab.github.io/MinerU/zh/usage/" target="_blank" rel="noopener"
&gt;其他加速卡适配&lt;/a&gt;。&lt;br&gt;
如果您有意将自己的环境适配经验分享给社区，欢迎通过&lt;a class="link" href="https://github.com/opendatalab/MinerU/discussions/categories/show-and-tell" target="_blank" rel="noopener"
&gt;show-and-tell&lt;/a&gt;提交或提交PR至&lt;a class="link" href="https://github.com/opendatalab/MinerU/tree/master/docs/zh/usage/acceleration_cards" target="_blank" rel="noopener"
&gt;其他加速卡适配&lt;/a&gt;文档。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h3 id="安装-mineru"&gt;安装 MinerU
&lt;/h3&gt;&lt;h4 id="使用pip或uv安装mineru"&gt;使用pip或uv安装MinerU
&lt;/h4&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simple
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install uv -i https://mirrors.aliyun.com/pypi/simple
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;uv pip install -U &lt;span class="s2"&gt;&amp;#34;mineru[core]&amp;#34;&lt;/span&gt; -i https://mirrors.aliyun.com/pypi/simple
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h4 id="通过源码安装mineru"&gt;通过源码安装MinerU
&lt;/h4&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git clone https://github.com/opendatalab/MinerU.git
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nb"&gt;cd&lt;/span&gt; MinerU
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;uv pip install -e .&lt;span class="o"&gt;[&lt;/span&gt;core&lt;span class="o"&gt;]&lt;/span&gt; -i https://mirrors.aliyun.com/pypi/simple
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;blockquote&gt;
&lt;p&gt;[!TIP]
&lt;code&gt;mineru[core]&lt;/code&gt;包含除&lt;code&gt;vLLM&lt;/code&gt;/&lt;code&gt;LMDeploy&lt;/code&gt;加速外的所有核心功能，兼容Windows / Linux / macOS系统，适合绝大多数用户。
如果您需要使用&lt;code&gt;vLLM&lt;/code&gt;/&lt;code&gt;LMDeploy&lt;/code&gt;加速VLM模型推理，或是有在边缘设备安装轻量版client端等需求，可以参考文档&lt;a class="link" href="https://opendatalab.github.io/MinerU/zh/quick_start/extension_modules/" target="_blank" rel="noopener"
&gt;扩展模块安装指南&lt;/a&gt;。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;hr&gt;
&lt;h4 id="使用docker部署mineru"&gt;使用docker部署Mineru
&lt;/h4&gt;&lt;p&gt;MinerU提供了便捷的docker部署方式，这有助于快速搭建环境并解决一些棘手的环境兼容问题。
您可以在文档中获取&lt;a class="link" href="https://opendatalab.github.io/MinerU/zh/quick_start/docker_deployment/" target="_blank" rel="noopener"
&gt;Docker部署说明&lt;/a&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="使用-mineru"&gt;使用 MinerU
&lt;/h3&gt;&lt;p&gt;最简单的命令行调用方式:&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;mineru -p &amp;lt;input_path&amp;gt; -o &amp;lt;output_path&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;您可以通过命令行、API、WebUI等多种方式使用MinerU进行PDF解析，具体使用方法请参考&lt;a class="link" href="https://opendatalab.github.io/MinerU/zh/usage/" target="_blank" rel="noopener"
&gt;使用指南&lt;/a&gt;。&lt;/p&gt;
&lt;h2 id="todo"&gt;TODO
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 基于模型的阅读顺序&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 正文中目录、列表识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 表格识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 标题分级&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 手写文本识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 竖排文本识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 拉丁字母重音符号识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; 正文中代码块识别&lt;/li&gt;
&lt;li&gt;&lt;input checked="" disabled="" type="checkbox"&gt; &lt;a class="link" href="docs/chemical_knowledge_introduction/introduction.pdf" &gt;化学式识别&lt;/a&gt;(&lt;a class="link" href="https://mineru.net" target="_blank" rel="noopener"
&gt;https://mineru.net&lt;/a&gt;)&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 图表内容识别&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="known-issues"&gt;Known Issues
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;阅读顺序基于模型对可阅读内容在空间中的分布进行排序，在极端复杂的排版下可能会部分区域乱序&lt;/li&gt;
&lt;li&gt;对竖排文字的支持较为有限&lt;/li&gt;
&lt;li&gt;目录和列表通过规则进行识别，少部分不常见的列表形式可能无法识别&lt;/li&gt;
&lt;li&gt;代码块在layout模型里还没有支持&lt;/li&gt;
&lt;li&gt;漫画书、艺术图册、小学教材、习题尚不能很好解析&lt;/li&gt;
&lt;li&gt;表格识别在复杂表格上可能会出现行/列识别错误&lt;/li&gt;
&lt;li&gt;在小语种PDF上，OCR识别可能会出现字符不准确的情况（如阿拉伯文易混淆字符等）&lt;/li&gt;
&lt;li&gt;部分公式可能会无法在markdown中渲染&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="acknowledgments"&gt;Acknowledgments
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/PDF-Extract-Kit" target="_blank" rel="noopener"
&gt;PDF-Extract-Kit&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/DocLayout-YOLO" target="_blank" rel="noopener"
&gt;DocLayout-YOLO&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/UniMERNet" target="_blank" rel="noopener"
&gt;UniMERNet&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/RapidAI/RapidTable" target="_blank" rel="noopener"
&gt;RapidTable&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/RapidAI/TableStructureRec" target="_blank" rel="noopener"
&gt;TableStructureRec&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/PaddlePaddle/PaddleOCR" target="_blank" rel="noopener"
&gt;PaddleOCR&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/frotms/PaddleOCR2Pytorch" target="_blank" rel="noopener"
&gt;PaddleOCR2Pytorch&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/ppaanngggg/layoutreader" target="_blank" rel="noopener"
&gt;layoutreader&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/Sanster/xy-cut" target="_blank" rel="noopener"
&gt;xy-cut&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/LlmKira/fast-langdetect" target="_blank" rel="noopener"
&gt;fast-langdetect&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/pypdfium2-team/pypdfium2" target="_blank" rel="noopener"
&gt;pypdfium2&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/datalab-to/pdftext" target="_blank" rel="noopener"
&gt;pdftext&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/pdfminer/pdfminer.six" target="_blank" rel="noopener"
&gt;pdfminer.six&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/py-pdf/pypdf" target="_blank" rel="noopener"
&gt;pypdf&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/google/magika" target="_blank" rel="noopener"
&gt;magika&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/vllm-project/vllm" target="_blank" rel="noopener"
&gt;vLLM&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/InternLM/lmdeploy" target="_blank" rel="noopener"
&gt;LMDeploy&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="links"&gt;Links
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/OpenDCAI/DataFlow" target="_blank" rel="noopener"
&gt;Easy Data Preparation with latest LLMs-based Operators and Pipelines&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/Vis3" target="_blank" rel="noopener"
&gt;Vis3 (OSS browser based on s3)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/labelU" target="_blank" rel="noopener"
&gt;LabelU (A Lightweight Multi-modal Data Annotation Tool)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/LabelLLM" target="_blank" rel="noopener"
&gt;LabelLLM (An Open-source LLM Dialogue Annotation Platform)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/PDF-Extract-Kit" target="_blank" rel="noopener"
&gt;PDF-Extract-Kit (A Comprehensive Toolkit for High-Quality PDF Content Extraction)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/OmniDocBench" target="_blank" rel="noopener"
&gt;OmniDocBench (A Comprehensive Benchmark for Document Parsing and Evaluation)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/opendatalab/magic-html" target="_blank" rel="noopener"
&gt;Magic-HTML (Mixed web page extraction tool)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/InternLM/magic-doc" target="_blank" rel="noopener"
&gt;Magic-Doc (Fast speed ppt/pptx/doc/docx/pdf extraction tool)&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://github.com/MigoXLab/dingo" target="_blank" rel="noopener"
&gt;Dingo: A Comprehensive AI Data Quality Evaluation Tool&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>