deepseek ocr2

محرك فهم المستندات

OCR للمستندات الواقعية

deepseek ocr2: OCR ثابت في بيئة الإنتاج

يحافظ على الدقة حتى مع المسح غير الواضح أو التنسيقات المختلطة.

مخرجات منظمة مع مواقع العناصر لتسهيل الدمج مع أنظمتك.

جرّب deepseek ocr2 عرض OCR2 API

OCR متعدد اللغاتاستخراج الجداولمخرجات مع التخطيط

99.2%

دقة الأحرف

180ms

متوسط التأخير

50+

أنواع المستندات

لوحة OCR2

Live

النص المعترف به

INVOICE 2471 · TOTAL: $4,820.00 · DUE: 2025-05-24

يتم توليد الثقة والإحداثيات تلقائيا.

إعادة بناء التخطيط

12 columns · 4 sections

يحافظ على العناوين والأعمدة والجداول.

صيغ التصدير

CSV / JSON / PDF

JSON / CSV / PDF قابل للبحث

القدرات الأساسية

ما يقدمه deepseek ocr2

ستة محاور للسرعة والدقة والاستقرار التشغيلي.

التقاط نص قوي

يتعامل مع الضبابية والدوران وضعف التباين بثبات.

فهم التخطيط

يحافظ على ترتيب القراءة ومواقع العناصر.

الجداول والنماذج

استخراج الخلايا والحقول دون قوالب.

إشارات الجودة

ثقة، وإطارات، وتحقق آلي للمراجعة.

الأمان والتدقيق

سجلات تدقيق مع إمكانيات إخفاء البيانات.

نشر مرن

سحابة عامة أو هجينة أو خاصة.

سير العمل

من المسح إلى بيانات منظمة

إدخال

رفع ملفات PDF والصور عبر API أو دفعات.

التعرّف والتحليل

OCR2 يقرأ النص والجداول والتخطيط دفعة واحدة.

التحقق

استخدم الثقة والقواعد للتحقق من النتائج.

التصدير

تصدير JSON أو CSV أو PDF قابل للبحث.

الأداء

دقة عالية دون إبطاء

استدلال سريع مع تخطيط ثابت حتى في الأحمال العالية.

97.4%

دقة الجداول

مقاسة على فواتير وتقارير معقدة.

30+

اللغات

OCR ثابت في مستندات متعددة اللغات.

12k صفحة/ساعة

إنتاجية الدُفعات

على مستندات A4 قياسية.

ملاحظات بحثية

قراءة ورقية لـ OCR2

الورقة تركز على التدفق البصري السببي وإعادة ترتيب الرموز والتقييم على مستندات واقعية.

DeepEncoder V2 يستبدل CLIP بمشفّر على نمط LLM ويضيف causal flow queries.

الرموز البصرية تبقى ثنائية الاتجاه، بينما الاستعلامات سببية ويُرسل ناتجها فقط إلى المفكك.

الورقة تشير إلى تحسن 3.73% على OmniDocBench v1.5 مقارنة بـ DeepSeek‑OCR.

ميزانية الرموز البصرية محصورة بين 256 و 1120 لموازنة التكلفة والدقة.

التدريب يستخدم ~80% بيانات OCR وثلاث مراحل: pretraining ثم query enhancement ثم decoder specialization.

يدعم استدلال بدقة ديناميكية للمستندات ذات الأحجام المختلفة.

مؤشرات OmniDocBench

TextEdit

مسافة تحرير النص لقياس الدقة.

Formula CDM

مؤشر اتساق المعادلات.

Table TEDS

تشابه بنية الجداول.

R-order Edit

مسافة تحرير ترتيب القراءة.

أمثلة المطالبات

مع التخطيط

<image>\n<|grounding|> Convert the document to markdown.

OCR بسيط

<image>\nFree OCR.

PDF الورقة بطاقة النموذج على HF مستودع GitHub

حالات الاستخدام

أين ينجح deepseek ocr2

مناسب للمالية واللوجستيات والدعم والمعرفة.

أتمتة الفواتير

استخراج الإجماليات والبنود والضرائب بدقة.

أرشفة الامتثال

مستندات قابلة للبحث والتدقيق بسهولة.

الشحن واللوجستيات

توحيد بيانات الوثائق والملصقات.

رقمنة المعرفة

تحويل الأدلة الورقية إلى مراجع قابلة للبحث.

الأسئلة الشائعة

أسئلة متكررة

هل يدعم اللغات المختلطة؟

نعم، OCR2 يميز النصوص المختلطة تلقائيا.

هل يتوفر نشر خاص؟

نعم، تتوفر خيارات خاصة وهجينة.

كيف نقيس الدقة؟

استخدم مستندات حقيقية وقارن على مستوى الحقول.

ما هي الصيغ المدعومة؟

صور، PDF، مسح ضوئي، ومستندات متعددة الصفحات.

جاهزون للانطلاق

ابدأ مع deepseek ocr2 اليوم

من المسح إلى بيانات منظمة بثقة.

اطلب الوصول عرض دليل التكامل