Portable Document Format
صيغة PDF (Portable Document Format) أصبحت معياراً دولياً مفتوحاً (ISO 32000) عام 2008 بعد 15 عاماً تحت سيطرة Adobe. حوّل واضغط وادمج ملفات PDF في متصفحك مع FileDex — بدون رفع الملف لأي خادم.
ملفاتك لا تغادر جهازك
أسئلة شائعة
كيف أضغط ملف PDF ليصبح أقل من 5 ميغابايت لرفعه في بوابة ZATCA؟
استخدم أداة ضغط PDF في FileDex مباشرة من المتصفح — حدد مستوى الجودة المتوازن للحصول على حجم أقل من 5 ميغابايت مع وضوح كافٍ للمستندات الرسمية. لا يتم رفع ملفك لأي خادم خارجي. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.
كيف أدمج عدة ملفات PDF في ملف واحد لتقديمها في بوابة ناجز؟
استخدم أداة دمج PDF في FileDex — أسقط الملفات بالترتيب المطلوب واضغط دمج. العملية تتم محلياً في المتصفح. بوابة ناجز (وزارة العدل) تتطلب دمج مستندات المحاكم في ملف PDF واحد. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.
كيف أحوّل ملف PDF إلى صور PNG أو JPG؟
أسقط ملف PDF في محوّل FileDex واختر PNG أو JPG كصيغة الإخراج. كل صفحة تُعرض كصورة منفصلة بدقة 150 نقطة في البوصة. الملفات متعددة الصفحات تُحزم في ملف ZIP. التحويل يتم بالكامل في متصفحك عبر pdfjs-dist WebAssembly.
هل يمكن استخراج النص العربي من ملف PDF ممسوح ضوئياً؟
ملفات PDF الممسوحة ضوئياً تحتوي صوراً لا نصاً — الاستخراج العادي لا يُنتج شيئاً. استخدم أداة OCR في FileDex (Tesseract WASM) لتوليد طبقة نص من صور الصفحات. النص العربي يحتاج محرّك OCR يدعم اتجاه القراءة من اليمين لليسار وتشكيل الحروف المتصلة.
ما الفرق بين PDF و PDF/A وأيهما أستخدم للأرشفة؟
PDF/A (ISO 19005) نسخة مقيّدة من PDF مصمّمة للحفظ الدائم. تمنع JavaScript والتشفير والمراجع الخارجية وتفرض تضمين جميع الخطوط. نظام FATOORAH في هيئة ZATCA يستخدم PDF/A-3 للفوترة الإلكترونية حيث يتم تضمين XML الفاتورة داخل ملف PDF.
هل فتح ملف PDF من مصدر مجهول آمن؟
PDF يدعم JavaScript مُضمّناً وأوامر تشغيل تلقائية يمكن استغلالها. افتح الملفات غير الموثوقة في Chrome أو Firefox (عارض PDF.js/PDFium المعزول) بدلاً من Adobe Acrobat. عطّل JavaScript في إعدادات عارض PDF كإجراء إضافي. FileDex يتجاهل JavaScript وأوامر التشغيل ويعالج تدفقات المحتوى فقط.
لماذا حجم ملف PDF كبير رغم أنه يحتوي نصاً فقط؟
الأسباب الشائعة: صور عالية الدقة مُضمّنة، خطوط كاملة غير مُقتطعة (ملف الخط بالكامل بدل الحروف المستخدمة فقط)، أو صفحات ممسوحة ضوئياً مخزّنة كصور غير مضغوطة. أسقط الملف في أداة ضغط PDF في FileDex لتقليص الحجم تلقائياً عبر إعادة ضغط الصور وتقليص الخطوط. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.
لماذا يكبر حجم ملف PDF مع كل عملية حفظ؟
برامج تحرير PDF تستخدم الحفظ التراكمي (Incremental Save) — كل حفظ يُلحق كائنات جديدة وجدول xref جديد دون حذف القديم. ملف 5 ميغابايت قد يصل 15 ميغابايت بعد تعديلات مكثفة. استخدم "حفظ باسم" بدل "حفظ" لإعادة كتابة الملف بالكامل.
ما يميز .PDF
كل ملف PDF هو قاعدة بيانات من الكائنات المرقّمة مربوطة بجدول مراجع تبادلية (Cross-Reference Table) يُتيح الوصول العشوائي لأي صفحة أو مورد في الملف. ملف PDF من 500 صفحة يفتح الصفحة 400 مباشرة دون تحليل الصفحات 1-399. هذا القرار التصميمي من عام 1993 هو السبب في بقاء PDF الصيغة المهيمنة للوثائق ثابتة التخطيط بعد ثلاثة عقود.
اكتشف التفاصيل التقنية
البنية الداخلية: أربعة أقسام
ملف PDF يتكون من: (1) ترويسة (Header) تُعلن إصدار PDF مثل %PDF-1.7. (2) جسم (Body) يحتوي الكائنات غير المباشرة — القواميس والتدفقات والمصفوفات. (3) جدول المراجع التبادلية (xref) يربط رقم كل كائن بموقعه بالبايت في الملف. (4) المقطورة (Trailer) تُشير إلى كتالوج المستند الجذري وجدول xref.
من إصدار PDF 1.5 فصاعداً، يمكن استبدال جدول xref النصي بتدفقات xref مضغوطة تُقلّص حجم الفهرسة بنسبة 30-50% في الملفات كثيرة الكائنات.
تضمين الخطوط والنص العربي
PDF يدعم ثلاث استراتيجيات لتضمين الخطوط: التضمين الكامل (الملف بأكمله)، تضمين مجموعة فرعية (Subset) للحروف المستخدمة فقط، و CIDFont للخطوط ذات الآلاف من الرموز. تضمين مجموعة فرعية يُقلّص خط بحجم 2 ميغابايت إلى حوالي 30 كيلوبايت لرسالة عمل نموذجية.
النص العربي في PDF يواجه تحديات خاصة: خوارزميات تشكيل الحروف (Shaping) تربط الأشكال المتصلة بالحروف العربية. عند غياب جدول ToUnicode CMap الصحيح، النص يظهر بشكل سليم على الشاشة لكن النسخ واللصق يُنتج حروفاً مفككة أو بترتيب معكوس.
مسار التوحيد القياسي: من Adobe إلى ISO
عام 1991، نشر مؤسس Adobe جون وارنوك ورقة بعنوان "مشروع Camelot" تصف نظاماً لإرسال وثائق بأمانة بصرية كاملة. PDF 1.0 صدر في يونيو 1993. Adobe جعلت Acrobat Reader مجانياً عام 1994.
الإصدارات الرئيسية:
- PDF 1.4 (2001): أضاف الشفافية (Alpha Compositing) وضغط JBIG2
- PDF 1.5 (2003): أضاف تدفقات الكائنات وتدفقات xref المضغوطة
- PDF 1.7 (2008): أصبح ISO 32000-1 — Adobe تخلّت عن السيطرة المُلكية
- PDF 2.0 (2017، مُنقّح 2020): ISO 32000-2، تشفير AES-256، إلغاء نماذج XFA
PDF/A للأرشفة طويلة المدى
PDF/A (ISO 19005) نسخة مقيّدة من PDF مُصمّمة للحفظ الدائم. تمنع JavaScript والتشفير والمراجع الخارجية والشفافية (في PDF/A-1). جميع الخطوط يجب تضمينها. ملفات تعريف ألوان ICC مطلوبة. PDF/A-3 يسمح بتضمين ملفات مرفقة — تستخدمه هيئة ZATCA في نظام الفوترة الإلكترونية FATOORAH حيث يتم تضمين XML الفاتورة داخل ملف PDF/A-3.
PDF/UA لذوي الاحتياجات الخاصة
PDF/UA (ISO 14289) يفرض البنية الدلالية المُوسومة (Tagged PDF)، ترتيب القراءة، نص بديل للصور، وتسلسل العناوين الصحيح. معظم مُولّدات PDF لا تُنتج ملفات متوافقة مع PDF/UA بدون ضبط صريح.
التشفير وأسطورة كلمة مرور المالك
تشفير PDF يعمل على مستويين. كلمة مرور المستخدم (User Password) تُشفّر المحتوى بالكامل بخوارزمية AES-256 في التطبيقات الحديثة — لا يمكن قراءة الملف بدون المفتاح. كلمة مرور المالك (Owner Password) تُقيّد العمليات: الطباعة والنسخ والتعديل. التمييز الحاسم — قيود كلمة مرور المالك تُطبّقها برامج العرض فقط وأي أداة تتجاهل أعلام الصلاحيات يمكنها طباعة ونسخ وتعديل الملف بحرية.
JavaScript في PDF: سطح هجوم كبير
PDF يدعم JavaScript المُضمّن عبر محرك Adobe Acrobat SDK. السكربتات تعمل عند فتح المستند أو التنقل بين الصفحات أو التفاعل مع حقول النماذج. هذا يُمكّن النماذج التفاعلية والحسابات لكنه يُنشئ سطح هجوم واسع. ملفات PDF خبيثة استُغلّت لتشغيل أكواد تعسفية وتحميل برمجيات ضارة. معظم العارضين الحديثين يُعطّلون JavaScript افتراضياً.
الخطية (Linearization) — عرض سريع عبر الويب
PDF الخطي (Fast Web View) يُعيد ترتيب الكائنات بحيث تظهر موارد الصفحة الأولى في بداية الملف. المتصفح يعرض الصفحة الأولى بينما بقية الملف يُحمَّل. هذا مشابه لنقل ذرة moov إلى مقدمة ملف MP4.
PDF في المملكة العربية السعودية
PDF هو الصيغة المطلوبة في عدة بوابات حكومية سعودية. هيئة الزكاة والضريبة والجمارك (ZATCA) تتطلب فواتير إلكترونية بصيغة PDF/A-3 مع حد أقصى 5 ميغابايت. بوابة ناجز (وزارة العدل) تتطلب مستندات المحاكم بصيغة PDF مع دمج المرفقات في ملف واحد. بوابة أبشر (وزارة الداخلية) تقبل رفع وثائق بصيغة PDF. بوابة اعتماد تتطلب عروض المشتريات الحكومية بصيغة PDF.
ضغط PDF إلى أقل من 5 ميغابايت لبوابة ZATCA ممكن مباشرة في المتصفح عبر أداة الضغط في FileDex — بدون رفع الملف لأي خادم خارجي.
مقارنة .PDF مع البدائل
| المقارنة | المعيار | الفائز |
|---|---|---|
| .PDF vs .DOCX | أمانة العرض PDF يُضمّن جميع الخطوط والصور وتعليمات التخطيط — المخرجات متطابقة بكسلياً على أي جهاز. DOCX يعتمد على الخطوط المثبّتة ومحرّك العرض مما يسبّب اختلافات بين المنصات. | PDF أفضل |
| .PDF vs .DOCX | قابلية التحرير DOCX يستخدم XML منظّم مع فقرات وأنماط دلالية يُعيد أي معالج نصوص تدفقها وتعديلها. PDF يخزّن المحتوى كرموز مُوضَعة في تدفقات محتوى — التحرير يتطلب إعادة بناء بنية المستند. | DOCX أفضل |
| .PDF vs .EPUB | القراءة على الهاتف EPUB يستخدم HTML/CSS قابل لإعادة التدفق ويتكيّف مع أي حجم شاشة. صفحات PDF ذات أبعاد ثابتة مصمّمة للطباعة — على الشاشات الصغيرة النص يتطلب تكبيراً وتمريراً أفقياً. | EPUB أفضل |
| .PDF vs .PNG | المستندات متعددة الصفحات ملف PDF واحد يحتوي آلاف الصفحات مع نص قابل للتحديد وروابط تشعبية وإشارات مرجعية. PNG يُنتج ملفاً واحداً لكل صفحة بدون طبقة نص ويحتاج تغليفاً خارجياً لمحتوى متعدد الصفحات. | PDF أفضل |
حوّل .PDF إلى...
المرجع التقني
- نوع MIME
application/pdf- Magic Bytes
25 50 44 46%PDF signature followed by version number.- المطوّر
- Adobe Systems / ISO
- سنة التقديم
- 1993
- معيار مفتوح
- نعم — عرض المواصفات
%PDF signature followed by version number.
البنية الثنائية
يتكون ملف PDF من أربعة أقسام متتالية. يبدأ الترويسة بالبايتات السحرية %PDF- متبوعة برقم الإصدار (1.0 حتى 2.0) وسطر تعليق ثنائي يحتوي على بايتات عالية للإشارة إلى المحتوى الثنائي لوكلاء النقل. يحتوي الجسم على كائنات غير مباشرة مرقمة بالتسلسل — كل منها محاط بمحددات 'N G obj ... endobj' — تمثل الصفحات والخطوط والصور وتدفقات المحتوى والبيانات الوصفية. جدول المراجع التبادلية (xref) يربط كل رقم كائن بإزاحته الدقيقة بالبايت في الملف، مما يتيح الوصول العشوائي دون تحليل تسلسلي. قاموس المقطع الختامي في نهاية الملف يشير إلى فهرس المستند (/Root) وقاموس المعلومات (/Info)، بالإضافة إلى قيمة startxref التي تعطي إزاحة البايت لجدول xref نفسه. يمكن لإصدار PDF 1.5 وما بعده استبدال xref النصي بتدفقات xref مضغوطة باستخدام DEFLATE، مما يقلل الحمل الزائد بنسبة 30-50% في المستندات كثيفة الكائنات. التحديثات التراكمية تضيف كائنات جديدة وقسم xref جديد ومقطع ختامي جديد مع /Prev يشير إلى xref السابق — هذه هي الطريقة التي تنمو بها كل عملية حفظ للملف دون إعادة كتابته.
| Offset | Length | Field | Example | Description |
|---|---|---|---|---|
0x00 | 5 bytes | التوقيع السحري + الشرطة | 25 50 44 46 2D (%PDF-) | توقيع PDF. الشرطة جزء من التوقيع السحري — يجب على أدوات التحقق فحص جميع البايتات الخمسة وليس أربعة فقط. |
0x05 | 3 bytes | الإصدار | 31 2E 37 (1.7) | سلسلة إصدار ASCII. القيم الشائعة: 1.4، 1.5، 1.6، 1.7، 2.0. |
0x08 | 1 byte | محدد نهاية السطر | 0A (LF) | سطر جديد أو إرجاع السطر ينهي سطر الترويسة. |
0x09 | 5+ bytes | تعليق ثنائي | 25 E2 E3 CF D3 (%....) | تعليق يحتوي على بايتات عالية (أكبر من 127) للإشارة إلى المحتوى الثنائي لوكلاء نقل FTP والبريد الإلكتروني. |
نقاط الضعف
- تنفيذ JavaScript المضمّن
- إجراء التشغيل وتنفيذ الملفات المضمّنة
- تسريب البيانات عبر إجراء URI
- تجاوز المخزن المؤقت بسبب طول التدفق المشوّه
- ملفات PDF/ZIP وPDF/HTML متعددة الصيغ
الحماية: يعالج FileDex ملفات PDF بالكامل داخل المتصفح باستخدام pdfjs-dist (WebAssembly). لا يتم رفع أي ملف إلى أي خادم. يتم تجاهل إجراءات JavaScript ومشغلات التشغيل والملفات المضمّنة في PDF بواسطة المُصيِّر — تتم معالجة تدفقات محتوى الصفحات فقط للتحويل والعرض.
- مواصفات ISO 32000-2:2020 — Document management, Portable document format, Part 2 (PDF 2.0)
- مواصفات PDF Reference 1.7 (Adobe, pre-ISO publication) — 756 pages, freely downloadable
- سجل PDF (Portable Document Format) Family — Library of Congress Format Description
- سجل application/pdf — IANA Media Types (registered by ISO 32000 Project Leaders)
- سجل Acrobat PDF 1.0–1.7 (fmt/14–fmt/1016) — The National Archives PRONOM Registry
- صناعة PDF Association — ISO 32000, PDF/A, PDF/UA technical resources
- تاريخ PDF — Wikipedia