.PDF Portable Document Format
.pdf

Portable Document Format

صيغة PDF (Portable Document Format) أصبحت معياراً دولياً مفتوحاً (ISO 32000) عام 2008 بعد 15 عاماً تحت سيطرة Adobe. حوّل واضغط وادمج ملفات PDF في متصفحك مع FileDex — بدون رفع الملف لأي خادم.

بنية الصيغة
%PDF header · version
Body objects · pages
XRef cross-reference
%%EOF trailer
صفحاتنماذجخطوطISO 320001993
بواسطة FileDex

ملفاتك لا تغادر جهازك

أسئلة شائعة

كيف أضغط ملف PDF ليصبح أقل من 5 ميغابايت لرفعه في بوابة ZATCA؟

استخدم أداة ضغط PDF في FileDex مباشرة من المتصفح — حدد مستوى الجودة المتوازن للحصول على حجم أقل من 5 ميغابايت مع وضوح كافٍ للمستندات الرسمية. لا يتم رفع ملفك لأي خادم خارجي. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.

كيف أدمج عدة ملفات PDF في ملف واحد لتقديمها في بوابة ناجز؟

استخدم أداة دمج PDF في FileDex — أسقط الملفات بالترتيب المطلوب واضغط دمج. العملية تتم محلياً في المتصفح. بوابة ناجز (وزارة العدل) تتطلب دمج مستندات المحاكم في ملف PDF واحد. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.

كيف أحوّل ملف PDF إلى صور PNG أو JPG؟

أسقط ملف PDF في محوّل FileDex واختر PNG أو JPG كصيغة الإخراج. كل صفحة تُعرض كصورة منفصلة بدقة 150 نقطة في البوصة. الملفات متعددة الصفحات تُحزم في ملف ZIP. التحويل يتم بالكامل في متصفحك عبر pdfjs-dist WebAssembly.

هل يمكن استخراج النص العربي من ملف PDF ممسوح ضوئياً؟

ملفات PDF الممسوحة ضوئياً تحتوي صوراً لا نصاً — الاستخراج العادي لا يُنتج شيئاً. استخدم أداة OCR في FileDex (Tesseract WASM) لتوليد طبقة نص من صور الصفحات. النص العربي يحتاج محرّك OCR يدعم اتجاه القراءة من اليمين لليسار وتشكيل الحروف المتصلة.

ما الفرق بين PDF و PDF/A وأيهما أستخدم للأرشفة؟

PDF/A (ISO 19005) نسخة مقيّدة من PDF مصمّمة للحفظ الدائم. تمنع JavaScript والتشفير والمراجع الخارجية وتفرض تضمين جميع الخطوط. نظام FATOORAH في هيئة ZATCA يستخدم PDF/A-3 للفوترة الإلكترونية حيث يتم تضمين XML الفاتورة داخل ملف PDF.

هل فتح ملف PDF من مصدر مجهول آمن؟

PDF يدعم JavaScript مُضمّناً وأوامر تشغيل تلقائية يمكن استغلالها. افتح الملفات غير الموثوقة في Chrome أو Firefox (عارض PDF.js/PDFium المعزول) بدلاً من Adobe Acrobat. عطّل JavaScript في إعدادات عارض PDF كإجراء إضافي. FileDex يتجاهل JavaScript وأوامر التشغيل ويعالج تدفقات المحتوى فقط.

لماذا حجم ملف PDF كبير رغم أنه يحتوي نصاً فقط؟

الأسباب الشائعة: صور عالية الدقة مُضمّنة، خطوط كاملة غير مُقتطعة (ملف الخط بالكامل بدل الحروف المستخدمة فقط)، أو صفحات ممسوحة ضوئياً مخزّنة كصور غير مضغوطة. أسقط الملف في أداة ضغط PDF في FileDex لتقليص الحجم تلقائياً عبر إعادة ضغط الصور وتقليص الخطوط. راجع تبويب CLI في المرجع التقني أدناه للأمر الدقيق.

لماذا يكبر حجم ملف PDF مع كل عملية حفظ؟

برامج تحرير PDF تستخدم الحفظ التراكمي (Incremental Save) — كل حفظ يُلحق كائنات جديدة وجدول xref جديد دون حذف القديم. ملف 5 ميغابايت قد يصل 15 ميغابايت بعد تعديلات مكثفة. استخدم "حفظ باسم" بدل "حفظ" لإعادة كتابة الملف بالكامل.

ما يميز .PDF

مشروع Camelot
Adobe تصوّرته عام 1991
جون وارنوك كتب ورقة بعنوان مشروع Camelot تصف نظاماً لإرسال وثائق بأمانة بصرية كاملة. PDF 1.0 صدر عام 1993.
معيار ISO مفتوح
لم تعد Adobe تملكه منذ 2008
PDF 1.7 أصبح ISO 32000-1 عام 2008 — معيار دولي مفتوح. PDF 2.0 (ISO 32000-2) أضاف تشفير AES-256 وألغى نماذج XFA.
وصول عشوائي
يفتح الصفحة 400 دون تحليل 1-399
جدول المراجع التبادلية يربط كل كائن بموقعه بالبايت. ملف PDF من 500 صفحة ينتقل مباشرة لأي صفحة دون تحليل تسلسلي.
أسطورة كلمة مرور المالك
قيود النسخ/الطباعة يمكن تجاوزها
قيود كلمة مرور المالك تُطبّقها برامج العرض فقط. أي أداة تتجاهل أعلام الصلاحيات يمكنها طباعة ونسخ وتعديل الملف بحرية.

كل ملف PDF هو قاعدة بيانات من الكائنات المرقّمة مربوطة بجدول مراجع تبادلية (Cross-Reference Table) يُتيح الوصول العشوائي لأي صفحة أو مورد في الملف. ملف PDF من 500 صفحة يفتح الصفحة 400 مباشرة دون تحليل الصفحات 1-399. هذا القرار التصميمي من عام 1993 هو السبب في بقاء PDF الصيغة المهيمنة للوثائق ثابتة التخطيط بعد ثلاثة عقود.

اكتشف التفاصيل التقنية

البنية الداخلية: أربعة أقسام

ملف PDF يتكون من: (1) ترويسة (Header) تُعلن إصدار PDF مثل %PDF-1.7. (2) جسم (Body) يحتوي الكائنات غير المباشرة — القواميس والتدفقات والمصفوفات. (3) جدول المراجع التبادلية (xref) يربط رقم كل كائن بموقعه بالبايت في الملف. (4) المقطورة (Trailer) تُشير إلى كتالوج المستند الجذري وجدول xref.

من إصدار PDF 1.5 فصاعداً، يمكن استبدال جدول xref النصي بتدفقات xref مضغوطة تُقلّص حجم الفهرسة بنسبة 30-50% في الملفات كثيرة الكائنات.

تضمين الخطوط والنص العربي

PDF يدعم ثلاث استراتيجيات لتضمين الخطوط: التضمين الكامل (الملف بأكمله)، تضمين مجموعة فرعية (Subset) للحروف المستخدمة فقط، و CIDFont للخطوط ذات الآلاف من الرموز. تضمين مجموعة فرعية يُقلّص خط بحجم 2 ميغابايت إلى حوالي 30 كيلوبايت لرسالة عمل نموذجية.

النص العربي في PDF يواجه تحديات خاصة: خوارزميات تشكيل الحروف (Shaping) تربط الأشكال المتصلة بالحروف العربية. عند غياب جدول ToUnicode CMap الصحيح، النص يظهر بشكل سليم على الشاشة لكن النسخ واللصق يُنتج حروفاً مفككة أو بترتيب معكوس.

مسار التوحيد القياسي: من Adobe إلى ISO

عام 1991، نشر مؤسس Adobe جون وارنوك ورقة بعنوان "مشروع Camelot" تصف نظاماً لإرسال وثائق بأمانة بصرية كاملة. PDF 1.0 صدر في يونيو 1993. Adobe جعلت Acrobat Reader مجانياً عام 1994.

الإصدارات الرئيسية:

  • PDF 1.4 (2001): أضاف الشفافية (Alpha Compositing) وضغط JBIG2
  • PDF 1.5 (2003): أضاف تدفقات الكائنات وتدفقات xref المضغوطة
  • PDF 1.7 (2008): أصبح ISO 32000-1 — Adobe تخلّت عن السيطرة المُلكية
  • PDF 2.0 (2017، مُنقّح 2020): ISO 32000-2، تشفير AES-256، إلغاء نماذج XFA

PDF/A للأرشفة طويلة المدى

PDF/A (ISO 19005) نسخة مقيّدة من PDF مُصمّمة للحفظ الدائم. تمنع JavaScript والتشفير والمراجع الخارجية والشفافية (في PDF/A-1). جميع الخطوط يجب تضمينها. ملفات تعريف ألوان ICC مطلوبة. PDF/A-3 يسمح بتضمين ملفات مرفقة — تستخدمه هيئة ZATCA في نظام الفوترة الإلكترونية FATOORAH حيث يتم تضمين XML الفاتورة داخل ملف PDF/A-3.

PDF/UA لذوي الاحتياجات الخاصة

PDF/UA (ISO 14289) يفرض البنية الدلالية المُوسومة (Tagged PDF)، ترتيب القراءة، نص بديل للصور، وتسلسل العناوين الصحيح. معظم مُولّدات PDF لا تُنتج ملفات متوافقة مع PDF/UA بدون ضبط صريح.

التشفير وأسطورة كلمة مرور المالك

تشفير PDF يعمل على مستويين. كلمة مرور المستخدم (User Password) تُشفّر المحتوى بالكامل بخوارزمية AES-256 في التطبيقات الحديثة — لا يمكن قراءة الملف بدون المفتاح. كلمة مرور المالك (Owner Password) تُقيّد العمليات: الطباعة والنسخ والتعديل. التمييز الحاسم — قيود كلمة مرور المالك تُطبّقها برامج العرض فقط وأي أداة تتجاهل أعلام الصلاحيات يمكنها طباعة ونسخ وتعديل الملف بحرية.

JavaScript في PDF: سطح هجوم كبير

PDF يدعم JavaScript المُضمّن عبر محرك Adobe Acrobat SDK. السكربتات تعمل عند فتح المستند أو التنقل بين الصفحات أو التفاعل مع حقول النماذج. هذا يُمكّن النماذج التفاعلية والحسابات لكنه يُنشئ سطح هجوم واسع. ملفات PDF خبيثة استُغلّت لتشغيل أكواد تعسفية وتحميل برمجيات ضارة. معظم العارضين الحديثين يُعطّلون JavaScript افتراضياً.

الخطية (Linearization) — عرض سريع عبر الويب

PDF الخطي (Fast Web View) يُعيد ترتيب الكائنات بحيث تظهر موارد الصفحة الأولى في بداية الملف. المتصفح يعرض الصفحة الأولى بينما بقية الملف يُحمَّل. هذا مشابه لنقل ذرة moov إلى مقدمة ملف MP4.

PDF في المملكة العربية السعودية

PDF هو الصيغة المطلوبة في عدة بوابات حكومية سعودية. هيئة الزكاة والضريبة والجمارك (ZATCA) تتطلب فواتير إلكترونية بصيغة PDF/A-3 مع حد أقصى 5 ميغابايت. بوابة ناجز (وزارة العدل) تتطلب مستندات المحاكم بصيغة PDF مع دمج المرفقات في ملف واحد. بوابة أبشر (وزارة الداخلية) تقبل رفع وثائق بصيغة PDF. بوابة اعتماد تتطلب عروض المشتريات الحكومية بصيغة PDF.

ضغط PDF إلى أقل من 5 ميغابايت لبوابة ZATCA ممكن مباشرة في المتصفح عبر أداة الضغط في FileDex — بدون رفع الملف لأي خادم خارجي.

مقارنة .PDF مع البدائل

مقارنة .PDF مع الصيغ البديلة
المقارنة المعيار الفائز
.PDF vs .DOCX
أمانة العرض
PDF يُضمّن جميع الخطوط والصور وتعليمات التخطيط — المخرجات متطابقة بكسلياً على أي جهاز. DOCX يعتمد على الخطوط المثبّتة ومحرّك العرض مما يسبّب اختلافات بين المنصات.
PDF أفضل
.PDF vs .DOCX
قابلية التحرير
DOCX يستخدم XML منظّم مع فقرات وأنماط دلالية يُعيد أي معالج نصوص تدفقها وتعديلها. PDF يخزّن المحتوى كرموز مُوضَعة في تدفقات محتوى — التحرير يتطلب إعادة بناء بنية المستند.
DOCX أفضل
.PDF vs .EPUB
القراءة على الهاتف
EPUB يستخدم HTML/CSS قابل لإعادة التدفق ويتكيّف مع أي حجم شاشة. صفحات PDF ذات أبعاد ثابتة مصمّمة للطباعة — على الشاشات الصغيرة النص يتطلب تكبيراً وتمريراً أفقياً.
EPUB أفضل
.PDF vs .PNG
المستندات متعددة الصفحات
ملف PDF واحد يحتوي آلاف الصفحات مع نص قابل للتحديد وروابط تشعبية وإشارات مرجعية. PNG يُنتج ملفاً واحداً لكل صفحة بدون طبقة نص ويحتاج تغليفاً خارجياً لمحتوى متعدد الصفحات.
PDF أفضل

المرجع التقني

نوع MIME
application/pdf
Magic Bytes
25 50 44 46 %PDF signature followed by version number.
المطوّر
Adobe Systems / ISO
سنة التقديم
1993
معيار مفتوح
نعم — عرض المواصفات
0000000025504446 %PDF

%PDF signature followed by version number.

البنية الثنائية

يتكون ملف PDF من أربعة أقسام متتالية. يبدأ الترويسة بالبايتات السحرية %PDF- متبوعة برقم الإصدار (1.0 حتى 2.0) وسطر تعليق ثنائي يحتوي على بايتات عالية للإشارة إلى المحتوى الثنائي لوكلاء النقل. يحتوي الجسم على كائنات غير مباشرة مرقمة بالتسلسل — كل منها محاط بمحددات 'N G obj ... endobj' — تمثل الصفحات والخطوط والصور وتدفقات المحتوى والبيانات الوصفية. جدول المراجع التبادلية (xref) يربط كل رقم كائن بإزاحته الدقيقة بالبايت في الملف، مما يتيح الوصول العشوائي دون تحليل تسلسلي. قاموس المقطع الختامي في نهاية الملف يشير إلى فهرس المستند (/Root) وقاموس المعلومات (/Info)، بالإضافة إلى قيمة startxref التي تعطي إزاحة البايت لجدول xref نفسه. يمكن لإصدار PDF 1.5 وما بعده استبدال xref النصي بتدفقات xref مضغوطة باستخدام DEFLATE، مما يقلل الحمل الزائد بنسبة 30-50% في المستندات كثيفة الكائنات. التحديثات التراكمية تضيف كائنات جديدة وقسم xref جديد ومقطع ختامي جديد مع /Prev يشير إلى xref السابق — هذه هي الطريقة التي تنمو بها كل عملية حفظ للملف دون إعادة كتابته.

OffsetLengthFieldExampleDescription
0x00 5 bytes التوقيع السحري + الشرطة 25 50 44 46 2D (%PDF-) توقيع PDF. الشرطة جزء من التوقيع السحري — يجب على أدوات التحقق فحص جميع البايتات الخمسة وليس أربعة فقط.
0x05 3 bytes الإصدار 31 2E 37 (1.7) سلسلة إصدار ASCII. القيم الشائعة: 1.4، 1.5، 1.6، 1.7، 2.0.
0x08 1 byte محدد نهاية السطر 0A (LF) سطر جديد أو إرجاع السطر ينهي سطر الترويسة.
0x09 5+ bytes تعليق ثنائي 25 E2 E3 CF D3 (%....) تعليق يحتوي على بايتات عالية (أكبر من 127) للإشارة إلى المحتوى الثنائي لوكلاء نقل FTP والبريد الإلكتروني.
1991نشر جون وارنوك المؤسس المشارك لشركة Adobe ورقة 'مشروع كاميلوت' التي اقترحت صيغة مستندات عالمية1993إصدار PDF 1.0 مع Acrobat 1.0؛ كان تجارياً في البداية مع اعتماد محدود1994أصبح Acrobat Reader مجانياً؛ بدأ اعتماد PDF بالانتشار الواسع2001اعتماد PDF/X-1a (المعيار ISO 15930-1) لسير عمل الإنتاج الطباعي2005اعتماد PDF/A-1 (المعيار ISO 19005-1) لأرشفة المستندات طويلة الأمد2008نشر PDF 1.7 كمعيار ISO 32000-1؛ تخلت Adobe عن السيطرة الاحتكارية2012اعتماد PDF/UA (المعيار ISO 14289-1) للامتثال لمتطلبات إمكانية الوصول الشاملة2017نشر PDF 2.0 كمعيار ISO 32000-2 مع تشفير AES-256 ونموذج شفافية محدّث2020نشر تصحيح ISO 32000-2:2020 مع توضيحات
تحويل جميع صفحات PDF إلى صور PNG بدقة 300 نقطة في البوصة ghostscript
gs -dNOPAUSE -dBATCH -sDEVICE=png16m -r300 -sOutputFile=page_%03d.png input.pdf

يقوم Ghostscript بتحويل كل صفحة إلى صورة PNG مرقمة بالتسلسل. الخيار -sDEVICE=png16m يختار إخراج ألوان بعمق 24 بت. الخيار -r300 يضبط الدقة على 300 نقطة في البوصة. %03d يضيف أصفاراً بادئة لأرقام الصفحات حتى 3 خانات.

استخراج النص من ملف PDF مع الحفاظ على التنسيق أخرى
pdftotext -layout -enc UTF-8 input.pdf output.txt

أداة pdftotext من مكتبة Poppler تحافظ على التنسيق المكاني باستخدام المسافات البيضاء. الخيار -layout ينتج مخرجات قابلة للقراءة بتنسيق أعمدة. الخيار -enc UTF-8 يفرض ترميز يونيكود للمخرجات.

ضغط ملف PDF للنشر على الويب ghostscript
gs -dNOPAUSE -dBATCH -dPDFSETTINGS=/ebook -sDEVICE=pdfwrite -dCompatibilityLevel=1.5 -sOutputFile=compressed.pdf input.pdf

يقوم Ghostscript بإعادة ضغط الصور إلى 150 نقطة في البوصة بصيغة JPEG، وتضمين مجموعات الخطوط الفرعية، وإزالة الكائنات الزائدة. إعداد /ebook مُحسَّن للنشر على الويب. الخيار -dCompatibilityLevel=1.5 يفعّل تدفقات xref لتقليل حجم المخرجات.

فك تشفير ملف PDF محمي بكلمة مرور المالك qpdf
qpdf --decrypt --password='' input.pdf decrypted.pdf

يزيل قيود كلمة مرور المالك (الطباعة، النسخ، التحرير) دون تغيير المحتوى. لا يتجاوز كلمة مرور المستخدم (تشفير محتوى AES).

دمج عدة ملفات PDF في ملف واحد qpdf
qpdf --empty --pages input1.pdf input2.pdf input3.pdf -- merged.pdf

ينشئ ملف PDF فارغاً ويضيف جميع الصفحات من كل ملف إدخال بالترتيب. الفاصل -- يشير إلى نهاية تحديد الصفحات.

PDF PNG render lossless يتم تحويل كل صفحة PDF إلى صورة نقطية على عنصر Canvas بدقة DPI محددة عبر pdfjs-dist، ثم تصديرها كـ PNG بدون فقدان. مثالي لصور مصغّرة الصفحات واستخراج المخططات من الأوراق الأكاديمية والنسخ الأرشيفية.
PDF JPG render lossy تحويل صفحات PDF إلى JPEG يحقق تقليصاً في الحجم بنسبة 60-80% مقارنة بـ PNG عند جودة 85 فما فوق، مع فقدان غير محسوس للمحتوى الفوتوغرافي. مفضّل لمرفقات البريد ومعاينات وسائل التواصل والصور المصغّرة للويب.
PDF TXT export variable يستخرج النص عبر تتبع عمليات تدفق المحتوى في PDF مثل Tj وTJ مع حل Unicode عبر خرائط ToUnicode CMap. يُستخدم للفهرسة النصية الكاملة وخطوط معالجة النماذج اللغوية الكبيرة وتحويلات إتاحة الوصول. تتطلب ملفات PDF الممسوحة ضوئياً OCR أولاً.
PDF WEBP render lossy توفر صيغة WebP أحجام ملفات أصغر بنسبة 25-35% من JPEG عند جودة مدركة مكافئة، مما يجعلها الخيار الأمثل لصور الصفحات المحسّنة للويب المقدّمة عبر شبكات CDN أو منصات إدارة المحتوى.
عالي

نقاط الضعف

  • تنفيذ JavaScript المضمّن
  • إجراء التشغيل وتنفيذ الملفات المضمّنة
  • تسريب البيانات عبر إجراء URI
  • تجاوز المخزن المؤقت بسبب طول التدفق المشوّه
  • ملفات PDF/ZIP وPDF/HTML متعددة الصيغ

الحماية: يعالج FileDex ملفات PDF بالكامل داخل المتصفح باستخدام pdfjs-dist (WebAssembly). لا يتم رفع أي ملف إلى أي خادم. يتم تجاهل إجراءات JavaScript ومشغلات التشغيل والملفات المضمّنة في PDF بواسطة المُصيِّر — تتم معالجة تدفقات محتوى الصفحات فقط للتحويل والعرض.

Adobe Acrobat أداة
أداة قياسية في الصناعة لإنشاء وتحرير وتصميم نماذج PDF
PDF.js مكتبة
مُصيِّر PDF مفتوح المصدر بلغة JavaScript من Mozilla يُستخدم في Firefox
pdfjs-dist مكتبة
توزيع NPM لمكتبة PDF.js لعرض PDF داخل المتصفح
Ghostscript أداة
مُفسِّر PostScript/PDF للتحويل النقطي والضغط
LibreOffice أداة
حزمة مكتبية مفتوحة المصدر تدعم تصدير واستيراد PDF
qpdf أداة
أداة سطر أوامر لتخطيط وفك تشفير وإصلاح ملفات PDF
pdftk أداة
مجموعة أدوات PDF للدمج والتقسيم والتدوير والختم
pdf-lib مكتبة
مكتبة JavaScript لإنشاء وتعديل ملفات PDF في المتصفح