Microsoft Word Document (Open XML)
ملف DOCX هو مستند Word القياسي منذ 2007. في الحقيقة هو أرشيف مضغوط يحمل ملفات XML قابلة للقراءة. غيّر الامتداد إلى zip وافتحه بنفسك. يتبع المعيار الدولي ISO/IEC 29500. استبدل الصيغة الثنائية القديمة DOC التي ظلّت سرّاً تجارياً لمدّة 25 سنة.
تحويل DOCX غير متاح حالياً في FileDex. استخدم أوامر CLI في المرجع التقني أدناه للتحويل بين صيغ المستندات عبر LibreOffice أو pandoc.
أسئلة شائعة
ما هو ملف DOCX وما الفرق بينه وبين DOC؟
كل ملف DOCX هو أرشيف ZIP — غيّر الامتداد إلى .zip وافتحه بنفسك. داخله ملفات XML تصف كل فقرة وخط وصورة. Microsoft جعلت DOCX التنسيق الافتراضي في 2007 بدلاً من DOC الثنائي الذي ظل مغلقاً 25 سنة. DOCX أيضاً يفصل الماكرو في امتداد .docm المنفصل مما يسهّل حظره أمنياً.
كيف أحوّل DOCX إلى PDF لتقديمه في بوابة ناجز أو للجامعة؟
افتح الملف في Microsoft Word أو LibreOffice Writer واختر تصدير كـ PDF. للرسائل الجامعية ومستندات ناجز القضائية، تأكد من تضمين الخطوط العربية في إعدادات التصدير لضمان عرض التشكيل والنص بشكل صحيح. Google Docs أيضاً يصدّر DOCX إلى PDF مع حفظ معظم التنسيقات.
لماذا يتشوه اتجاه النص العربي عند النسخ بين مستندات Word؟
DOCX يتحكم باتجاه النص على مستويين مستقلين: إعداد الفقرة وإعداد المسار. عندما تختلف إعدادات الاتجاه بين المستند المصدر والوجهة، النص الملصق قد ينقلب في منتصف الجملة. الحل: استخدم لصق خاص واختر نص غير منسق لإزالة إعدادات الاتجاه الموروثة ثم أعد تطبيق التنسيق.
كيف أزيل كل البيانات المخفية من DOCX قبل إرساله رسمياً؟
قبول تتبع التغييرات لا يكفي — بيانات المراجعات تبقى مضمنة في XML. في Word اذهب إلى ملف ثم فحص المستند ثم فاحص المستندات لكشف كل البيانات المخفية بما فيها أسماء المؤلفين وأوقات التحرير والتعليقات. هذه الخطوة ضرورية للمرافعات القضائية والمستندات الحكومية الرسمية.
هل ملفات DOCX من مصادر مجهولة آمنة للفتح؟
ملفات .docx العادية لا تحتوي ماكرو VBA وآمنة للعرض بشكل عام في أي برنامج حديث. لكن ملفات .docm تدعم ماكرو وقد تتخفى بأسماء مضللة تبدو كملفات عادية. لا تُفعّل الماكرو أبداً في مستندات من جهات غير معروفة. Word يفتح المرفقات تلقائياً في طريقة العرض المحمي كطبقة حماية إضافية.
ما يميز .DOCX
غيِّر امتداد أي ملف DOCX إلى zip وافتحه في برنامج فكّ الضغط. ستظهر أمامك سلسلة من المجلّدات والملفّات النصّية، كلّها مكتوبة بلغة XML واضحة وقابلة للقراءة. هذه هي القصّة غير المعروفة لـ DOCX: خلف الواجهة الأنيقة لبرنامج Word يختبئ أرشيف مفتوح البنية.
اكتشف التفاصيل التقنية
غيّر امتداد .docx إلى .zip. مستكشف الملفات يفتحه. ماذا في الداخل؟
كلّ ملف DOCX يتبع معياراً يُسمّى "اتفاقيات التعبئة المفتوحة" أو اختصاراً OPC. الأرشيف يحتوي على ملف فهرس اسمه [Content_Types].xml يُعلن عن نوع كلّ مكوِّن، ومجلّد _rels/ يصف العلاقات بين المكوِّنات، ومجلّد word/ يحمل المحتوى الفعلي.
داخل مجلّد word/ تجد ملف document.xml الذي يحوي نصّ المستند الرئيسي كسلسلة من الفقرات. ملف styles.xml يُعرِّف الأنماط المستخدمة — فقرة، حرف، جدول، ترقيم. ملف fontTable.xml يُعلن عن الخطوط وبدائلها إذا لم يجدها النظام. ملف settings.xml يحمل إعدادات المستند مثل نسبة التكبير وأعلام التوافق. ملف numbering.xml يحفظ تعريفات القوائم المرقَّمة. الصور والرسوم المضمَّنة تعيش في مجلّد فرعي اسمه word/media/.
البرامج تحتاج طريقة للتمييز بين تنسيقات Office المختلفة — كلّها أرشيفات ZIP تبدأ بنفس التوقيع السحري PK. الحلّ في ملف [Content_Types].xml: مستندات Word تُعلن عن نوع محتوى WordprocessingML، بينما XLSX يستخدم SpreadsheetML، وPPTX يستخدم PresentationML. اسم المجلّد الداخلي كذلك يكشف النوع: word/ للمستندات، xl/ للجداول، ppt/ للعروض التقديمية.
قصّة فتح هذه البنية تستحقّ التأمّل. قبل 2008 كان تنسيق DOC القديم سرّاً تجارياً مُحافَظاً عليه من Microsoft لمدّة 25 عاماً كاملة — من 1983 إلى 2008. بنية التنسيق الثنائي المسمّى CFBF كانت غير موثَّقة عمداً للحفاظ على الهيمنة التنافسية. عندما اعتمدت ECMA معيار 376 عام 2006 وأتبعته ISO/IEC بمعيار 29500 عام 2008، أصبحت بنية المستندات مفتوحة للعالم. نشرت Microsoft أيضاً مواصفات DOC القديم ضمن برنامج وعد المواصفات المفتوحة — لكن الوقت كان قد فات، وDOCX كان قد أصبح الافتراضي. للمعيار مستويان من التوافق: "Transitional" الذي يسمح بعناصر VML القديمة وامتدادات Microsoft، و"Strict" الذي يقبل فقط عناصر ISO الخالصة. معظم الملفّات المتداولة من النوع الانتقالي لأن Word يستخدمه افتراضياً.
مستند Word بسيط ينتفخ إلى 15 ميجابايت. لماذا؟
حوِّل كلمة واحدة إلى خطٍّ عريض وسيُنشئ Word ثلاثة عناصر XML منفصلة. التنسيق يُخزِّن النصّ في ثلاثة مستويات متداخلة: الفقرة (العنصر w:p) تحمل خصائص المحاذاة والتباعد والمسافات البادئة. داخل الفقرة، "المسار" (العنصر w:r) يمثّل نصّاً متواصلاً بتنسيق موحَّد. كلّ مسار يحمل عنصر نصّ (w:t) يحوي الأحرف الفعلية.
كلّ تغيير في التنسيق — تحويل إلى عريض، إلى مائل، تبديل الخطّ، تغيير اللون، تكبير الحجم — يفرض إنشاء مسار جديد. جملة مثل "مرحباً بالعالم" تُنتج مسارين. فقرة بخمسة أشكال خطّ مختلفة تحتوي خمسة مسارات على الأقلّ. الخاصّية xml:space="preserve" على عنصر النصّ تضمن عدم حذف المسافات البيضاء تلقائياً أثناء المعالجة.
نظام الأنماط يُخفِّف من هذا التضخّم بشكل ملحوظ. أربعة أنواع من الأنماط — فقرة، حرف، جدول، ترقيم — تتدرّج من الإعدادات الافتراضية للمستند عبر تسلسل الأنماط إلى التنسيق المباشر. نمط "Normal" يُرسي كلّ فقرة غير مُنسَّقة. لكن أيّ تنسيق مباشر (كتطبيق لون يدوياً) يُنتج مسارات فردية لكلّ انحراف عن النمط.
الصور المضمَّنة تُخزَّن مرّة واحدة فقط في مجلّد word/media/ ويُشار إليها عبر معرِّف علاقة. الصورة نفسها إذا ظهرت في عشر صفحات لا تُضيف عشر نسخ من الحجم — استراتيجية إزالة التكرار هذه تمنع المستندات الغنيّة بالصور من التضخّم بلا حاجة.
مستندات Word تتذكّر كل ما حاولت حذفه. لماذا؟
ميزة "تتبُّع التغييرات" في Word ليست مجرّد عرض واجهة. هي عناصر XML مُدمَجة في الملف نفسه. النصّ المُدرَج يُغلَّف بعنصر w:ins، والنصّ المحذوف يُغلَّف بعنصر w:del مع w:delText بدلاً من w:t العادي. كلّ مراجعة تحمل اسم المؤلِّف والتاريخ ومعرِّف جلسة التحرير (rsid) الذي يُميِّز الجلسات المختلفة عن بعضها.
المشكلة الأمنيّة الحقيقية أن هذه البيانات تبقى في الملف حتى بعد اختيار "قبول كلّ التغييرات". العلامات المرئية تختفي، لكن التاريخ الكامل يبقى في XML ما لم يُمسح يدوياً عبر "فاحص المستندات" المدمج في Word.
النتائج كانت محرجة أحياناً. مرافعات قانونية كشفت مواقف تفاوضية سرّية عندما فكَّ الطرف المقابل ضغط ملف DOCX وقرأ XML المراجعات. وثائق حكومية سرَّبت تعديلات مُصنَّفة بنفس الطريقة. معرِّفات rsid تتتبَّع جلسات التحرير الفردية، مما يسمح بإعادة بناء التسلسل الزمني الكامل لكتابة المستند — متى كُتب ماذا، ومن غيّره، ومتى.
الأمر لا يتوقّف عند تسريب المعلومات. ملفّات DOCX كانت تدعم في الماضي رموز حقول تُسمّى DDE قادرة على تنفيذ أوامر نظام عند فتح المستند، دون أيّ تحذير ماكرو. أصلحت Microsoft هذه الثغرة الخطيرة في 2017 عبر التحديث الأمني ADV170021. كائنات OLE المضمَّنة لا تزال تستطيع تنفيذ كود عند النقر المزدوج — ملفّات Flash القديمة، ملفّات تنفيذية متنكِّرة كأيقونات مستندات. لهذا السبب، امتداد .docx ذاته يُعتبر حدّاً أمنياً: ملفّات .docx القياسية لا تستطيع احتواء ماكرو VBA. المستندات التي تحتاج ماكرو يجب أن تستخدم امتداد .docm، مما يُتيح للمؤسّسات حظر هذا النوع في بوّابات البريد الإلكتروني دون حظر جميع مستندات Word.
النص العربي في Word يحتاج تحكُّمَين منفصلَين في الاتجاه. لماذا؟
انسخ فقرة عربية من مستند Word إلى آخر، وراقب اتجاه النصّ ينقلب في منتصف الجملة. هذه المشكلة لها سبب تقني واضح: النصّ ثنائي الاتجاه في DOCX يعمل على مستويَين مستقلَّين. العنصر w:bidi على خصائص الفقرة يُحدِّد اتجاه الفقرة الأساسي من اليمين إلى اليسار. العنصر w:rtl على خصائص المسار يُعلِم البرنامج أن المسار نفسه نصّ من اليمين إلى اليسار.
عندما تختلف إعدادات الاتجاه بين المستند المصدر والمستند الوجهة، النصّ المُلصَق قد يُرث إعدادات غير مناسبة وينقلب اتجاهه. الحلّ العملي: استخدم "لصق خاصّ" واختر "نصّ غير منسَّق" لإزالة إعدادات الاتجاه الموروثة، ثم أعد تطبيق تنسيق الفقرة الجديدة.
الفقرات المختلطة عربي-إنجليزي — شائعة في التقارير الفنّية والمستندات القانونية السعودية التي تحمل مصطلحات إنجليزية — تُفعِّل خوارزمية Unicode ثنائية الاتجاه على مستوى المسار تلقائياً. العنصر w:rFonts مع خاصّية w:cs يُعلن عن خطوط النصوص المعقَّدة. إعداد w:bidi على مستوى القسم يُحدِّد الاتجاه الافتراضي لقسم كامل من المستند — مفيد في مستندات الجهات الحكومية التي تبدأ بصفحات عربية ثم تحتوي ملحقاً إنجليزياً.
علامات التشكيل العربية (الفتحة، الضمّة، الكسرة، السكون، الشدّة، التنوين) تُحفَظ داخل عناصر النصّ كأحرف Unicode مُركَّبة. النصوص الدينية والتعليمية ومستندات الجهات الحكومية الرسمية التي تتطلَّب تشكيلاً كاملاً تُخزَّن في DOCX بسلامة تامّة. تنجو من التحويل بين التنسيقات طالما أن التنسيق الهدف يدعم توحيد Unicode (normalization). أدوات التدقيق العربي المُدمَجة في Word تدعم إدراج التشكيل تلقائياً، والجامعات والجهات الحكومية السعودية (جامعة الملك سعود، جامعة الملك فهد للبترول، الأمانة العامّة لمجلس التعاون) تستخدم DOCX بشكل أساسي لتأليف المحتوى العربي المُشكَّل.
مقارنة .DOCX مع البدائل
| المقارنة | المعيار | الفائز |
|---|---|---|
| .DOCX vs .DOC | قابلية الفحص DOCX أرشيف مضغوط من ملفّات XML يستطيع أيّ شخص فتحه وقراءته بمحرِّر نصّي بسيط. DOC كان تنسيقاً ثنائياً مغلقاً — بنيته الداخلية كانت سرّاً تجارياً لمدّة 25 عاماً. الفرق ليس تقنياً فقط، هو فرق فلسفي: مستندات مفتوحة مقابل صناديق سوداء. | DOCX أفضل |
| .DOCX vs .DOC | الأمان DOCX يفصل الماكرو في امتداد مستقل (docm)، مما يسمح للمؤسّسات بحظر ملفّات الماكرو في بوّابات البريد الإلكتروني دون حظر جميع مستندات Word. DOC لم يُميِّز بين الملفّات العادية وملفّات الماكرو، فأيّ ملف كان يستطيع حمل كود قابل للتنفيذ. | DOCX أفضل |
| .DOCX vs .PDF | قابلية التحرير DOCX مُصمَّم للتحرير المستمرّ. النصّ يتدفَّق تلقائياً عند تغيير الهوامش، الأنماط تتحدَّث عبر المستند كلّه، تتبُّع التغييرات يسجِّل المراجعات. PDF تنسيق تخطيط ثابت مصمَّم لمرحلة العرض النهائي — التحرير فيه ممكن لكنه صعب وغير طبيعي. | DOCX أفضل |
| .DOCX vs .PDF | ثبات العرض المرئي PDF يُعرَض بشكل متطابق تماماً على كلّ جهاز ونظام تشغيل وبرنامج. مظهر DOCX يعتمد على الخطوط المتاحة محلياً ومحرِّك العرض — المستند نفسه قد يبدو مختلفاً في Word وLibreOffice وGoogle Docs. للتوقيع والطباعة النهائية والأرشفة الرسمية، PDF هو الخيار الصحيح. | PDF أفضل |
المرجع التقني
- نوع MIME
application/vnd.openxmlformats-officedocument.wordprocessingml.document- Magic Bytes
50 4B 03 04توقيع أرشيف ZIP. الملف يحتوي على [Content_Types].xml ومجلّد word/ الذي يضمّ XML المستند.- المطوّر
- Microsoft / Ecma International
- سنة التقديم
- 2007
- معيار مفتوح
- نعم — عرض المواصفات
توقيع أرشيف ZIP. الملف يحتوي على [Content_Types].xml ومجلّد word/ الذي يضمّ XML المستند.
البنية الثنائية
ملف DOCX هو في الحقيقة أرشيف ZIP مُعاد تسميته، يبدأ بالتوقيع السحري `50 4B 03 04` (نصّ ASCII `PK`). يتبع معيار "اتفاقيات التعبئة المفتوحة" (OPC). داخل الأرشيف تجد ملف `[Content_Types].xml` في الجذر يعمل كفهرس لأنواع المحتوى، ومجلّد `word/` الذي يضمّ الملفّات المهمّة: `document.xml` (المحتوى الرئيسي في صيغة فقرة/مسار/نصّ)، `styles.xml` (تعريفات الأنماط)، `fontTable.xml` (إعلانات الخطوط)، ومجلّد فرعي اسمه `media/` يحتوي الصور المضمَّنة. الطريقة القياسية للتمييز بين DOCX وXLSX وPPTX (جميعها أرشيفات ZIP بنفس التوقيع السحري) هي قراءة `[Content_Types].xml` والبحث عن نوع محتوى WordprocessingML الخاصّ بمستندات Word.
| Offset | Length | Field | Example | Description |
|---|---|---|---|---|
0x00 | 4 بايت | توقيع ZIP المحلّي | 50 4B 03 04 | ترويسة ملف ZIP المحلّي القياسية. توقيع مشترك بين جميع تنسيقات Office Open XML (DOCX، XLSX، PPTX) وأي أرشيف ZIP آخر |
0x04 | 2 بايت | الإصدار المطلوب | 14 00 | الحدّ الأدنى لإصدار مواصفة ZIP اللازم لفكّ الضغط. القيمة 0x0014 تعني الإصدار 2.0، وهو الحدّ الأدنى المدعوم في معظم الأنظمة الحديثة |
0x1A | 2 بايت | طول اسم الملف | 13 00 | طول اسم أوّل ملف داخل الأرشيف. القيمة 0x0013 تعني 19 بايتاً، وهو طول السلسلة `[Content_Types].xml` بالضبط — الملف الأوّل دائماً في مستندات DOCX القياسية |
تحويل DOCX غير متاح حالياً في FileDex. استخدم أوامر CLI في المرجع التقني أدناه للتحويل بين صيغ المستندات عبر LibreOffice أو pandoc.
نقاط الضعف
- تنفيذ أوامر عبر حقول DDE
- كائنات OLE المضمَّنة
- حقن ماكرو عبر امتداد DOCM
- تسريب تاريخ تتبُّع التغييرات
- حقن كيانات XML خارجية (XXE)
الحماية: افتح ملفات DOCX في معالجات النصوص الموثوقة فقط. عطّل الماكرو افتراضياً، ولا تُفعّلها أبداً لمستندات من مرسلين مجهولين. استخدم امتداد .docm كعلامة خطر — المستندات المُفعَّلة بالماكرو قادرة على تنفيذ الكود عند الفتح. افحص بنية XML في محرّر نصّي قبل فتح الملفات المشبوهة. FileDex لا يحلل DOCX — هذه الصفحة مرجع ثابت، لا رفع ملف.