HyperText Markup Language
HTML يُحدّد بنية كل صفحة ويب باستخدام وسوم ترميزية تُحوّلها المتصفحات إلى محتوى مرئي. وحّده W3C منذ عام 1993، وتتولّى منظّمة WHATWG تطويره اليوم كمعيار حيّ — لا أرقام إصدار، المواصفات تتغيّر مع كل تحديث متصفّح.
التحويل غير متاح حالياً. عرض HTML إلى PDF يتطلب محرك متصفح — ميزة مخططة لتحديث مستقبلي.
أسئلة شائعة
ما هو ملف HTML وما استخدامه؟
ملف HTML مستند نص عادي يحتوي وسوم لغة ترميز النص التشعبي التي تُحدّد بنية صفحة ويب. تقرأ المتصفحات هذه الوسوم وتعرض الصفحة المرئية — عناوين وفقرات وصور وروابط ونماذج. كل موقع على الإنترنت مبني على HTML. الملف قابل للتحرير في أي محرر نصوص وقابل للعرض في أي متصفح.
لماذا يُسمّى index.html؟
خوادم الويب تُرجع مستنداً افتراضياً عندما يُشير URL إلى دليل. اتفاقية تسمية ذلك الملف index.html نشأت من خادم NCSA HTTPd عام 1993. Apache وNginx وVercel وعملياً كل منصة استضافة لا تزال تتبع هذه الاتفاقية اليوم.
ما الفرق بين .html و.htm؟
متطابقان وظيفياً. الامتداد .htm يعود إلى MS-DOS وWindows المبكر اللذين فرضا حد امتداد ثلاثة أحرف (أسماء ملفات 8.3). عندما أصبحت أسماء الملفات الطويلة معيارية مع Windows 95 أصبح .html الامتداد المُفضّل. خوادم الويب تُرجع نفس نوع MIME — text/html — لكليهما.
هل HTML لغة برمجة؟
لا. HTML لغة ترميز تصف بنية المستند ومحتواه باستخدام وسوم. لا تستطيع إجراء حسابات أو تنفيذ منطق أو التحكم في تدفق البرنامج. لغات البرمجة مثل JavaScript وPython تتعامل مع الحسابات. HTML يوفر الهيكل العظمي الذي تُحييه لغات البرمجة وCSS.
كيف أعرض مصدر HTML لصفحة ويب؟
انقر بالزر الأيمن في أي مكان على الصفحة واختر عرض مصدر الصفحة، أو اضغط Ctrl+U على Windows وLinux أو Cmd+Option+U على macOS. للـ DOM الحي بما في ذلك المحتوى المُولّد بـ JavaScript اضغط F12 لفتح أدوات المطوّر وافحص لوحة العناصر.
ما الفرق بين HTML وHTML5؟
HTML5 كانت توصية W3C نُشرت عام 2014 أضافت عناصر دلالية وصوت وفيديو أصليين ورسم canvas. منذ 2019 المواصفة الوحيدة هي المعيار الحي WHATWG بدون رقم إصدار ويُحدّث باستمرار. مصطلح HTML5 يعني الآن بشكل غير رسمي HTML الحديث.
هل يمكنني فتح ملف HTML بدون متصفح؟
نعم. ملفات HTML نص عادي لذا أي محرر نصوص يفتحها مباشرةً — VS Code أو Notepad++ أو Sublime Text أو vim أو حتى Windows Notepad. سترى وسوم الترميز الخام بدلاً من الصفحة المعروضة.
كيف أُنشئ ملف HTML؟
افتح أي محرر نصوص، اكتب البنية الأساسية بدءاً من إعلان DOCTYPE ثم وسوم html وhead وbody، ثم احفظ الملف بامتداد .html. افتح الملف المحفوظ في متصفح لرؤية النتيجة المعروضة. لا حاجة لبرامج خاصة أو مترجم.
ما يميز .HTML
لغة الويب
تحت كل موقع إلكتروني ونشرة بريدية وتطبيق ويب يكمن مستند HTML. لغة ترميز النص التشعبي ليست لغة برمجة — لا تستطيع إجراء حسابات أو تكرار بيانات أو اتخاذ قرارات. إنها لغة ترميز: نظام وسوم يصف ماهية المحتوى وعلاقته بالمحتوى الآخر. يقرأ المتصفح تلك الوسوم ويبني صفحة مرئية. هذا التمييز مهم لأنه يُحدّد ما يستطيع HTML فعله وما لا يستطيعه بمفرده، ولماذا توجد CSS وJavaScript كطبقات منفصلة.
اكتشف التفاصيل التقنية
البداية: بيرنرز-لي والوسوم الـ 18
كتب تيم بيرنرز-لي أول وصف لـ HTML في مختبر CERN عام 1991 كجزء من اقتراحه لنظام إدارة المعلومات "الشبكة العنكبوتية العالمية". حدّد ذلك المستند الأولي نحو 18 عنصراً — عناوين (h1 إلى h6) وفقرات وقوائم وروابط تشعبية وبضعة وسوم نصية. لم تكن هناك مواصفة رسمية ولا هيئة معايير ولا رقم إصدار. أول متصفح وأول خادم ويب عملا على حاسوب NeXT في مكتب بيرنرز-لي. صُمّم HTML ليكون بسيطاً بما يكفي ليتمكن عالم فيزياء من ترميز ورقة بحثية بدون أدوات متخصصة — فلسفة تصميم تستمر في تسامح اللغة مع الترميز المشوّه.
بنية المستند: DOCTYPE وhead وbody
يتبع مستند HTML الحديث الصحيح بنية مطلوبة. يبدأ المستند بإعلان DOCTYPE — في HTML الحالي ببساطة <!DOCTYPE html> — الذي يُوجّه المتصفح لاستخدام وضع المعايير بدلاً من وضع التوافق. العنصر الجذر هو <html> ويحمل عادةً سمة lang لإمكانية الوصول وتحسين محركات البحث. داخل <html> يوجد عنصران فرعيان: <head> و<body>.
عنصر <head> يحتوي بيانات وصفية غير مرئية للمستخدمين: عنوان المستند (يظهر في ألسنة المتصفح ونتائج البحث) وإعلان ترميز الأحرف ومراجع لملفات CSS وJavaScript الخارجية ووسوم Open Graph لمعاينات مواقع التواصل الاجتماعي. عنصر <body> يحتوي كل ما يراه المستخدم ويتفاعل معه: نصوص وصور ونماذج وجداول ووسائط مُضمّنة.
هذا التقسيم بين head وbody أساسي لطريقة عمل الويب. زواحف محركات البحث تقرأ البيانات الوصفية في <head> لفهم موضوع الصفحة قبل تحليل المحتوى المرئي. المتصفحات تبدأ عرض محتوى <body> فور وصوله حتى قبل اكتمال تحميل المستند — سلوك يُسمّى العرض التدريجي يجعل HTML مناسباً بشكل فريد للتسليم عبر الشبكة.
الترميز: لماذا انتصر UTF-8
توصي مواصفة WHATWG بشدة باستخدام UTF-8 لجميع مستندات HTML. ملفات HTML المبكرة كانت عادةً مُرمّزة بـ ISO-8859-1 أو Windows-1252 التي تغطي أحرف أوروبا الغربية لكنها لا تستطيع تمثيل العربية أو الصينية أو اليابانية أو الكورية أو معظم الخطوط الأخرى. UTF-8 يُرمّز نطاق Unicode الكامل بصيغة متغيرة العرض متوافقة مع ASCII.
يُصرّح عن الترميز عبر عنصر meta في head: <meta charset="utf-8">. عدم تطابق الترميز — ملف محفوظ بـ UTF-8 لكن مُعلن كـ ISO-8859-1 — يُنتج أحرفاً مشوّهة حيث يجب أن تظهر الأحرف العربية. هذا من أكثر مشكلات تنقيح HTML شيوعاً وخاصةً في بوابات الحكومة الإلكترونية السعودية مثل أبشر وتوكلنا وناجز التي تخدم محتوى عربياً كثيفاً.
HTML الدلالي: المعنى فوق المظهر
قدّم عصر HTML5 عناصر دلالية تصف غرض المحتوى بدلاً من مظهره. تشمل المجموعة الدلالية <header> و<footer> و<main> و<nav> و<aside> و<article> و<section>. يخدم الترميز الدلالي جمهورين: قارئات الشاشة تستخدم أنواع العناصر لبناء مخطط صفحة قابل للتصفح، ومحركات البحث تستخدم تسلسل العناوين لفهم بنية المحتوى مما يؤثر مباشرةً في الترتيب. متطلبات إمكانية الوصول من هيئة الحكومة الرقمية DGA تستلزم ترميزاً دلالياً صحيحاً لضمان وصول جميع المواطنين للخدمات.
المعيار الحي WHATWG: لا مزيد من أرقام الإصدارات
لمواصفة HTML تاريخ حوكمة مضطرب. من 1995 إلى 1999 نشرت IETF ثم W3C إصدارات مرقّمة: HTML 2.0 و3.2 و4.0 و4.01. في 2000 تحوّلت W3C إلى XHTML. في 2004 شكّلت Apple وMozilla وOpera مجموعة WHATWG لتطوير تطور عملي لـ HTML 4. أصبح عملهم HTML5 الذي نشرته W3C كتوصية في أكتوبر 2014.
في 28 مايو 2019 وقّعت W3C وWHATWG اتفاقية: المعيار الحي HTML Living Standard سيكون المواصفة الرسمية الوحيدة لـ HTML. مصطلح "HTML5" تقنياً لقطة مجمّدة من 2014 — المواصفة الحالية ليس لها رقم إصدار وتُحدّث باستمرار.
اتفاقية index.html
تُقدّم خوادم الويب مستنداً افتراضياً عندما يُشير URL إلى دليل. الاتفاقية شبه العالمية هي البحث عن ملف باسم index.html. نشأت هذه الممارسة من خادم NCSA HTTPd في 1993.
عرض المصدر: الفصل المفتوح للويب
من أكثر السمات الثقافية تميزاً في HTML هي الشفافية. أي متصفح يستطيع عرض مصدر HTML الخام لأي صفحة ويب. صمّم بيرنرز-لي الويب كنظام مفتوح حيث يستطيع أي شخص التعلم بقراءة الصفحات الموجودة ونسخ الأنماط.
الأمان: XSS وحدود الثقة
HTML هو سطح الهجوم الأساسي لثغرات أمن الويب. البرمجة عبر المواقع (XSS) — المُصنّفة في OWASP Top 10 — تحدث عندما يحقن مهاجم HTML أو JavaScript خبيثاً في صفحة يشاهدها مستخدمون آخرون. نقطة الحقن عادةً مدخلات مستخدم غير مُنقّاة. الدفاعات تشمل ترويسات Content Security Policy ومكتبات تنقية المدخلات مثل DOMPurify وعلامة HttpOnly لملفات تعريف الارتباط.
الفرق بين .html و.htm
كلا الامتدادين متطابقان وظيفياً. الامتداد ذو الأحرف الثلاثة .htm موجود لأن MS-DOS وWindows 3.x فرضا حد أسماء ملفات 8.3. عندما قدّم Windows 95 دعم أسماء الملفات الطويلة أصبح .html المعيار.
مقارنة .HTML مع البدائل
| المقارنة | المعيار | الفائز |
|---|---|---|
| .HTML vs .XML | Parser error handling HTML يستخدم محللاً متسامحاً يتعافى من الأخطاء ويعرض الترميز المشوّه بسلاسة — الوسوم غير المُغلقة والسمات الناقصة تُصحّح تلقائياً. XML يتطلب تشكيلاً صارماً؛ خطأ واحد يُنتج فشلاً كاملاً في التحليل بدون أي عرض. | HTML أفضل |
| .HTML vs .PDF | Editability and reflow HTML نص عادي قابل للتحرير في أي محرر نصوص، والمحتوى يُعيد التدفق تلقائياً ليناسب أي عرض شاشة. PDF صيغة ثنائية ثابتة التخطيط تتطلب أدوات متخصصة للتعديل، بدون قدرة استجابة أصلية. | HTML أفضل |
| .HTML vs .MARKDOWN | Expressiveness HTML يدعم النماذج والجداول بخلايا مدمجة والوسائط المُضمّنة والعناصر التفاعلية وسمات ARIA لإمكانية الوصول والتداخل التعسفي. Markdown يغطي العناوين والقوائم والروابط والتنسيق الأساسي فقط ويحتاج HTML مضمّناً لأي شيء يتجاوز نحوه المحدود. | HTML أفضل |
المرجع التقني
- نوع MIME
text/html- المطوّر
- World Wide Web Consortium (W3C) / WHATWG
- سنة التقديم
- 1993
- معيار مفتوح
- نعم — عرض المواصفات
البنية الثنائية
HTML صيغة نص عادي بدون بنية ثنائية ولا بايتات سحرية ولا ترويسة ملف ثابتة. تبدأ المستندات عادةً بسلسلة ASCII `<!DOCTYPE html>` يتبعها عنصر `<html>` الجذر. UTF-8 هو الترميز الموصى به؛ قد يسبق BOM بترميز UTF-8 (بايتات EF BB BF) إعلان DOCTYPE لكن مواصفة WHATWG لا تُشجّع عليه. المتصفحات تُعرّف HTML عبر استنشاق المحتوى. العناصر تُشكّل بنية شجرية (DOM) عند التحليل، حيث `<html>` هو الجذر و`<head>` و`<body>` فرعاه.
التحويل غير متاح حالياً. عرض HTML إلى PDF يتطلب محرك متصفح — ميزة مخططة لتحديث مستقبلي.
نقاط الضعف
- البرمجة عبر المواقع (XSS): JavaScript خبيث يُحقن عبر مدخلات مستخدم غير مُنقّاة في innerHTML أو href أو src أو سمات معالجات الأحداث. أكثر ثغرات الويب انتشاراً، مُصنّفة في OWASP Top 10 منذ إنشائه.
- اختطاف النقرات عبر iframe: إطار iframe شفاف أو مُتنكّر يُغطّي عناصر واجهة مشروعة، يخدع المستخدمين للنقر على أزرار مخفية — تفويض مدفوعات أو تغيير إعدادات بدون علمهم.
- حقن HTML / نماذج تصيّد: نماذج تسجيل دخول مزيفة تُحقن في صفحات مشروعة عبر XSS مُخزّن أو HTML بريد إلكتروني، لا يمكن تمييزها بصرياً عن مكونات واجهة حقيقية.
- حقن السكريبت عبر معالجات الأحداث: سمات HTML مثل onload وonerror وonmouseover تُنفّذ JavaScript عشوائياً بدون الحاجة لوسم <script>. تتجاوز أدوات التنقية التي تُرشّح عناصر script فقط.
الحماية: FileDex يُعالج ملفات HTML بالكامل داخل بيئة المتصفح المحلية — بدون رفع ملفات إلى خوادم، بدون تحميل موارد خارجية، وبدون تنفيذ سكريبتات من الملفات المُحلّلة. ترويسات Content Security Policy تُقيّد تنفيذ السكريبتات المضمّنة.
- مواصفات WHATWG HTML Living Standard
- مواصفات W3C HTML5.2 Recommendation (frozen snapshot, December 2017)
- سجل IANA Media Type: text/html (RFC 2854)
- سجل Library of Congress Format Description — HyperText Markup Language Format Family (fdd000475)
- تاريخ W3C/WHATWG Memorandum of Understanding (28 May 2019)
- تاريخ HTML — Wikipedia