.HTML HyperText Markup Language
.html

HyperText Markup Language

HTML يُحدّد بنية كل صفحة ويب باستخدام وسوم ترميزية تُحوّلها المتصفحات إلى محتوى مرئي. وحّده W3C منذ عام 1993، وتتولّى منظّمة WHATWG تطويره اليوم كمعيار حيّ — لا أرقام إصدار، المواصفات تتغيّر مع كل تحديث متصفّح.

بنية الصيغة
<!DOCTYPE html> — إعلان نوع المستند
<head> — البيانات الوصفية
<body> — المحتوى المرئي
DOM — شجرة الكائنات
نصW3C1991
غير قابل للتحويل

التحويل غير متاح حالياً. عرض HTML إلى PDF يتطلب محرك متصفح — ميزة مخططة لتحديث مستقبلي.

أسئلة شائعة

ما هو ملف HTML وما استخدامه؟

ملف HTML مستند نص عادي يحتوي وسوم لغة ترميز النص التشعبي التي تُحدّد بنية صفحة ويب. تقرأ المتصفحات هذه الوسوم وتعرض الصفحة المرئية — عناوين وفقرات وصور وروابط ونماذج. كل موقع على الإنترنت مبني على HTML. الملف قابل للتحرير في أي محرر نصوص وقابل للعرض في أي متصفح.

لماذا يُسمّى index.html؟

خوادم الويب تُرجع مستنداً افتراضياً عندما يُشير URL إلى دليل. اتفاقية تسمية ذلك الملف index.html نشأت من خادم NCSA HTTPd عام 1993. Apache وNginx وVercel وعملياً كل منصة استضافة لا تزال تتبع هذه الاتفاقية اليوم.

ما الفرق بين .html و.htm؟

متطابقان وظيفياً. الامتداد .htm يعود إلى MS-DOS وWindows المبكر اللذين فرضا حد امتداد ثلاثة أحرف (أسماء ملفات 8.3). عندما أصبحت أسماء الملفات الطويلة معيارية مع Windows 95 أصبح .html الامتداد المُفضّل. خوادم الويب تُرجع نفس نوع MIME — text/html — لكليهما.

هل HTML لغة برمجة؟

لا. HTML لغة ترميز تصف بنية المستند ومحتواه باستخدام وسوم. لا تستطيع إجراء حسابات أو تنفيذ منطق أو التحكم في تدفق البرنامج. لغات البرمجة مثل JavaScript وPython تتعامل مع الحسابات. HTML يوفر الهيكل العظمي الذي تُحييه لغات البرمجة وCSS.

كيف أعرض مصدر HTML لصفحة ويب؟

انقر بالزر الأيمن في أي مكان على الصفحة واختر عرض مصدر الصفحة، أو اضغط Ctrl+U على Windows وLinux أو Cmd+Option+U على macOS. للـ DOM الحي بما في ذلك المحتوى المُولّد بـ JavaScript اضغط F12 لفتح أدوات المطوّر وافحص لوحة العناصر.

ما الفرق بين HTML وHTML5؟

HTML5 كانت توصية W3C نُشرت عام 2014 أضافت عناصر دلالية وصوت وفيديو أصليين ورسم canvas. منذ 2019 المواصفة الوحيدة هي المعيار الحي WHATWG بدون رقم إصدار ويُحدّث باستمرار. مصطلح HTML5 يعني الآن بشكل غير رسمي HTML الحديث.

هل يمكنني فتح ملف HTML بدون متصفح؟

نعم. ملفات HTML نص عادي لذا أي محرر نصوص يفتحها مباشرةً — VS Code أو Notepad++ أو Sublime Text أو vim أو حتى Windows Notepad. سترى وسوم الترميز الخام بدلاً من الصفحة المعروضة.

كيف أُنشئ ملف HTML؟

افتح أي محرر نصوص، اكتب البنية الأساسية بدءاً من إعلان DOCTYPE ثم وسوم html وhead وbody، ثم احفظ الملف بامتداد .html. افتح الملف المحفوظ في متصفح لرؤية النتيجة المعروضة. لا حاجة لبرامج خاصة أو مترجم.

ما يميز .HTML

18 وسماً
الويب بالكامل بدأ بـ 18 عنصر HTML
وصف بيرنرز-لي لـ HTML عام 1991 في CERN حدّد 18 وسماً فقط — عناوين وفقرات وقوائم وروابط. المعيار الحي الحالي يُعرّف أكثر من 110 عنصراً، لكن كل صفحة لا تزال تستخدم تلك اللبنات الأصلية.
بلا رقم إصدار
مواصفة HTML الحالية ليس لها إصدار
منذ اتفاقية W3C/WHATWG عام 2019 يُصان HTML كمعيار حي بتحديثات مستمرة وبدون رقم إصدار. مصطلح HTML5 هو لقطة مجمّدة من 2014. عندما يقول المطوّرون HTML5 يقصدون عادةً HTML الحديث.
عرض المصدر
مصدر HTML لأي صفحة على بُعد نقرة واحدة
صمّم بيرنرز-لي الويب كنظام مفتوح. انقر بالزر الأيمن ثم عرض مصدر الصفحة في أي متصفح يكشف HTML الخام. هذه الشفافية علّمت أجيالاً من المطوّرين البرمجة بقراءة صفحات حقيقية.
index.html
اسم الصفحة الرئيسية الافتراضي يعود لـ 1993
خادم NCSA HTTPd في 1993 أسّس اتفاقية تقديم index.html عندما يُشير URL إلى دليل. Apache وNginx وVercel وعملياً كل منصة استضافة لا تزال تتبع هذه الاتفاقية منذ أكثر من 30 عاماً.

لغة الويب

تحت كل موقع إلكتروني ونشرة بريدية وتطبيق ويب يكمن مستند HTML. لغة ترميز النص التشعبي ليست لغة برمجة — لا تستطيع إجراء حسابات أو تكرار بيانات أو اتخاذ قرارات. إنها لغة ترميز: نظام وسوم يصف ماهية المحتوى وعلاقته بالمحتوى الآخر. يقرأ المتصفح تلك الوسوم ويبني صفحة مرئية. هذا التمييز مهم لأنه يُحدّد ما يستطيع HTML فعله وما لا يستطيعه بمفرده، ولماذا توجد CSS وJavaScript كطبقات منفصلة.

اكتشف التفاصيل التقنية

البداية: بيرنرز-لي والوسوم الـ 18

كتب تيم بيرنرز-لي أول وصف لـ HTML في مختبر CERN عام 1991 كجزء من اقتراحه لنظام إدارة المعلومات "الشبكة العنكبوتية العالمية". حدّد ذلك المستند الأولي نحو 18 عنصراً — عناوين (h1 إلى h6) وفقرات وقوائم وروابط تشعبية وبضعة وسوم نصية. لم تكن هناك مواصفة رسمية ولا هيئة معايير ولا رقم إصدار. أول متصفح وأول خادم ويب عملا على حاسوب NeXT في مكتب بيرنرز-لي. صُمّم HTML ليكون بسيطاً بما يكفي ليتمكن عالم فيزياء من ترميز ورقة بحثية بدون أدوات متخصصة — فلسفة تصميم تستمر في تسامح اللغة مع الترميز المشوّه.

بنية المستند: DOCTYPE وhead وbody

يتبع مستند HTML الحديث الصحيح بنية مطلوبة. يبدأ المستند بإعلان DOCTYPE — في HTML الحالي ببساطة <!DOCTYPE html> — الذي يُوجّه المتصفح لاستخدام وضع المعايير بدلاً من وضع التوافق. العنصر الجذر هو <html> ويحمل عادةً سمة lang لإمكانية الوصول وتحسين محركات البحث. داخل <html> يوجد عنصران فرعيان: <head> و<body>.

عنصر <head> يحتوي بيانات وصفية غير مرئية للمستخدمين: عنوان المستند (يظهر في ألسنة المتصفح ونتائج البحث) وإعلان ترميز الأحرف ومراجع لملفات CSS وJavaScript الخارجية ووسوم Open Graph لمعاينات مواقع التواصل الاجتماعي. عنصر <body> يحتوي كل ما يراه المستخدم ويتفاعل معه: نصوص وصور ونماذج وجداول ووسائط مُضمّنة.

هذا التقسيم بين head وbody أساسي لطريقة عمل الويب. زواحف محركات البحث تقرأ البيانات الوصفية في <head> لفهم موضوع الصفحة قبل تحليل المحتوى المرئي. المتصفحات تبدأ عرض محتوى <body> فور وصوله حتى قبل اكتمال تحميل المستند — سلوك يُسمّى العرض التدريجي يجعل HTML مناسباً بشكل فريد للتسليم عبر الشبكة.

الترميز: لماذا انتصر UTF-8

توصي مواصفة WHATWG بشدة باستخدام UTF-8 لجميع مستندات HTML. ملفات HTML المبكرة كانت عادةً مُرمّزة بـ ISO-8859-1 أو Windows-1252 التي تغطي أحرف أوروبا الغربية لكنها لا تستطيع تمثيل العربية أو الصينية أو اليابانية أو الكورية أو معظم الخطوط الأخرى. UTF-8 يُرمّز نطاق Unicode الكامل بصيغة متغيرة العرض متوافقة مع ASCII.

يُصرّح عن الترميز عبر عنصر meta في head: <meta charset="utf-8">. عدم تطابق الترميز — ملف محفوظ بـ UTF-8 لكن مُعلن كـ ISO-8859-1 — يُنتج أحرفاً مشوّهة حيث يجب أن تظهر الأحرف العربية. هذا من أكثر مشكلات تنقيح HTML شيوعاً وخاصةً في بوابات الحكومة الإلكترونية السعودية مثل أبشر وتوكلنا وناجز التي تخدم محتوى عربياً كثيفاً.

HTML الدلالي: المعنى فوق المظهر

قدّم عصر HTML5 عناصر دلالية تصف غرض المحتوى بدلاً من مظهره. تشمل المجموعة الدلالية <header> و<footer> و<main> و<nav> و<aside> و<article> و<section>. يخدم الترميز الدلالي جمهورين: قارئات الشاشة تستخدم أنواع العناصر لبناء مخطط صفحة قابل للتصفح، ومحركات البحث تستخدم تسلسل العناوين لفهم بنية المحتوى مما يؤثر مباشرةً في الترتيب. متطلبات إمكانية الوصول من هيئة الحكومة الرقمية DGA تستلزم ترميزاً دلالياً صحيحاً لضمان وصول جميع المواطنين للخدمات.

المعيار الحي WHATWG: لا مزيد من أرقام الإصدارات

لمواصفة HTML تاريخ حوكمة مضطرب. من 1995 إلى 1999 نشرت IETF ثم W3C إصدارات مرقّمة: HTML 2.0 و3.2 و4.0 و4.01. في 2000 تحوّلت W3C إلى XHTML. في 2004 شكّلت Apple وMozilla وOpera مجموعة WHATWG لتطوير تطور عملي لـ HTML 4. أصبح عملهم HTML5 الذي نشرته W3C كتوصية في أكتوبر 2014.

في 28 مايو 2019 وقّعت W3C وWHATWG اتفاقية: المعيار الحي HTML Living Standard سيكون المواصفة الرسمية الوحيدة لـ HTML. مصطلح "HTML5" تقنياً لقطة مجمّدة من 2014 — المواصفة الحالية ليس لها رقم إصدار وتُحدّث باستمرار.

اتفاقية index.html

تُقدّم خوادم الويب مستنداً افتراضياً عندما يُشير URL إلى دليل. الاتفاقية شبه العالمية هي البحث عن ملف باسم index.html. نشأت هذه الممارسة من خادم NCSA HTTPd في 1993.

عرض المصدر: الفصل المفتوح للويب

من أكثر السمات الثقافية تميزاً في HTML هي الشفافية. أي متصفح يستطيع عرض مصدر HTML الخام لأي صفحة ويب. صمّم بيرنرز-لي الويب كنظام مفتوح حيث يستطيع أي شخص التعلم بقراءة الصفحات الموجودة ونسخ الأنماط.

الأمان: XSS وحدود الثقة

HTML هو سطح الهجوم الأساسي لثغرات أمن الويب. البرمجة عبر المواقع (XSS) — المُصنّفة في OWASP Top 10 — تحدث عندما يحقن مهاجم HTML أو JavaScript خبيثاً في صفحة يشاهدها مستخدمون آخرون. نقطة الحقن عادةً مدخلات مستخدم غير مُنقّاة. الدفاعات تشمل ترويسات Content Security Policy ومكتبات تنقية المدخلات مثل DOMPurify وعلامة HttpOnly لملفات تعريف الارتباط.

الفرق بين .html و.htm

كلا الامتدادين متطابقان وظيفياً. الامتداد ذو الأحرف الثلاثة .htm موجود لأن MS-DOS وWindows 3.x فرضا حد أسماء ملفات 8.3. عندما قدّم Windows 95 دعم أسماء الملفات الطويلة أصبح .html المعيار.

مقارنة .HTML مع البدائل

مقارنة .HTML مع الصيغ البديلة
المقارنة المعيار الفائز
.HTML vs .XML
Parser error handling
HTML يستخدم محللاً متسامحاً يتعافى من الأخطاء ويعرض الترميز المشوّه بسلاسة — الوسوم غير المُغلقة والسمات الناقصة تُصحّح تلقائياً. XML يتطلب تشكيلاً صارماً؛ خطأ واحد يُنتج فشلاً كاملاً في التحليل بدون أي عرض.
HTML أفضل
.HTML vs .PDF
Editability and reflow
HTML نص عادي قابل للتحرير في أي محرر نصوص، والمحتوى يُعيد التدفق تلقائياً ليناسب أي عرض شاشة. PDF صيغة ثنائية ثابتة التخطيط تتطلب أدوات متخصصة للتعديل، بدون قدرة استجابة أصلية.
HTML أفضل
.HTML vs .MARKDOWN
Expressiveness
HTML يدعم النماذج والجداول بخلايا مدمجة والوسائط المُضمّنة والعناصر التفاعلية وسمات ARIA لإمكانية الوصول والتداخل التعسفي. Markdown يغطي العناوين والقوائم والروابط والتنسيق الأساسي فقط ويحتاج HTML مضمّناً لأي شيء يتجاوز نحوه المحدود.
HTML أفضل

المرجع التقني

نوع MIME
text/html
المطوّر
World Wide Web Consortium (W3C) / WHATWG
سنة التقديم
1993
معيار مفتوح
نعم — عرض المواصفات

البنية الثنائية

HTML صيغة نص عادي بدون بنية ثنائية ولا بايتات سحرية ولا ترويسة ملف ثابتة. تبدأ المستندات عادةً بسلسلة ASCII `<!DOCTYPE html>` يتبعها عنصر `<html>` الجذر. UTF-8 هو الترميز الموصى به؛ قد يسبق BOM بترميز UTF-8 (بايتات EF BB BF) إعلان DOCTYPE لكن مواصفة WHATWG لا تُشجّع عليه. المتصفحات تُعرّف HTML عبر استنشاق المحتوى. العناصر تُشكّل بنية شجرية (DOM) عند التحليل، حيث `<html>` هو الجذر و`<head>` و`<body>` فرعاه.

1991تيم بيرنرز-لي ينشر أول وصف لـ HTML في CERN، مُعرّفاً نحو 18 عنصراً للشبكة العنكبوتية العالمية1993خادم NCSA HTTPd يُؤسّس اتفاقية index.html؛ متصفح Mosaic يجلب HTML للجمهور العام1995HTML 2.0 يُنشر كـ RFC 1866 — أول مواصفة رسمية، تُضيف النماذج ودعم الصور1999HTML 4.01 (توصية W3C) يُقدّم فصل CSS وسمات إمكانية الوصول وإطار البرمجة النصية2004Apple وMozilla وOpera تُشكّل WHATWG بعد رفض اتجاه W3C نحو XHTML 2.0، وتبدأ العمل على HTML52008W3C تتبنّى مسودة WHATWG HTML5، مُضيفةً canvas وvideo وaudio والعناصر الدلالية2014HTML5 يُنشر كتوصية W3C في 28 أكتوبر، مُرسّخاً الويب الدلالي وقدرات الوسائط المتعددة2019W3C وWHATWG توقّعان اتفاقية في 28 مايو: المعيار الحي HTML Living Standard يصبح المواصفة الرسمية الوحيدة
التحقق من HTML وفق المعيار الحي أخرى
html5validator --root ./public --also-check-css --log INFO

يُشغّل Nu Html Checker (vnu.jar) على جميع ملفات HTML في دليل ./public. علامة --also-check-css تتحقق من CSS المُضمّن والمُرتبط. يُرجع كود خروج غير صفري عند الأخطاء، مناسب لخطوط CI/CD.

إصلاح وإعادة تنسيق HTML مشوّه باستخدام Tidy أخرى
tidy -q -m -utf8 --wrap 0 --indent auto page.html

يُصلح HTML Tidy الأخطاء البنيوية (وسوم غير مُغلقة، تداخل غير صحيح)، ويُحوّل الترميز إلى UTF-8، ويُعيد التنسيق بمسافات بادئة متسقة. علامة -m تُعدّل الملف في مكانه.

تحويل HTML إلى Markdown باستخدام Pandoc أخرى
pandoc -f html -t gfm --wrap=none -o output.md input.html

يستخرج المحتوى المُهيكل من ملف HTML ويُحوّله إلى GitHub Flavored Markdown. علامة --wrap=none تمنع Pandoc من إدراج فواصل أسطر صلبة.

جلب وفحص ترويسات HTTP لصفحة HTML أخرى
curl -sI https://example.com | head -15

يسترد ترويسات استجابة HTTP فقط من URL، ويعرض Content-Type والترميز وتوجيهات التخزين المؤقت وترويسات الأمان (CSP وX-Frame-Options) بدون تحميل محتوى الصفحة.

تصغير HTML للنشر الإنتاجي أخرى
npx html-minifier-terser --collapse-whitespace --remove-comments --minify-css true --minify-js true -o output.html input.html

يُزيل التعليقات ويطوي المسافات البيضاء ويُصغّر CSS وJavaScript المُضمّنين في مرور واحد. يُقلّل حجم الملف للنشر الإنتاجي بدون تغيير المخرجات المعروضة.

التحويل غير متاح حالياً. عرض HTML إلى PDF يتطلب محرك متصفح — ميزة مخططة لتحديث مستقبلي.

عالي

نقاط الضعف

  • البرمجة عبر المواقع (XSS): JavaScript خبيث يُحقن عبر مدخلات مستخدم غير مُنقّاة في innerHTML أو href أو src أو سمات معالجات الأحداث. أكثر ثغرات الويب انتشاراً، مُصنّفة في OWASP Top 10 منذ إنشائه.
  • اختطاف النقرات عبر iframe: إطار iframe شفاف أو مُتنكّر يُغطّي عناصر واجهة مشروعة، يخدع المستخدمين للنقر على أزرار مخفية — تفويض مدفوعات أو تغيير إعدادات بدون علمهم.
  • حقن HTML / نماذج تصيّد: نماذج تسجيل دخول مزيفة تُحقن في صفحات مشروعة عبر XSS مُخزّن أو HTML بريد إلكتروني، لا يمكن تمييزها بصرياً عن مكونات واجهة حقيقية.
  • حقن السكريبت عبر معالجات الأحداث: سمات HTML مثل onload وonerror وonmouseover تُنفّذ JavaScript عشوائياً بدون الحاجة لوسم <script>. تتجاوز أدوات التنقية التي تُرشّح عناصر script فقط.

الحماية: FileDex يُعالج ملفات HTML بالكامل داخل بيئة المتصفح المحلية — بدون رفع ملفات إلى خوادم، بدون تحميل موارد خارجية، وبدون تنفيذ سكريبتات من الملفات المُحلّلة. ترويسات Content Security Policy تُقيّد تنفيذ السكريبتات المضمّنة.

VS Code أداة
محرر Microsoft مفتوح المصدر مع IntelliSense مدمج لـ HTML وتوسعة اختصارات Emmet وإضافة Live Server للمعاينة الحية
HTML Tidy أداة
أداة سطر أوامر لتنظيف وإصلاح وإعادة تنسيق مستندات HTML المشوّهة، يُصانها مجتمع HTACG
Pandoc أداة
محوّل مستندات عالمي يدعم التحويل من HTML إلى Markdown وDOCX وPDF وLaTeX وعشرات الصيغ الأخرى
htmlparser2 مكتبة
محلل HTML وXML سريع ومتسامح لـ Node.js مع دعم البث وواجهات أحداث DOM/SAX
Beautiful Soup مكتبة
مكتبة Python لتحليل HTML واستخراج البيانات من صفحات الويب، تُستخدم على نطاق واسع في استخراج بيانات الويب
DOMPurify مكتبة
مُنقّي XSS لـ HTML وMathML وSVG يُزيل المحتوى الخطير مع الحفاظ على الترميز الآمن
مُدقق HTML رسمي من W3C/WHATWG يفحص المستندات وفق المعيار الحي HTML Living Standard
المواصفة الرسمية الوحيدة لـ HTML، تُصانها WHATWG باستمرار منذ اتفاقية W3C عام 2019 بدون أرقام إصدارات