٪۴۰ تخفیف تابستانه شروع شد! بزرگترین حراج سال ما

به ما بپیوندید

آموزش کد گذاری HTML (مجموعه کاراکترها)

برای نمایش صحیح یک صفحه HTML ، یک مرورگر وب باید بداند از کدام کاراکتر استفاده می کند. از ASCII تا UTF-8 ASCII اولین استاندارد رمزگذاری کاراکتر بود. ASCII 128 نویسه مختلف را که می توان در اینترنت استفاده کرد تعریف…

محمد یوسفی

1 جولای 2021

برای نمایش صحیح یک صفحه HTML ، یک مرورگر وب باید بداند از کدام کاراکتر استفاده می کند.


از ASCII تا UTF-8

ASCII اولین استاندارد رمزگذاری کاراکتر بود. ASCII 128 نویسه مختلف را که می توان در اینترنت استفاده کرد تعریف کرد: اعداد (0-9) ، حروف انگلیسی (AZ) و برخی از نویسه های خاص مانند! $ + – () @ <>.

ISO-8859-1 مجموعه نویسه پیش فرض برای HTML 4 بود. این مجموعه کاراکتر از 256 کد نویسه مختلف پشتیبانی می کند. HTML 4 همچنین از UTF-8 پشتیبانی می کند.

ANSI (ویندوز -1252) مجموعه اصلی کاراکترهای ویندوز بود. ANSI با ISO-8859-1 یکسان است ، با این تفاوت که ANSI دارای 32 نویسه اضافی است.

مشخصات HTML5 توسعه دهندگان وب را به استفاده از مجموعه کاراکترهای UTF-8 تشویق می کند ، که تقریباً همه شخصیت ها و نمادهای جهان را پوشش می دهد!


ویژگی کاراکتر HTML

برای نمایش صحیح یک صفحه HTML ، یک مرورگر وب باید مجموعه کاراکترهای استفاده شده در صفحه را بداند.

این در <meta>برچسب مشخص شده است :

<meta charset="UTF-8">

تفاوت بین مجموعه کاراکترها

جدول زیر تفاوت بین مجموعه کاراکترهای توضیح داده شده در بالا را نشان می دهد:


مجموعه کاراکترهای ASCII

ASCII از مقادیر 0 تا 31 (و 127) برای نویسه های کنترل استفاده می کند.

ASCII از مقادیر 32 تا 126 برای حروف ، ارقام و نمادها استفاده می کند.

ASCII از مقادیر 128 تا 255 استفاده نمی کند.


مجموعه کاراکترهای ANSI (Windows-1252)

ANSI برای مقادیر 0 تا 127 با ASCII یکسان است.

ANSI مجموعه ای اختصاصی از نویسه ها برای مقادیر 128 تا 159 دارد.

ANSI برای مقادیر 160 تا 255 با UTF-8 یکسان است.


مجموعه کاراکترهای ISO-8859-1

ISO-8859-1 برای مقادیر 0 تا 127 با ASCII یکسان است.

ISO-8859-1 از مقادیر 128 تا 159 استفاده نمی کند.

ISO-8859-1 برای مقادیر 160 تا 255 با UTF-8 یکسان است.


مجموعه کاراکترهای UTF-8

UTF-8 برای مقادیر 0 تا 127 با ASCII یکسان است.

UTF-8 از مقادیر 128 تا 159 استفاده نمی کند.

UTF-8 برای مقادیر 160 تا 255 با ANSI و 8859-1 یکسان است.

UTF-8 با بیش از 10 000 کاراکتر متفاوت از مقدار 256 ادامه می یابد.

منبع

مطالب مرتبط

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها