Заметили, что на форуме только реально прикольные мужчины, а тухлые не приживаются здесь? Почему так?
В UTF8 все символы закодированы в Байтах (8бит), в UTF16 все символы закодированы в блоках по 16бит и в UTF32 - 32бит. Но при этом индексы символов одинаковые при любой битности. Есть правило кодирования для UTF8, UTF16 и UTF32. Если символ по индексу меньше 127, то в UTF8 он будет занимать один Байт, это латынь и всякие знаки пунктуации. Для остальных символов будет больше Байт, для этого в первом Байте пишется метка, что это символ с индексом больше 127, и дальше ещё могут быть метки, тогда будет 3 Байта и более. Может быть любое количество Байт. UTF8 сейчас везде практически стандарт, но в WinAPI часто используется UTF16. UTF16 может быть выгоднее, если много совсем редких символов, при этом в большинстве случаев для UTF8 большинство символов тоже два Байта или меньше, при том, что расходуется часть информации на метку. В UTF16 тоже используется метка, индекс может быть 32бита и более по тем же правилам как в UTF8.
UTF32 уже не надо декодировать, в нём уже 4 миллиарда индексов можно представить, столько видеопамяти даже не хватит под шрифт.
В UTF8 все символы закодированы в Байтах (8бит), в UTF16 все символы закодированы в блоках по 16бит и в UTF32 - 32бит. Но при этом индексы символов одинаковые при любой битности. Есть правило кодирования для UTF8, UTF16 и UTF32. Если символ по индексу меньше 127, то в UTF8 он будет занимать один Байт, это латынь и всякие знаки пунктуации. Для остальных символов будет больше Байт, для этого в первом Байте пишется метка, что это символ с индексом больше 127, и дальше ещё могут быть метки, тогда будет 3 Байта и более. Может быть любое количество Байт. UTF8 сейчас везде практически стандарт, но в WinAPI часто используется UTF16. UTF16 может быть выгоднее, если много совсем редких символов, при этом в большинстве случаев для UTF8 большинство символов тоже два Байта или меньше, при том, что расходуется часть информации на метку. В UTF16 тоже используется метка, индекс может быть 32бита и более по тем же правилам как в UTF8.
UTF32 уже не надо декодировать, в нём уже 4 миллиарда индексов можно представить, столько видеопамяти даже не хватит под шрифт.
Зачем ты мне копипастишь определение? Сколько бит занимает А на латинице и сколько на кириллице?
В UTF8 все символы закодированы в Байтах (8бит), в UTF16 все символы закодированы в блоках по 16бит и в UTF32 - 32бит. Но при этом индексы символов одинаковые при любой битности. Есть правило кодирования для UTF8, UTF16 и UTF32. Если символ по индексу меньше 127, то в UTF8 он будет занимать один Байт, это латынь и всякие знаки пунктуации. Для остальных символов будет больше Байт, для этого в первом Байте пишется метка, что это символ с индексом больше 127, и дальше ещё могут быть метки, тогда будет 3 Байта и более. Может быть любое количество Байт. UTF8 сейчас везде практически стандарт, но в WinAPI часто используется UTF16. UTF16 может быть выгоднее, если много совсем редких символов, при этом в большинстве случаев для UTF8 большинство символов тоже два Байта или меньше, при том, что расходуется часть информации на метку. В UTF16 тоже используется метка, индекс может быть 32бита и более по тем же правилам как в UTF8.
UTF32 уже не надо декодировать, в нём уже 4 миллиарда индексов можно представить, столько видеопамяти даже не хватит под шрифт.
***.)
дррочер на вуман с 10 летним стажем снова разродился простыней
В UTF8 все символы закодированы в Байтах (8бит), в UTF16 все символы закодированы в блоках по 16бит и в UTF32 - 32бит. Но при этом индексы символов одинаковые при любой битности. Есть правило кодирования для UTF8, UTF16 и UTF32. Если символ по индексу меньше 127, то в UTF8 он будет занимать один Байт, это латынь и всякие знаки пунктуации. Для остальных символов будет больше Байт, для этого в первом Байте пишется метка, что это символ с индексом больше 127, и дальше ещё могут быть метки, тогда будет 3 Байта и более. Может быть любое количество Байт. UTF8 сейчас везде практически стандарт, но в WinAPI часто используется UTF16. UTF16 может быть выгоднее, если много совсем редких символов, при этом в большинстве случаев для UTF8 большинство символов тоже два Байта или меньше, при том, что расходуется часть информации на метку. В UTF16 тоже используется метка, индекс может быть 32бита и более по тем же правилам как в UTF8.
UTF32 уже не надо декодировать, в нём уже 4 миллиарда индексов можно представить, столько видеопамяти даже не хватит под шрифт.
Дополз Анатолич до Википедии, вынув пэнис наконец то из бабы, слава те госсподи!