Revision 53224863 of "Кракозябры" on ruwiki{{refimprove|date=февраль 2009}}
'''Кракозя́бры''' ('''крякозя́бры''') — [[жаргон]]изм, обозначающий [[Абсурд|бессмысленный]] с точки зрения читателя набор [[символ]]ов, чаще всего получаемый на компьютере в результате неправильного перекодирования осмысленного текста. В единственном числе — вообще любой компьютерный символ, для которого в [[русский язык|русском языке]] нет общеизвестного названия, например, значок [[@]].
Чаще всего кракозябры образуются на выводе программ по причине неправильно настроенной кодировки символов, а также из-за использования неподходящего шрифта.
По-японски явление, аналогичное кракозябрам, называется ''модзибакэ'' ({{lang-jp|文字化け}} «искаженные символы»), а по-китайски — ''луаньма'' ({{lang-zh|乱码}} «мешанина из знаков»). Болгары называют этот эффект ''маймуница'' («обезьянья азбука»), сербы — ''ђубре'' («мусор»), немцы — ''Buchstabensalat'' («салат из букв») и ''Krähenfüße'' («вороньи лапки»), поляки — ''krzaki'' («знаки китайского письма; помехи видные в телевизоре, когда нет сигнала», буквально «кусты»).
== История ==
В [[1980-е]] и [[1990-е]] пользователи компьютеров и с [[1990]] г. — пользователи [[Рунет|русскоязычной части интернета]] вынуждены были мириться с существованием нескольких конкурирующих [[кодировка|кодировок]] [[кириллица|кириллицы]]: основная — ГОСТ, альтернативная — [[DOS 866]] (Unix [[KOI8-R]], Windows [[CP-1251]], [[ISO 8859-5]]), [[MacCyrillic]]. В результате неправильной конфигурации серверов и недостаточной совместимости тексты очень часто было невозможно прочесть. Получая сообщения по электронной почте или зайдя на [[веб-сайт]], неопытные пользователи могли наткнуться на странные необычные символы вместо букв кириллицы.
Несмотря на всё более широкое распространение [[Юникод]]а, феномен кракозябр иногда встречается и сегодня. Есть возможность получить неадекватные символы при использовании неправильных шрифтов при печати на [[принтер]]е или [[фотонаборный автомат|фотонаборном автомате]], неверно настроенной локали программы (когда вместо кодовой страницы CP1251 используется CP1252).
При использовании UTF-8 всё равно остаётся риск получить кракозябры при выводе текста по HTTP: если кодировка нигде не указана, RFC 2616 даёт значение по умолчанию — ISO-8859-1<ref>[http://tools.ietf.org/html/rfc2616#section-3.7.1 RFC 2616 — Hypertext Transfer Protocol — HTTP/1.1<!-- Заголовок добавлен ботом -->]</ref>.
== Эквивалентные варианты ==
{{нет источников в разделе|дата=2012-02-03}}
[[Файл:Letter_to_Russia_with_krokozyabry.jpg|thumb|280px|Кракозябры на бандероли, написанные от руки и исправленные почтовым служащим перед доставкой]]
Жаргонизм не имеет на сегодняшний день устоявшейся формы. Существуют множество конкурирующих вариаций. Вот некоторые из них:
* [[абракадабра]]
* абраказябры
* бнопня
* боржоми {{нет АИ|3|02|2012}}
* ёгрики
* зюквы
* зюки
* калябушки
* каракули {{нет АИ|3|02|2012}}
* квакозябры
* козюбрики
* козяблики
* козябры
* кракозябли
* кракозяблы
* кракосямбы
* крокозяблики
* крокозяблы
* крокозябры
* крюкозяблы
* крюкозябры
* крякозяблики
* крякозябры
* птичий язык
Название «бнопня» (или, более точно, «бНОПНЯ») напрямую происходит от явления неправильной настройки кодировок в почтовых программах. Так выглядит слово «Вопрос», преобразованное из кодировки [[CP1251]] в [[KOI8-R]]. По слову «бНОПНЯ» опытные пользователи сразу определяли новичков, задававших вопрос по настройке кодировки.
== Примеры ==
Для примера использована [[панграмма]] (без кавычек): «Широкая электрификация южных губерний даст мощный толчок подъёму сельского хозяйства».
{| class="wikitable"
!Исходная кодировка!!При декодировании воспринято как!!Результат
|-
|colspan="2" style="text-align:center;" | При воспроизведении применяется та же кодировка, что и при создании текста. || Широкая электрификация южных губерний даст мощный толчок подъёму сельского хозяйства.
|-
|rowspan="4"| [[Windows-1251]] || [[Windows-1252]] или <br />[[ISO 8859-1]]<ref name="w1252">Кодовая таблица ISO 8859-1 отличается лишь отсутствием ряда изображённых символов. В системе [[Microsoft Windows]] вместо кодовой страницы ISO 8859-1 применяется её расширение Windows-1252.</ref> || <nowiki>Øèðîêàÿ ýëåêòðèôèêàöèÿ þæíûõ ãóáåðíèé äàñò ìîùíûé òîë÷îê ïîäú¸ìó ñåëüñêîãî õîçÿéñòâà.</nowiki>
|-
| [[КОИ-8|KOI8-R]] || <nowiki>ьХПНЙЮЪ ЩКЕЙРПХТХЙЮЖХЪ ЧФМШУ ЦСАЕПМХИ ДЮЯР ЛНЫМШИ РНКВНЙ ОНДЗ╦ЛС ЯЕКЭЯЙНЦН УНГЪИЯРБЮ.</nowiki>
|-
| [[ISO 8859-5]] || <nowiki>иш№юърџ §ыхъђ№шєшърішџ ўцэћѕ уѓсх№эшщ фрёђ ьюљэћщ ђюыїюъ яюфњИьѓ ёхыќёъюую ѕючџщёђтр.</nowiki>
|-
| [[Альтернативная кодировка|CP 866]] || <nowiki>╪шЁюър ¤ыхъЄЁшЇшърЎш ■цэ√ї уєсхЁэшщ фрёЄ ью∙э√щ Єюыўюъ яюф·╕ьє ёхы№ёъюую їюч щёЄтр.</nowiki>
|-
|rowspan="5"| [[КОИ-8|KOI8-R]] || [[Windows-1252]] или <br />[[ISO 8859-1]]<ref name="w1252"/> || <nowiki>ûÉÒÏËÁÑ ÜÌÅËÔÒÉÆÉËÁÃÉÑ ÀÖÎÙÈ ÇÕÂÅÒÎÉÊ ÄÁÓÔ ÍÏÝÎÙÊ ÔÏÌÞÏË ÐÏÄߣÍÕ ÓÅÌØÓËÏÇÏ ÈÏÚÑÊÓÔ×Á.</nowiki>
|-
| [[Windows-1251]] || <nowiki>ыЙТПЛБС ЬМЕЛФТЙЖЙЛБГЙС АЦОЩИ ЗХВЕТОЙК ДБУФ НПЭОЩК ФПМЮПЛ РПДЯЈНХ УЕМШУЛПЗП ИПЪСКУФЧБ.</nowiki>
|-
| [[ISO 8859-5]] || <nowiki>ћЩвЯЫСб мЬХЫдвЩЦЩЫСУЩб РжЮйШ ЧеТХвЮЩЪ ФСгд ЭЯнЮйЪ дЯЬоЯЫ аЯФпЃЭе гХЬигЫЯЧЯ ШЯкбЪгдзС.</nowiki>
|-
| [[Альтернативная кодировка|CP 866]] || <nowiki>√╔╥╧╦┴╤ ▄╠┼╦╘╥╔╞╔╦┴├╔╤ └╓╬┘╚ ╟╒┬┼╥╬╔╩ ─┴╙╘ ═╧▌╬┘╩ ╘╧╠▐╧╦ ╨╧─▀г═╒ ╙┼╠╪╙╦╧╟╧ ╚╧┌╤╩╙╘╫┴.</nowiki>
|-
| [[КОИ-7|7 бит]] || <nowiki>{IROKAQ \LEKTRIFIKACIQ @VNYH GUBERNIJ DAST MO]NYJ TOL^OK POD_#MU SELXSKOGO HOZQJSTWA.</nowiki>
|-
|rowspan="4"| [[ISO 8859-5]] || [[Windows-1252]] или <br />[[ISO 8859-1]]<ref name="w1252"/> || <nowiki>ÈØàÞÚÐï íÛÕÚâàØäØÚÐæØï îÖÝëå ÓãÑÕàÝØÙ ÔÐáâ ÜÞéÝëÙ âÞÛçÞÚ ßÞÔêñÜã áÕÛìáÚÞÓÞ åÞ×ïÙáâÒÐ.</nowiki>
|-
| [[Windows-1251]] || <nowiki>ИШаЮЪРп нЫХЪваШдШЪРжШп оЦЭле УгСХаЭШЩ ФРбв ЬЮйЭлЩ вЮЫзЮЪ ЯЮФксЬг бХЫмбЪЮУЮ еЮЧпЩбвТР.</nowiki>
|-
| [[КОИ-8|KOI8-R]] || <nowiki>хьЮчзпО МшузБЮьДьзпФьО НжщКЕ сЦяуЮщьы тпАБ эчИщКы БчшГчз ъчтЙЯэЦ АушЛАзчсч ЕчвОыАБрп.</nowiki>
|-
| [[Альтернативная кодировка|CP 866]] || <nowiki>╚╪р▐┌╨я э█╒┌тр╪ф╪┌╨ц╪я ю╓▌ых ╙у╤╒р▌╪┘ ╘╨ст ▄▐щ▌ы┘ т▐█ч▐┌ ▀▐╘ъё▄у с╒█ьс┌▐╙▐ х▐╫я┘ст╥╨.</nowiki>
|-
|rowspan="5"| [[Альтернативная кодировка|CP 866]] || [[Windows-1252]]<ref name="w1252"/> || <nowiki>˜¨à®ª ï í«¥ªâà¨ä¨ª æ¨ï î¦ëå £ã¡¥à¨© ¤ áâ ¬®éë© â®«ç®ª ¯®¤êñ¬ã ᥫì᪮£® å®§ï©á⢠.</nowiki>
|-
| [[Windows-1251]] || <nowiki>�Ёа®Є п н«ҐЄваЁдЁЄ жЁп о¦ле ЈгЎҐаЁ© ¤ бв ¬®йл© в®«з®Є Ї®¤кс¬г ᥫмбЄ®Ј® е®§п©бвў .</nowiki>
|-
| [[КОИ-8|KOI8-R]] || <nowiki>≤╗Ю╝╙═О М╚╔╙БЮ╗Д╗╙═Ф╗О Н╕╜КЕ ёЦ║╔Ю╜╗╘ ╓═АБ ╛╝И╜К╘ Б╝╚Г╝╙ ╞╝╓ЙЯ╛Ц А╔╚ЛА╙╝ё╝ Е╝╖О╘АБ╒═.</nowiki>
|-
| [[ISO 8859-5]] || <nowiki>�ЈрЎЊ я эЋЅЊтрЈфЈЊ цЈя юІых ЃуЁЅрЈЉ Є ст ЌЎщыЉ тЎЋчЎЊ ЏЎЄъёЌу сЅЋьсЊЎЃЎ хЎЇяЉстЂ .</nowiki>
|-
| [[CP437|CP 437]] || <nowiki>ÿ¿α«¬á∩ φ½Ñ¬Γα¿Σ¿¬áµ¿∩ δσ úπíÑα¡¿⌐ ñáßΓ ¼«Θ¡δ⌐ Γ«½τ«¬ »«ñΩ±¼π ßѽ∞߬«ú« σ«º∩⌐ßΓóá.</nowiki>
|-
|rowspan="5"| [[UTF-8]]<ref>
Варианты ''декодирования'' в UTF-8 не приводятся, так как бо́льшая часть русского текста, записанного в [[кодовая страница|8-битной кодовой странице]], будет сочтена ошибочной (не имеющей представления).</ref>
| [[Windows-1252]]<ref name="w1252"/> || <nowiki>Ð¨Ð¸Ñ€Ð¾ÐºÐ°Ñ ÑÐ»ÐµÐºÑ‚Ñ€Ð¸Ñ„Ð¸ÐºÐ°Ñ†Ð¸Ñ ÑŽÐ¶Ð½Ñ‹Ñ… губерний даÑÑ‚ мощный толчок подъёму ÑельÑкого хозÑйÑтва.</nowiki>
|-
| [[Windows-1251]] || <nowiki>Широкая электрификация южных губерний даст мощный толчок подъёму сельского хозяйства.</nowiki>
|-
| [[КОИ-8|KOI8-R]] || <nowiki>п╗п╦я─п╬п╨п╟я▐ я█п╩п╣п╨я┌я─п╦я└п╦п╨п╟я├п╦я▐ я▌п╤п╫я▀я┘ пЁя┐п╠п╣я─п╫п╦п╧ п╢п╟я│я┌ п╪п╬я┴п╫я▀п╧ я┌п╬п╩я┤п╬п╨ п©п╬п╢я┼я▒п╪я┐ я│п╣п╩я▄я│п╨п╬пЁп╬ я┘п╬п╥я▐п╧я│я┌п╡п╟.</nowiki>
|-
| [[ISO 8859-5]] || <nowiki>аЈаИб�аОаКаАб� б�аЛаЕаКб�б�аИб�аИаКаАб�аИб� б�аЖаНб�б� аГб�аБаЕб�аНаИаЙ аДаАб�б� аМаОб�аНб�аЙ б�аОаЛб�аОаК аПаОаДб�б�аМб� б�аЕаЛб�б�аКаОаГаО б�аОаЗб�аЙб�б�аВаА.</nowiki>
|-
| [[Альтернативная кодировка|CP 866]] || <nowiki>╨и╨╕╤А╨╛╨║╨░╤П ╤Н╨╗╨╡╨║╤В╤А╨╕╤Д╨╕╨║╨░╤Ж╨╕╤П ╤О╨╢╨╜╤Л╤Е ╨│╤Г╨▒╨╡╤А╨╜╨╕╨╣ ╨┤╨░╤Б╤В ╨╝╨╛╤Й╨╜╤Л╨╣ ╤В╨╛╨╗╤З╨╛╨║ ╨┐╨╛╨┤╤К╤С╨╝╤Г ╤Б╨╡╨╗╤М╤Б╨║╨╛╨│╨╛ ╤Е╨╛╨╖╤П╨╣╤Б╤В╨▓╨░.</nowiki>
|-
|rowspan="1"| [[UTF-16]]
| [[Альтернативная кодировка|CP 866]] || <nowiki>(♦8♦@♦>♦:♦0♦O♦ M♦;♦5♦:♦B♦@♦8♦D♦8♦:♦0♦F♦8♦O♦ N♦6♦=♦K♦E♦ 3♦C♦1♦5♦@♦=♦8♦9♦ 4♦0♦A♦B♦ <♦>♦I♦=♦K♦9♦ B♦>♦;♦G♦>♦:♦ ?♦>♦4♦J♦Q♦<♦C♦ A♦5♦;♦L♦A♦:♦>♦3♦>♦ E♦>♦7♦O♦9♦A♦B♦2♦0♦.
</nowiki>
|}
== Перекодировка ==
Для восстановления текста (и для перекодировки) в [[POSIX|POSIX-совместимых]] системах можно использовать утилиту [[iconv]], например:
<syntaxhighlight lang="bash">
iconv -c -f cp1251 -t cp1252 source.txt > target.txt
</syntaxhighlight>
Если возможности применить [[iconv]] нет, следует открыть текстовый [[файл]] с неизвестной кодировкой с помощью любого популярного [[браузер]]а, в котором доступно ручное указание кодировки (обычно: ''Вид — кодировка — …'' в верхнем меню, либо в контекстном меню). Позже, когда методом перебора удастся получить читаемый текст, его можно скопировать в текстовой редактор и сохранить в нужной кодировке. Также существует множество утилит, позволяющих ручное (с выбором пары кодировок) или автоматическое (вплоть до нескольких уровней глубины) перекодирование текста, например, для Windows, TotalRecode или «[[Штирлиц (программа)|Штирлиц]]».
Перекодировка с целью восстановления исходного текста не всегда возможна. Например, уже при двукратной перекодировке, произошедшей, к примеру, при передаче сообщения через несколько неверно настроенных почтовых серверов, может произойти необратимая потеря информации, так как определённые различные символы исходного текста при определённых условиях могут замениться на другие, но одинаковые неправильные символы, и восстановить такое сообщение невозможно, даже если знать, какие перекодировки и в каком порядке были произведены.
== Другие искажения, связанные с перекодировкой ==
Нередко бывает, что перекодировка осуществляется в правильном направлении, но сам перекодировщик работает не совсем корректно. Например, некоторые программы-перекодировщики преобразуют только базовые русские буквы, а все остальные символы оставляют на месте. В итоге при перекодировке KOI8-R → Windows-1251 буква '''ё''' превращается в '''Ј''' (сербская буква), значок градуса (°) превращается в '''њ''' и т. д. (такие тексты в изобилии встречаются в Интернете, достаточно поискать слова «всЈ» или «њС»).
Другой вариант искажений связан с тем, что в целевой кодировке могут отсутствовать символы, имеющиеся в исходной кодировке. В этом случае отсутствующие символы могут просто выбрасываться, заменяться на символ-заменитель (часто знак вопроса — ?, иногда [[Заменяющий символ|�]]) или же заменяться на похожие символы из [[ASCII]] (например, знак минуса (<code>U+2212</code>, −) может заменяться на простой дефис (<code>U+002D</code>, -), буква '''š''' может заменяться на '''s''' и т. д. В случае [[текстовые данные|простого текста]] такие потери информации неизбежны, однако, если преобразованию подвергается файл HTML или XML, то корректным преобразованием будет замена отсутствующих в целевой кодировке символов на соответствующие [[Кодировки символов в HTML#Мнемоники HTML и коды Unicode|мнемоники HTML]]: например, знак минуса должен заменяться на <code>&minus;</code> или <code>&#8722;</code> буква '''š''' должна заменяться на <code>&scaron;</code> или <code>&#353;</code> и т. д.
== Этимология ==
Происхождение слова неизвестно. В народной этимологии приводится аналогия с детскими каракулями (гибрид крокодила и зебры), а также производное от английского глагола «to crack» — ломать, крушить.
== В культуре ==
В [[1997]] г. московское издательство «[[АРГО-РИСК]]» выпустило сборник рассказов «Проблемы с кодировкой» (составитель [[Кузьмин, Дмитрий Владимирович|Д. Кузьмин]]), в котором «все тексты напечатаны не поддающимимся прочтению наборами букв или иных знаков, возникающими обыкновенно при конвертировании текста из одной компьютерной программы в другую как следствие некорректной перекодировки»; в книгу вошли рассказы [[Николай Байтов|Николая Байтова]], [[Курицын, Вячеслав Николаевич|Вячеслава Курицына]], [[Тучков, Владимир Яковлевич|Владимира Тучкова]], [[Жуков, Игорь Аркадьевич|Игоря Жукова]], Максима Скворцова и [[Давыдов, Данила Михайлович|Данилы Давыдова]]<ref>[http://www.vavilon.ru/lit/books97.html Коротко о новых книгах. 1997] // «[[Литературная жизнь Москвы]]»</ref>. По мнению [[Суховей, Дарья Алексеевна|Д. Суховей]], «таким акционным жестом издатели, вероятно, стремились привлечь внимание к новым эффектам, возникающими в результате „компьютеризации“ литературы»<ref>[http://magazines.russ.ru/nlo/2003/62/suhovei.html Д. Суховей. Круги компьютерного рая] // «Новое литературное обозрение», № 62, 2003.</ref>.
== См. также ==
* [[Буква зю]]
== Примечания ==
{{примечания}}
== Ссылки ==
{{викисловарь|крокозябра}}
* [http://www.artlebedev.ru/tools/decoder Почтовый декодер] [[Студия Артемия Лебедева|Студии Артемия Лебедева]]
* [http://2cyr.com/decode/?lang=ru Универсальный декодер кириллицы]
* [http://www.online-decoder.com/ru Онлайн декодер]
{{Кодировки символов}}
[[Категория:Ошибки программирования]]
[[Категория:Компьютерный сленг]]
[[Категория:Рунет]]All content in the above text box is licensed under the Creative Commons Attribution-ShareAlike license Version 4 and was originally sourced from https://ru.wikipedia.org/w/index.php?oldid=53224863.
![]() ![]() This site is not affiliated with or endorsed in any way by the Wikimedia Foundation or any of its affiliates. In fact, we fucking despise them.
|