Kernel panic

Kernel panic (с англ. — «тревога, сбой в ядре», дословно паника ядра) — сообщение о критической ошибке ядра операционной системы, после которой операционная система не может продолжать дальнейшую работу^[1].

Обычно этот термин применяется в среде операционных систем типа UNIX. Её имя связано с текстом ошибки вида «Kernel panic: …» и именем функции ядра panic() из оригинальной ОС UNIX^[2].

Kernel panic возможен на Android, который базируется на ядре Linux, и в самих Linux-системах. Поскольку Mac OS X и iOS базируются на Darwin, являющейся подсемейством UNIX-систем, они также подвержены kernel panic.^[3].

История править

Кен Томпсон и Деннис Ритчи, создатели UNIX и концепции kernel panic.

История Kernel panic тесно связана с историей операционной системы UNIX, которая была разработана в конце 1960-х годов сотрудниками Bell Labs, — в первую очередь Кеном Томпсоном, Деннисом Ритчи и Дугласом Макилроем.

Сообщение Kernel panic было введено в ранних версиях UNIX и представляло собой важное отличие в философии этой операционной системы от Multics — главного конкурента на то время и предшественника UNIX. Multics был разработан для работы на 36-битном мейнфрейме GE-645, в то время как UNIX разрабатывался для гораздо менее мощного 18-битного мини-компьютера PDP-7 и по этой причине UNIX было доступно меньше ресурсов, что привело к необходимости их экономии, в том числе и при обработке ошибок. Разработчик Multics Том ван Влек так описывает это изменение в дискуссии с разработчиком UNIX Деннисом Ритчи^[4]:

Я сказал Деннису, что примерно половина кода, который я написал для Multics, была кодом обработки ошибок. Он ответил: «Мы всё это отбросили. Если произошла ошибка, у нас есть процедура под названием panic, и если она вызвана, компьютер зависает и вы кричите: „Эй, перезапустите его!“».

Оригинальный текст (англ.)

I remarked to Dennis that easily half the code I was writing in Multics was error recovery code. He said, «We left all that stuff out. If there’s an error, we have this routine called panic, and when it is called, the machine crashes, and you holler down the hall, ‘Hey, reboot it.’

Изначальная функция panic() принципиально не менялась от UNIX V5 до базирующихся на VAX систем 32V и выводила только сообщение об ошибке без дополнительной информации, после чего система переводилась в бесконечный пустой цикл. Позже — в процессе развития UNIX — функция panic() была доработана и стала выводить на терминал разнообразную информацию, необходимую для отладки.

Подобный принцип обработки критических ошибок был перенят большинством более поздних операционных систем, например Mac OS^[3] или Microsoft Windows^[5].

Причины Kernel panic править

Сообщение об аппаратной ошибке и Kernel panic.

Одной из самых распространённых причин kernel panic является невозможность найти и смонтировать корневую файловую систему. Часто это ошибка конфигурации, которая может быть исправлена при перезагрузке ядра вручную^[6].

В Linux возникновению паники ядра зачастую предшествует состояние под названием «oops». В ряде случаев «oops» может приводить к такому же неработоспособному состоянию системы, как и паника ядра^[1].

В большинстве остальных случаев причиной Kernel panic является критическая аппаратная ошибка (отказ оперативной памяти, ошибка процессора, материнской платы, видеокарты или иного критически важного устройства) или ошибка в самом ядре ОС (например, попытка обращения к неверному или запрещённому адресу в памяти). Также причиной для Kernel panic могут быть ошибки в драйверах аппаратных (в частности периферийных) устройств или ошибки в файловой системе^[3]^[7]. Во время финальной стадии инициализации пространства пользователя kernel panic обычно возникает тогда, когда не удаётся запустить init, так как, несмотря на запущенное и работоспособное ядро, сама система все ещё остаётся в нерабочем состоянии^[8].

Kernel panic может быть вызван и прикладной программой, если та некорректно работает с ядром. Так в 2012 году ошибка в Google Chrome вызывала Kernel panic в Mac OS X^[9].

Исходный код функции panic() править

Исходный код функции panic() в UNIX V6^[10]:

 char    *panicstr;
 /*
  * Panic is called on unresolvable
  * fatal errors.
  * It syncs, prints "panic: mesg" and
  * then loops.
 */
 panic(s)
 char *s;
 {
 	panicstr = s;
 	update();
 	printf("panic:%s\n", s);
 	for(;;)
 		idle();
 }

Обработка Kernel panic править

В нормальном случае при возникновении Kernel panic происходит аварийная остановка (авост) работы операционной системы с выдачей сообщений об ошибках на экран, после чего система ожидает выключения или перезагрузки компьютера. Однако такой механизм обработки этого события неприемлем тогда, когда простой компьютера крайне нежелателен или человека нет рядом (например, на удалённых серверах или в нерабочее время)^[11].

В современных ОС (в частности в GNU/Linux, FreeBSD или Solaris) существует возможность изменить стандартное поведение функции panic() и производить перезагрузку компьютера автоматически. В GNU/Linux данная настройка осуществляется при помощи procfs^[11]:

echo 5 > /proc/sys/kernel/panic

Чтобы изменения действовали в GNU/Linux и после перезагрузки, необходимо добавить в файл /etc/sysctl.d/99-sysctl.conf строку:

kernel.panic=5

Значение параметра kernel.panic — количество секунд, после которых произойдёт перезагрузка. При установке отрицательного или равного 0 значения этого параметра автоматической перезагрузка не произойдёт^[11].

Также в BSD-системах есть специальная опция в ядре. Цитата из файла /usr/src/sys/conf/NOTES^[12]:

# Set the amount of time (in seconds) the system will wait before
# rebooting automatically when a kernel panic occurs. If set to (-1),
# the system will wait indefinitely until a key is pressed on the
# console.
options PANIC_REBOOT_WAIT_TIME=16

В Solaris автоматическая перезагрузка после Kernel panic является стандартным поведением системы^[13].

Перезагрузка после Kernel panic имеет и очень серьёзный недостаток, особенно если это изменение не пропадает после первой перезагрузки. В случае, если перезагрузка не устраняет ошибку, вызывавшую Kernel panic, система будет останавливаться и перезапускаться вновь и вновь, что может привести к аппаратным ошибкам или потерям данных^[6]. В случае если такая ситуация возникла после сборки нового ядра, решением проблемы может стать загрузка сохранённой копии старого работающего ядра. Как правило, для этого достаточно вручную указать при загрузке путь к работоспособной копии ядра^[14].

Для изучения причины паники ядра Linux может пригодиться файл System.map^[15].

Kernel panic в различных операционных системах править

Kernel panic в Mac OS X версии 10.6 и ниже.

Изначально сообщение о Kernel panic ограничивалось коротким текстом о необходимости перезагрузки системы. В современных системах обычно выдается больше дополнительной информации.

GNU/Linux и большинство других UNIX-совместимых операционных систем создают лог с описанием ошибки и выводят на экран сообщение об ошибке, содержащее информацию, необходимую для отладки и поиска причин этой ошибки. Этот механизм носит название Linux oops. В современных дистрибутивах Linux используется графический сервер X Window, и Kernel panic не приводит к переключению на физическую консоль, на которую выводятся диагностические сообщения. Распознать Kernel panic можно по мигающим светодиодам Caps Lock и Scroll Lock на клавиатуре^[16].
В изначальных версиях Mac OS X (от 10.0 до 10.0.1.5) по аналогии с операционными системами, базирующимися на ядре Linux, на экран выводилась информация о произошедшей ошибке, после чего система останавливалась. Начиная с версии Mac OS X 10.2 это сообщение было упрощено и указывает лишь на необходимость перезапустить компьютер на четырёх языках (английском, немецком, французском и японском) вне зависимости от языковой версии операционной системы^[3]^[17]. Однако OS X позволяет^[17] заменить изображение на любое другое, что дает возможность разработчикам показывать изменённые сообщения об ошибках в различных ситуациях^[17]. Благодаря этой возможности на OS X возможно даже симулировать синий экран смерти операционной системы Windows, заменив стандартное изображение скриншотом соответствующего изображения Windows^[17].

В не-UNIX операционных системах править

В то время как термин Kernel panic употребляется в основном для UNIX-совместимых операционных систем, в других операционных системах обработка критических ошибок методом остановки системы тоже прижилась и получила следующие названия:

В большинстве версий Microsoft Windows система останавливается с выдачей голубого экрана с кратким описанием ошибки^[5], который получил название синий экран смерти. В операционной системе Windows XP при возникновении ошибки компьютер перезагружается автоматически. Это поведение системы управляется через панель управления Windows. Если ошибка происходит при загрузке ОС, изменить поведение системы можно через меню кнопки F8^[5].
В старых компьютерах Macintosh: Sad Mac (аппаратная ошибка при запуске системы)^[18], Bomb^[en] (для ошибок программ или операционной системы)^[19].
На компьютерах Amiga в AmigaOS до 2.04 этот механизм назывался Guru Meditation и работал аналогично Kernel panic в Unix^[20]. В последующих версиях текст «Guru meditation» был удалён из сообщения об ошибке^[20].

См. также править

Примечания править

↑ ¹ ² Kirkland, Tinker, 2006, p. 51.
↑ Информация о функции panic() на сайте UNIX.com (неопр.). BSD manpage on The UNIX and Linux Forums (11 августа 1995). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ ¹ ² ³ ⁴ Причины Kernel panic в Mac OS X (неопр.). macmaps.com. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ Unix and Multics (неопр.). www.multicians.org (03/21/93). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ ¹ ² ³ Информация о поведении Windows в нештатных ситуациях (неопр.). Microsoft Corp.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ ¹ ² Karim Yaghmour, Jon Masters, Gilad Ben-Yossef, Philippe Gerum, 2008, p. 170.
↑ Информация о причинах Kernel panic на сайте Apple (неопр.). Apple Inc.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ Wolfgang Mauerer. Professional Linux Kernel Architecture (неопр.). — John Wiley and Sons, 2008. — С. 1238—1239. — ISBN 978-0-470-34343-2. Архивная копия от 15 декабря 2016 на Wayback Machine
↑ Google comes clean: Yes, your kernel panic is Chrome's fault (неопр.). Betanews (7 января 2012). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ Исходный код prf.c UNIX V6 (неопр.). Unix-tree. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ ¹ ² ³ Kopper, 2005, p. 178.
↑ OpenBSD SYSCTL.CONF man page (неопр.). OpenBSD. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
↑ Solaris System Engineers, 2009, p. 9.3.4.2.
↑ Michael Urban, Brian Tiemann, 2002, p. 172.
↑ Michael Schwarz, 2002, p. 21.
↑ Kirkland, Tinker, 2006, p. 52.
↑ ¹ ² ³ ⁴ A New Screen of Death for Mac OS X (неопр.). Amit Singh. Дата обращения: 30 июля 2012. Архивировано 6 августа 2012 года.
↑ Ted Landau, 2000, p. 133.
↑ Ted Landau, 2000, p. 83.
↑ ¹ ² Eric S. Raymond, 1996, p. 230.

Литература править

Karl Kopper. The Linux Enterprise Cluster: Build a Highly Available Cluster. — No Starch Press, 2005. — С. 430. — ISBN 1593270364.
Michael Urban, Brian Tiemann. Sams Teach Yourself FreeBSD in 24 Hours. — Sams Publishing, 2002. — С. 456. — ISBN 0672324245.
James Kirkland, Christopher L. Tinker. Linux Troubleshooting for System Administrators And Power Users. — Prentice Hall Professional, 2006. — С. 571. — ISBN 0-13-185515-8.
Karim Yaghmour, Jon Masters, Gilad Ben-Yossef, Philippe Gerum. Building Embedded Linux Systems. — O'Reilly Media, 2008. — С. 439. — ISBN 0596529686.
Solaris System Engineers. Solaris 10 System Administration Essentials. — Pearson Education, 2009. — С. 456. — ISBN 013700009X.
Michael Schwarz. Multitool Linux: Practical Uses for Open Source Software. — Addison-Wesley Professional, 2002. — С. 532. — ISBN 0201734206.
Ted Landau. Sad Macs, Bombs, and Other Disasters: And What to Do About Them. — Peachpit Press, 2000. — С. 955. — ISBN 020169963X.
Eric S. Raymond. The New Hacker's Dictionary. — MIT Press, 1996. — С. 547. — ISBN 0262680920.

Ссылки править

[_0210fefa5a0a51e6-1] ¹ ² Kirkland, Tinker, 2006, p. 51.

[2] Информация о функции panic() на сайте UNIX.com (неопр.). BSD manpage on The UNIX and Linux Forums (11 августа 1995). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[mac_reasons-3] ¹ ² ³ ⁴ Причины Kernel panic в Mac OS X (неопр.). macmaps.com. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[4] Unix and Multics (неопр.). www.multicians.org (03/21/93). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[Windows-5] ¹ ² ³ Информация о поведении Windows в нештатных ситуациях (неопр.). Microsoft Corp.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[_35fd3e5c1da233de-6] ¹ ² Karim Yaghmour, Jon Masters, Gilad Ben-Yossef, Philippe Gerum, 2008, p. 170.

[7] Информация о причинах Kernel panic на сайте Apple (неопр.). Apple Inc.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[Mauerer2008-8] Wolfgang Mauerer. Professional Linux Kernel Architecture (неопр.). — John Wiley and Sons, 2008. — С. 1238—1239. — ISBN 978-0-470-34343-2. Архивная копия от 15 декабря 2016 на Wayback Machine

[9] Google comes clean: Yes, your kernel panic is Chrome's fault (неопр.). Betanews (7 января 2012). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[10] Исходный код prf.c UNIX V6 (неопр.). Unix-tree. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[_e91a844b7fb8b9b1-11] ¹ ² ³ Kopper, 2005, p. 178.

[12] OpenBSD SYSCTL.CONF man page (неопр.). OpenBSD. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.

[_3e14f6ba5882955e-13] Solaris System Engineers, 2009, p. 9.3.4.2.

[_92103225696d220c-14] Michael Urban, Brian Tiemann, 2002, p. 172.

[_fbf645480376e823-15] Michael Schwarz, 2002, p. 21.

[_0210fefa5a0a51e5-16] Kirkland, Tinker, 2006, p. 52.

[mac_screens-17] ¹ ² ³ ⁴ A New Screen of Death for Mac OS X (неопр.). Amit Singh. Дата обращения: 30 июля 2012. Архивировано 6 августа 2012 года.

[_a6314c9fe7d7b616-18] Ted Landau, 2000, p. 133.

[_2f5691244436013c-19] Ted Landau, 2000, p. 83.

[_dcd478e714613e69-20] ¹ ² Eric S. Raymond, 1996, p. 230.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]