Car-tech

Oracle Engineer раскрывает тайны латентности с картами тепла

Amazon Interview question: Learn hashing and consistent hash ring

Amazon Interview question: Learn hashing and consistent hash ring
Anonim

В то время как менеджеры дата-центров давно используют карты тепла, чтобы определить, где лучше всего разместить стойки серверов и охлаждающих устройств, этот способ визуализации также может быть полезен для лучшего понимания системной задержки, утверждает инженер Oracle в июльском выпуске Коммуникации ACM.

«Представление латентности как карты тепла является эффективным способом выявления тонких характеристик, которые в противном случае могут быть пропущены», - пишет Брендан Грегг, главный инженер-программист Oracle, в статье «Визуализация системной задержки».

Грегг также предупредил, что, хотя такая визуализация может дать нам больший обзор того, что происходит, она не всегда дает ответы на наблюдаемое поведение. Тем не менее, карты тепла могут обеспечить понимание проблем следующего поколения проблем с задержкой в ​​центре обработки данных.

[Подробнее читайте: Лучшие NAS-боксы для потоковой передачи и резервного копирования мультимедиа]

Точное определение причин системной вялости уже давно расстраивает менеджеров центров обработки данных и системных администраторов. Средства сетевого анализа доступны для визуализации производительности сети, хотя другие аспекты системы, такие как отзывчивость дисков в массиве хранения, сложнее определить.

Sun Microsystems уже давно предлагает один инструмент для своей операционной системы Solaris, называемый DTrace, который может характеризовать латентность в разных частях системы на основе второго за второй. Однако подавляющие данные, которые он может произвести, все же необходимо свернуть в легко понятную форму.

Войдите в карты тепла Грегга. Тепловые карты - это простой метод визуализации, в котором на двумерном графике разные значения представлены разными цветами.

Графики тепла могут показывать больше, чем линейные графики для большинства инструментов сетевого анализа, потому что, хотя графики «позволят средним латентность, которую нужно исследовать со временем, фактический состав или распределение этой задержки не может быть идентифицирован за пределами максимума, если это предусмотрено », - пишет он.

Карты тепла также хороши для быстрого выявления выбросов, которые затем могут быть рассмотрены более подробно, - утверждал он.

В этой статье Грегг разработал множество необычных условий рабочей нагрузки, используя программное обеспечение визуализации Oracle Analytics для визуального отображения данных, собранных DTrace. Он задал ось X для представления времени и оси Y, чтобы представить время задержки. Самые темные цвета представляли наибольший вход-выход.

Во многих случаях он обнаружил, что простые рабочие нагрузки могут создавать множество сложных, а иногда и необъяснимых шаблонов.

В одном случае небольшой объем данных был последовательно записанный в пул дисков. Грегг ожидал увидеть только «белый шум», представляющий случайную латентность. Вместо этого, тепловая карта показала, что уровни латентности растут и падают в разных моделях по неизвестной причине. «Визуализация латентности таким образом явно ставит больше вопросов, чем дает ответы», - сказал он.

Другая картина оказалась столь же загадочной. Тест включал отправку потока данных на 44 диска. Во-первых, данные будут отправляться только на один диск, затем на два диска и т. Д., Пока все 44 диска не получат данные.

Ожидаемая латентность диска Gregg для линейного увеличения, поскольку системные шины стали насыщенными данными.

Вместо этого латентность возрастает, а затем немного утихает, а затем увеличивается еще больше.

Он назвал этот образец радужным птеродактилем, поскольку тепловой график напоминал профиль цветного летающего динозавра.

«Подводя итог радуга птеродактиль: мало известно с точностью, и требуется гораздо больше исследований. То, что это показывает, - это то, насколько глубокой может быть простая визуализация », - пишет он.

Грегг также использовал карту тепла, чтобы выявить ударные эффекты, имеет на серверах, явления, которые Грегг продемонстрировал несколько лет назад на YouTube.

Несмотря на то, что эти карты тепла были выполнены в системе, работающей на файловой системе Zetteabyte (ZFS), работающей по протоколу сетевого хранения (NFS), этот подход можно использовать для характеристики операций других файловых систем и даже других компонентов, таких как процессоры, Грегг пишет.

Joab Jackson охватывает программное обеспечение для энтерификации и общую технологию для новостей за Служба новостей IDG. Следуйте за Joab в Twitter на @Joab_Jackson. Адрес электронной почты Joab - [email protected]