GNU Grep 3.7 выпущен с исправлением для «экстремального снижения производительности» •

От

23.08.2021

GNU grep 3.7 был выпущен с исправлением ошибки, вызывающей «резкое снижение производительности» в некоторых типах поиска.

Этот инструмент поиска, который ищет шаблоны символов в файлах, является основной утилитой в Linux и других Unix-подобных операционных системах. В ноябре прошлого года пользователь заметил: «У меня есть случай использования, когда я запускаю grep с большим количеством шаблонов поиска в большом текстовом файле. Он хорошо работает с grep-3.3, но с grep-3.4 он быстро сжигает гигабайты. памяти и почти заблокировал мою систему из-за подкачки … даже с 30 000 шаблонов он превышает предел в 5 ГБ ».

Напротив, grep 3.3 использовал «всего несколько 100 МБ».

Сопровождающий Grep Джим Мейеринг обнаружил ошибку, которая «вызывает чрезмерные коллизии хэшей … из-за которой новая фаза предварительной обработки шаблонов занимает O (N ^ 2) времени для N шаблонов».

В объявлении о версии 3.7 Майеринг сказал, что пример использования (ниже) теперь занимает «секунды, а не дни».

: | grep -Ff <(seq 6400000 | tr 0-9 A-J)

Ошибка появляется только в тех случаях, когда «слишком много шаблонов хешируется в слишком мало корзин».

Grep обычно работает на удивление быстро и дает гораздо больше удовольствия, чем, например, мучительные попытки поиска строки в большом каталоге в проводнике Windows.

В 2010 году автор GNU grep Майк Хэртель написал о том, «почему GNU grep работает быстро».

Haertel сказал, что он избегает просмотра каждого входного байта, пропуская вперед «всякий раз, когда он находит несоответствующий символ», избегает копирования данных и выполняет «менее 3 инструкций x86, выполняемых для каждого входного байта, который он фактически просматривает».

GNU Grep 3.7 выпущен с исправлением для «экстремального снижения производительности» •

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Qlik теряет данные Vis и делает ставку на автоматизацию °

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

Freeing developers from GenAI deployment nightmares

Nvidia unveils 288 GB Blackwell Ultra GPUs

Огромное количество данных подталкивает финансовые службы к более глубокому внедрению ИИ –

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Qlik теряет данные Vis и делает ставку на автоматизацию °

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА