Только-только объявили о выходе девелоперского релиза 5.11 и я решил прочесть подробную дельту. Русский перевод, кстати, есть у хороших людей на Opennet-е.
Вот чего я там накопал (прямая ссылка на нужное место):
The key change here is that \d will no longer match every digit in the unicode standard (there are thousands) nor will \w match every word character in the standard, instead they will match precisely their POSIX or Perl definition.
В принципе говоря, это означает, что \w больше не будет мэтчить русские буквы. Приехали :)
Я бодро скачал и собрал 5.11, чтобы проверить, что я не ошибся и всё верно понял. Результат описал в виде вопроса к небесам на Перломонахах. Судя по всему, это изменение ещё не реализовали и в данном случае документация бежит вперёд кода. Особенно смотрите комменты юзера demerphq (это знаменитый Ив Ортон), по которым становится понятно, что они пока точно не решили, как быть с этим дальше.
Походу, пора наконец начать использовать \p и \P в регекспах. Такие дела.
Recent Comments