Генератор устойчивых к взлому паролей
Артем Мáлков
437 просм
1 комм
Поделиться

Как с помощью Notepad++ удалить данные после определенного знака?

Не так давно, решая некоторые задачи по одному сайту, я обнаружил базу данных, содержащую список url адресов с дополнительными сведениями такого плана:

http://your_site.ru/page_1.html 164 3 30% 2016-08-17 06:29
http://your_site.ru/page_2.html 232 10 30% 2016-06-22 21:34
http://your_site.ru/page_3.html 43 8 30% 2016-07-22 07:01

Естественно, база сама по себе больше, и таких строк порядка 1000. Задача была следующая – получить из этого списка все ссылки. Как же ее решить?

В Notepad++ есть такая штука, как регулярные выражения, и все, что вам нужно сделать, это найти, за что можно зацепиться. В нашем случае мы будем «цепляться» за часть .html, ведь именно после нее нам нужно удалить весь мусор.

1. Первое, что вам необходимо сделать, это вставить (или открыть) базу в Notepad++

Как с помощью Notepad++ удалить данные после определенного знака?

2. Далее нажмите сочетание клавиш Ctrl+F и перейдите во вкладку «Заменить».

3. В графе «Режим поиска» отметьте пункт «Регулярные выражения». В поле «Найти» впишите:

(.html.+)$

В поле «Заменить» впишите:

.html

И нажмите «Заменить все».

Как с помощью Notepad++ удалить данные после определенного знака?

С помощью этого нехитрого способа мы с вами получили необходимые нам данные, удалив, тем самым, ненужный мусор. Как вы поняли, .html вы можете заменить на нужный вам ориентир для массовой обработки данных.

1
комментарий
Васо
30.07 в 18:46
Была такая же проблема, не стал париться, закинул в Эксель - Данные - Текст по столбцам-С разделитем- пробл и вуаля, только у меня список был 44 кило
  • 0
Оставить комментарий:
Нажимая кнопку «Отправить» вы даете согласие на обработку своих персональных данных.
Ваше Имя
Ваш E-mail
Текст комментария