Котаны, нид хелп
Имеется тыща папок, в каждой из которых есть один файл, предположим, index.html
Задача: из каждого из этих файлов вытащить одну и ту же информацию: например, цифры после определенного текста или текст внутри определенного тега.
Можно ли это сделать, например, автоматором? Или чем?

 
About The Author

Anonymous

10 Responses to Котаны, нид хелпИмеется тыща папок, в каждой из которых есть один файл, предположим, index.

  1. MooRU:

    гуру баш скриптинга нужен тебе.

    вообще могу попробовать на выходных набросать скрипт, дай только больше деталей о том что ты хочешь вытаскивать

  2. Evilite:

    сильно зависит от того, после какого текста находится искомое. скорее всего, нужно regexp писать. лучше пример приведи.
    банальный же поиск можно сделать так:
    find. -type f -name ‘index.html’ -exec grep -H ‘string_to_find’ {} ;

    но он выведет только искомую строку. можно конечно добавить к grep какой-нибудь n5, но это слабо поможет. надо будет глазами искать.
    если покажешь файл и что нужно достать, быстрее решится.

  3. Nupekb:

    https://dl.dropboxusercontent.com/u/1241
    Нужно выцепить
    Название города (думаю, ловить первое вхождение h2)
    Код ОКАТО
    Широта
    Долгота
    А вот дальше — самое интересное: в некоторых файлах есть таблица Показатели муниципального образования (index2.html в архиве), а в некоторых — нет (index1.html)
    Вот там, где он есть, нужно эту таблицу перевести в текст с табуляторами.
    Ну и напоследок ещё один геморрой — последнюю таблицу нужно перевести в текст с табуляторами, но сделать таблицу в 2 столбца — годtчисло
    Как-то так. Думаю, надо делать скрипт и хреначить всё в TextWrangler’e
    Заранее спасибо

  4. Nupekb:

    Бро, спасибо, буду благодарен
    http://iphone10gs.com/comments/15883

  5. Nupekb:

    Фуф. Написал

  6. MooRU:

    написал скрипт который вытягивает это? покажешь?

  7. Nupekb:

    Покажу. Там вообще пиздей был. Заказчица ещё попросила, чтобы таблица большая, если она есть, была в отдельном файле, который бы идентифицировался с основным по коду города.

  8. Xinein:

    судя по всему ты на маке это делаешь, открой для себя руби.

  9. Recira:

    Питон тогда уж. Но зачем?

Добавить комментарий