Основные веб-термины

Что такое парсинг?

Парсинг (от англ. parse – синтаксический разбор) – автоматическая процедура сбора данных или контента с определенного веб-сайта. Результат парсинга, как правило, оформляется в виде файла в формате XML. Программа, занимающаяся сбором и анализом полученных данных, называется парсером.

Для чего применяется парсинг?

Основной задачей парсинга является преобразование и вывод данных в удобном формате. Активно используется в случаях, когда необходимо наполнить веб-ресурс большим объемом не авторской информации, например, техническими характеристиками товаров, которые будут размещены в каталоге сайта.

Стадии парсинга

  • Получение данных – скачивание HTML кода веб-страниц, из которого необходимо в дальнейшем извлечь нужную информацию.
  • Обработка информации – стадия извлечения требуемых данных из кода страницы и их преобразование в необходимый формат.
  • Вывод результата – последняя фаза парсинга, на которой осуществляется запись полученной информации в базу данных или отдельный файл.

Аналогичные названия:



Посмотреть все термины