Jump to content

Sign in to follow this  
GAMEOVER

Функция IMPORTXML в Google Таблицах (Doc/Sheets)

Recommended Posts

Функция IMPORTXML в Google Docs позволяет автоматически выгружать данные с сайта автоматически используя ссылку на страницу и определенный запрос.

Для просмотра ссылки Войди или ЗарегистрируйсяВидеоинструкция

Для просмотра ссылки Войди или ЗарегистрируйсяСинтаксис IMPORTXML в Google Таблице

Для просмотра ссылки Войди или ЗарегистрируйсяДля того, чтобы использовать данную функцию потребуется в таблице написать формулу:

Для просмотра ссылки Войди или Зарегистрируйся=IMPORTXML(Ссылка;Запрос)

3-14-1024x263.png

Для просмотра ссылки Войди или ЗарегистрируйсяГде:

Для просмотра ссылки Войди или ЗарегистрируйсяС примером можно ознакомиться в:

Для просмотра ссылки Войди или ЗарегистрируйсяДля просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или ЗарегистрируйсяПримеры использования IMPORTXML в Google Doc

Для просмотра ссылки Войди или ЗарегистрируйсяПарсинг названий

Для просмотра ссылки Войди или ЗарегистрируйсяДля работы с парсингом через данную функцию потребуется знание XPATH и составление пути в этом формате. Сделать это можно открыв консоль разработчика. Для примера будет использоваться сайт крупного интернет-магазина и в первую очередь необходимо в Google Chrome открыть окно разработчика кликнув правой кнопкой мыли и в выпавшем меню выбрать «Посмотреть код» (сочетание клавиш CTRL+Shift+I).

2-16-1024x760.png

Для просмотра ссылки Войди или ЗарегистрируйсяПосле этого пытаемся получить название товара, которое содержится в H1, единственным на странице, поэтому запрос должен быть:

Для просмотра ссылки Войди или Зарегистрируйся//h1

Для просмотра ссылки Войди или ЗарегистрируйсяИ как следствие формула:

Для просмотра ссылки Войди или Зарегистрируйся=IMPORTXML(A2;»//h1″)

4-16-1024x224.png

Для просмотра ссылки Войди или ЗарегистрируйсяВажно! Запрос XPath пишется в кавычках «запрос».

Для просмотра ссылки Войди или ЗарегистрируйсяПарсинг различных элементов

Для просмотра ссылки Войди или ЗарегистрируйсяЕсли мы хотим получить баллы, то нам потребуется обратиться к элементу div с классом product-standart-bonus поэтому получаем:

Для просмотра ссылки Войди или Зарегистрируйся//div[@class=’product-standart-bonus’]

5-13-1024x757.png

Для просмотра ссылки Войди или ЗарегистрируйсяВ этом случае первый тег div обозначает то, откуда берутся данные, когда в скобках [] уточняется его уникальность.

Для просмотра ссылки Войди или ЗарегистрируйсяДля уточнения потребуется указать тип в виде @class, который может быть и @id, а после пишется = и в одинарных кавычках ‘значение’ пишется запрос.

Для просмотра ссылки Войди или ЗарегистрируйсяОднако, нужное нам значение находиться глубже в теге span, поэтому добавляем /span и вводим:

Для просмотра ссылки Войди или Зарегистрируйся//div[@class=’product-standart-bonus’]/span

Для просмотра ссылки Войди или ЗарегистрируйсяВ документе:

6-11-1024x201.png

Для просмотра ссылки Войди или ЗарегистрируйсяПарсинг цен без знаний XPath

Для просмотра ссылки Войди или ЗарегистрируйсяЕсли нет знаний XPath и необходимо быстро получить информацию, то требуется выбрав нужный элемент в консоли разработчика кликнуть правой клавишей мыши и в меню выбрать «Copy»-«XPath». Например, при поиске запроса цены получаем:

7-10-1024x711.png

Для просмотра ссылки Войди или Зарегистрируйся//*[@id=»showcase»]/div/div[3]/div[2]/div[2]/div[1]/div[2]/div/div[1]

Для просмотра ссылки Войди или ЗарегистрируйсяВажно! Следует изменить » на одинарные кавычки ‘.

Для просмотра ссылки Войди или ЗарегистрируйсяДалее используем ее вместе с IMPORTXML.

8-9-1024x266.png

Для просмотра ссылки Войди или ЗарегистрируйсяВсе готово цены получены.

Для просмотра ссылки Войди или ЗарегистрируйсяПростые формулы с IMPORTXML в Google Sheets

Для просмотра ссылки Войди или ЗарегистрируйсяЧтобы получить title страницы необходимо использовать запрос:

Для просмотра ссылки Войди или Зарегистрируйся=IMPORTXML(A3;»//title»)

9-9-1024x295.png

Для просмотра ссылки Войди или ЗарегистрируйсяДля вывода description стоит использовать:

Для просмотра ссылки Войди или Зарегистрируйся=IMPORTXML(A3;»//description»)

10-9.png

Для просмотра ссылки Войди или ЗарегистрируйсяПервый заголовок (или любой другой):

Для просмотра ссылки Войди или Зарегистрируйся=IMPORTXML(A3;»//h1″)

11-9-1024x185.png

Share this post


Link to post
Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this  

×
×
  • Create New...