API за HTML собирање податоци за јавни веб-страници
Список на услуги
Имате прашање?
API за HTML собирање податоци за јавни веб-страници
Парсирајте HTML страници со одење низ вгнездените селектори и добијте го скратениот фрагмент како JSON.
HTML Scraper API
Повикајте https://api.mihajlo.mk/v1/scrape со вашиот токен, целната страница и вгнездените правила кои го опишуваат јазолот што сакате да го инспектирате.
Параметри
-
token — копирајте го токенот (API Key) од вашата
https://mihajlo.mkсметка откако ќе се најавите со Google/Gmail. - url — апсолутна https:// или http:// адреса на HTML страницата за парсирање.
-
rules — селектори одделени со запирки како
tag|attribute=value:index. Секој дел продлабочува едно ниво.
Форматот на селекторот поддржува филтри за атрибути (class, data-*, итн.) и индекс со нула, така што можете да го изберете точниот настап.
https://api.mihajlo.mk/v1/scrape?token=YOUR_TOKEN&rules=div|class=article-info:0,h1|class=specs-phone-name-title:0&url=https://www.gsmarena.com/samsung_galaxy_s10_5g-9588.php
Примерок одговор:
{
"error": false,
"status_text": "OK",
"status_code": 200,
"data": {
"tag": "h1",
"class": "specs-phone-name-title",
"data-spec": "modelname",
"text": "Samsung Galaxy S10 5G"
}
}
JSON податоците секогаш ги изложуваат tag, мапата на атрибути и исечениот text на совпаднатиот јазол.