admin

Администратор
Команда форума
Регистрация
30.09.2022
Сообщения
468
Реакции
84

1572436377309-png-1736.png



Вам нужно найти сайт на котором используют ID КиноПоиск и брать конкретно ID КиноПоиск для автообновления коллекций.

Пример, берем URL самого популярного торрент сайта:

http://rutracker.org/forum/viewforum.php?f=1950

1572436955332-png-1738.png


Смотрим как выглядят ссылки на новость и составляем RegExp:

href="(viewtopic\.php\?t=[0-9]{1,8})"\sclass="torTopic\sbold\stt-text">

1572436876974-png-1737.png


Находим в новости ID КиноПоиска и составляем RegExp:

kinopoisk\.ru\/([0-9]{3,10})\.gif

1572437107451-png-1739.png


Теперь всё собираем воедино:

КаждыйЧас~ЗаходитьНаURL~НаходитьСсылкуНаНовости~НаходитьIDКиноПоискаВНовостях~СохранятьИхВКоллекцию

1 ~ http://rutracker.org/forum/viewforum.php?f=1950 ~ href="(viewtopic\.php\?t=[0-9]{1,8})"\sclass="torTopic\sbold\stt-text"> ~ kinopoisk\.ru\/([0-9]{3,10})\.gif ~ poslednie-obnovleniya

И в коллекцию добавятся фильмы, ID КиноПоиск которых будут найдены на страницах.

1572458021898-png-1746.png


Перед тем, как составлять RegExp условие, протестируйте его онлайн на regex101.com
  • Копируете весь HTML страницы нужного Вам сайта в regex101:
1572458021898-png-1746.png


  • Составляем условие чтобы получить только тот текст, который нужен (он обводится скобками) и будет выделен зелёным цветом:

1572458697375-png-1747.png
 

admin

Администратор
Команда форума
Регистрация
30.09.2022
Сообщения
468
Реакции
84
Примеры парсинга страниц:

Код:
9 ~ https://www.kinopoisk.ru/popular/?quick_filters=serials ~ ~ ~ kinopoisk

10 ~ http://rutor.info/kino ~ href="(/torrent/[0-9]{1,7}/.*?)" ~ ~ rutor

11 ~ http://rutracker.org/forum/viewforum.php?f=1950 ~ href="(viewtopic\.php\?t=[0-9]{1,8})" ~ ~ rutracker

2 ~ http://kinozal.tv/browse.php ~ href="(/details\.php\?id=[0-9]{1,8})" ~  ~ kinozal

2 ~ http://riperam.org/ ~ href="(http://riperam\.org/(?:russkie-seriali|zarubejnie-seriali)/.*?\.html)" ~ ~ riperam

Вот что получится:

collection-png-3036.png
 
Верх