Насколько я знаю. Движок booru работает через формат ATOM. Он открытый, можно создавать запросы самому (Это позволяет обходить "скрытые" картинки, поскольку ATOM возвращает всё, а скрипты уже решают, что показывать юзеру, а что нет. Хотя не везде такое пашет, видимо в новых версиях пофикшено). Что нам нужно - это понять, можно ли по md5 получить картинку. В любом случае эти запросы будут работать на всех движках booru. У кого есть время - можете проверить.


Я хз, говорю же. В идеале должно быть сделано так:
if (АПИ движка позволяет искать картинки по md5 и возвращать масив тегов)
  • Берём десяток самых крупным Booru сайтов;

Псевдо-код:
Спойлер!

Парсить сайт "поисковика" - это самый худший вариант.

ИМХО - забудь про русский язык, есть желание - вперёд. Есть тыща людей, которые это будут делать?
Есть русская ИБ? Делай запросы в ENG и RUS версию, сливай массивы и вуаля: рус. и инг. теги к картинкам.

А вот если такой хеш не найден во всех задаых ИБ, тогда можно юзать "поисковик" по ИБ. Скармливать ему картинки, брать самый лучший ревалентный результат, переходить по ссылке и вырезать теги со страницы.