WEBLEDI.RUВебледи Форум успешных женщин-вебмастеров
03 Декабрь 2016, 23:42:25 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.

Войти
Правила Реклама
 
5
10
15
Свежие ответы
Re: Готовые статьи на тему "Красота и здоровье" недорого. от Yula (Контент, копирайтинг, переводы)
Re: CPA-сеть Hotpartner.biz от kuprum (CPA-сети)
Re: Нужны копирайтеры на постоянную работу! от ZAS (Ищу копирайтера, редактора, контент-менеджера)
Re: Дизайн от новичка от LanaSvetNik (Дизайн)
Онлайн-консультант Jivosite со скидкой до 20% от KeyWebRu (Хостинг)
Создать тест-опрос в Гугл Документах (или ваш вариант) от Anonyff (Работа и услуги)
Re: AdBean - Бобовая тизерная сеть. Новостные и товарные тизеры. До 90% отчислений! от AdBean (Реклама и доход)
Re: Подарю, продам или сдам в аренду домены от June (Домены)
Автоматизация Яндекс Директ + возврат 8% от рекламного бюджета. от Александр_26 (Полезное)
Re: Quick Sender - Комбайн для продвижения в ВКонтакте от Dima_Myrzich (Социальные сети)
Re: Марафон Спарта от Пузата - Почему я иду от Katelite (Обучение сайтостроению, SEO и заработку)
Re: Чистенький женский СДЛ. Размещение в авто от uckpa (Платное размещение статей и ссылок)
Re: [Анонс] Программа для группировки ключевых слов KeyAssort от KeyAssort (Сервисы и SEO программы)
Re: Имеют ли вес покупные ссылки при теперешних правилах Яндекса от Lina7 (Раскрутка сайтов в поисковиках)
Re: Насколько необходим онлайн консультант на сайте? от fainna (Юзабилити)
Свежие темы
Показать ещё
  Печать  
Страниц: 1
Автор

Тема: Вычисляем грабер и способы борьбы  (Прочитано 1271 раз)

0 Пользователей и 1 Гость смотрят эту тему.
GoodShadow
Offline Offline

Пол: Женский
Сообщений: 460


Мур мур :3


Просмотр профиля
« : 12 Февраль 2013, 22:28:51 »

В этой статье мы поговорим с вами о насущной проблеме а именно грабер, через которые воруют контент с ваших сайтов. В статье я буду использовать примеры и постараюсь передать вам смысл всех заумных слов.

Для начала давайте разберёмся что такое грабер, чяще всего граберы использую на обычных сайтах, для вывода информации из базы данных на монитор пользователю. запрос -> ответ но в нашем случае это не те самые безобидные граберы а воришки контента, самый распространённый грабер для кражи контента использует 2 тега (для расшифровки) то есть при выдирание кода статьи мы получаем кашу, 2 тега которые чаще всего используют самые популярные cms * - пробел, начало абзаца и конец  -<"p"> \ <"/p"> и  новая строка<"br" > то есть грабер расшифровывает <"br"> как новую строку, по этому при копировании статей на выходе получает абсолютную копию. Пробелы же он видит в виде звёздочек * после каждого слова, но эту техническую часть мы опустим ведь разговор идёт о вычисление а не о том как он работает  :D

По скольку на каждом из сайтов по которому ходит хотя бы 1 поисковый бот отличить от грабера не возможно, ведь они занимаются почти одним и тем же (бот по сути и есть грабер) по этому тут нам поможет сайт miratools он не обладает не каким особым движком для вычисления граберов, просто через него легко найти туда куда уходят ваши статьи, зачем вам это нужно? Вот зачем что воришка (грабер) не может находится на удалённом сервере и если даже так оно и есть то это колоссальная нагрузка на базу данных. Через любой возможный сервис вычисляем ip ресурса, внимание если это под домен то наверняка его ip отличается от ip основго домена так делают грамотные дорвейщики и воры, после того как мы получили ip сравните её с ip посетителей сайта, если вы на хостинге то попросите отослать вам статистику в сапорте (хотя логи апатча доступны на большинстве хостинг) далее самостоятельно заносим ip в чёрный список или просим сделать это через сапорт.

Откуда я знаю что ip грабера будет идентичен ip домена\под домена, при покупки хостинга, vps, выделенного хостинга предоставляется выделенный ip, о обычном хостинге речь не идёт потому что грабер много поточный и обычный хостинг просто умрёт от нагрузки и подключений к базе данных. ip грабера не может отличатся от ip сервера\сайта иначе как я писала выше ему придётся подключатся удалённо что вывозит огромную нагрузку.

Вот собственно и всё, надеюсь вы поймёте мои каракули и не будите сильно негодовать о моей грамотности.  :D
« Последнее редактирование: 13 Февраль 2013, 00:35:22 от GoodShadow » Записан

skype: goodsh_love
Кукла в бантиках
Offline Offline

Пол: Женский
Сообщений: 8840



Просмотр профиля
« Ответ #1 : 13 Февраль 2013, 00:28:21 »

В терминалогии веб-разработок граббер - это специализированный скрипт, который позволяет "выкачивать" информацию с чужих сайтов на свой. В отличии от грабберов, парсер способен распознать информацию в груде "мусора" и обработать ее в соотвествии с поставленной задачей.

Вот что такое парсер, а не то, что вы написали.

Кроме того, некоторые парсеры могут запускаться на компе. И не обязательно быть много поточным. Смотря как написали.
Записан

Нужна срочно оплата, в личку кошелек, сумму, дата что и когда отправили


GoodShadow
Offline Offline

Пол: Женский
Сообщений: 460


Мур мур :3


Просмотр профиля
« Ответ #2 : 13 Февраль 2013, 00:33:11 »

В терминалогии веб-разработок граббер - это специализированный скрипт, который позволяет "выкачивать" информацию с чужих сайтов на свой. В отличии от грабберов, парсер способен распознать информацию в груде "мусора" и обработать ее в соотвествии с поставленной задачей.

Вот что такое парсер, а не то, что вы написали.

Кроме того, некоторые парсеры могут запускаться на компе. И не обязательно быть много поточным. Смотря как написали.

Да я словом ошиблась, вместо грабера написала парсер. Писала по структуре популярно платого порно грабера, который настроен на выдергивание кода плеера и привела аналогию на текстовый грабер.

Благодарю за то что написали, сама бы не увидела свою ошибку.
« Последнее редактирование: 13 Февраль 2013, 00:49:05 от GoodShadow » Записан

skype: goodsh_love
sugaring
Offline Offline

Пол: Женский
Сообщений: 78


sugaring.su


Просмотр профиля WWW
« Ответ #3 : 17 Февраль 2013, 19:47:37 »

во всех статьях должны быть ссылки (полный урл) на другие статьи, причем сами статьи лучше разбивать на 2-3 части => пускай грабят наздоровье
Записан

irina777
Offline Offline

Пол: Женский
Сообщений: 89


Все в моих руках


Просмотр профиля
« Ответ #4 : 04 Март 2013, 14:16:44 »

причем сами статьи лучше разбивать на 2-3 части => пускай грабят наздоровье

Ну это уже зависит от объемов самой статьи.. Если статья скажем 1500 - 2000 символов нет смысла мне кажется ее разбивать!  дарю цветочек
Записан



irina777
Offline Offline

Пол: Женский
Сообщений: 89


Все в моих руках


Просмотр профиля
« Ответ #5 : 04 Март 2013, 14:18:46 »

А еще для тех кто не в курсе, простой совет:

Ставить в статьях подпись автора и регистрировать статью в G+ и яндекс блогах!  танцуют все
Записан



Кукла в бантиках
Offline Offline

Пол: Женский
Сообщений: 8840



Просмотр профиля
« Ответ #6 : 04 Март 2013, 14:24:53 »

А еще для тех кто не в курсе, простой совет:

Ставить в статьях подпись автора и регистрировать статью в G+ и яндекс блогах!  танцуют все
Если везде будет одинаково подписано, подпись можно вырезать при желании грабером. Имя, наверное, вырезать и не будут. А толку от него немного. А адрес сайта вырежут на раз-два. Или на свое поменяют.
Записан

Нужна срочно оплата, в личку кошелек, сумму, дата что и когда отправили


Dreamy
Offline Offline

Сообщений: 1155



Просмотр профиля
« Ответ #7 : 04 Март 2013, 14:36:21 »

и регистрировать статью в G+ и яндекс блогах!
Если сайт с коллективным наполнением, или несколько сайтов, то это нереально. Кроме того, вред грабера даже не в том, что контент тырит, а в том, что нагрузка на сайт возрастает.
Записан

Страниц: 1
  Печать  
 
Перейти в:  

| Sitemap