Casa Securitywatch Difendi il tuo sito Web dai ladri di contenuti

Difendi il tuo sito Web dai ladri di contenuti

Video: Imma Battaglia su Detto Fatto: "Caricare di erotismo il quotidiano è caricare l'arma della violenza" (Novembre 2024)

Video: Imma Battaglia su Detto Fatto: "Caricare di erotismo il quotidiano è caricare l'arma della violenza" (Novembre 2024)
Anonim

Supponi di essere un fornitore online di elettronica usata. La tua attività dipende da quel ragazzo che vuole un iPad usato trovare i tuoi ottimi prezzi. Ma non saresti così felice se un concorrente catturasse il tuo intero listino prezzi per battere i tuoi prezzi appena quanto basta. Come puoi consentire l'accesso completo per gli utenti evitando al contempo lo scraping all'ingrosso dei tuoi contenuti? Bene, potresti usare ScrapeDefender, una soluzione anti-scraping basata su cloud rilasciata oggi. Ho parlato con Robert Kane, CEO di ScrapeDefender, di come funziona il prodotto.

Chi ne ha bisogno?

"Stiamo già lavorando con compagnie aeree, elettronica di consumo, mercati finanziari e altro ancora come clienti beta", ha affermato Kane. "Qualsiasi sito web che pubblica molti contenuti importanti, listini prezzi, immobili… tutti questi contenuti possono essere raccolti in serie." Kane ha sottolineato che mentre alcuni raschiatori usano semplici script, altri cercano di mascherarsi da umani catturando il sito più lentamente o usando più robot. "La sfida per i proprietari è: come faccio a far entrare il mondo e tenere fuori robot non autorizzati", ha concluso Kane.

Ecco dove entra in gioco ScrapeDefender. "Il nostro monitor è uno strumento passivo, come Google Analytics", ha affermato Kane. "Inserisci una riga di codice sul tuo sito che ci consente di monitorarlo 24 ore su 24, 7 giorni su 7. Solo una riga di codice nell'intestazione della pagina web. Poiché è passivo, non ha alcun effetto sulla tua rete di produzione."

Dashboard online

Un cliente ScrapeDefender può visualizzare una panoramica di tutte le attività di raschiatura bloccate, ma può anche scavare in profondità per i dettagli completi. Kane ha dimostrato il sistema, mostrandomi il tipo di attività che alzano una bandiera rossa. Molti sono abbastanza semplici. L'indirizzo IP di un raschiatore tende a rendere notevolmente più visite al sito e accessi alle pagine rispetto a quelli di un essere umano e tende a rimanere su qualsiasi pagina per un tempo molto breve. Anche quando provano a rallentare ed evitare il rilevamento, è visibile uno schema. Le visite degli umani di solito arrivano con un campo referrer; le visite dei robot raschiatori non lo fanno mai. Tutti questi criteri contribuiscono a un punteggio di rischio complessivo; un punteggio abbastanza alto identifica quasi sempre l'attività di raschiatura.

"I sofisticati raschiatori utilizzano più indirizzi IP", ha osservato Kane. "Ma usiamo un'impronta digitale per abbinare le sessioni correlate anche quando l'IP è diverso. Potrebbe essere uno script in esecuzione su macchine diverse o macchine virtuali diverse, ma l'impronta digitale è la stessa.

Raschietto, nessuna raschiatura!

Ho chiesto cosa succede una volta identificato un raschietto. "Lo facciamo in due modi", ha detto Kane. "Offriamo un modulo di sicurezza che può fare il blocco per loro, ma stiamo scoprendo che le organizzazioni con cui lavoriamo hanno il proprio firewall in atto. Quindi, abbiamo un'API che può inviare gli indirizzi IP sospetti al loro firewall."

Quindi, quanto costa? I prezzi partono da $ 79 al mese e si adattano a siti Web di qualsiasi dimensione. "Qualcuno ci ha contattato la scorsa settimana", ha detto Kane, "a proposito di un sito Web con 25 milioni di pagine visualizzate… al giorno ! Lo supportiamo."

La società eseguirà una scansione su circa 150 vulnerabilità legate alla raschiatura per un nuovo cliente, ma chiunque può eseguire una scansione gratuita che controlla un sottoinsieme di quelli. Basta visitare il sito Web di ScrapeDefender e inserire il nome del dominio. In pochi minuti avrai la tua risposta.

Il futuro

"Secondo me", ha detto Kane, "l'antiscraping ora è simile al primo business degli antivirus. È un'enorme opportunità. Tutti dovranno averlo." Ha sottolineato che Snapchat avrebbe potuto utilizzare questa tecnologia per impedire la raccolta di 4, 6 milioni di dati degli utenti e quindi evitare la recente ondata di spam di Snapchat.

"CAPTCHA non è una soluzione", ha detto Kane. "Anche se ha funzionato, non hanno sentito parlare delle fattorie CAPTCHA? La vera soluzione è guardare al comportamento e bloccare i comportamenti di raschiatura."

Resta da vedere se un numero sufficiente di proprietari di siti Web sceglierà di pagare per una soluzione anti-scraping. Guarderò per vedere come va.

Difendi il tuo sito Web dai ladri di contenuti