
De ceva vreme, mai ales pentru conturile mici, este plin Analytics-ul de vizite spam, majoritatea vin cu refferal de la tot felul de site-uri dubioase care practic fac un ping catre site-ul tau in speranta ca ulterior vei vizita acele surse, sa vezi ce e cu ele. Unele dintre acele surse sunt si tot felul de redirecturi care te duc catre diverse oferte de solutii sofware, pluginuri samd, ba chiar vad ca multe dintre ele te duc si pe vreun site care are in coada un link de tracking caracteristic marketingului afiliat.
Problemuta mare pentru aceste surse este si ca excluderea e dificila, fiind atat de multe parca timpul pierdut este prea mare pentru a filtra sa ai niste date corecte.
Uite cum arata analytics-ul pe zona de surse de trafic pentru un mic site-ulet de-al meu:
Majoritatea acestor surse transmit vizitele si cu un (not set) la furnizorul de internet (Audience – Technology – Network) asa ca poate o excludere a traficului care vine cu (not set) ar rezolva parte dintre probleme. De asemenea este si trafic cu hostname not set, asa ca am gasit oarecum o legatura intre ele.
Mi-ar placea daca si Google ar rezolva problema aceasta, ca deja ce e mult, e mult. Pentru un site mic practic se dau peste cap 30% din datele de trafic.
Totusi, pentru a rezolva oarecum problema, o data ce intelegi patternul acestor vizite, sugerez crearea unui nou view in Analytics cu niste filtre aplicate.
Pe acest filtru, o data ce acumulezi niste date, poti sa te joci oleaca si sa aplici fie filtre de includere, fie de excludere. De exemplu, poti sa aplici un filtru la hostname ca totul sa fie in domeniul tau (numeletaudedomeniu.ro). Plus de asta, tot aici poti sa excluzi referalli dubiosi. Spre exemplu, sus la mine face sens sa exclud prima sursa de trafic, ca doar „aduce” aproape 70% din totalul traficului de tip referall. Insa din pacate aceste domenii se vor inmulti tot mai mult daca Google nu va aplica niste filtre manuale anti-spam.
Am dat si de un articol cuprinzator in engleza care vorbeste despre acelasi subiect si explica detaliat ce aveti de scapat pentru a scapa de vizitele spam care dau doar peste cap rapoartele.
In timpul in care a stat articolul asta prin draft, a mai aparut un nou tip de spam: keyword spam. Asta de fapt iti aduce niste rezultate de cuvinte de cautare care nu are nici o treaba cu realitatea. Si, cel mai probabil, cei care fac acest tip de spam, mai ales pe cautarea Ghost spam is free from the politics sunt si cei care sunt no1 cu solutia.
O alta solutie aparenta pentru vizitele spam este pluginul WP BAN care iti permite sa adaugi in lista de IP-uri diverse surse trafic, keyword-uri si altele.
De fapt, problema e maingrava de atat. Site-urile alea nu fac ping, iar pluginul care baneaza ip-uri sau reguli de mod_rewrite (.htacess)sunt ineficiente.
Ce fac oamenii aia este sa apeleze js-ul cu UA-ul tau, fara sa vorbească măcar cu serverul pe care e găzduit site-ul.
Iar problema cu acel .js e tocmai faptul ca e .js si deci un limbaj client side. Asadar nu poti face o legătură intre UA si domeniile pe care rulează, pentru ca nu serverul tau trimite date la Google, ci browserele vizitatorilor.
Singura solutie mai puțin time-consuming este filtrarea cu ajutorul unor regexuri care contin free, buttons, etc.