e-Spidering incorporado

parent 651fb1a1
Showing with 22 additions and 4 deletions
...@@ -2,6 +2,18 @@ ...@@ -2,6 +2,18 @@
import Dato import Dato
from Dato import Dato from Dato import Dato
def eSpidering(reg):
aQuitar=["spider","bot","crawler"]
c=0
for r in reg:
for q in aQuitar:
if q in r.hostRemoto.lower():
reg.pop(c)
c+=1
return reg
def identificacionUsuarios(reg): def identificacionUsuarios(reg):
aux=[] aux=[]
ret=[] ret=[]
...@@ -24,7 +36,7 @@ def identificacionUsuarios(reg): ...@@ -24,7 +36,7 @@ def identificacionUsuarios(reg):
return ret return ret
def leerFicheroLog(ruta): def leerFicheroLog(ruta,espidering):
registros=[] registros=[]
f = open(ruta, "r") f = open(ruta, "r")
total=0 total=0
...@@ -35,10 +47,12 @@ def leerFicheroLog(ruta): ...@@ -35,10 +47,12 @@ def leerFicheroLog(ruta):
except: except:
continue continue
f.close() f.close()
if espidering:
registros=eSpidering(registros)
print("Procesados ",len(registros)," registros") print("Procesados ",len(registros)," registros")
return registros return registros
def leerFicheroLogEliminarFiltradas(ruta,extensionesNoDeseadas): def leerFicheroLogEliminarFiltradas(ruta,extensionesNoDeseadas,espidering):
registros=[] registros=[]
f = open(ruta, "r") f = open(ruta, "r")
total=0 total=0
...@@ -55,10 +69,12 @@ def leerFicheroLogEliminarFiltradas(ruta,extensionesNoDeseadas): ...@@ -55,10 +69,12 @@ def leerFicheroLogEliminarFiltradas(ruta,extensionesNoDeseadas):
except: except:
continue continue
f.close() f.close()
if espidering:
registros=eSpidering(registros)
print("Procesados ",len(registros)," registros") print("Procesados ",len(registros)," registros")
return registros return registros
def leerFicheroLogAceptarFiltradas(ruta,extensionesNoDeseadas): def leerFicheroLogAceptarFiltradas(ruta,extensionesNoDeseadas,espidering):
registros=[] registros=[]
f = open(ruta, "r") f = open(ruta, "r")
total=0 total=0
...@@ -75,10 +91,12 @@ def leerFicheroLogAceptarFiltradas(ruta,extensionesNoDeseadas): ...@@ -75,10 +91,12 @@ def leerFicheroLogAceptarFiltradas(ruta,extensionesNoDeseadas):
except: except:
continue continue
f.close() f.close()
if espidering:
registros=eSpidering(registros)
print("Procesados ",len(registros)," registros") print("Procesados ",len(registros)," registros")
return registros return registros
registros=leerFicheroLog("../access_log_Aug95_reducido") registros=leerFicheroLog("../access_log_Aug95_reducido",True)
registros=identificacionUsuarios(registros) registros=identificacionUsuarios(registros)
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or sign in to comment