El funcionamiento de Urchin se basa en 3 procesos, recogida de datos, procesamiento de los mismos y creación de informes.
El proceso de recogida de datos comienza cuando un visitante solicita una página a nuestro servidor. El servidor responde enviando la página solicitada al navegador del usuario (paso 1). Cuando el navegador procesa los datos (información que reside en el código Java Script, denominado UTM sensor y que es el código de Javascript urchin.js) la envía al servidor donde esté instalado y configurado Urchin. A diferencia de Google Analytics, está información es no se alberga en servidores de terceros.
Todo el código de datos está dentro de un fichero llamado Urchin.js. Una vez que el navegador recibe el código empieza a ejecutarse mientras se carga el resto de la página y lo envía al servidor.
Durante la ejecución el código identifica atributos del visitante y de su entorno de navegación tales como cuantas veces ha visitado su sitio, de dónde viene, etc.
Después de recoger todos los datos el código crea o actualiza una serie de cookies en el ordenador del visitante. Esas cookies se usan para almacenar la información del visitante. Una vez escritas las cookies el código envía la información al servidor de donde esté instalado Urchin, mediante la petición de un fichero GIF invisible . El sistema UTM de Urchin es el encargado de recibir dicha información e incluirla en el proceso de datos.
Una vez Urchin ha recibido estos datos los interpreta través de un proceso (UTM Engine) y los integra con el fichero de logs tradicional generando un solo archivo de logs. A través del motor de proceso de logs (Urchin Log Processing Engine ) Urchin crea una línea de datos en el fichero por cada una de las páginas vistas y genera los informes.
Cada línea contiene numerosos atributos de la página vista que incluyen:
* Cuando se vio la página (fecha y hora).
* De dónde viene el visitante (sitio web del que procede, buscador, etc.).
* Cuantas veces nos ha visitado el usuario (número de visitas).
* Donde está ubicado el visitante (localización geográfica).
* Quién es el visitante (dirección IP).
* Etc…
Una vez que se ha integrado la información en el fichero de logs se termina el proceso de recolección de datos. El siguiente paso es su procesamiento a través del motor de proceso de logs de Urchin (Urchin Log Processing Engine).
La gran diferencia con Google Analytics que supone la gran ventaja, este proceso se puede programar o ejecutar en datos históricos cada vez que sea necesario.
Durante ese proceso cada una de las líneas es analizada separando cada uno de sus atributos.
Urchin convierte cada uno de los atributos en un elemento llamado campo, por ejemplo, la dirección IP se convierte en el campo “c_IP”. Es importante entender que cada una de las líneas contiene una gran cantidad de atributos y que estos son almacenados cada uno en un campo distinto.
Una vez que se han rellenado los campos con la información se aplican los filtros que hayamos configurado en Urchin. Esto controla como aparecen los datos en los perfiles de Urchin que tenemos creados en el panel de administración de perfiles.
Finalmente después de aplicar los filtros, se crean los informes y se almacenan en una base de datos . A diferencia de la versión anterior, Urchin 6 utiliza una base de datos Mysql o Posgress dependiendo de la plataforma.
Cada informe en Urchin, se crea comparando un campo, por ejemplo la ciudad del visitante, con un grupo de datos (visitas, páginas vistas, ratio de conversiones, etc.).
Una vez que los datos se almacenan en la base de datos el proceso termina. Cuando un usuario pide un informe los datos son obtenidos de la base de datos y enviados al navegador.
Google Urchin utiliza la tecnología Urchin Traffic Monitor (UTM)
La tecnología de Urchin Traffic Monitor se compone de dos partes:
- Urchin Traffic Monitor Sensor que se ocupa de la recogida de los datos del Java Script.
- Urchin Traffic Monitor Engine que unifica la información de las dos fuentes y Urchin Log Processing Engine que procesa los logs para la creación de los informes.
Configuración mediante IP+USR-AGENT sin utilizar el módulo UTM
Hay que tener en cuenta que la configuración por IP+USR-AGENT funciona de distinta forma a la hora de indetificar los usuarios. No utiliza el código de seguimeibto de Javascript sino que compara una serie de campos para reconocerlos.
Este método es menos preciso y se utiliza en aquellos casos que no es posible añadir un código en las páginas.